Auteur Voornaam Achternaam
Lorem ipsum dolor sit amet, consectetur adipiscing elit.

DenkTank Blog 6: Data, data en nog eens data

20-10-2014

Door: Marijn ten Thij en Rolien Sandelowsky

De Nationale DenkTank is al een paar weken bezig en de dagen vliegen voorbij door de vele analyses, interviews en brainstormsessies. Iets wat echter minstens zo belangrijk is als het verwerven van nieuwe inzichten, is het reflecteren op wat je tot nu toe geleerd hebt. In het landschap van het verwerken van data (ofwel gegevens) zijn momenteel vele termen die veel voorbij komen. Maar wat houden ze nu eigenlijk in?

Big Data

Laten we beginnen met het thema van de Nationale DenkTank: “Big Data”. Deze term wordt in het Engels doorgaans gekenmerkt met de begrippen “Volume, Velocity, Veracity and Variety”: grofweg volume, snelheid, betrouwbaarheid en verscheidenheid. Deze termen hebben betrekking op het soort gegevens waarmee gewerkt wordt. Eén van de problemen is dat deze omschrijving de data niet meetbaar maakt. Wat is immers snel; zijn dat 1.000 berichten per seconde, of 100.000? Wat is groot en wanneer noemen we een set gevarieerd? Dit blijken lastige kwesties te zijn, waar ook experts het niet altijd over eens zijn en waarvan de betekenis lijkt te veranderen over tijd.

Open Data

Een andere term die vaak hand in hand gaat met Big Data is ‘Open Data’. Hierbij gaat het om datagegevens die voor iedere internetgebruiker beschikbaar zijn. Een praktisch voorbeeld is de dienstregeling van het Nederlandse openbare vervoer; via 9292 zijn alle actuele reisgegevens immers beschikbaar voor iedereen. Wanneer persoonlijke gegevens openbaar worden gemaakt, is het zaak om ze te anonimiseren, om ervoor te zorgen dat ze niet terug te herleiden zijn naar een individu. Dat we traceerbaar zijn via onze OV-chipkaart is één ding, maar we willen niet dat onze buurman na een half uur surfen precies kan achterhalen hoe onze forensische dag eruit zag.

Datadriven decision making

Een derde term die maar terug blijft komen en de bron van Big Data lijkt te zijn is ‘dataficatie’. Hiermee doelen we op het feit dat onze maatschappij steeds afhankelijker wordt van data en dat we hier steeds meer mee kunnen en willen doen. Nauw hieraan verwant is de term ‘data-driven decision making’: keuzes maken gebaseerd op gegevens, in plaats van op gevoel. Waar voorheen veel beslissingen werden gemaakt vanuit een bepaalde visie, of gestoeld op een testcase, kunnen we inmiddels onze keuzes baseren op een enorme set aan vergelijkbare situaties. Stel je voor dat een arts een patiënt met een zeldzame ziekte op zijn spreekuur krijgt. Gebaseerd op eigen ervaring is de kans groot dat hij moeite heeft met het stellen van een juiste diagnose. Wanneer hij zich kan verhalen op een grote set aan data, waarin vergelijkbare gevallen zitten, verhoogt dit de potentiële accuraatheid aanzienlijk.

Dataficatie

Hoe verhouden deze drie begrippen zich nu tot elkaar? Momenteel zitten we in een periode van dataficatie. We verzamelen steeds meer gegevens over allerlei zaken omdat we ons realiseren hoeveel waardevolle informatie erin schuil gaat. Kennis is macht, en gegevens zijn kennis. De groeiende veelheid aan opgeslagen gegevens maakt dat we steeds vaker en meer datasets kunnen koppelen, waar weer nieuwe inzichten uit ontstaan. Wanneer de set ‘zeldzame ziekte’ gecombineerd zou worden met de bonuskaartgegevens van de betreffende patiënten, zou zo maar eens kunnen blijken dat het overmatig nuttigen van frambozenjam en ketchup kan leiden tot vreemde aandoeningen. Het op deze wijze combineren van datasets noemen we Big Data-analyses.

Digitale rollercoaster

Big Data, Open Data en dataficatie versterken elkaar voortdurend. De maatschappij legt steeds meer druk op bedrijven en de overheid om niet-persoonlijke datagegevens te delen. Hieruit ontstaat steeds meer Open Data, waar we Big Data-analyses op los laten. Dit stelt ons in staat steeds meer keuzes te maken gebaseerd op grote, snelle, accurate en diverse datasets. We bevinden ons in een digitale, vicieuze rollercoaster. En of we het nou eens worden over wanneer we data snel mogen noemen, de snelheid van de ontwikkelingen zelf staat buiten kijf.

Auteur Voornaam Achternaam
Lorem ipsum dolor sit amet, consectetur adipiscing elit.

Agenda

Expertforum Nationale DenkTank 2018

27 september 2018

Eindpresentatie Nationale DenkTank 2018

10 december 2018

Wilt u op de hoogte gehouden worden?

Meld u dan hier aan voor onze nieuwsbrief