EINDRAPPORT 2014
Big Data In Zicht: 10 oplossingen voor maatschappelijke impact met Big Data
Big Data In Zicht: 10 oplossingen voor maatschappelijke impact met Big Data
In de analysefase brengt de Nationale DenkTank de belangrijkste knelpunten rondom het thema in kaart
In 2014 is het thema van de Nationale DenkTank ‘Big Data’. In augustus 2014 is een groep van 23 studenten, pas afgestudeerden en promovendi met uiteenlopende achtergronden aan de slag gegaan met de vraag hoe we Big Data kunnen inzetten om Nederland mobieler, gezonder en socialer te maken.
De Nationale DenkTank beslaat een periode van vier maanden en bestaat uit een analysefase en een oplossingsfase. In de analysefase brengt de Nationale DenkTank de belangrijkste knelpunten in kaart. Dit gebeurt onder andere door middel van interviews, data-analyse, enquêtes en literatuuronderzoek.
Op 3 oktober 2014 presenteerde de Nationale DenkTank de resultaten van de analysefase tijdens een ExpertForum aan ongeveer 200 experts vanuit de overheid, het bedrijfsleven en de wetenschap. In dit document vindt u de resultaten van deze eerste fase. Op basis van de analyses ontwikkelt de Nationale DenkTank 2014 oplossingen die gaan helpen om het potentieel van Big Data te verwezenlijken.
Big Data biedt revolutionaire kansen voor Nederland
Het Eindrapport 2014 op papier of als PDF?
Big Data biedt revolutionaire kansen voor Nederland. De geschatte waarde die Big Data kan toevoegen aan de Nederlandse economie bedraagt maar liefst €45 miljard. De drie focusgebieden uit de hoofdvraag – mobieler, socialer en gezonder – vormen een groot gedeelte van dit bedrag. Er valt dus veel impact te behalen binnen de domeinen van ons onderzoek.
Deze waarde van €45 miljard euro is niet van vandaag op morgen te realiseren. Hiervoor is een cultuuromslag nodig bij zowel organisaties als in de samenleving. Uit een enquête onder 1.000 Nederlanders is gebleken dat er veel weerstand is tegen het delen van informatie met bedrijven en overheid. Er moet een maatschappelijk debat gevoerd worden over de randvoorwaarden die efficiënt en veilig gebruik van Big Data toepassingen mogelijk maken.
Om de mogelijkheden en uitdagingen voor Big Data in de Nederlandse samenleving in kaart te brengen heeft de Nationale DenkTank in samenwerking met Newcom een enquête gehouden onder ruim 1.000 Nederlanders. Uit de resultaten hiervan komt onder andere naar voren welke associaties Nederland heeft bij Big Data, in welke mate wij organisaties vertrouwen in het beheren en gebruiken van onze data en wat voor gevoeligheden er te herkennen zijn in het delen van data binnen de vier domeinen.
Wij ramen de potentiële waarde van Big Data voor de Nederlandse economie op €45 miljard (zie ook Figuur 1). Aan de hand van vijf best practices hebben wij bepaald wat Big Data kan bijdragen aan elk van de sectoren van de Nederlandse economie. Voor iedere sector die bijdraagt aan de Nederlandse economie hebben wij de potentie voor toepassing van Big Data en de haalbaarheid daarvan bepaald. Deze potentie en haalbaarheid is uitgedrukt in een index, waarbij 1 de hoogste potentie of haalbaarheid is en 5 de laagste. Een overzicht van de sectoren en de bijbehorende indices kunt u vinden in Tabel 1.
Maar de belangrijkste vraag blijft toch: “Wat betekent die €45 miljard voor mij, als burger?”. Om deze vraag te beantwoorden hebben wij ook onderzoek gedaan naar de kwalitatieve waarde.
“Hoe kan Big Data worden gebruikt om Nederland mobieler, socialer en gezonder te maken?”
Het Eindrapport 2014 op papier of als PDF?
De Nationale DenkTank benadert vanuit een multidisciplinaire invalshoek de verschillende mogelijkheden en randvoorwaarden van Big Data, waarbij rekening wordt gehouden met verschillende partijen met diverse belangen. Om tot concrete analyses en oplossingen te komen, heeft de Nationale DenkTank ervoor gekozen om zich te richten op vier domeinen binnen het grote thema van Big Data: mobiliteit, infrastructuur, sociaal domein en gezondheid.
+Big Data in de mobiliteitssector
De mobiliteitssector – waaronder wij zowel het openbaar vervoer als het auto- en vrachtverkeer verstaan – is een sector waarin nu al veel data wordt gebruikt. Deze data wordt op dit moment voornamelijk ingezet om de reiziger zo accuraat mogelijk te informeren over zijn reis. Door gebruik van Big Data kan echter meer bereikt worden; zo kan de zogenaamde deur-tot-deur reis geoptimaliseerd worden, en biedt Big Data ook de mogelijkheid tot het grootschalig implementeren van smart cars. Big Data toepassingen in de mobiliteitssector leveren dus voordelen op voor de reiziger. Dit beeld wordt bevestigd door ons onderzoek: De totale waarde van Big Data binnen de mobiliteitssector wordt geschat op €6 miljard. Een verdere specificatie staat in Figuur 2.
Deze waarde is bepaald door een geldbedrag aan de tijd, betrouwbaarheid en comfort van een reis te koppelen.1 Vervolgens is de grootte van de categorie bepaald2 om daarna aan de hand van concrete casussen in te schatten met hoeveel procent Big Data de reistijd, betrouwbaarheid of comfort zou kunnen verbeteren. Twee belangrijke inzichten uit deze analyse zijn dat vooral veel waarde zit in het verbeteren van wacht- en overstaptijden voor het openbaar vervoer, terwijl voor de auto een minimale verkorting van de reistijd al veel kan opleveren. Voor het goederenverkeer heeft de Nationale DenkTank besloten voornamelijk te focussen op de effecten van het goederenverkeer op het netwerk. Er is bepaald hoeveel deze externe effecten nu kosten en vervolgens in hoeverre Big Data deze effecten kan verminderen. Uit deze analyse volgt dat bijna 80% van de waarde binnen het goederentransport in het wegverkeer zit. Als laatste is op basis van MKBA-technieken3 een indirecte maatschappelijke waarde van 10% toegevoegd, die buiten de eerste twee categorieën valt. Hierbij kan gedacht worden aan vestigingseffecten of een daling van de werkloosheid door verbeterde mobiliteit van een stad of regio.
Referenties
1 Kennisinstituut voor Mobiliteitsbeleid
2 Centraal Bureau voor de Statistiek
3 Maatschappelijke Kosten Baten Analyse
+Big Data in de infrastructuur
Een goede infrastructuur is van vitaal belang voor de open Nederlandse economie. Op jaarbasis wordt er €18 miljard uitgegeven aan onze civiele infrastructuur, waarvan ongeveer de helft aan onderhoud. Het goed onderhouden van de Nederlandse infrastructuur is gezien het intensieve gebruik ervan essentieel. In onze analyse hebben we gekeken naar de weg-, water-, spoor-, en stedelijke infrastructuur. Onze analyses wijzen uit dat aan de hand van Big Data hier een grote efficiëntieslag kan worden gemaakt.
De toegevoegde waarde van Big Data zit in de toegang tot betere en meer nauwkeurige informatie. Er wordt op dit moment periodiek en steekproefsgewijs gecontroleerd of de infrastructuur nog in goede staat is. Daarbij worden er reactief herstelwerkzaamheden verricht. Er zijn andere manieren om aan informatie hierover te komen. Op sommige plaatsen in Nederland is begonnen met het plaatsen van sensoren om een actueler beeld van de staat van de infrastructuur te verkrijgen. Op deze manier worden de Van Brienenoordbrug in Rotterdam en de Hollandsche brug bij Almere continu gemonitord. Hetzelfde geldt voor veel objecten, zoals wissels, in het spoor. Daarnaast vormen smartphones in de broekzakken van de reizigers die dagelijks gebruik maken van de infrastructuur miljoenen potentiële sensoren. Wanneer al deze gegenereerde data ook daadwerkelijk beschikbaar komt, kan waardevolle informatie worden verkregen en is het bijvoorbeeld duidelijk waar onderhoud gepleegd moet worden. Sterker nog: door de vervoersstromen in kaart te brengen door middel van deze Big Data kunnen er zelfs voorspellingen gedaan worden over het toekomstig falen van de infrastructuur. Op basis hiervan kunnen we slimmer onderhoud plegen. Zo kunnen bijvoorbeeld wissel- en seinstoringen voorkomen worden in plaats van achteraf hersteld. Dit scheelt veel vertraging op het spoor.
Tenslotte kan Big Data ook bijdragen aan een groter veiligheidsgevoel in Nederland. Door gebruik te maken van meerdere bronnen, zoals satellietbeelden, kan er een beter beeld gevormd worden van de status van de dijken in Nederland. Deze informatie draagt zodoende bij aan een hogere betrouwbaarheid van onze waterkeringen. Ook kan Big Data helpen investeringen, gerelateerd aan bijvoorbeeld een maatschappelijk verantwoord overstromingsrisico, beter te onderbouwen en bewustwording van het veiligheidsgevoel onder burgers te vergroten.
Wij geloven dat met behulp van Big Data in de toekomst ook een regelsysteem kan worden gerealiseerd. Hiermee kan dan direct gereageerd en ingespeeld worden op de aanwezige vervoersstromen of verwachte vervoersstromen. Een dynamische infrastructuur is veel minder vatbaar voor incidenten. Big Data kan als tool en katalysator werken om processen minder reactief te maken en te ontwikkelen naar een meer predictieve aard. Dit kan allemaal omdat met Big Data een betere monitoring van de infrastructuur mogelijk wordt.
+Big Data in de gezondheidszorg
Big Data heeft in de gezondheidszorg enorme potentiële waarde om zowel de kwaliteit verder te verbeteren als de kosten te drukken. Volgens onze berekeningen ligt de potentiële waarde van Big Data in de gezondheidszorg maar liefst rond de 10 miljard euro. Bij een optimale inzet van de mogelijkheden van Big Data zouden de huidige zorgkosten in Nederland met 10% verlaagd kunnen worden. De waarde van Big Data in de zorg is zo groot omdat Big Data op verschillende manieren ingezet kan worden.
Ten eerste kan Big Data een grote rol spelen in de transitie van genezen naar voorkomen. Epidemieën kunnen real-time in beeld worden gebracht. Het verzamelen en delen van fitness- en gezondheidsdata kan tot nieuwe inzichten leiden en een belangrijke stimulans vormen voor een gezonde levensstijl. Daarnaast kunnen nieuwe digitale technologieën een groot deel van de zorgvraag verplaatsen van het ziekenhuis naar huis. De vele doktersbezoeken kunnen voorkomen en vervangen worden door zaken als bloedwaarden, slaappatronen en medicijngebruik thuis te meten. Het is op dit moment verleidelijk voor zorgverleners en farmaceuten om meer zorg te leveren dan nodig. Daarbij denken veel patiënten op basis van online informatie dat een medische ingreep noodzakelijk is om hun klachten op te lossen. Big Data kan in kaart brengen welke interventies ook daadwerkelijk nodig zijn op basis van grote hoeveelheden eerdere resultaten. Ook is het met de enorme toename aan onderzoeksgegevens mogelijk om bijwerkingen en interacties van en tussen behandelingen beter in kaart te brengen. Zo kan Big Data de zorgvraag verminderen en onnodige, en mogelijk zelfs schadelijke diagnostiek en behandelingen drastisch verminderen.
Van de zorg die noodzakelijk blijft, kan Big Data vervolgens de kwaliteit aanzienlijk verhogen. Waar nu vaak op basis van grote studies iedereen dezelfde behandeling voorgeschreven krijgt, kan door persoonlijke wensen en data te combineren met klinische data van andere patiënten, de juiste op maat gemaakte behandeling voorgeschreven worden. Ook kunnen door Big Data (bijvoorbeeld door analyse van genetische informatie) nieuwe behandelingen worden ontwikkeld.
Buiten het medisch vlak kan Big Data het zorgstelsel zelf optimaliseren. Zo kan Big Data bijvoorbeeld zowel de logistiek als de bevoorrading van ziekenhuizen enorm verbeteren of fraudegevallen aantonen.
+Big Data in het sociaal domein
De potentie van Big Data binnen de publieke sector als geheel is met een geschatte waarde van €8 miljard groot. De gevonden toepassingen hebben met name betrekking op fraudebestrijding, openbare orde en veiligheid.4 Uit literatuuronderzoek, interviews met experts en casestudies blijkt dat er geen grote voorbeelden zijn van het gebruik van Big Data binnen het sociaal domein op het terrein van dienstverlening en monitoring.
De reden hiervoor lijkt te zitten in een complexe samenhang van omstandigheden. Ten eerste ligt de huidige focus op de decentralisatie en niet op het gebruik van innovatieve technieken. Bovendien zijn factoren als talent, data-kwaliteit en budget zeer afhankelijk van de grootte van een gemeente. Daarnaast zit het experimenteren met data ook niet in de aard van de overheid en is de overheid vooral binnen het sociale domein terughoudend op dit gebied. Met enkele pioniersgemeenten, zoals Almere met haar Big Data Value Center, worden hier nu wel eerste stappen in gemaakt.
Wij denken dat Big Data een rol kan spelen bij effectmetingen en onderzoek naar de werking van het bestuurlijk systeem in het sociaal domein, en bij het uitbouwen van sociale netwerken van burgers. Big Data technieken kunnen op een innovatieve wijze gebruikt worden om het Rijk inzicht te verschaffen in het functioneren van het sociaal domein als geheel. Bovendien denken wij dat er door middel van text mining en process mining meer inzicht kan komen in de knelpunten van informatievoorzieningen. Andere toepassingen van Big Data zien wij in bijvoorbeeld het verbeteren van de dienstverlening door ‘webcare’ en het stimuleren van user empowerment bij de burgers. Zo zou Big Data kunnen worden ingezet om de werkloosheidsduur te verminderen5, de zelfredzaamheid van geïsoleerde ouderen te verbeteren en het verlegenheidsvraagstuk in de mantelzorg te verhelpen.6
Tot slot verwachten wij dat door het gebruik van Big Data in het sociaal domein een besparing op de maatschappelijke kosten behaald kan worden. Big Data kan een efficiënte dienstverlening verzorgen, doorlooptijden van aanvragen verkorten en adequate monitoring faciliteren.
Referenties
4 Zie bijv. RAND Report: Predictive Policing: The Role of Crime Forecasting in Law Enforcement Operations (2013).
5 In 2014 zijn er bijna 700.000 werklozen in Nederland. De jaarlijkse uitgaven aan werkloosheid bedragen rond de €20 miljard.
6 43% van de hulpbehoevenden durft niet of nauwelijks hulp te vragen aan familie, 63% durft geen hulp te vragen aan buren. Zie SCP-rapporten Mantelzorg op waarde geschat (2013) en Informele zorg in Nederland (2013).
Als we Big Data op een correcte en breed geaccepteerde wijze in onze maatschappij willen implementeren, moeten we antwoorden vinden op een aantal praktische en ethische vraagstukken
Het Eindrapport 2014 op papier of als PDF?
Big Data heeft een grote potentie om Nederland socialer, mobieler en gezonder te maken. Om deze potentie te realiseren is er echter een aantal domeinoverstijgende vraagstukken die geadresseerd moeten worden.
We willen Big Data op een correcte en breed geaccepteerde wijze in onze maatschappij implementeren. Dit betekent dat we antwoorden moeten vinden op praktische en ethische vraagstukken op vier dimensies: het normatief kader, allianties, talent en cultuur. Deze zijn weergegeven in Figuur 3.
+Normatief kader Big Data is een technologische ontwikkeling die overal in de maatschappij plaatsvindt. Niet alleen bedrijven, maar ook individuen creëren enorme hoeveelheden data. De meningen over de impact van het gebruik van Big Data in verschillende sectoren lopen uiteen, maar vrijwel alle experts zijn het erover eens dat deze aanzienlijk is. Daarnaast wijzen experts ook op onzekerheden en zelfs gevaren die gepaard gaan met het gebruik van Big Data. Moeten we alles wat er mogelijk is eigenlijk wel willen? Wij gebruiken de term normatief kader als overkoepelend begrip voor verschillende obstakels die wij zijn tegengekomen: juridische en ethische bezwaren, het privacyvraagstuk, en transparantie over het gebruik van gegevens. Wij hebben aan de hand van literatuuronderzoek, interviews met experts en casestudies onderzocht wat de mogelijke normatieve implicaties van het gebruik van Big Data zijn. Daarnaast hebben we gekeken hoe deze implicaties concreet naar voren komen binnen iedere sector. Figuur 4 illustreert deze bevindingen. Juridische en praktische bevindingen: veiligheid en publieke opinie Ethische vraagstukken: onbewuste gedragsverandering Een eerste voorzet voor oplossingen: zie de burger als persoon, niet als dataset +Allianties: het Nieuwe Samenwerken De kracht van Big Data ligt in het combineren van verschillende datasets. Om de waarde die in deze data besloten ligt te realiseren is het essentieel dat partijen op een nieuwe manier met elkaar samenwerken. In de eerste plaats is een grotere durf om te experimenteren met het delen en combineren van data van belang. In de tweede plaats moeten bedrijven, overheid en wetenschap ook in meer onverwachte hoek, buiten de eigen sector en het eigen domein om, naar potentiële samenwerkingspartners zoeken. Wij denken dat dergelijke nieuwe vormen van samenwerking op het gebied van Big Data Nederland gezonder, socialer en mobieler kunnen maken. In theorie is het nieuwe samenwerken eenvoudig, hoewel in de praktijk bepaalde obstakels optreden die dit bemoeilijken. Het combineren van datasets en kennis leidt vaak tot nieuwe inzichten. Sinds 2013 stelt telecomaanbieder Orange ieder jaar een dataset met belgegevens van een ontwikkelingsland beschikbaar voor het publiek. De uitkomsten van dit Data for Development-initiatief leiden tot nieuwe toepassingen, variërend van het optimaliseren van stadsvervoer tot het voorkomen van een epidemie. Orange had dit soort innovatieve inzichten nooit onafhankelijk kunnen genereren. Een ander voorbeeld is de samenwerking tussen Mezuro, Vodafone en het Centraal Bureau voor de Statistiek (CBS). Mezuro beschrijft de drukte op bepaalde plaatsen in de stad aan de hand van telefoondata van Vodafone. Het CBS kan deze data gebruiken om nieuwe statistiek te produceren, onder andere over de day-time population in Nederland. Door data en kennis te delen tussen verschillende sectoren kan een waarde worden gecreëerd die door de partijen afzonderlijk nooit gerealiseerd zou zijn. Deze twee specifieke voorbeelden illustreren het Nieuwe Samenwerken: onverwachte inzichten door kruisbestuiving en, daaraan gekoppeld, synergiën tussen sectoren en over domeinen heen. Om nieuwe samenwerkingen te realiseren en datasets en kennis te combineren is het belangrijk om te begrijpen waarom momenteel nog niet samengewerkt wordt op het gebied van Big Data. Bedrijven, overheden, wetenschappers en burgers hebben allen belangen en angsten die innovatieve samenwerking bemoeilijken. De volgende tabel licht dit toe en geeft voorbeelden van oplossingsrichtingen: Naast deze praktische obstakels is er nog een aantal bredere mogelijke bezwaren waarmee rekening gehouden moet worden. Om het Nieuwe Samenwerken te implementeren met steun van de burger is verdere reflectie nodig op controle, verantwoording en transparantie. Hier ligt zowel voor de overheid als voor het bedrijfsleven een belangrijke taak. Er moet helderheid komen over het eigenaarschap van data en over de mate waarin data tussen partijen gedeeld mag worden. Er moet duidelijker worden wat het begrip ‘transparantie’ over het gebruik van persoonlijke data in de praktijk precies betekent. Tenslotte is het belangrijk ons af te vragen in hoeverre het Nieuwe Samenwerken kan leiden tot economische machtsconcentratie en kartelvorming. Zelfregulering of wettelijke regulering zijn opties om de controle en transparantie te waarborgen die nodig zijn om draagvlak voor het Nieuwe Samenwerken te creëren. Opt-in en opt-out regelingen kunnen een middel zijn om hier invulling aan te geven. Als deze vragen op zorgvuldige en transparante wijze beantwoord worden, zijn wij ervan overtuigd dat het Nieuwe Samenwerken voor burgers, wetenschappers, bedrijven én de overheid nieuwe kennis en waarde uit Big Data kan opleveren. +Talent De ontwikkeling van kennis en vaardigheden in het Big Data tijdperk zijn van groot belang om het potentieel van Big Data te benutten. Er is een tekort aan data scientists, zowel in het bedrijfsleven als bij de overheid, die waardevolle inzichten kunnen verwerven met analytische technieken en grote hoeveelheden data. Onze analyse laat een tekort van 8.000 data scientists zien, die nodig zijn om Big Data in te zetten in Nederland en de waarde van €45 miljard waar te maken. Maar wat is een data scientist eigenlijk? Een data scientist is iemand die niet alleen de data analyses kan uitvoeren, maar de bevindingen ook in de context kan plaatsen en kan communiceren naar de besluitvormers. Het is dus belangrijk dat hij of zij bagage heeft op het gebied van statistiek en programmeren om de data analyses uit te voeren. Daarnaast is kennis van database management nodig om zowel gestructureerde als ongestructureerde data te analyseren en aan elkaar te koppelen. Een data scientist gebruikt domeinkennis om de werkelijkheid te modelleren en de bevindingen uit de data in een context te plaatsen. Daarnaast is het zeer belangrijk dat hij of zij over de vaardigheden beschikt om de bevindingen te communiceren en te visualiseren. Een goede data scientist heeft het totaalpakket aan vaardigheden hierboven. Het is zeer moeilijk om al deze eigenschappen in één persoon terug te vinden. Er zijn in Nederland op dit moment ook geen studies die al deze vaardigheden aanleren. Het potentieel uit Big Data talent zal dan ook bestaan uit afgestudeerden met een relevante achtergrond die omgeschoold moeten worden tot data scientist. Studies met een sterke analytische component, zoals econometrie en bèta-opleidingen, zijn op dit moment in staat om data scientists voort te brengen. Op basis van het aantal studenten van deze studies schat de Nationale DenkTank het potentieel aan Big Data talent in 2018 op 23 000 mensen. Ondanks dit grote potentieel aan talent in Nederland, zal er in 2018 een tekort zijn van 8.000 data scientists, omdat niet alle afgestudeerden als data scientist aan de slag zullen gaan. Een schatting op basis van expertinterviews laat zien dat van het potentiële talent slechts 10% daadwerkelijk een dergelijke, analytische carrière zal starten. Aan de ene kant kan dat komen doordat deze afgestudeerden simpelweg geen data scientist willen worden. Daarnaast zijn organisaties ook slechts geïnteresseerd in het beste deel van het talent. Dit maakt de aanwas van talent in 2018 gelijk aan 2.000 afgestudeerden. Op basis van expertinterviews en een analyse is de vraag in 2018 bepaald op 10.000 mensen. Dit zorgt ervoor dat er een tekort is van 8.000 mensen. Dit tekort is vier keer zo groot als de huidige aanwas in Nederland. Om dit tekort aan data scientists in de komende jaren tegen te gaan, moet een aantal maatregelen genomen worden. Allereerst zullen bestaande medewerkers omgeschoold moeten worden. Schulich School of Business en Harvard Business School bieden beide programma’s aan waar managementvaardigheden worden ontwikkeld bij IT-personeel om zo het gat tussen management en IT te dichten. In de afgelopen 3 jaar zien wij een grote groei van dit type programma’s. Daarnaast zijn er veel programma’s waarin managementpersoneel bijgeschoold wordt op het gebied van data analyse-vaardigheden. Ten tweede is het van belang jongeren te stimuleren om een opleiding te volgen waarin meerdere data scientist vaardigheden terugkomen en te stimuleren om te gaan werken in het Big Data veld. Teradata University Network is een goed voorbeeld van een opleidingsinstituut dat curricula vormt waarin alle benodigde vaardigheden van een data scientist aan bod komen. Als laatste is het belangrijk dat talent in Nederland behouden wordt en dat er buitenlands talent aangetrokken wordt. Het Techniekpact in Nederland heeft programma’s ontwikkeld waarbij het aantrekkelijk gemaakt wordt voor buitenlandse studenten om in Nederland te studeren en vooral ook na hun studie te blijven. Studenten worden strategisch geworven en voor, tijdens en na hun studie verbonden met Nederland. Daarnaast ligt hier een grote verantwoordelijkheid voor het bedrijfsleven. Waar wij zien dat bedrijven in Silicon Valley veel Big Data talent aantrekken, schiet Nederland hierin tekort. Bedrijven kunnen lessen halen uit de succesverhalen uit het buitenland en Nederland zoals Google, Facebook en IBM. +Datagedreven cultuur De grote hoeveelheden data en de nieuwe technieken die het mogelijk maken om deze data te verwerken tot waardevolle inzichten, vragen om een nieuwe manier van denken. Organisaties moeten hun beslissingen meer datagedreven gaan nemen. Ook de keuzes van individuele burgers worden steeds meer gebaseerd op inzichten verkregen uit data. Op dit moment worden veel beslissingen bij organisaties nog genomen op basis van intuïtie en niet op basis van een objectieve data-analyse. Daarnaast maken wij in het dagelijks leven nog veel keuzes op basis van gevoel. Denk bijvoorbeeld aan je reisgedrag: Hoe vaak negeer je niet het advies van de navigatie? Ook laten we onze eet- en beweeggewoontes nog amper sturen door data. Wij verwachten dat data een steeds grotere rol gaat spelen bij het nemen van besluiten, zowel in de maatschappij als bij organisaties. Daarom hebben wij onderzocht hoe datagedreven de Nederlandse maatschappij op dit moment is en daarnaast in kaart gebracht waarom organisaties nog onvoldoende datagedreven zijn. De Nederlandse burger is niet bekend met de mogelijkheden van data en weet ook niet wat de term Big Data inhoudt. Wij denken dat acceptatie en begrip van Big Data binnen de samenleving een belangrijke voorwaarde is om de kracht van Big Data ten volle te benutten. Veel organisaties, zeker in de publieke sector, zijn reactief ingesteld. Zij reageren op het moment dat een probleem zich voordoet. Daarnaast hebben veel traditionele organisaties vooral experts in dienst die jarenlange ervaring hebben in een specifiek vakgebied. De reactieve organisatie, waar de besluiten op basis van expertise werden genomen, was zeer geschikt in de tijd dat er nog weinig data beschikbaar was.Figuur 4. Overzicht van normatieve obstakels en hoe deze per domein worden ervaren
Een vaak terugkerend probleem is onduidelijkheid over de privacy van burgers bij zowel bedrijven en overheden als bij burgers zelf. Uit onze interviews blijkt dat vaak onduidelijk is welke gegevens precies beschermd worden door de Wet bescherming persoonsgegevens. Tevens geeft 76% van de ondervraagden in onze enquête aan zich in meer of mindere mate zorgen te maken over zijn of haar privacy, maar blijkt nog niet de helft van die groep daadwerkelijk maatregelen te nemen om de eigen privacy te beschermen. Bovendien lijken bedrijven de wetgeving vaak te omzeilen door zich op andere rechtsgronden te beroepen. Zo hoeven ze niet opnieuw toestemming te vragen voor het gebruiken van persoonsgegevens voor nieuwe doeleinden. En er is een privacy paradox die onduidelijkheid creëert: als bedrijven zich aan de voorkant wel aan de wet houden, kunnen ze aan de achterkant toch nog de privacy van burgers aantasten, omdat door datamining van geanonimiseerde gegevens profielen ontstaan. Daarnaast wijkt de publieke opinie soms af van de wetgeving. Dit blijkt bijvoorbeeld uit de ING-casus, waar het plan lag om bankgegevens te gebruiken voor commerciële doeleinden. Dit was wettelijk toegestaan, maar de publieke reactie heeft ervoor gezorgd dat dit plan niet doorging. Een andere bevinding is dat de toenemende precisie van Big Data zowel voor- als nadelen heeft. Enerzijds kan men de identiteit van de burger steeds preciezer en scherper bepalen, wat maatwerk mogelijk maakt. Anderzijds maakt dit het risico op het uitlekken van gevoelige gegevens van burgers groter, samen met de consequenties daarvan. De vraag wie toegang heeft tot gegevens en hoe de veiligheid is geborgd wordt pregnant.
Naast deze juridische en praktische bevindingen spelen er ethische kwesties omtrent de langetermijneffecten van het gebruik van Big Data. Dit gebruik betreft niet alleen een technische ontwikkeling, maar heeft ook directe invloed op onze persoonlijke levens. Een voorbeeld is onbewuste gedragsverandering door het gevoel dat alles wat je doet, opgeslagen en in de gaten gehouden wordt. Uit onderzoek bleek dat mensen na de NSA-leaks door Edward Snowden niet alleen minder zochten naar gevoelige termen voor de Amerikaanse overheid (bijvoorbeeld ’anthrax’), maar ook naar persoonlijke informatie (zoals ‘therapie’).1 Ook kun je indirect gediscrimineerd worden op basis van algoritmen waarvan de criteria niet openlijk bekend zijn en waartegen je dus niets kunt doen. Je mag geen busabonnement afsluiten, je krijgt geen sociale huurwoning of je komt niet in aanmerking voor een aanvullende zorgverzekering, terwijl je niet weet waarom. Zo hebben onderzoeken naar algoritmes aangetoond dat iemands etnische achtergrond een bepalende factor is in het al dan niet toekennen van een lening van de bank, zonder dat dit bekend is bij de beoordelaars van de aanvraag. Het is opvallend dat deze effecten wel uit wetenschappelijke studies blijken, maar nauwelijks worden ervaren door de bevolking. Het is echter wel belangrijk dat deze vraagstukken besproken worden in het maatschappelijk debat.
Wij geloven dat bewustwording, keuzevrijheid en transparantie in combinatie met een integere, kritische blik op de effecten en grenzen van het gebruik van Big Data tot het nemen van verantwoordelijkheid en het afleggen van verantwoording zal leiden. Voor een juist gebruik van Big Data moeten bedrijven, overheden en burgers zich realiseren dat de data die zij gebruiken, afkomstig zijn van personen voor wie dit gebruik consequenties kan hebben. Momenteel is het enige instrument hiervoor het vragen van toestemming voor dit gebruik aan mensen. De informatie die mensen hier nu over ontvangen is vaak al complex en bovendien is de toestemming vaak ontoereikend: gegevens worden op steeds meer onvoorziene manieren gebruikt. Vaak weten mensen niet wat de consequenties hiervan zijn. Wij stellen daarom voor om een voorbeeld te nemen aan bestaande toepassingen die op inzichtelijke wijze ingewikkelde informatie overbrengen, zoals de Kijkwijzer of de Financiële Bijsluiter.Referenties
1 Marthews, A. & Tucker, C. ‘Government Surveillance and Internet Search Behavior’, 28 augustus 2014.
De komst van Big Data maakt het echter mogelijk dat organisaties proactief zijn in hun bedrijfsvoering. Wanneer zij besluiten maken op basis van inzichten verkregen uit analyses van grote hoeveelheden data kunnen zij sneller en effectiever handelen. Dit vergt een innovatievere cultuur; de datagedreven cultuur.