Auteur Voornaam Achternaam
Lorem ipsum dolor sit amet, consectetur adipiscing elit.

DenkTank Blog 4: Shakespeare vs. Wu-Tang Clan: 0-1

28-09-2014

Door: Thijs Bootsma

Humor is de mooiste vorm van intelligentie. Met deze gedachte in zijn achterhoofd is Matt Daniels, data scientist uit New York, de zoektocht gestart naar het grootste vocabulaire in hiphop. Hierin onderzoekt hij de woordenschat van rappers en  vergelijkt deze met die van Shakespeare. En wat blijkt? Veel rappers zijn creatiever in het gebruik van hun woorden dan Shakespeare. De bekende hiphopformatie Wu-Tang Clan heeft zelfs meerdere leden die qua vocabulaire boven Shakespeare in de ranglijst staan. Een opvallend resultaat? Daarover zullen de meningen uiteenlopen. Vrij vertaald betekent hiphop intelligente beweging, wat in het voordeel spreekt van de hiphopartiesten. Deze betekenis wordt echter niet vaak geassocieerd met hiphop als er weer gerapt wordt over “money, cash, hoes”.  Daarnaast wordt  Shakespeare  toch door velen gezien als de grootste woordkunstenaar die ooit geleefd heeft. Hoe is Matt Daniels tot zijn conclusie gekomen?

Persoonlijke advertenties
Het antwoord hierop is: data analytics en specifiek ‘text mining’. Text mining is een analysemethode om informatie uit tekst te halen. Iets meer nerdy: het is een manier om tekst om te zetten in numerieke gegevens die geanalyseerd kunnen worden. Naast text mining zijn er ook technieken om informatie te halen uit afbeeldingen, audio en video. Hierdoor kan er informatie worden gewonnen uit een bestand, zonder dat een persoon ernaar gekeken en/of geluisterd heeft. Een voorbeeld hiervan zijn de advertenties op Facebook en Google. Door middel van text mining zijn dergelijke partijen in staat je zoekopdracht, statusupdates en zelfs e-mails te analyseren. De informatie die zij hieruit halen gebruiken ze om hun gebruikers in kaart te brengen en gerichte advertenties te doen. Daarom zie je na het zoeken naar een vakantie altijd ‘subtiele’ advertenties van de goedkoopste vluchten en de beste hotels.

Twitter is always ahead of the news
De ontwikkeling van data analytics heeft de basis gelegd voor de hype Big Data zoals wij die nu kennen. Het is nu mogelijk op een relatief eenvoudige manier informatie te halen uit verschillende bronnen waarvan dat eerst nog niet mogelijk was. Een van deze nieuwe databronnen is Twitter. Dagelijks worden er 500 miljoen Tweets verstuurd,  door 271 miljoen actieve Twitter gebruikers wereldwijd. Veel organisaties gebruiken nu al data van Twitter, waaronder verschillende media. Door middel van een systeem ontwikkeld op de VU zijn de media in staat eerder nieuws te verkrijgen.  Zo was het voor een krant last-minute mogelijk toch een stuk te plaatsen over de dood van Nelson Mandela door deze versnelde informatievoorziening. Dus door gebruik te maken van data analytics kunnen organisaties profiteren van de voordelen van Big Data!

Maar wat heb ik daar aan?
Het is natuurlijk allemaal leuk en aardig deze ontwikkelingen.. Maar wat hebben wij eraan? Hoe kan het mijn persoonlijke leven makkelijker maken? Of misschien meer idealistisch: hoe kunnen wij als maatschappij er beter van worden? Het is antwoord hierop is bevredigend: er zijn veel  mogelijkheden voor de toepassing van Big Data. Wie heeft er geen ervaring mee? Door de drukte heeft je trein vertraging, mis je ook nog eens de aansluiting op je bus en kom je te laat op je werk. Je baas is boos en jij bent ook niet vrolijk omdat je tijdens je reis een uur lang hebt moeten staan. Met Big Data is het mogelijk de betrouwbaarheid van de reis te vergroten en de informatievoorziening te verbeteren. Zo kunnen deze ergernissen tot het verleden behoren! Naast de trein zijn er natuurlijk meer gebieden die interessant zijn. Big Data kan ook worden toegepast om de filedruk te verminderen, door preventief onderhoud aan de wegen beter in te zetten. Het aantal voortijdige schoolverlaters kan worden teruggedrongen door deze personen eerder te signaleren. Mensen kunnen gezonder worden doordat hun zorgbehoefte beter in kaart kan worden gebracht. Het lijken idealen voor dagdromers, maar door Big Data zijn ze dichterbij dan ooit.

Data science = sexy
De leden van Wu-Tang Clan hadden geen data analytics nodig om tot de uitkomst van Daniels’ onderzoek te komen. In hun hit “Wu-Tang Clan ain’t nothing to fuck with” blijkt reeds dat zij overtuigd waren van hun eigen kunnen. Echter, in combinatie met Big Data is data analytics wel degelijk een belangrijke tool waar veel maatschappelijke waarde uit te halen valt. De komende maanden zullen door de Nationale DenkTank mooie stappen gezet worden om Nederland mobieler, socialer en gezonder te maken. Ook op individueel niveau liggen er kansen op het gebied van Big Data. Organisaties hebben veel vraag naar zogenoemde ‘data scientists’, mensen die in staat zijn data te analyseren en toe te passen. Niet onbelangrijk: het beroep data scientist is uitgeroepen tot het meest sexy beroep van de komende eeuw. Dus voor elke Romeo die nog op zoek is naar zijn Julia: grijp je kans!

Auteur Voornaam Achternaam
Lorem ipsum dolor sit amet, consectetur adipiscing elit.

Agenda

Expertforum Nationale DenkTank 2018

27 september 2018

Eindpresentatie Nationale DenkTank 2018

10 december 2018

Wilt u op de hoogte gehouden worden?

Meld u dan hier aan voor onze nieuwsbrief