Dé opleidingensite voor hbo en hoger
Gepubliceerd op: 21 augustus 2017
Auteur:
Functie: Hoogleraar / directeur Data & Business Analytics op Erasmus Universiteit Rotterdam
Organisatie: Erasmus Q-Intelligence


Het gat tussen big data en wijsheid

Big data zijn inmiddels ongekend gemeengoed. Dankzij technologische ontwikkelingen worden er steeds meer data gegenereerd, opgeslagen en uitgewisseld. Desondanks maken overheden en bedrijfsleven nog niet optimaal gebruik van de mogelijkheden.

Big data zijn inmiddels ongekend gemeengoed. Dankzij technologische ontwikkelingen worden er steeds meer data gegenereerd, opgeslagen en uitgewisseld. Desondanks maken overheden en bedrijfsleven nog niet optimaal gebruik van de mogelijkheden. Veelal omdat men de technische vaardigheden daarvoor mist, zegt prof. dr. ir. Rommert Dekker, academisch directeur van de opleiding Data & Business Analytics aan de Erasmus Universiteit Rotterdam.

Big data zijn overal en de vraag naar data-experts stijgt volgens marktonderzoeksbureau IDC de komende jaren flink. Toch is het een vage term, vindt prof. dr. ir. Rommert Dekker: "Het is niet altijd even duidelijk wat big data 'big' maakt. Je kunt vaak volstaan met de juiste data; het gaat erom wat je ermee doet. De belangrijkste misvatting over big data is dat ze automatisch leiden tot nieuwe inzichten."

Dekker is academisch directeur van de postacademische opleiding 'Data & Business Analytics' van Erasmus Q-Intelligence (dienstverlener op het gebied van onderzoek en onderwijs en verbonden aan het Econometrisch Instituut van de Erasmus Universiteit). De opleiding is bedoeld voor IT'ers, economen, bedrijfskundigen, bestuurskundigen en analisten die affiniteit hebben met kwantitatief onderzoek. "Overheden en bedrijfsleven zouden meer profijt kunnen hebben van inzichten uit big data, maar hun mensen ontberen vaak de technische vaardigheden", meent hij.
"Sensoren verzamelen data elektronisch, de opslag is goedkoper en het internet maakt delen makkelijker. Dat leidt tot een vloedgolf aan data. Maar die zijn nooit perfect. Data moeten worden geschoond op verbanden die nergens op slaan. Je hebt technische kennis over de verzameling van data nodig om de bruikbare stukjes informatie eruit te vissen."

En dan ben je er nog niet: "De hiërarchie is: van data, naar informatie, naar wijsheid. Je moet informatie uit data in verband brengen met de context, en combineren met andere inzichten. Dan kun je er wat mee in vraagstukken. Daar worstelen bedrijfsleven en overheden nu mee. Ik denk dat veel beslissingen gewoon nattevingerwerk zijn en maar weinig worden ondersteund door cijfermatige informatie. Big data maken inzichtelijker waar je moet investeren, hoe je de vraag kan sturen en welke diensten op maat je kunt bieden."


Koelkasten voorspellen

Voor het omzetten van informatie naar inzichten die kunnen worden gebruikt voor beleid of bedrijfsvoering bestaan verschillende technieken. Een ervan is 'forecasting': op basis van historische data voorspellingen doen over de toekomst. "Het is meer dan simpelweg een lijntje van een grafiek doortrekken", legt Dekker uit. "In Griekenland worden al jaren steeds minder koelkasten verkocht. We wilden het marktpotentieel in 2025 voorspellen. Als we de trend doortrokken, kwamen we op nul uit. Een koelkast is een primaire levensbehoefte, dus dat klopt waarschijnlijk niet. Je moet er dan data-gedreven modellen op loslaten die onderliggende mechanismes meenemen, zoals een economische crisis. Daarvoor moet je beschikken over kennis van de werking van een model, weten welke factoren de werking beïnvloeden en hoe je daarvoor corrigeert."

Maar big data-analyse gaat niet puur over het voorspellen van de toekomst. 'Prescriptive analytics' biedt data-gedreven inzichten in de effecten van beslissingen en kan laten zien welke opties het meest bijdragen aan het bereiken van een doel. Dekker: "Je ziet dat bij grote datasets men daar weinig gevoel bij heeft. Met data-gedreven simulatie en optimalisatie kun je veel gerichter beslissingen maken voor allerlei praktische vraagstukken."

Bijvoorbeeld: "Sport analytics is enorm in opkomst. Mensen werden gevraagd hockeywedstrijden te coderen: persoon A neemt de bal goed aan, persoon B doet een succesvolle pass. Als je dat heel vaak doet, kun je analyseren wat je sterke en zwakke punten zijn en daarop trainen. Wij hebben vergelijkbare modellen ingezet bij grote bedrijven: welke projecten dragen het meeste bij aan je doelstelling?"


Lerende machines

Een andere toepassing in opkomst is kunstmatige intelligentie, of 'machine learning'. Op basis van duizenden kenmerken 'leren' machines wat de juiste beslissing is. "Zo werkt bijvoorbeeld gezichtsherkenning. Als je een systeem steeds vertelt bij welke kenmerken het een gezicht goed of fout herkent, leert het automatisch welke patronen cruciaal zijn voor goede herkenning. Dit wordt ook gebruikt in de gezondheidszorg, bijvoorbeeld bij het opsporen van tumoren. Maar ook bij het bepalen van de huizenprijs. Het aantal kenmerken is zo groot dat we dat niet zelf kunnen."

De bovengenoemde technieken vergen kennis over het programmeren van modellen. Die kennis hebben beslissers hard nodig bij het gericht maken van beleid of bedrijfsvoering, zegt Dekker. "We zien een groot gat. Mensen met de technische vaardigheden kunnen vaak geen businesscase maken. En mensen die dat wel kunnen, missen de technische achtergrond om modellen te programmeren en data goed te interpreteren. Het komt maar bij weinig opleidingen beide aan de orde. Het is belangrijk dat die scheidslijn verdwijnt. En communicatie is minstens zo belangrijk. Zowel techneuten als beslissers moeten over de tools beschikken om ontdekte verbanden te visualiseren en zo inzichtelijk en begrijpelijk te maken."