Data zijn hot. In de academische wereld én in het populaire debat worden big data en open data als the next big thing beschouwd. De indrukwekkende infograhics die gebruikt worden in datajournalisme en dataonderzoek doen daar nog een fraai visueel schepje bovenop.

Data in beeld
Ook ik ben meer dan enthousiast over de mogelijkheden die nieuwe tools bieden om – bijvoorbeeld – enorme hoeveelheden Twitterdata te analyseren: wie communiceert in de Tweede Kamer met wie op Twitter, welke thema’s bespreken burgemeesters er, en wie zijn op Twitter influencers in het debat over duurzame energie in Nederland? (Een ‘influencer’ is iemand die invloed uitoefent op mensen die behoren tot je doelgroep.)
Dit zijn zomaar een paar grepen uit dataonderzoek dat zeer relevante gegevens kan opleveren. En uiteraard zijn wij academici ook niet vies van flitsende netwerkvisualisaties om de resultaten voor een breder publiek toegankelijk te maken.
Visualisaties hebben de eigenschap dat zij zeer overtuigend kunnen werken. Denk aan de visualisatie van de aswolk van die onuitspreekbare vulkaan in IJsland drie jaar geleden: een wolk die bijna heel Europa bedekte. Het leidde tot een vliegverbod van bijna een week. Echter, een luchtmonster was er niet bij aan te pas gekomen. De berekening was enkel en alleen op data gebaseerd. De uitdrukking ‘the map is not the territory’ (‘De kaart is niet het gebied’) kon bijna niet toepasselijker zijn.
Interpretatie van data
De rol van informatietechnologie in kennisontwikkeling wordt steeds groter en raakt soms direct beslissingsprocessen en beleidsvorming. In zekere zin worden beslissingen soms gedeeltelijk door machines gemaakt op basis van data-berekeningen. Ook is er sprake van een trend om resultaten als vrij vormgegeven visualisaties te presenteren. We moeten ons echter afvragen of we wel over de ‘mediawijsheid’ beschikken om deze afbeeldingen en de achterliggende data te begrijpen. De Utrecht Data School leert studenten daarom precies wat er achter een visualisatie schuil gaat. Ze leren data te verzamelen, op te schonen en gereed te maken voor analyse met een softwareprogramma.

Het is belangrijk om te beseffen dat aan de analyse van een data-monster veel beslissingen voorafgaan. Dit geldt in nog sterkere mate voor de visualisatie ervan. Het resultaat is dus altijd enigszins ‘geconstrueerd’. Vervolgens worden de resultaten in een bepaalde samenhang geplaatst, die ook bijdraagt aan de interpretatie. De wetenschap wil deze stappen transparant maken. Als onderzoeker wil je uitleggen hoe je tot een bepaald resultaat komt.
In het populaire debat gaan deze nuances vaak verloren. Het is echter cruciaal dat we een gezonde scepsis ontwikkelen voor kennis die van een computer afkomstig is. Dit betekent dat een kritisch begrip van de rol die informatietechnologie inneemt in onze beslissingsprocessen en kennisontwikkeling noodzakelijk is. Mijns inziens geldt dit niet alleen voor beleidsmedewerkers en bestuurders, maar ook voor de geïnformeerde burger, aangezien data centraal zullen staan in de kennismaatschappij van morgen.