Naar de content

'Tekort aan datawetenschappers op komst'

Interview met Inald Lagendijk over Big Data

CC BY SA 1.0

Er komt een groot tekort aan goede datawetenschappers, zo vreest hoogleraar Informatie- en Communicatietheorie Inald Lagendijk. Het gaat om honderdduizenden vacatures. Er breken dus gouden tijden aan voor de datawetenschapper, die nuttige informatie uit terabytes data kan destilleren.

“Overal in Europa is behoefte aan goede datawetenschappers. Waar ik ook kom is er vraag naar”, zegt Inald Lagendijk, hoogleraar hoogleraar Informatie- en Communicatietheorie aan de TU Delft en lid van de directie van ict-onderzoeksplatform Commit/. “Amerikaanse bedrijven als Apple en Google zijn aantrekkelijk, maar een hoop andere ondernemingen hebben moeite de juiste mensen te werven. Ook Philips, Unilever, de ministeries en de Belastingdienst zoeken specialisten.”

Het gaat om honderdduizenden vacatures, volgens Lagendijk. “Als die niet vervuld worden, levert dat veiligheidsrisico’s op en remt het de economische ontwikkeling.” Bedrijven en overheden zoeken informatici die creatief zijn en verstand hebben van statistiek, die in de data duiken en met zinvolle analyses komen. Daarnaast is er behoefte aan zogeheten data stewards, zegt Lagendijk. Dit zijn werknemers die ervoor zorgen dat computersystemen goed beveiligd zijn, data goed opgeslagen worden en dat toepassingen uitwisselbaar zijn. “Die functie zit tussen die van de datawetenschappers en de traditionele ICT ondersteuner in.”

Van logistiek tot astronomie en van geneeskunde tot bedrijfskunde, overal worden data verzameld. Prima, deze digitalisering, aldus Lagendijk. Maar de problemen in de verschillende sectoren zijn dan nog niet opgelost. De gegevens moeten vermarkt worden. Het is de rol van de datawetenschapper om uit de enorme hoeveelheid gegevens nuttige informatie te halen.

Data uit meerdere bronnen

Het laaghangend fruit is inmiddels wel geplukt, meent hij. Alles wat eenvoudig geanalyseerd kan worden, gebeurt al. Lagendijk noemt medische gegevens, waarbij met virtualisatietools bekeken wordt hoe vaak iemand naar de arts gaat, gerelateerd aan medicijngebruik en woonplaats. Hierdoor achterhalen wetenscappers of mensen uit bepaalde steden vaker naar de arts gaan of vaker dezelfde ziektes hebben. Lagendijk: “Het wordt ingewikkelder als je data uit verschillende bronnen combineert. Stel dat je wilt nagaan hoe bepaalde ziektes zich ontwikkelen. Dan moet je onder meer weten wie resistent is, wat mensen eten, of ze ingeënt zijn en waar ze geweest zijn. Zodra het moeilijker is verbanden te leggen, wordt het voor mensen lastig om er een heldere boodschap uit te destilleren.” De computer draagt de gegevens dan wel aan, maar er kan qua analyse door de gebruiker niet mee gedaan worden wat mogelijk is.

Een groene en blauwe achtergrond met binaire codenummers.

Big Data en ethiek gaan soms moeilijk samen.

Wiki Commons, DARPA,CC-0

Niet alleen de hoeveelheid data maakt het lastig, snel wisselende gegevens zijn ook een probleem bij data-analyse, aldus de hoogleraar. Hij maakt de vergelijking met astronomie waar onderzoekers terrabytes aan data verzamelen en analyseren. “De sterren zijn hetzelfde als tienduizend jaar geleden. Maar bij onderzoek naar Twitterdata is dat anders, over een politicus wordt vandaag soms anders getweet dan over een week. Wat de analyse van astronomische gegevens wel weer moeilijk maakt, is dat je bij een terrabyte aan data niet goed kunt zien of alle gegevens kloppen. Bij een kleine dataset zie je het eerder als er een onjuiste meting is gedaan.”

Ethiek

Wie Big Data zegt, zegt eigenlijk ook ethiek. Alles wat instanties verzamelen, kan tegen je gebruikt worden, menen critici. Reist u bijvoorbeeld weleens met de trein? OV-bedrijven weten precies hoe laat u bent ingecheckt en waar u heenging. En met kentekenherkenning is vaak ook duidelijk op welke wegen en in welke parkeergarages u bent geweest. Big brother is watching you. Lagendijk ziet het echter niet zo negatief. “De meeste wetenschappers hebben echt wel aandacht voor het ethische aspect van hun onderzoek. Je moet – met de juiste voorzorgsmaatregelen zoals een lastig te hacken systeem – data kunnen verzamelen en analyseren, zonder over ethische argumenten te struikelen. Je kunt sceptisch zijn, maar de keerzijde is: wat levert het ons op?”

Volgens Lagendijk zijn er meerdere elementen belangrijk als het om privacy en Big Data gaat. Allereerst de wetgeving. Er zijn Europese regels over gegevensgebruik, maar de dataprotectiewet is verouderd en gebaseerd op een privacy-discussie die achterhaald is. De EU-wet stelt dat er persoonsgegevens verzameld mogen worden, zolang vooraf één bekend doel is bepaald. De data mogen niet voor andere doelen gebruikt worden. Maar bij big-data-technologie bestaat er vaak geen doel. Er worden automatisch en massaal gegevens verzameld en opgeslagen. Ook gaat het bij Big Data vaak niet om personen, maar om gedrag- en gedragspatronen.

Verder is het bewustzijn van mensen belangrijk, aldus de hoogleraar. Sommige mensen gaan erg onvoorzichtig met hun wachtwoorden op, versturen info via versleutelde netwerken of gooien alles op Facebook. “Net als op de weg geldt: als je je onvoorzichtig gedraagt gebeuren er ongelukken. En tot slot, technisch wetenschappelijke oplossingen om voordelen te kunnen benutten zonder ethisch onverantwoord me de gegevens om te gaan. Als het om Big Data gaat liggen er grote economische mogelijkheden. Angst of een slechte ervaring mag niet tot een deadlock leiden. Ik heb er zelf bijvoorbeeld geen probleem mee dat camera’s op straat me overal volgen. Er is nogal wat nodig, voordat die beelden in verkeerde handen komen.”

ReactiesReageer