Faces of Science en historicus Thomas en zijn collega Melvin Wevers dromen van een historisch AI lab, maar wat hebben kunstmatige intelligentie en geschiedenis eigenlijk met elkaar te maken?

19 december 2018

AI, kunstmatige intelligentie, machine learning en algoritmes: je kan geen krant openslaan zonder erover te lezen. De ontwikkeling gaat de laatste jaren razendsnel. Computers verslaan mensen met schaken en het bordspel Go. Algoritmes helpen ons bij het kiezen van kleren, laten ons nieuwe muziek ontdekken en bepalen of we advertenties voor lippenstift of grasmaaiers te zien krijgen.

Daarnaast nemen computergestuurde robots steeds meer werk van ons over. Meestal gaan dit soort verhalen over techniek en de toekomst: “You won’t believe what AI can do in 2020!” Maar kunnen historici dit soort technieken ook gebruiken om met een andere blik naar het verleden te kijken? En wat de ontwikkelaars van Silicon Valley hier op hun beurt weer van leren?

Kunstmatige intelligentie heeft data nodig om patronen te herkennen. Alles wat wij op het internet, bewust of onbewust, over onszelf vertellen en van onszelf laten zien voedt de algoritmes van grote techbedrijven. Hoewel historische bronnen niet precies hetzelfde zijn als dit soort data – ze zijn immers niet born digital – zorgt de grootschalige digitalisering van historische boeken, kranten en andere archieven ervoor dat er, ook over het verleden, steeds meer data beschikbaar zijn. Data die we kunnen gebruiken om algoritmes te trainen.

Patronen

Sinds het eind van de jaren negentig houdt een relatief nieuw veld, de zogenaamde digital humanities, zich bezig met de vraag hoe we gedigitaliseerde bronnen met behulp van digitale technieken kunnen bestuderen. Tot nu toe richtte dit soort onderzoek zich vooral op tekst. Met behulp van OCR (Optical Character Recognition), dat gescande documenten omzet in digitale tekst, en statistische technieken kunnen we bijvoorbeeld patronen in grote hoeveelheden tekst ontdekken.

Door de introductie van Deep Learning, een bepaald type kunstmatige intelligentie, in computer vision, een veld dat technieken ontwikkelt waarmee computers afbeeldingen kunnen analyseren, is het de laatste paar jaar ook mogelijk geworden om patronen in grote hoeveelheden visuele data te herkennen. Google en Facebook gebruiken dit soort technieken om je bijvoorbeeld te vertellen wie er op je foto’s staan, zonder dat je dit zelf hebt aangegeven, of om je te helpen met het vinden van foto’s van bomen of zonsondergangen.

Voor een historicus die visuele cultuur bestudeert zijn dit soort technieken ontzettend interessant. In tegenstelling tot close reading, het één voor één bestuderen van afbeeldingen, kunnen we algoritmes gebruiken om van een afstandje naar patronen in grote hoeveelheden afbeeldingen te zoeken. Dit wordt ook wel distant viewing genoemd.

Aan het begin van de jaren twintig vindt een enorme beeldexplosie plaats en in 1925 staan voor het eerst meer foto’s dan illustraties in Nederlandse kranten.
Miriam Loois

Zo onderzocht ik bijvoorbeeld samen met Willem Jan Faber, een onderzoeksprogrammeur bij de Koninklijke Bibliotheek, hoe we computer vision technieken kunnen inzetten om te bekijken wanneer Nederlandse kranten voor het eerst op grote schaal foto’s begonnen te publiceren. Nadat we automatisch 313.000 afbeeldingen uit gedigitaliseerde kranten hadden gehaald, pasten we een neuraal netwerk, een speciaal soort algoritme, toe om deze in te delen in illustraties en foto’s. Afbeelding 1 laat zien dat er aan het begin van de jaren twintig een enorme beeldexplosie plaats vindt en dat er in 1925 voor het eerst meer foto’s dan illustraties in Nederlandse kranten staan. Mijn collega Melvin gebruikte, ook bij de KB, algoritmes om visuele patronen in een grote database van krantenadvertenties te herkennen (afbeelding 2).

Mijn collega Melvin gebruikte, ook bij de KB, algoritmes om visuele patronen in een grote database van krantenadvertenties te herkennen
Thomas Smits en Melvin Wevers voor NEMO Kennislink

Wat programmeurs van historici leren

Historici hebben dus baat bij algoritmes, maar kunnen programmeurs ook iets van historici leren? Ik denk van wel. Programmeurs hebben ervoor gezorgd dat algoritmes goed zijn geworden in het vinden van signalen in visuele data, maar naar welke signalen moeten ze eigenlijk zoeken? Wat is het verschil tussen wat er op een afbeelding staat en de betekenis van een afbeelding? Kunnen we algoritmes ook trainen om de betekenis van een afbeelding te herkennen? Zijn dit soort betekenissen universeel? Kunnen we de betekenis van een beeld achterhalen zonder allerlei tekst, zoals de titel, te bestuderen? Algoritmes kijken, voorlopig, maar op één manier, maar geldt dit ook voor mensen? Zien we hetzelfde? En als wij niet hetzelfde zien, moeten algoritmes dit dan wel doen?

Met dit soort vragen, die steeds relevanter worden voor programmeurs, houden we ons in de humanities al een tijdje bezig. Literair historicus Ted Underwood stelt dan ook dat de geesteswetenschappen, juist in de eeuw van machine learning, onontbeerlijk zijn. Zouden we Google bijvoorbeeld kunnen helpen om hun algoritmes meer culturally diverse te maken? Het bedrijf erkent het gebrek hieraan als een probleem, maar richt zich voor een oplossing vooral op data en techniek. Kort gezegd: het probleem is dat algoritmes nog niet goed genoeg werken of dat ze zijn getraind op witte en Amerikaanse data. Natuurlijk heeft het bedrijf hier voor een deel gelijk, maar is er ook niet een diepere oorzaak? Is het wel zinvol om een universeel algoritme te trainen dat voor alle mensen altijd hetzelfde ziet? Of worden de classificaties van algoritmes betekenisvoller wanneer ze meer als mensen kijken?

Stoomtrein
By David Stowell, CC BY-SA 2.0 via Wikipedia commons

Het is belangrijk dat algoritmes niet alleen meer oog krijgen voor culturele diversiteit, maar ook voor historiciteit: het feit dat hoe dingen eruit zien en, veel belangrijker, wat ze betekenen altijd historisch gesitueerd is. Een locomotief uit de negentiende eeuw en de Japanse Shinkansen lijken weinig op elkaar, maar representeren wel hetzelfde: een trein.

Een locomotief uit de negentiende eeuw en de Japanse Shinkansen lijken weinig op elkaar, maar representeren wel hetzelfde: een trein.
Rsa CC-BY-SA-3.0 via Wikimedia Commons

Dit probleem komt ook naar voren in het feit dat visuele classificatiesoftware steeds slechter is in het herkennen van de categorie ‘website.’ Veel algoritmes zijn getraind op data van de zogenaamde ImageNet wedstrijd uit 2010. Hoewel er aan katten weinig verandert is, hebben websites een ander visueel jasje gekregen. Dit soort verschillen, die wij nauwelijks opmerken omdat de verandering geleidelijk gaat, zorgen dus nu al, acht jaar na de Deep Learning revolutie, voor problemen: algoritmes zijn bijvoorbeeld minder goed in het herkennen van de categorie ‘websites’.

Wat zouden we doen met 1 miljoen? Wat kunnen historici en programmeurs van elkaar leren? Welke problemen kunnen ze oplossen als ze samenwerken? Geef ons een lab en we laten het zien! Computer Vision biedt ons een nieuwe blik op het visuele verleden. En als we de geschiedenis van visuele cultuur beter begrijpen, leidt dit ongetwijfeld tot betere algoritmes in de toekomst.

Over hun onderzoek bij de KB schreven Melvin en Thomas het artikel “The Visual Digital Turn. Using Neural Networks to Study Historical Images” dat binnenkort verschijnt in Digital Scholarship in the Humanities (OUP)

Reageer

Serie

Face met miljoen

19 december 2018

Wat zou je doen met een miljoen?

Terwijl iedereen met een loterijlot droomt over een nieuw huis of dure auto, kies ik voor iets anders: mijn eigen MRI-scanner!

19 december 2018

Wat zou je doen met een miljoen?

Met een miljoen zou ik een interdisciplinair sociaalwetenschappelijk team aanstellen dat zich gezamenlijk en gericht buigt over urgente onderzoeksproblemen.

19 december 2018

Wat zou je doen met een miljoen?

Als ik een miljoen cadeau kreeg om te spenderen aan wetenschap dan droom ik over drie doelen. Mijn onderzoeksideeën uitvoeren, een ondersteuningsfonds oprichten en werkdruk aanpakken.

19 december 2018

Wat zou je doen met een miljoen?

Met een miljoen zou ik een grootschalige opgraving willen opzetten in het centrum van Antakya. We weten maar bar weinig over de archeologie van deze oude metropool. Toch lag hier vroeger de antieke...

19 december 2018

Wat zou je doen met een miljoen?

Na vier jaar onderzoek naar hoe overstromingen en klimaatverandering de huizenmarkt in kustgebieden beïnvloeden, zou ik graag een miljoen hebben voor het volgen van mijn hart. Door olifanten en neu...

19 december 2018

Wat zou je doen met een miljoen?

Ik kan een hele hoop leuke onderzoeken bedenken om met een miljoen te doen. Maar de kracht van goede wetenschappers is om veel te bereiken met weinig. Als beginnend wetenschapper zou ik daarom eers...

19 december 2018

Wat zou je doen met een miljoen?

Wat zou ik doen met een miljoen? “Meer onderzoek doen” is waarschijnlijk het juiste antwoord. Maar stiekem besteed ik het geld liever aan iets anders. Namelijk: aan een prachtige film maken over he...

19 december 2018

Wat zou je doen met een miljoen?

Met een miljoen zou ik een statistiek-superheldenteam beginnen. Met deze statistiek-Avengers wil ik statistieke problemen binnen de universiteit aanvallen.

19 december 2018

Wat zou je doen met een miljoen?

Faces of Science en historicus Thomas en zijn collega Melvin Wevers dromen van een historisch AI lab, maar wat hebben kunstmatige intelligentie en geschiedenis eigenlijk met elkaar te maken?

19 december 2018

Wat zou je doen met een miljoen?

Stel je voor, op een dag zegt de Nederlandse regering: “Wen, je bent super gaaf (ik: zekerrrr!!!) en een geweldige onderzoeker, hier is een miljoen euro voor je onderzoek!” Veel van mijn vriendinne...

19 december 2018

Wat zou je doen met een miljoen?

Veel gedragsonderzoek wordt uitgevoerd met hoogopgeleide, westerse proefpersonen. Daardoor is moeilijk om algemene uitspraken over menselijk gedrag te doen. Binnen de taalwetenschap wordt ook veel ...

19 december 2018

Faces of Science over wat ze doen met een extra miljoen

Wat zou je als wetenschapper graag doen met een miljoen onder je kerstboom? Onze Faces of Science weten het wel!

19 december 2018

Wat zou je doen met een miljoen?

Met een miljoen kan je het salaris van vier promovendi betalen, voor vier jaar. Naast dit salaris is er in de rechtstheorie weinig meer nodig dan een stapel boeken en een bezoek aan enkele conferentie...

20 december 2018

Wat zou je doen met een miljoen?

Een miljoen in de wetenschap… wat zou jij ermee doen? Een nieuwe studie opzetten, nieuwe collega’s aannemen of meer labapparatuur kopen?

Hoe algoritmes ons helpen anders naar de geschiedenis te kijken

Patronen

Wat programmeurs van historici leren

Face met miljoen

Wat zou je doen met een miljoen?

Wat zou je doen met een miljoen?

Wat zou je doen met een miljoen?

Wat zou je doen met een miljoen?

Wat zou je doen met een miljoen?

Wat zou je doen met een miljoen?

Wat zou je doen met een miljoen?

Wat zou je doen met een miljoen?

Wat zou je doen met een miljoen?

Wat zou je doen met een miljoen?

Wat zou je doen met een miljoen?

Faces of Science over wat ze doen met een extra miljoen

Wat zou je doen met een miljoen?

Wat zou je doen met een miljoen?

De risico's van chatbottherapie

Interview met de schrijvers van ‘En toen brak de pleuris uit’

Over gewicht: afslankmedicatie

Voor straf: over opvoeden en straffen

Wetenschap doe je samen!

Stuur ons een reactie, vraag of suggestie