Voor Nederland Leest schreef Ronald Giphart een verhaal samen met een literaire robot

Op 1 november 2017 was de aftrap van Nederland Leest met het thema ‘robotica’. Het geschenkboek bevat behalve negen verhalen van Isaac Asimov, een vervolgverhaal van Ronald Giphart en Asibot. Deze literaire robot werd ontwikkeld door de Universiteit van Antwerpen en het Meertens Instituut.

3 november 2017

Is een computer in staat om een verhaal te schrijven? Die vraag kreeg taaltechnoloog Folgert Karsdorp deze zomer van het CPNB. Hij moet er nog steeds een beetje om lachen, want zover is de technologie nog lang niet. Een lopende tekst kan hij nog wel genereren, maar een coherent geheel is het niet. Maar toen kreeg Karsdorp een idee: zou het niet veel leuker zijn om een Nederlandse schrijver een interactie aan te laten gaan met een computer?

“Dan laat je ze allebei doen waar ze goed in zijn”, licht Karsdorp toe. “De computer genereert tekst, maar de schrijver houdt de grotere lijn van het verhaal in de gaten. Want dat is typisch iets waar die computersystemen moeite mee hebben: in vooruit plannen en richting geven.”

Taaltechnoloog Folgert Karsdorp en schrijver Ronald Giphart met het Nederland Leest-geschenk *Ik, robot*.
CPNB

Shakespeare

Ronald Giphart werd gevraagd om samen met een computersysteem een vervolg te schrijven op de verhalen van Asimov, waarin robots centraal staan. Dat juist Giphart hiervoor werd benaderd, kwam niet geheel uit de lucht vallen. Hij deed namelijk al vaker schrijversexperimenten. “Beter konden we ons niet wensen”, zegt Karsdorp over de samenwerking met Giphart. “Dat vond ik het allerleukste aan dit experiment: dat er een schrijver bij betrokken was die niet alleen maar moest lachen om ons computermodel, maar zijn best deed eruit te halen wat erin zit.”

Karsdorp ontwikkelde de literaire robot samen met Mike Kestemont, Enrique Manjavacas en Ben Burtenshaw van de Universiteit Antwerpen, die al langer werken aan computationele tekstgeneratiesystemen. Dat zijn computersystemen die nieuwe tekst kunnen genereren op basis van een grote hoeveelheid bestaande teksten. Zo kun je bijvoorbeeld recepten uit kookboeken invoeren, en er een nieuw recept uit laten rollen. Ook bestaat er een systeem dat gevoed is met teksten van Shakespeare, en dat op basis daarvan nieuwe Shakespeareteksten kan schrijven.

Revimov

Om Asibot te ontwikkelen voerden de onderzoekers tienduizenden Nederlandstalige boeken in, variërend van de Bijbel tot Baantjer. Maar ook Vondel staat erin en zelfs de vertaling van Mein Kampf. “Die teksten werden gebruikt om een achtergrondmodel te maken”, vertelt Karsdorp, “om het systeem het Nederlands aan te leren. Op basis daarvan leert hij wat een woord is en meer basale dingen.”

Daarna werd Asibot opnieuw getraind om in bepaalde stijlen te kunnen schrijven. Het verhaal dat Giphart schreef moest uiteindelijk vooral aansluiten bij de eerdere verhalen van Asimov. “Daarom zat er natuurlijk veel Asimov in ons model en hebben we ook geprobeerd om bestaande Nederlandse auteurs te mixen met Asimov, resulterend in verschillende bots. Zoals de Revimov: dan krijg je een Reviaanse stijl maar het gaat wel over robots. In zijn verhaal gaat Giphart voortdurend de dialoog aan met de verschillende bots. “

Voor Nederland Leest ontwikkelden het Meertens Instituut en de Universiteit Antwerpen een literaire robot met verschillende schrijfstijlen. — Het systeem werkt als volgt: je typt een stukje tekst in, bijvoorbeeld een paar woorden of een zin. De computer leest dan tweehonderd letters terug en die tekst gebruikt hij als input om een stuk nieuwe tekst te genereren. De gele tekst hier komt van de Giphart-bot.
Meertens Instituut

Statistiek

Het systeem werkt op basis van statistiek, legt de onderzoeker uit. In feite imiteert de computer onze hersenen door eigen patronen te ontdekken in grote hoeveelheden data. Neurale netwerksystemen worden ze ook wel genoemd. Karsdorp: “Die modellen zijn bedacht in de jaren 90, maar hebben nu pas een actieve toepassing, omdat hedendaagse computers over de rekenkracht beschikken die hiervoor nodig is. De modellen werken met waarschijnlijkheidsdistributies: in dit geval berekent Asibot voor elke letter welke volgende letter het meest waarschijnlijk is.”

Een voorbeeld: stel je begint met de letter e. Dan berekent de computer welke letters waarschijnlijk zijn na een e. Nog een e is heel waarschijnlijk, maar ook een r of een n. Een z is al minder waarschijnlijk, en een a is vrij onwaarschijnlijk omdat we in het Nederlands geen opeenvolging kennen van e en a aan het begin van een woord. Kiest de computer voor ee, dan volgt daarna een nieuwe waarschijnlijkheidsverdeling. Dat er nog een e volgt, is bijvoorbeeld heel onwaarschijnlijk.

Hindernissen

“Als je het model goed traint, levert het fantastische resultaten op”, zegt Karsdorp enthousiast. “Dan kan het elk soort zin produceren, wat eigenaardig is als je bedenkt dat het letter voor letter gebeurt. Maar alle zinsconstructies, maakt niet uit hoe moeilijk, leert hij zelf te maken op basis van al die input.” Dat de computer goede zinnen maakt, komt door een specifieke eigenschap van neurale netwerkmodellen: ze hebben een langere aandachtsspanne dan andere modellen. Er vindt als het ware steeds interactie plaats tussen het lange- en kortetermijngeheugen, net als in onze hersenen.

Tegelijkertijd heeft Asibot nog lang niet dezelfde aandachtsspanne als mensen. Zo weet hij na een paar zinnen vaak niet meer wat het oorspronkelijke onderwerp was. “Het systeem reageert steeds op wat er recentelijk is gezegd, namelijk in de vorige tweehonderd letters. Bovendien kan hij niet vooruit plannen. Dus om een echt autonome literaire robot te maken zijn er nog heel wat hindernissen te nemen. Maar nu hadden we Giphart om het proces te bewaken.”

Giphart moest de tekst dus steeds weer repareren. “Dat deed hij door het invoegen van verbindingswoordjes of soms een hele paragraaf. De verhouding tussen Giphart en de bot is ongeveer fiftyfifty.” De onderzoekers hebben dit hele schrijfproces van Giphart opgeslagen. “We kunnen letter voor letter de opbouw van zijn tekst zien. Literatuurwetenschappers dromen van zo’n dataset. Dat je daadwerkelijk kunt zien hoe zo’n tekst tot stand komt.”

Kijkje in de keuken

Een ander voordeel van dit experiment is dat Asibot door de feedback van Giphart verbeterd kan worden. “Nou heb je nog niet zo veel aan de feedback van één gebruiker, maar als je heel veel mensen hebt die voor een deel dezelfde beslissingen nemen, dan kan het systeem daarvan leren.” Daarom gaat Asibot ook tijdelijk online voor andere gebruikers. Er is zelfs een schrijfwedstrijd aan verbonden. Karsdorp: “Op die manier kunnen we nog meer data binnenhalen en zo het systeem nog beter maken.”

Ook de lezer kan binnenkort een kijkje in de keuken nemen. Halverwege de maand brengt het CPNB een versie van het verhaal online met kleurtjes. Daarmee kun je voor elke passage zien welke van de robot afkomstig is en welke van Giphart. De titel De robot van de machine is de mens komt trouwens van de bot, merkt Karsdorp op. “Het verhaal is ook een soort whodunit, want in de verhalen van Asimov is er een moord gepleegd en de enige verdachte is een robot. Dus Giphart dacht: laat ik aan een robot vragen wie het heeft gedaan, en toen kwam de computer met dit soort orakeltaal. Die interactie tussen robot en mens is soms wat unheimisch, maar vooral heel leuk om te lezen.”

Dit artikel is een publicatie van Meertens Instituut

Reageer