Computers worden steeds beter in taal

Nog niet zo lang geleden lachten we computers uit om hun kromme vertalingen. Maar de taalvaardigheid van computers gaat met sprongen vooruit. Moeten vertalers vrezen voor hun baan? Specialisten uit de wetenschap, de overheid en de industrie spraken erover tijdens het DRONGO talenfestival. NEMO Kennislink was erbij.

31 oktober 2017

Computers worden steeds intelligenter. Denk alleen al aan de IBM-computer Watson die zijn menselijke tegenstanders versloeg bij de Amerikaanse televisiequiz Jeopardy. Dat deed hij door allerlei moeilijke vragen op de juiste manier te interpreteren en vervolgens ook nog eens correcte antwoorden te formuleren.

Ook de automatische vertaalprogramma’s worden steeds beter en de tijd dat een chatbot blikkerig sprak is voorgoed voorbij. Tijdens het DRONGO talenfestival spraken specialisten met elkaar over deze snelle ontwikkelingen binnen de kunstmatige intelligentie. Moeten tolken en vertalers, en misschien zelfs schrijvers, straks vrezen voor hun baan?

Herbert Blankesteijn (discussieleider), Frieda Steurs, Luciën Burm en Daniël Prou naast elkaar aan tafel. Dit was een panelsessie tijdens het DRONGO talenfestival 2017 — Panelsessie tijdens het DRONGO talenfestival 2017. V.l.n.r. Herbert Blankesteijn (discussieleider), Frieda Steurs, Luciën Burm, Daniël Prou.
Mathilde Jansen voor NEMO Kennislink

Nee, is het volmondige antwoord van de aanwezige kenners bij het DRONGO talenfestival. Het zal een opluchting zijn voor de vele tolken en vertalers die vanmiddag naar deze sessie over kunstmatige intelligentie gekomen zijn. De sfeer is ronduit positief: de sprekers op het podium zijn zelfs van mening dat er alleen maar werk bij komt voor de genoemde beroepsgroep. Zoals Frieda Steurs, directeur van het Instituut voor Nederlandse Taal, zegt: “Bedrijven worden alleen maar internationaler, dus is er een groeiende behoefte aan vertalers. En juist voor vertalers die de techniek omarmen, is er veel werk.”

Hulpmiddel

Steurs betoogt dat automatische vertaling en spraakherkenning het werk van vertalers alleen maar ten goede komen: “Ze kunnen nu in dezelfde tijd meer werk afleveren. Als de computer gewend is aan je stem, spreek je de vertaling gewoon in. Dat gaat drie keer zo snel als typen en je voorkomt ook nog eens RSI-problemen.” Daniël Prou werkt voor de Europese Commissie en beaamt dit. Bij de Europese Commissie worden vertalers zelfs getraind in het gebruik van vertaalmachines. “Ze gebruiken computervertalingen op dagelijkse basis, om een globale impressie te krijgen van een tekst. Voor hen is een automatische vertaling een startpunt, waardoor ze sneller kunnen vertalen.”

Automatische vertalingen dienen dus vooral als hulpmiddel. Want hoewel computers steeds slimmer worden, gaat er ook nog veel mis, weet Prou. “Machine learning werkt altijd met taalparen. Hoe meer twee talen op elkaar lijken, hoe makkelijker de vertaling te maken is. Dat geldt niet alleen voor computers maar net zo goed voor menselijke vertalers.” Vanuit het Engels zijn bijvoorbeeld het Hongaars, Fins, Duits en Ests nog moeilijk te vertalen. Een bekend struikelblok is de woordvolgorde in het Duits, waarbij alle werkwoorden achteraan in de zin staan. In talen als het Hongaars en het Fins heeft de computer moeite met het genereren van de juiste vervoegingen.

In dit artikel op NEMO Kennislink legt Antal van den Bosch uit hoe automatische vertalingen beter worden dankzij de toepassing van kunstmatige neurale netwerken. Overigens is de basis daarvan al gelegd in de jaren 1980, maar toen hadden computers nog niet de rekenkracht om die netwerken op grote schaal te laten draaien.

Hamza Butt / Flickr (CC BY-ND 2.0)

Bob en Alice

Op dit vlak is er wel een belangrijke verandering gaande. Vertaalsoftware wordt namelijk steeds beter door deep learning, gebaseerd op kunstmatige neurale netwerken. Daarover vertelt Boris Boonzajer Flaes. Hij is gadgetspecialist en volgt nieuwe technische ontwikkelingen op de voet. Bij deep learning ontwikkelt de computer zijn eigen algoritme op basis van grote hoeveelheden data op internet en legt als het ware zelf de juiste verbindingen in het computerbrein.

Boonzaajer vertelt hoe onderzoekers deze techniek gebruikten om de computer het spelletje Space Invaders aan te leren: na een nacht kon het programma dit perfect spelen. Ook taal leren computerprogramma’s door een eigen algoritme te creëren op basis van grote hoeveelheden data. Bij Facebook hebben ze er al mee geëxperimenteerd: daar werden de robots Bob en Alice in het leven geroepen, die moesten onderhandelen over de verkoop van artikelen in de Facebookshop. Bob en Alice ontwikkelden tijdens de onderhandelsessies hun eigen efficiënte taal, die voor de onderzoekers abracadabra was.

Datagedreven

Luciën Burm gebruikt Watson-technologie in zijn bedrijf dat tools ontwikkelt die communicatie tussen mens en machines mogelijk maken. Hij beschrijft dezelfde ontwikkeling bij Google Translate: ook daar werkt men nu met datagedreven algoritmes, oftwel deep learning. Prou vertelt dat ze bij de Europese Commissie ook voor het Hongaars zijn overgestapt op zo’n vertaalprogramma, wat leidde tot betere resultaten. Maar hij waarschuwt dat het niet een oplossing is voor iedere willekeurige taal, want er moeten wel genoeg digitale data aanwezig zijn. Vooral kleine talen ondervinden nadeel bij _deep learning_-software.

Voorlopig biedt de voortschrijdende technologie dus alleen maar kansen voor vertalers. En in sommige branches zal vertalen nog op de ouderwetse manier doorgaan, zoals bij het vertalen van juridische contracten en andere privacygevoelige documenten of bij het live tolken.

Toekomstmuziek

Maar hoelang duurt het nog voordat computers net zo goed zijn in taal als mensen? Volgens de deelnemers is dat nog echt toekomstmuziek, want een cruciaal aspect ontbreekt in artificiële intelligentie, namelijk kennis van de wereld. Prou: “De vertaling is nu nog enkel een voorspelling op basis van andere vertalingen, zonder context. Dus op een of andere manier moet je kennis van de context zien toe te voegen, maar vooralsnog is dat te kostbaar.” Burm ziet wel een mogelijkheid: “We hebben Google, en Google heeft toegang tot heel veel data.”

Tot slot is schrijver Ronald Giphart aan het woord. Hij schreef een verhaal in samenwerking met een literaire robot. Onderzoekers van het Meertens Instituut en de Universiteit Antwerpen ontwikkelden deze robot door zo’n tienduizend boeken in een computer in te lezen. Zo ontstonden unieke fingerprints voor verschillende bekende schrijvers. Op basis van een willekeurig begin, zoals een of meerdere woorden, maakt de computer een vervolg op je tekst.

Maar over het algemeen moest Giphart die tekst grondig herschrijven. “Het was harder werken dan normaal.” In volledige autonome robotschrijvers gelooft Giphart daarom niet. “De redacteur die mijn teksten las wist niet welke zinnen van mij kwamen en welke van de robot. Maar bij zinnen van de robot kwam steevast de opmerking: ‘Heb je soms drugs gebruikt?’”

Reageer

Computers worden steeds beter in taal

Hulpmiddel

Bob en Alice

Datagedreven

Toekomstmuziek

Onze leestips

‘Wie niet het best is, moet het slimst zijn’

Gaan voor goud: sportinnovaties

Knalroze catwalk en boerenverstand op Zwarte Cross

Embryo-modellen shinen met Holland's Next Embryo Model

Gesprekken als superfood voor ons denken

Recensie ‘Waarom we beter denken dan we denken’

Sleutelen aan voedsel

Fitte mannen en feestende vrouwen

Later in beeld: m/v-verschillen

Alleen maar een tekstherkauwer

Superkracht AI: Mark Dingemanse

Stuur ons een reactie, vraag of suggestie