Je leest:

Rijmen met Google Translate

Rijmen met Google Translate

Auteur: | 22 oktober 2010

Het vertalen van een gedicht is misschien wel de moeilijkste taak die je een vertaler voor kunt leggen. Niet alleen de betekenis, maar ook de vorm moet goed worden omgezet in de doeltaal. Taaltechnologen hebben daarom altijd gesteld dat het automatisch vertalen van poëzie een brug te ver is. Google probeert het toch.

Een gedicht is niet zomaar een tekst. Naast de betekenis is ook de vorm in een gedicht erg belangrijk. Soms rijmen de zinnen op elkaar, soms ook niet. Vaak lopen de zinnen in een bepaald ritme, het metrum. Daarnaast heb je ook dichtvormen die specifieke eisen stellen aan de lengte van de regels. Een haiku bijvoorbeeld bestaat uit drie regels waarvan de eerste en de derde vijf lettergrepen telt, en de tweede zeven.

Statistiek

Een perfect vertaald gedicht brengt naast de betekenis, ook al deze vormaspecten over zoals de dichter ze bedoeld heeft. In de praktijk blijkt dat echter een onmogelijke taak: meestal gaat een gedeelte van de inhoud of de vorm verloren in het vertaalproces. Het is een puzzel die volgens velen alleen door mensen opgelost kan worden. Google houdt wel van een uitdaging en probeert nu haar Google Translate ook gedichten te laten vertalen. De resultaten daarvan presenteerden de onderzoekers vorige week tijdens de EMNLP-conferentie in Amerika.

De wetenschappers van Google beseffen heel goed dat de taak die ze op zich nemen niet de makkelijkste is, maar ze denken dat juist zíj in staat zijn om de puzzel op te lossen. Google vertaalt met behulp van statistiek: door heel veel teksten te vergelijken, kiest ze die woorden die het beste passen bij de te vertalen tekst. Dat is een andere manier dan de regelgebaseerde methode, die eerst de zinstructuur ontleedt en omzet naar de doeltaal, waarna de juiste woorden op de juiste plek worden ingevuld. Omdat Google met haar methode over heel veel mogelijke vertalingen beschikt, verwacht ze dat er altijd wel eentje bij zal zitten die voldoet aan de vormeisen die het gedicht stelt.

Bakvorm

Het gedicht dat Google’s systeem moet vertalen zal eerst geanalyseerd moeten worden: welke zinnen rijmen op elkaar? En wat is het metrum van het gedicht? Hiervoor gebruikt Google een speciaal uitspraakwoordenboek. Daar staat precies in hoe een woord klinkt en op welke lettergreep de klemtoon ligt. Er bestaan vele soorten rijm, maar om het zichzelf niet al te moeilijk te maken, kiest Google ervoor alleen naar de laatste lettergreep te kijken. Als de laatste twee klanken van woorden overeenkomen beschouwt Google ze als rijmend.

Deze analyse levert een soort ‘bakvorm’ waarin de vertaling die Google maakt zal moeten passen. Als de eerste keus vertaling niet past zoekt het systeem verder naar een vertaling met dezelfde betekenis die wel aan de vormeisen voldoet.

Openbaar

Met deze methode zijn Google’s onderzoekers gaan testen. Ze gebruikten een grote database met dezelfde teksten in het Frans en Engels. De Franse teksten vertaalden ze naar het Engels, telkens met een vooraf bepaalde bakvorm. Daarnaast vertaalden de onderzoekers een Franse vertaling van een gedicht van de Britse schrijver en dichter Oscar Wilde terug naar het Engels. Zo konden ze de kunstmatige vertaling vergelijken met het origineel.

Enkele resultaten

Originele vertaling van Google A police spokesman said three people had been arrested and the material was being examined.

Poëtische vertaling van Google (klemtoon schuingedrukt) An of ficer sta ted the three were ar res ted and that the e quip ment is cur rently tes ted

Origineel Oscar Wilde Vertaling Google
He did not wring his hands, as do Without hands twisted like these men,
Those witless men who dare Poor men without hope, dare
To try to rear the changeling Hope To nourish hope in vault
In the cave of black Despair Of desperation there
He only looked upon the sun And looked toward the sun, drink cool
And drank the morning air Until the evening air

Na evaluatie concludeert Google dat het systeem zeker werkt, maar dat de experts ook gelijk hebben. Het vertalen van een gedicht gaat altijd ten koste van vorm of inhoud. Het systeem heeft vooral moeite met het vinden van juiste rijmwoorden aan het eind van een regel. Voorlopig is de gedichtenvertaler nog te traag om hem openbaar te maken, maar Google hoopt dat in de toekomst iedereen zijn poëzie automatisch kan laten vertalen.

Zie ook:

Oeps: Onbekende tag `feed’ met attributen {"url"=>"https://www.nemokennislink.nl/kernwoorden/vertalen.atom", “max”=>"5", “detail”=>"normaal"}

Dit artikel is een publicatie van NEMO Kennislink.
© NEMO Kennislink, sommige rechten voorbehouden
Dit artikel publiceerde NEMO Kennislink op 22 oktober 2010
NEMO Kennislink nieuwsbrief
Ontvang elke week onze nieuwsbrief met het laatste nieuws uit de wetenschap.