Het ontcijferen van een onbekend schrift is te vergelijken met het leren van een spelletje waarvan je de regels niet kent. Zonder enige houvast moet je uitvinden wat mag en wat niet mag. En daarnaast moet het geheel ook nog een doel, een betekenis hebben. Eeuwenlang waren de Egyptische hiërogliefen onmogelijk te ontcijferen. Dat veranderde plotseling in 1799 met de vondst van de Steen van Rosetta in Egypte. Op de steen stond drie keer dezelfde tekst, één keer in het Grieks, één keer in Egyptische hiërogliefen en één keer in het Demotisch, een ander Oud-Egyptisch schrift. Met deze kennis konden onderzoekers ook andere teksten in hiërogliefen ontcijferen.

Puzzelwerk
Ontcijferaars van schriften hebben altijd gesteld dat logica en intuïtie onontbeerlijk zijn bij het ontcijferen van onbekende schriften. Elk beetje nieuwe informatie is een aanwijzing die kan leiden tot het vinden van het volgende puzzelstukje. Computers beschikken niet over de logica en intuïtie die hiervoor nodig is en zijn daarmee onbruikbaar bij het ontcijferen. Amerikaanse onderzoekers dachten hier anders over en ontwikkelden een computerprogramma dat automatisch het Ugaritisch, een in 1200 v. Chr. uitgestorven taal verwant aan het Hebreeuws, kan vertalen. Zij presenteerden hun resultaten vorige week tijdens de jaarlijkse bijeenkomst van de Association for Computational Linguistics in Zweden.
Tabletten met het Ugaritische schrift zijn voor het eerst in 1929 gevonden in Syrië. Het kostte verschillende onderzoekers drie jaar om de tekst te ontcijferen. De onderzoekers van het Massachusetts Institute of Technology lieten hun computerprogramma het nog eens over doen aan de hand van Hebreeuwse teksten. Het Hebreeuws lijkt zowel qua locatie als qua tijdsperiode op het Ugaritisch, dus de kans is groot dat de onbekende taal daar op zal lijken. Ook menselijke ontcijferaars gebruiken dergelijke aanwijzingen bij hun puzzelwerk.

Vergelijken
De software vergeleek de patronen en frequenties van de symbolen in het Ugaritisch met die van het Hebreeuws. De kans is namelijk groot dat symbolen en reeksen symbolen die in het Ugaritisch vaak voorkomen, in het Hebreeuws ongeveer net zo vaak voorkomen. Zo kon het programma 29 van de 30 verschillende Ugaritische symbolen koppelen aan de 22 verschillende letters uit het Hebreeuwse alfabet. 8 van de Hebreeuwse letters bleken overeen te komen met 2 of 3 van de Ugaritische symbolen.
Daarnaast kon het programma 60 procent van de Ugaritische woorden met dezelfde woordstam als in het Hebreeuws aanwijzen. Dit zijn bijvoorbeeld het Franse ‘homme’ en het Spaanse ‘hombre’, die beide afstammen van het Latijnse woord voor ‘man’. Het onderzoeksteam onder leiding van Regina Barzilay denkt dat hun computerprogramma met enige aanpassingen ook andere geschriften zal kunnen ontcijferen.
Niet alle computerlinguïsten zijn hier echter van overtuigd. “Het Ugaritisch is een eenvoudig en klein schrift dat nauw verwant is aan enkele bekende talen”, aldus Richard Sproat, computerlinguïst aan de Oregon Health en Science University tegen National Geographic. “Het zal niet altijd het geval zijn dat er dergelijke nauw verwante talen beschikbaar zijn.” Barzilay denkt dat dit probleem op te lossen is door het programma het onbekende schrift te laten vergelijken met verschillende talen. Zo wordt de software een soort digitale Steen van Rosetta waarmee de puzzelstukjes van nog niet ontcijferde geschriften ineens op hun plek vallen.
Bron
Benjamin Snyder, Regina Barzilay en Kevin Knight presenteerden hun artikel A statistical model for lost language decipherment tijdens de 48e jaarlijkse bijeenkomst van de Association for Computational Linguistics.
Lees ook:
- Dossier Bedreigde talen
- Het Hebreeuws is niet van deze tijd
- Verdwenen taal
- Schrijven op het plastic van de oudheid
Oeps: Onbekende tag `feed’ met attributen {"url"=>"https://www.nemokennislink.nl/kernwoorden/bedreigde-talen.atom", “max”=>"5", “detail”=>"normaal"}