Je leest:

De Steen van Rosetta gaat digitaal

De Steen van Rosetta gaat digitaal

Computer helpt onbekend schrift ontcijferen

Auteur: | 21 juli 2010

Een onbekend schrift ontcijferen is een flinke uitdaging. Waar begin je? En lijkt de onbekende taal eigenlijk wel op een bekende taal? In de 19e eeuw werden onderzoekers geholpen door de Steen van Rosetta, vandaag de dag kunnen computers van grote betekenis zijn.

Het ontcijferen van een onbekend schrift is te vergelijken met het leren van een spelletje waarvan je de regels niet kent. Zonder enige houvast moet je uitvinden wat mag en wat niet mag. En daarnaast moet het geheel ook nog een doel, een betekenis hebben. Eeuwenlang waren de Egyptische hiërogliefen onmogelijk te ontcijferen. Dat veranderde plotseling in 1799 met de vondst van de Steen van Rosetta in Egypte. Op de steen stond drie keer dezelfde tekst, één keer in het Grieks, één keer in Egyptische hiërogliefen en één keer in het Demotisch, een ander Oud-Egyptisch schrift. Met deze kennis konden onderzoekers ook andere teksten in hiërogliefen ontcijferen.

De Steen van Rosetta bleek de sleutel tot de ontcijfering van de Egyptische hiërogliefen. Op de steen staat drie keer dezelfde tekst: één keer in het Grieks, één keer in hiërogliefen en één keer in het Demotisch. De Steen van Rosetta ligt nu in het British Museum in Londen. In het Rijksmuseum voor Oudheden in Leiden is een kopie te bezichtigen.

Puzzelwerk

Ontcijferaars van schriften hebben altijd gesteld dat logica en intuïtie onontbeerlijk zijn bij het ontcijferen van onbekende schriften. Elk beetje nieuwe informatie is een aanwijzing die kan leiden tot het vinden van het volgende puzzelstukje. Computers beschikken niet over de logica en intuïtie die hiervoor nodig is en zijn daarmee onbruikbaar bij het ontcijferen. Amerikaanse onderzoekers dachten hier anders over en ontwikkelden een computerprogramma dat automatisch het Ugaritisch, een in 1200 v. Chr. uitgestorven taal verwant aan het Hebreeuws, kan vertalen. Zij presenteerden hun resultaten vorige week tijdens de jaarlijkse bijeenkomst van de Association for Computational Linguistics in Zweden.

Tabletten met het Ugaritische schrift zijn voor het eerst in 1929 gevonden in Syrië. Het kostte verschillende onderzoekers drie jaar om de tekst te ontcijferen. De onderzoekers van het Massachusetts Institute of Technology lieten hun computerprogramma het nog eens over doen aan de hand van Hebreeuwse teksten. Het Hebreeuws lijkt zowel qua locatie als qua tijdsperiode op het Ugaritisch, dus de kans is groot dat de onbekende taal daar op zal lijken. Ook menselijke ontcijferaars gebruiken dergelijke aanwijzingen bij hun puzzelwerk.

Het computerprogramma deed enkele uren over het ontcijferen van het Ugaritisch. Menselijke ontcijferaars hadden een paar jaar nodig voor de klus. Als eerste herkende de Duitse onderzoeker Hans Bauer twee Ugaritische letters die in het Hebreeuws in dezelfde patronen voorkomen. Op basis hiervan vond hij enkele woorden die leken op Hebreeuwse woorden en de nieuwe letters die dit opleverde leidden tot weer nieuwe ontdekkingen. Zo werd beetje bij beetje de puzzel opgelost.

Vergelijken

De software vergeleek de patronen en frequenties van de symbolen in het Ugaritisch met die van het Hebreeuws. De kans is namelijk groot dat symbolen en reeksen symbolen die in het Ugaritisch vaak voorkomen, in het Hebreeuws ongeveer net zo vaak voorkomen. Zo kon het programma 29 van de 30 verschillende Ugaritische symbolen koppelen aan de 22 verschillende letters uit het Hebreeuwse alfabet. 8 van de Hebreeuwse letters bleken overeen te komen met 2 of 3 van de Ugaritische symbolen.

Daarnaast kon het programma 60 procent van de Ugaritische woorden met dezelfde woordstam als in het Hebreeuws aanwijzen. Dit zijn bijvoorbeeld het Franse ‘homme’ en het Spaanse ‘hombre’, die beide afstammen van het Latijnse woord voor ‘man’. Het onderzoeksteam onder leiding van Regina Barzilay denkt dat hun computerprogramma met enige aanpassingen ook andere geschriften zal kunnen ontcijferen.

Niet alle computerlinguïsten zijn hier echter van overtuigd. “Het Ugaritisch is een eenvoudig en klein schrift dat nauw verwant is aan enkele bekende talen”, aldus Richard Sproat, computerlinguïst aan de Oregon Health en Science University tegen National Geographic. “Het zal niet altijd het geval zijn dat er dergelijke nauw verwante talen beschikbaar zijn.” Barzilay denkt dat dit probleem op te lossen is door het programma het onbekende schrift te laten vergelijken met verschillende talen. Zo wordt de software een soort digitale Steen van Rosetta waarmee de puzzelstukjes van nog niet ontcijferde geschriften ineens op hun plek vallen.

Bron

Benjamin Snyder, Regina Barzilay en Kevin Knight presenteerden hun artikel A statistical model for lost language decipherment tijdens de 48e jaarlijkse bijeenkomst van de Association for Computational Linguistics.

Lees ook:

Oeps: Onbekende tag `feed’ met attributen {"url"=>"https://www.nemokennislink.nl/kernwoorden/bedreigde-talen.atom", “max”=>"5", “detail”=>"normaal"}

Dit artikel is een publicatie van NEMO Kennislink.
© NEMO Kennislink, sommige rechten voorbehouden
Dit artikel publiceerde NEMO Kennislink op 21 juli 2010
NEMO Kennislink nieuwsbrief
Ontvang elke week onze nieuwsbrief met het laatste nieuws uit de wetenschap.