Je leest:

De computer als assistent-taalkundige

De computer als assistent-taalkundige

Auteur: | 20 april 2011

In het pre-computertijdperk was tekstanalyse vaak monnikenwerk. Tegenwoordig fungeert de computer als assistent-onderzoeker. Dankzij computerlinguïstiek is het mogelijk om een grootschalige en consistente analyse te maken van een ‘corpus’, een grote verzameling teksten. Dirk Bakker zette deze techniek in voor zijn promotieonderzoek naar een oude Syrische tekst.

Dirk Bakker.

Bakkers onderzoek is onderdeel van ‘Turgama’, een project van het Instituut Godsdienstwetenschappen, geleid door dr. Wido van Peursen. In het onderzoek wordt de Syrische vertaling van de Hebreeuwse Bijbel grondig geanalyseerd.

Het project is een vervolg op het gelijknamige Vidi-onderzoeksproject, dat liep van 2005 tot 2010. ‘Turgama’ betekent zowel ‘interpretatie’ als ‘vertaling’ in het Syrisch.

IJkpunt voor Bijbelteksten

Bakker is een van de Leidse taalwetenschappers die de computer inschakelt bij zijn onderzoek. Hij promoveert op 20 april op zijn analyse van Het Boek van de Wetten van de Landen van de derde-eeuwse Syrische filosoof en theoloog Bardaisan. Deze oorspronkelijke Syrische tekst fungeert binnen het Turgama-onderzoek als ijkpunt waaraan de in het Syrisch vertaalde Bijbelteksten worden getoetst.

Computerlinguïstiek is in het Turgama-project nadrukkelijk een interactief proces. De computer maakt niet zelfstandig een analyse, hoewel er wel toepassingen zijn waarin dit al mogelijk is. Bakker: “Ook al doet de computer een groot deel van het werk, het is voor de onderzoeker toch een heel intensief traject. De computer doet suggesties op grond van eerder gemaakte keuzes. Maar als wetenschapper blijf je zelf verantwoordelijk voor die keuzes binnen het proces.”

Het Boek van de Wetten van de Landen.

Consistente analyse

Het computerprogramma bouwt een database op vier taalkundige niveaus op. Daarbinnen vallen woorden, woordgroepen, zinnen en stukken tekst. Met behulp van die database kunnen alle mogelijke patronen binnen de tekst opgevraagd en geanalyseerd worden. Het grote voordeel: analyse door het computerbrein is consistenter dan analyse door een mensenbrein.

Zo’n database lijkt misschien abstract, maar de resultaten zijn heel concreet. Bakker: “We kunnen verschillen in uiteenlopende versies van Bijbelteksten opsporen en vergelijken. Zo dragen we bij aan de interpretatie en studie van die teksten.” Dat is belangrijk, benadrukt hij, “want een gedegen taalkundige analyse is essentieel. Je kunt pas beginnen met interpreteren als je zeker weet wat er staat.”

Wiskundig gedrag

Het Turgama-project richt zich op oude Bijbelteksten, maar de gebruikte methode is toepasbaar op alle soorten tekst, en zelfs op muziekstukken. Taal gedraagt zich immers uitermate wiskundig. De structuren, syntaxis en woordbouw zijn meestal heel consistent. Hetzelfde geldt voor muziek. De inzichten van de computerlinguïstiek zijn daarom niet gebonden aan eeuwenoude teksten. Ook moderne software om plagiaat op te sporen is gebaseerd op diezelfde inzichten. Net als vertaalprogramma’s en zoekmachines.

Maar er is nog veel meer mogelijk. Bakker: “Nu gebruiken we de computer als assistent. We kunnen hem echter ook inzetten als onderzoeker en de eerste analyse van een corpus laten uitvoeren. Maar in de vervolgfasen kun je vooralsnog niet zonder mens.”

Zie ook:

Oeps: Onbekende tag `feed’ met attributen {"url"=>"https://www.nemokennislink.nl/kernwoorden/taaltechnologie.atom", “max”=>"5", “detail”=>"normaal"}

Dit artikel is een publicatie van NEMO Kennislink.
© NEMO Kennislink, sommige rechten voorbehouden
Dit artikel publiceerde NEMO Kennislink op 20 april 2011
NEMO Kennislink nieuwsbrief
Ontvang elke week onze nieuwsbrief met het laatste nieuws uit de wetenschap.