Je leest:

Computer herkent klinkers

Computer herkent klinkers

Auteur: | 18 juni 2003

Verschillen in uitspraak van Nederlandse klinkers zijn semi-automatisch in kaart te brengen. Dit is de belangrijkste conclusie van het proefschrift van onderzoekster Patti Adank. Zij promoveert op 23 juni aan de Katholieke Universiteit Nijmegen. Met haar onderzoek heeft ze laten zien dat computeralgoritmes kunnen concurreren met menselijke experts als het gaat om klinkerherkenning en het negeren van verschillen in lichaamsbouw.

Drs. Patti Adank van de Katholieke Universiteit Nijmegen heeft onderzoek gedaan naar klinkeruitspraak in Nederland en Vlaanderen. Ze vergeleek menselijke experts in het analyseren van uitspraak met verschillende computeralgoritmes. Haar onderzoek laat zien dat het juiste computerprogramma klinkers bijna net zo goed kan onderscheiden als een mens. Daarbij hoeft het geen last te hebben van verschillen tussen mannen en vrouwen.

Adank maakte opnames van 160 leraren Nederlands op middelbare scholen uit Nederland en Vlaanderen. Deze leerkrachten moesten onder andere zinnen met daarin telkens een andere Nederlandse klinker voorlezen, zoals “In soes en soeze zit de oe”. Ze wilde onderzoeken of een computer kan concurreren met getrainde mensen als het gaat om het onderscheiden van klinkers.

Om de menselijke en digitale experts te laten concurreren moest ze wel een manier vinden om de invloed van lichaamsbouw op de klank te verwijderen. Menselijke experts kunnen namelijk horen in welke stand de kaak, tong en lippen staan bij een bepaalde klank, waarbij ze de toonhoogte en andere verschillen tussen mannen en vrouwen kunnen negeren. Als een computer die verschillen ook uit de opname weg kan filteren, blijft alleen de informatie over die iets zegt over de uitgesproken klinker en het gebruikte dialect.

In de fonetiek bestaan verschillende rekenrecepten om een opname zo aan te passen dat het verschil tussen bijvoorbeeld mannen en vrouwen niet meer hoorbaar is, maar de verschillen tussen klinkers of door gebruik van verschillende dialecten nog wel. Adank heeft er elf naast elkaar gelegd en vergeleken met de prestaties van menselijke experts. De rekenrecepten kunnen inderdaad het klankverschil door lichaamsbouw goed verwijderen. Tegelijkertijd blijft het mogelijk om klinkers goed te onderscheiden. Dat lukt voor twee van de elf rekenrecepten met een slagingspercentage van 95%, terwijl de experts 98% haalden. Dat betekent dat sommig onderzoek voortaan minder tijdrovend handwerk vereist; de computer kan het immers bijna even goed.

Fonetische methode

De fonetische methode van menselijke experts stelt uitspraakverschillen vast door deskundigen handmatig fonetische transcripties te laten maken. De experts geven een verschil in de uitspraak van klinkers weer door de stand van de kaak, tong en lippen te beschrijven: de e in pet is met de tong voor in de mond uitgesproken, met een verlaagde kaak en met licht gespreide lippen. Op deze manier kunnen verschillen in uitspraak zeer nauwkeurig vastgelegd worden. Deze methode kost echter zeer veel tijd, omdat het allemaal handwerk is. Voor de zekerheid worden metingen ook een aantal keer herhaald om toevallige missers zoveel mogelijk uit te sluiten.

Akoestische methode

Bij de akoestische methode meten de onderzoekers bijvoorbeeld de toonhoogte of formanten. Een formant is een voor een bepaalde spraakklank karakteristieke, versterkte geluidsfrequentie. Akoestische metingen kosten weinig tijd en bovendien veranderen de meetwaarden voor een spreker niet van meting tot meting.

Spraakherkenning is niet alleen de juiste klanken herkennen. Het is ook belangrijk om achtergrondgeluiden weg te filteren. Eén methode daarvoor is letten op de stand van de mond: is die dicht, dan praat de gebruiker niet en hoeft de computer dus niet te luisteren. Informaticus Jacek Wojdel van de TU Delft werkt aan zo’n systeem.
Delft Integraal

De promotie van Patti Adank maakt onderdeel uit van een Nederlands-Vlaams onderzoeksproject dat de verschillen in uitspraak van het Nederlands en Vlaams in kaart moet brengen. Na haar promotie gaat dr. Adank niet verder met dit onderzoek, maar gaat ze werk doen voor het Hearing Organisation And Recognition of Speech in Europe (HOARSE), een samenwerkingsproject tussen universiteiten en bedrijven uit de hele EU. Ze gaat in Liverpool onderzoek doen naar automatische spraakherkenning in lawaaiige omgevingen.

Dit artikel is een publicatie van NEMO Kennislink.
© NEMO Kennislink, sommige rechten voorbehouden
Dit artikel publiceerde NEMO Kennislink op 18 juni 2003
NEMO Kennislink nieuwsbrief
Ontvang elke week onze nieuwsbrief met het laatste nieuws uit de wetenschap.