De dialectherkenner is ontwikkeld door Dirk Van Compernolle en zijn collega’s van de Katholieke Universiteit Leuven, in een project gefinancierd door het STEVIN-programma. Zij houden zich veel bezig met spraakherkenning en wilden met dit project aantonen wat er allemaal al mogelijk is in de spraaktechnologie. De dialectherkenner nodigt de Technopolis-bezoeker uit om een tekstje voor te lezen. Op basis van de uitspraak van deze tekst berekent een computer uit welke regio de bezoeker waarschijnlijk afkomstig is. Hij heeft het zo’n 60 tot 70% van de keren bij het juiste eind. Dat is een betere score dan die van de mens, die meestal maar zo’n 45% haalt.

Referentie
Hoe maakt de dialectherkenner zijn berekening? Als eerste stelt een spraakherkenner vast welk deel van de geluidsopname overeenkomt met welke klank uit de tekst. Daarna berekent hij van elke klank de gemiddelde uitspraak. Deze is voor elke spreker verschillend, afhankelijk van niet alleen het dialect, maar ook van bijvoorbeeld het geslacht, de leeftijd en de gemoedstoestand. Uit het sprekermodel dat deze berekening oplevert, selecteert de computer de klanken die het belangrijkst zijn voor het onderscheid in dialecten. Klinkers zijn bijvoorbeeld belangrijk, denk maar aan de platte ‘a’ van de Antwerpenaar. Maar ook de ‘g’ is belangrijk; die wordt in West-Vlaanderen meer als een ‘h’ uitgesproken.
Ten slotte vergelijkt de computer de klanken van de spreker met de referentieklanken uit de verschillende dialecten. Deze referentieklanken zijn bepaald aan de hand van zo’n tweehonderd dialectsprekers uit de verschillende regio’s. Met deze spraak als referentie berekent de computer in hoeverre de spraak overeenkomt met de verschillende Vlaamse dialecten.

Provinciegrenzen
Dat de dialectherkenner de maximale score van 100% correct niet haalt is niet zo vreemd. Veel mensen verhuizen in de loop der tijd of hebben ouders die afkomstig zijn uit een andere regio dan waar ze nu wonen. Het ‘oude’ dialect heeft dan nog altijd invloed op de manier waarop je spreekt. Daarnaast lopen de grenzen van een dialect lang niet altijd gelijk aan de provinciegrenzen. Dat maakt het voor de computer moeilijker om aan te geven waar iemand precies vandaan komt.
Met de dialectherkenner willen de Leuvense onderzoekers laten zien hoeveel kanten je op kunt met spraakherkenners. Je kunt er dus niet alleen teksten mee dicteren aan je computer of mee bellen naar een automatische informatiedienst, het levert ook nog eens een leuk dagje weg op.
Lees ook:
Oeps: Onbekende tag `feed’ met attributen {"url"=>"https://www.nemokennislink.nl/kernwoorden/spraakherkenning.atom", “max”=>"5", “detail”=>"normaal"}