Je leest:

Haperende computerstem klinkt natuurlijkst

Haperende computerstem klinkt natuurlijkst

Auteur: | 16 februari 2009

IBM heeft patent aangevraagd op een nieuwe vorm van spraaksynthese. Met hun nieuwe techniek spreekt de computer met kleine haperingen en korte pauzes. Net als echte mensen doen.

Onderzoekers van IBM hebben een nieuwe methode van spraaksynthese ontwikkeld. Dankzij deze methode spreekt de computer met een stem die zo natuurlijk klinkt dat hij nauwelijks van een menselijke stem is te onderscheiden. Dit komt door de toevoeging van kleine haperingen, kuchjes en pauzes in de computerspraak. IBM heeft de nieuwe technologie onlangs gepatenteerd onder de ingewikkelde naam “generating paralinguistic phenomena via markup in text-to-speech syntheses”.

Sst, de computer is aan het woord

Tegenwoordig kom je regelmatig met sprekende computer in aanraking. Denk bijvoorbeeld aan een telefonische klantenservice of aan het navigatiesysteem in de auto. Vaak klinkt de computerspraak daar nog verre van menselijk. De zin is meestal wel goed verstaanbaar, maar de intonatie laat vaak nog te wensen over. De spraak klinkt monotoon en waar wij even een pauze zouden inlassen, spreekt de computer op volle vaart door. Met de nieuwe methode klinkt de computerspraak juist heel natuurlijk.

Volgens Andy Aaron, onderzoeker bij IBM, kan de nieuwe techniek een groot verschil maken. In de Britse krant The Telegraph legt hij uit: “De effecten kunnen heel subtiel zijn, soms zelfs onhoorbaar, maar ze hebben een groot psychologisch effect.” Zo zegt de computer af en toe ‘uh’ om te laten blijken dat hij nadenkt en zucht hij zo nu en dan om te laten zien dat hij zijn best doet. Ook kan hij kuchen als je je aandacht erbij moet houden en zelfs ‘sst’ zeggen als je niet door hem heen moet praten.

Luister hier naar een fragment van de spraaksynthese van IBM.

TomTom

Het is niet de bedoeling om computerstemmen zo menselijk te maken dat ze niet meer van echte stemmen te onderscheiden zijn, vertelt Andy Aaron. “We hebben dat punt nu wel bijna bereikt, maar we willen niemand voor de gek houden.” De nieuwe techniek is dus alleen ontwikkeld om de communicatie tussen mens en computer soepeler te laten verlopen. Er is zelfs een formule ingebouwd waarmee de computer zelf nieuwe uitdrukkingen kan leren en ze op het juiste moment gebruikt.

Iedere taal heeft zijn eigen manier om aan te geven dat je even nadenkt of om de aandacht van je gesprekspartner te trekken. IBM heeft de nieuwe techniek alleen voor het Engels ontwikkeld; het is dus nog niet toe te passen in het Nederlands. De markt heeft wel oren naar de nieuwe methode. Mark Gretton van TomTom zegt in The Telegraph: “Het kan zeker een waardevolle toevoeging zijn om non-woorden te gebruiken om gestreste chauffeurs te helpen herinneren op tijd af te slaan, of eenvoudigweg om op te letten.”

Zie ook:

Oeps: Onbekende tag `feed’ met attributen {"url"=>"https://www.nemokennislink.nl/kernwoorden/spraaksynthese.atom", “max”=>"5", “detail”=>"normaal"}

Dit artikel is een publicatie van NEMO Kennislink.
© NEMO Kennislink, sommige rechten voorbehouden
Dit artikel publiceerde NEMO Kennislink op 16 februari 2009

Discussieer mee

0

Vragen, opmerkingen of bijdragen over dit artikel of het onderwerp? Neem deel aan de discussie.

NEMO Kennislink nieuwsbrief
Ontvang elke week onze nieuwsbrief met het laatste nieuws uit de wetenschap.