Je leest:

“Had hij maar een fluisterstand”

“Had hij maar een fluisterstand”

Auteur: | 2 oktober 2007

Dankzij slimme computers die tekst omzetten in spraak (en andersom) kunnen blinden de krant lezen en doven telefoneren. Maar hoe mooi sommige toepassingen ook zijn, ze blijken nog steeds niet het communicatiewondermiddel te zijn waarop al zo lang wordt gehoopt.

Joël Dupont is al vanaf zijn geboorte blind. Desondanks kan hij dagelijks de krant lezen, informatie op internet zoeken en gedrukte teksten zelfstandig lezen. Hij doet dit allemaal door gebruik te maken van taal- en spraaktechnologische toepassingen, oftewel toepassingen die taal en spraak automatisch verwerken.

Hij toont een notitieapparaat waar hij dagelijks mee werkt: een grijs doosje met onderaan achttien braillecellen. Die vormen een strook met gaatjes waardoor pinnetjes omhoog komen en weer verdwijnen. “Daarmee kan ik computerbestanden met gewone tekst in braille omzetten”, zegt hij. “Met de leesregel kan ik mijn agenda of een adressenbestand in braille lezen, en ik kan die tekst zelfs door het apparaat laten uitspreken. Dat gebeurt wel met een kunstmatige stem, maar het is goed verstaanbaar.”

Een notitieapparaat met een brailleregel biedt slechtzienden veel mogelijkheden. (Bron: www.low-vision.be)

Sms’en

Tegenwoordig heeft iedereen bewust of onbewust weleens te maken gehad met taal- en spraaktechnologie, bijvoorbeeld door te bellen met een geautomatiseerde telefoondienst, zoals OV9292 voor reisinformatie, of door gebruik te maken van de spellingcontrole in tekstverwerkers. En wie sms’t, kent waarschijnlijk wel de zogeheten woordpredictieprogramma’s, zoals T9, die het aantal toetsaanslagen flink inperken. Op je mobiele telefoon kan iedere toets voor meerdere letters staan. Als je bijvoorbeeld 2 (abc), 3(def), 7 (pqrs), 8 (tuv) en nog eens 3 toetst, levert dat 324 (3 × 3 × 4 x 3 × 3) mogelijke lettercombinaties op, maar dankzij het woordpredictieprogramma ‘weet’ je telefoon dat je (waarschijnlijk) beste wilt typen.

Door woordpredictie is de mobiele telefoon helemaal doorgebroken bij doven en slechthorenden. Hoewel ze niet kunnen horen, kunnen ze toch mobiel telefoneren in de vorm van tekstberichtjes. Weinig mensen weten overigens dat woordpredictie oorspronkelijk is ontwikkeld op gewone computers, voor mensen die vanwege motorische beperkingen weinig toetsaanslagen kunnen maken.

Stephen Hawking

Er zijn meer technologieën die eerst werden gebruikt door mensen met een communicatieve beperking voordat ze door het grote publiek werden omarmd. Zo zijn er op NS-stations pas sinds kort automatisch voorgelezen vertragingsberichten te horen, terwijl blinden en slechtzienden al vanaf begin jaren negentig gebruikmaken van spraaksynthese, het automatisch omzetten van tekst in spraak. Op die manier kunnen ze bijvoorbeeld kranten lezen. En de bekende natuurkundige Stephen Hawking communiceert al jaren uitsluitend via de spraaksynthese op zijn computer, die door hem ingetikte teksten uitspreekt.

De kunstmatige spraak was in het begin nog vergelijkbaar met een robotstem in een slechte sciencefictionfilm, maar inmiddels is de kwaliteit erg verbeterd en wordt deze technologie in allerlei producten toegepast. Recentelijk nog verscheen een navigatiesysteem voor blinden op de markt, Trekker genaamd. Dankzij een kunstmatige stem, digitale kaarten en de ingebouwde gps, die met satellietsignalen bepaalt waar iemand zich bevindt, kan het systeem een blinde wandelaar overal in Nederland vertellen welke kant hij op moet lopen om een bepaalde bestemming te bereiken.

De bekende natuurkundige Stephen Hawking communiceert via de spraaksynthese op zijn computer.

Spraakherkenning

Net als spraaksynthese wordt spraakherkenning (het automatisch omzetten van spraak naar tekst) al langer gebruikt bij communicatieve beperkingen. Spraakherkenning komt van pas als iemand de spraak niet kan verstaan (bijvoorbeeld een dove student die wil begrijpen wat een docent zegt) of als iemand zijn handen niet kan gebruiken (een rsi-patiënt bijvoorbeeld).

Ook deze technologie is de afgelopen jaren een stuk verbeterd. De nieuwste uitgave van de spraakherkenner Dragon Naturally Speaking weet bij goed gebruik raad met ongeveer 99% van alle uitingen. Wel moet de software uitgebreid worden afgestemd (‘getraind’) op de stem en uitspraak van een persoon, die op zijn beurt weer een redelijke handigheid moet krijgen in het gebruik van het programma.

Ondertiteling

Bij televisieomroepen in Nederland en België wordt spraakherkenning ingezet bij het via teletekst ondertitelen van (Nederlandstalige) liveprogramma’s. Dankzij die ondertitels kunnen kijkers die moeite hebben om gesproken tekst te begrijpen (omdat ze het niet verstaan, of omdat ze de taal nog niet goed beheersen) deze programma’s toch volgen.

Vroeger werd voor de ondertiteling gebruikgemaakt van twee personen. De een dicteerde een vereenvoudigde vorm van wat er op tv gezegd werd en de ander typte dat dictaat snel in op een speciaal toetsenbord, de zogeheten velotype, waarmee met elke aanslag een lettergreep wordt gevormd. Op zichzelf een prima methode, maar het aantal mensen dat met een velotype overweg kan, is beperkt. Met behulp van spraakherkenning hoeft er alleen iemand de vereenvoudigde tekst te dicteren. De computer zet het dictaat zelf om in ondertitels.

In Nederland wordt het systeem nog getest, maar in Vlaanderen lijkt de nieuwe werkwijze een succes. De Vlaamse omroep kan met behulp van de nieuwe techniek tweemaal zo veel programma’s ondertitelen. De kijker merkt er zelf weinig van: de tekst verschijnt even snel. En ondanks typische fouten van spraakherkenners ( hard wordt bijvoorbeeld verward met hart) is het totale aantal fouten in de ondertiteling met de nieuwe techniek opmerkelijk genoeg ongeveer hetzelfde gebleven.

Lipbewegingen

Er wordt nog steeds gewerkt aan nieuwe toepassingen op het gebied van taal- en spraaktechnologie. De researchafdeling van Viataal, een centrum voor communicatieve beperkingen, houdt zich bijvoorbeeld bezig met SYNFACE, een programma waarmee spraak automatisch wordt omgezet in lipbewegingen op een gezicht dat op een computerscherm te zien is.

Als een slechthorende wordt gebeld, kan wat de beller zegt worden doorgestuurd naar een computer die het omzet in lipbewegingen. De slechthorende krijgt dan op zijn monitor een driedimensionaal hoofd te zien waarvan de mond synchroon beweegt met het gesprokene, zodat hij het allemaal beter kan begrijpen. Uit een eerste internationale evaluatie blijkt minstens zeventig procent van de gebruikers de toepassing te waarderen.

Met het programma SYNFACE worden de lipbewegingen van de gesprekspartner nagebootst. (Bron: www.speech.kth.se)

In de Verenigde Staten werkt men ondertussen aan ‘tekstuele simplificatie’. Hierbij worden woordenschat en zinsbouw van geschreven teksten automatisch vereenvoudigd. Op deze manier kunnen ingewikkelde teksten toegankelijk worden gemaakt voor mensen met leesproblemen, zoals dyslectici (mensen die woordblind zijn) en afatici (mensen met taalproblemen door hersenletsel).

Wondermiddel?

Er blijkt dus al heel wat mogelijk met al die taal- en spraaktechnologische toepassingen. Is die technologie daarmee ook hét wondermiddel voor communicatieve beperkingen?

Uit een inventariserende studie die recentelijk werd uitgevoerd voor de Nederlandse Taalunie – het samenwerkingsverband op taalgebied tussen de Nederlandse, Vlaamse en Surinaamse overheid – blijkt dit nog niet het geval te zijn. In het onderzoek werd ervaringsdeskundigen en organisaties in Nederland en Vlaanderen gevraagd naar de behoeften van mensen met communicatieve beperkingen, en de mate waarin taal- en spraaktechnologie aan deze behoeften voldoet of kan voldoen.

“Gebruiksvriendelijkheid blijkt een van de grootste hindernissen bij deze technologische toepassingen”, stelt Marijke Koster van Polderland Language & Speech Technology. Als taaltechnoloog was zij rechtstreeks betrokken bij het onderzoek. “Je kunt nog zo’n mooi product hebben, maar als de gebruikers niet weten hoe ze de knoppen moeten bedienen, ben je nergens. Veel communicatieve beperkingen komen voor bij ouderen, die over het algemeen meer moeite hebben met de omgang met technische apparatuur. Zij kunnen de producten dan soms niet gebruiken.”

Meerdere beperkingen

Anderen die minder goed met taal- en spraaktechnologie overweg kunnen, zijn mensen met meerdere beperkingen tegelijk – een verschijnsel dat zich bijvoorbeeld kan voordoen bij hersenletsel. Als een hersenbloeding of ongeluk zowel iemands spraakorgaan als de cognitieve vermogens aangetast heeft, dan is spraaksynthese geen optie, omdat die persoon niet begrijpt hoe hij de toepassing moet gebruiken.

Doofblinde mensen kunnen communiceren via vierhandengebarentaal, waarbij ze losjes de handen van hun gesprekspartner vasthouden.

Soms treden andere beperkingen op als bijeffect van een stoornis. Zo hebben veel doofgeborenen problemen met spreken, doordat ze nog nooit spraakklanken hebben gehoord en daardoor de terugkoppeling naar hun eigen stem missen. Door deze combinatie van beperkingen zijn veel toepassingen voor hen niet effectief. Ze kunnen bijvoorbeeld geen spraakherkenner gebruiken om teksten te dicteren, omdat dit proces een vrij constante uitspraak vereist.

Doofblinden kunnen niet via spraaksynthese teksten laten voorlezen, omdat ze de kunstmatige stem niet kunnen horen. En verder hebben veel doofgeboren kinderen een leesbeperking, zo blijkt uit onderzoek aan de Radboud Universiteit Nijmegen. Hun woordenschat is gemiddeld veel kleiner dan die van horende kinderen, vermoedelijk omdat ze woorden alleen schriftelijk of in gebarentaal krijgen aangeboden. Zij missen alle hoorbare informatie die je normaal voortdurend in je omgeving hoort: in gesprekken, op de radio of op tv.

Omdat deze groep moeilijk of nauwelijks kan lezen, heeft het geen nut om een spraakherkenner te gebruiken om alle mondelinge informatie om te zetten in tekst. Deze kinderen begrijpen de tekst die uit de computer komt maar met moeite.

Uitbreiding van stemmen

Maar er zijn meer problemen. “Sommige producten sluiten gewoonweg niet aan bij de wereld van de gebruiker”, vervolgt Marijke Koster. “Neem Sanne Louvenberg. Zij is een achttienjarig meisje met een motorische aandoening waardoor ze niet kan praten. Ze zou wel met spraaksynthese kunnen werken, maar het grootste probleem is dat er maar een beperkt aantal stemmen beschikbaar is. Aangezien dit stemmen van volwassen mannen of oudere vrouwen zijn, ervaart ze deze stemmen niet als de hare. Kortom, omdat ‘haar’ stem er niet bij zit, gebruikt ze het programma amper.”

Joël Dupont, die vanwege zijn visuele beperking geregeld gebruikmaakt van kunstmatige spraak, bevestigt dat een uitbreiding van het aantal stemmen zeer wenselijk is. “In vergaderingen kan het erg storend zijn als je een stuk tekst door middel van spraaksynthese aan je buurman laat voorlezen. Het zou erg mooi zijn als er zoiets als een fluisterstand zou zijn. Dan kan je buurman toch de tekst horen, zonder dat iedereen hoeft mee te luisteren.”

Ontoegankelijk

Soms is een bepaald product nog niet voor het Nederlands beschikbaar. Dat geldt bijvoorbeeld voor een programma dat spraak automatisch omzet in gebarentaal. Het wordt onder andere toegepast op Engelse postkantoren zodat doven en slechthorenden de loketbeambte kunnen begrijpen.

TESSA (‘TExt and Sign Support Assistant’) helpt doven en slechthorenden bij transacties in een postkantoor. (Bron:www.visicast.co.uk)

Ook ondersteuning en onderhoud van de technologie kunnen een struikelblok zijn. Bij sommige producten is iemand nodig om de zaak goed te installeren en af te stemmen op de gebruiker – en die is niet altijd aanwezig. Rob van Geel van RdgKompagne, leverancier van communicatieve hulpmiddelen, noemt als voorbeeld communicatieborden, waarmee je zinnen kunt maken door het aanraken van symbolen.

Het staat niet altijd vast welk symbool wáárvoor staat. Iemand kan bijvoorbeeld een plaatje van een zon met een strand koppelen aan het begrip ‘zomer’, terwijl iemand anders misschien kiest voor de combinatie van een zon met bergen. Eigenlijk moeten deze combinatieborden onder begeleiding van een therapeut worden ingesteld. Gebeurt dit niet, dan is het product al snel minder bruikbaar en verdwijnt het vaak in een kast.

Weinig ontwikkeling?

De indruk bestaat dat er de laatste tijd weinig ontwikkeling zit in de taal- en spraaktechnologie. “Dit komt doordat de doelgroep zeer divers is”, legt Marijke Koster uit. "Het aantal handicaps is zeer groot, en zelfs daarbinnen zijn onderverdelingen te maken: Is een beperking aangeboren of verworven? Hoe oud is iemand?

Producten die voor specifieke doelgroepen worden ontwikkeld, worden maar door een relatief kleine groep mensen gebruikt. Vanwege dit kleine aantal potentiële klanten is er vanuit de markt minder interesse om in nieuwe ontwikkelingen te investeren, en zijn subsidies lang niet toereikend. En áls er al nieuwe ontwikkelingen zijn, dan wordt hier buiten de specifieke doelgroep weinig ruchtbaarheid aan gegeven."

Wat zouden de meeste gebruikers van de technologie nu het liefst verbeterd zien? Marijke Koster: “We kwamen één wens steeds weer tegen: een spraakherkenner die alle sprekers verstaat zonder enige training of aanpassing. Laat dat nou meteen de lastigste toepassing zijn.”

Het rapport Taal- en spraaktechnologie en communicatieve beperkingen is gratis op te vragen bij de Nederlandse Taalunie ([email protected], 070 – 346 95 48), of als pdf-formaat te downloaden.

Dit artikel is eerder verschenen in Onze Taal.

zie ook:

Dit artikel is een publicatie van Genootschap Onze Taal.
© Genootschap Onze Taal, alle rechten voorbehouden
Dit artikel publiceerde NEMO Kennislink op 02 oktober 2007
NEMO Kennislink nieuwsbrief
Ontvang elke week onze nieuwsbrief met het laatste nieuws uit de wetenschap.