Je leest:

Computer gaat tv-programma’s ondertitelen

Computer gaat tv-programma’s ondertitelen

Auteur: | 10 april 2008

Deze week is het de Week van de Ondertiteling. Steeds meer Nederlandse televisieprogramma’s moeten ondertiteld gaan worden, een arbeidsintensieve klus. Het NEON-project gaat verschillende mogelijkheden onderzoeken om met behulp van spraak- en taaltechnologie de ondertiteling zoveel mogelijk geautomatiseerd te verzorgen.

In het voorjaar van 2004 heeft het kabinet, na veel aandringen van verschillende belangenverenigingen voor doven en slechthorenden, besloten dat de publieke en commerciële omroepen meer programma’s moeten ondertitelen. In het verleden werd van de programma’s op de publieke zenders zo’n 60% ondertiteld, bij de commerciële en regionale omroepen bijna niets. Vanaf 1 januari 2008 moet dit echter zijn opgeschroefd tot 80% bij de publieke omroepen en 15% bij de commerciële, en in 2011 moeten deze percentages zelfs liggen op 95% en 50%.

Via Teletekstpagina 888 is de ondertiteling bij de publieke omroepen en bij SBS6, Net5 en Veronica aan te zetten. Bij RTL 4, 5 en 8 moet je hiervoor naar pagina 222. Vooral op de commerciële zenders worden nog niet veel programma’s van ondertiteling voorzien.

Het ondertitelen van programma’s is momenteel een arbeidsintensieve taak. Met een programma van een half uur is een titelredacteur bijna een hele dag bezig. Bij live-programma’s werken 2 titelredacteuren samen: de één luistert en vat snel samen wat er gezegd wordt en de ander typt dat razendsnel in op een speciaal toetsenbord. Wanneer bijna alle programma’s op deze manier ondertiteld zouden worden, wordt dat voor de publieke omroepen een onbetaalbare klus. Daarom wordt er nu onderzoek gedaan naar mogelijkheden om met behulp van spraak- en taaltechnologie Nederlands gesproken programma’s sneller, beter en goedkoper van ondertiteling te voorzien.

NEON

Tijdens de Week van de Ondertiteling (7 t/m 13 april) is het NEON-project (NEderlandse ONdertiteling) gepresenteerd, waarin verschillende mogelijkheden om automatische ondertiteling te verzorgen onderzocht gaan worden. Het Enschedese bedrijf Telecats gaat hiervoor samenwerken met de Nederlandse Taalunie, drie Vlaamse universiteiten en de Nederlandse en Vlaamse publieke omroepen.

De publieke omroepen maken al een paar jaar gebruik van speciale dicteersoftware: deze sprekerafhankelijke software is speciaal getraind op de spreekstijl van de titelredacteur zodat wanneer deze nazegt wat er in het programma gezegd wordt, er vanzelf een vrij goede ondertiteling gegenereerd wordt. De spraaktechnologie is helaas nog niet zo ver ontwikkeld dat de transcriptie (de uitgeschreven spraak) direct kan worden gemaakt vanaf de opname (sprekeronafhankelijk). Wel kan de spraakherkenner ingezet gaan worden bij programma’s waar al teksten voor op papier staan (bijvoorbeeld scripts of autocues). Deze teksten kunnen automatisch gesynchroniseerd worden met de spraak op de opname, zodat een vorm van ondertiteling ontstaat. Zelfs als sprekers afwijken van het script kan deze oplijning erg snel en nauwkeurig gebeuren.

Met een Velotype is het mogelijk om razendsnel te typen. Voor het intypen van de ondertiteling van live-uitzendingen worden dan ook dit soort speciale toetsenborden gebruikt. In de toekomst zullen deze toetsenborden steeds minder nodig zijn, omdat de spraak- en taaltechnologie de taak van het ondertitelen op zich zal nemen.

Volledig automatische ondertiteling

NEON zal de mogelijkheden onderzoeken om met behulp van spraak- en taaltechnologie ondertiteling zo snel, goed en goedkoop mogelijk te genereren. Bij automatische spraakherkenning van de originele opname moet worden berekend welke woorden gesproken worden. Dit gaat het beste als de spraakherkenner een goed taalmodel heeft: een groot aantal relevante documenten, zodat geschat kan worden welke woorden waarschijnlijk wel gezegd worden en welke juist niet.

De spraakherkenner werkt het beste als hij alleen spraak hoeft te analyseren; dit vraagt dus om een pre-processor die de spraak kan scheiden van de niet-spraak in een opname. Naast de spraakherkenner zal ook een systeem nodig zijn dat de verschillende sprekers van elkaar onderscheidt en aparte kleuren toekent aan de verschillende sprekers, zodat doven en slechthorenden precies weten wie welke zin heeft gezegd.

Tenslotte zal NEON ook een tool ontwikkelen om de ondertiteling samen te vatten. Vaak wordt er tijdens een programma veel meer gezegd dan past in de twee regels onder in het scherm. Momenteel wordt dit nog door de titelredacteur samengevat, maar het zal ook mogelijk worden deze condensering automatisch te laten plaatsvinden. Uit onderzoek van de Universiteit van Antwerpen voor het Engels blijkt dat dit mogelijk is.

Zie ook:

Oeps: Onbekende tag `feed’ met attributen {"url"=>"https://www.nemokennislink.nl/kernwoorden/spraakherkenning.atom", “max”=>"5", “detail”=>"normaal"}

Dit artikel is een publicatie van NEMO Kennislink.
© NEMO Kennislink, sommige rechten voorbehouden
Dit artikel publiceerde NEMO Kennislink op 10 april 2008
NEMO Kennislink nieuwsbrief
Ontvang elke week onze nieuwsbrief met het laatste nieuws uit de wetenschap.