Je leest:

Waarom is ‘waarom’ moeilijk voor computers?

Waarom is 'waarom' moeilijk voor computers?

Voor mensen is het herkennen van een antwoord op een waaromvraag vaak makkelijk, maar voor computers is dit heel ingewikkeld. Bestaande antwoordsystemen, computersystemen die een antwoord geven wanneer je er een vraag aan stelt, worstelen met deze categorie. Taalwetenschapster Suzan Verberne heeft in het kader van haar promotieonderzoek een antwoordsysteem ontworpen, dat bijna 60 procent van de waaromvragen kan beantwoorden.

Voor vragen die beginnen met ‘wie’, ‘waar’ en ‘wanneer’ zijn in het afgelopen decennium slimme antwoordsystemen ontwikkeld. De waaromvragen zijn echter blijven liggen. Waarom? “Omdat het antwoord op een waaromvraag vaak veel langer is dan op een wie- of wat-vraag”, aldus Verberne. “Bovendien is het niet altijd duidelijk waar een waaromvraag precies naar vraagt. Een wie-vraag vraagt altijd naar een persoon, maar een waaromvraag kan bijvoorbeeld vragen naar de motivatie van een persoon: waarom nam Agnes Kant ontslag? Of naar een oorzaak: waarom viel kabinet Balkenende IV? Of naar de herkomst van een woord: waarom heet het kabinet kabinet? Enzovoorts.”

Techniek van zoekmachines

Small
Suzan Verberne promoveert 27 april aan de Radboud Universiteit Nijmegen.

Verberne gebruikte taalkundige informatie, zoals de zinsopbouw, om automatisch vast te stellen waar een waaromvraag naar vraagt en om daar vervolgens het antwoord bij te vinden. Toen bleek dat deze taalkundige benadering alleen niet succesvol genoeg was, ging ze zich meer richten op de aanpak van zoekmachines als Google. Verberne: “Meestal bestaan zoekvragen in Google uit een paar woorden of een naam: ‘_Balkenende IV_’ bijvoorbeeld. Google geeft je dan alle beschikbare informatie over het kabinet Balkenende IV. Maar als je iets specifieks wilt weten, bijvoorbeeld waarom het kabinet Balkenende IV is gevallen, kies je voor meer zoekwoorden.” Om deze andere manier van zoeken mogelijk te maken, ontwikkelde Verberne een systeem dat zoekt naar tekstpassages waarin de woorden ‘kabinet’, ‘Balkenende’ en ‘gevallen’ voorkomen. Om te bepalen of het antwoord op de vraag daadwerkelijk in een gevonden passage staat, gebruikt het systeem bovendien taalkundige informatie over de vraag en de passage.

‘Echte’ waaromvragen

Verbernes antwoordsysteem slaagt erin om bijna 60 procent van de waaromvragen te beantwoorden waarvoor een mens het antwoord kon vinden. Ze onderzocht dit met vragen die echt gesteld zijn door mensen op internet. “Eerder gebruikte ik nog vragen die niet spontaan gesteld waren, maar die proefpersonen formuleerden bij een krantentekst. Deze vragen waren heel anders dan de vragen die écht gesteld worden.”

Als je kijkt naar de waaromvragen die mensen online stellen, kan zelfs een mens maar in tweederde van de gevallen het antwoord vinden op internet. De vragen waarvoor geen antwoord gevonden kan worden zijn soms een soort grapjes (‘Waarom zijn hotdogs per 10 verpakt en hotdogbroodjes per 8?’) of de vraag gaat uit van een onwaarheid (‘Waarom zei Marie-Antoinette ’Let them eat cake’?’ – wat ze helemaal niet gezegd heeft).

Gebrek aan wereldkennis

Dat het antwoordsysteem van Verberne niet in staat is om het antwoord te vinden op ruim 40 procent van de gestelde waaromvragen, komt vooral doordat het systeem, in tegenstelling tot de mens, geen wereldkennis heeft. De computer kan het menselijke niveau simpelweg niet evenaren omdat hij de grote hoeveelheid associatieve kennis mist die mensen onbewust gebruiken bij het beantwoorden van vragen. “Neem bijvoorbeeld de vraag: waarom praten Amerikanen Engels? Als je het antwoord leest: de Britse kolonisering bracht het Engels naar de Verenigde Staten, dan leg je onbewust de relatie tussen ‘Amerikanen’ en ‘Verenigde Staten’. Deze kennis is echter heel lastig in een computer in te bouwen omdat de twee woorden niet exact synoniem aan elkaar zijn; toch is de associatie ertussen voor menselijke lezers heel sterk.”

Verberne sluit niet uit dat het in de toekomst wél mogelijk is om een computer het antwoord op meer waaromvragen te laten vinden. “Er is nog veel te behalen in de kunstmatige intelligentie. In dat vakgebied wordt hard gewerkt aan het oplossen van het gebrek aan wereldkennis in computers en robots.”

Dinsdag 27 april verdedigt Suzan Verberne haar preofschrift ‘In search of the why: Developing a system for answering why-questions’ aan de Radboud Universiteit Nijmegen.

Lees ook:

Oeps: Onbekende tag `feed’ met attributen {"url"=>"http://www.kennislink.nl/kernwoorden/zoekmachine.atom", “max”=>"5", “detail”=>"normaal"}

Dit artikel is een publicatie van Radboud Universiteit Nijmegen.
© Radboud Universiteit Nijmegen, alle rechten voorbehouden
Dit artikel publiceerde NEMO Kennislink op 12 april 2010

Discussieer mee

Vragen, opmerkingen of bijdragen over dit artikel of het onderwerp? Neem deel aan de discussie.

LEES EN DRAAG BIJ AAN DE DISCUSSIE