Dialoogsystemen zijn computersystemen die met mensen communiceren. Ze focussen zich op informatieoverdracht, zoals de sprekende computer die reisinformatie verstrekt. Daarbij houden de computers echter geen rekening met menselijke emoties, terwijl dit wel een belangrijke component is van menselijke interactie. Het lastige van menselijke emoties is dat ze niet altijd even goed te duiden zijn, zeker niet voor een computer. Een stemverheffing kan bijvoorbeeld een teken van enthousiasme zijn, maar ook een teken van woede. Zonder extra informatie weten we niet zeker om welk van de twee emoties het gaat. Mensen zijn er in getraind om verschillende soorten (onzekere) informatie te combineren en op basis hiervan toch juiste conclusies te trekken. Dit omgaan met onzekerheden is echter moeilijk in te programmeren in een computerprogramma.
Rekening houden met emoties
Bui ontwikkelde een dialoogsysteem dat wel rekening kan houden met emoties. Hij paste daarvoor een wiskundige techniek toe die in de jaren zestig werd ontwikkeld voor het aansturen van fabrieksprocessen: Partially Observable Markov Decision Process (POMDP). Hij toonde aan dat deze techniek geschikt is voor het integreren van emoties van de gebruiker in een dialoogsysteem. De POMDP-techniek kan namelijk goed omgaan met onzekerheden. De methode presteert, zolang ze getest wordt met kleinschalige dialoogproblemen, beter dan de bestaande systemen. Voor grotere problemen vereist de methode echter te veel rekenkracht. Bui ontwikkelde daarom een hybride strategie. Deze combineert de Dynamic Decision Network (DDN) techniek met POMDP. In tegenstelling tot POMDP’s, splitsen DDN-POMDP’s de dialoogsystemen op in twee niveaus. Ze maken een afweging tussen het ver vooruit kijken en haalbaarheid qua rekenkracht.
POMDP en DDN In de jaren ’50 is het Markov Decision Process (MDP) ontwikkeld, een wiskundig model waarmee computers een keuze kunnen maken uit verschillende willekeurige mogelijkheden. De computer berekent welke keuze hem het meest oplevert en baseert daarop zijn beslissing. Als de computer echter niet weet hoe de situatie momenteel is, kan hij ook niet berekenen welke keuze voor hem optimaal is. Voor dit soort situaties is het Partial Observable Markov Decision Process (POMDP) ontwikkeld. Hierbij probeert de computer met behulp van kennis van de wereld en eigen observaties zijn uitgangspositie vast te stellen. POMDP wordt steeds vaker toegepast in de kunstmatige intelligentie. Ook een Dynamic Decision Network (DDN) helpt een computer om beslissingen te nemen, maar ditmaal in een alsmaar veranderende situatie. Je kunt bijvoorbeeld denken aan het humeur van een chauffeur: dit is niet logisch te voorspellen en verandert van tijd tot tijd.
Om de effectiviteit van een DDN-POMDP te illustreren paste Bui het toe bij een navigatiesysteem voor hulpverleners dat rekening houdt met de ervaren stress van een gebruiker. Het navigatiesysteem krijgt input van een losse ‘stressmodule’ die de stress bij de hulpverlener meet. Bij de communicatie met de gebruiker houdt het systeem hier rekening mee. In een situatie dat het stressniveau bij de gebruiker is verhoogd, zal het systeem er bijvoorbeeld rekening mee houden dat de gebruiker eerder fouten maakt en zal het vaker om bevestiging vragen.
Trung H. Bui verdedigt op 9 oktober 2008 zijn proefschrift ‘Toward Affective Dialogue Management using Partially Observable Markov Decision Processes’. Het onderzoek is uitgevoerd binnen instituut CTIT in het project ICIS (Interactive Collaborative Information Systems).
Zie ook:
- Navigatiesatellieten – the sky is the limit (Kennislinkartikel)
- Sprekende gezichten (TU Delft)
Oeps: Onbekende tag `feed’ met attributen {"url"=>"https://www.nemokennislink.nl/kernwoorden/spraakherkenning.atom", “max”=>"5", “detail”=>"normaal"}