Consumenten klagen en prijzen heel wat af op het internet. Consumentensites en fora staan bomvol met meningen over producten en diensten. Bedrijven realiseren zich de invloed van deze sites en willen natuurlijk dolgraag weten hoe goed hun online imago er voorstaat. Het internet is echter ondertussen zo immens groot dat het onmogelijk is dit handmatig in kaart te brengen. Gelukkig is daar dan opinion mining, een techniek om online sentimenten te analyseren.
Software voor opinion mining analyseert teksten aan de hand van een grote woordenlijst. Teksten met positieve woorden bevatten een positieve mening en teksten met negatieve woorden een negatieve. Deze vlieger gaat echter niet altijd op. Sarcastische opmerkingen kunnen de analyse flink in de war schoppen. Deze opmerkingen zijn spottend bedoeld: letterlijk staat er iets positiefs, maar impliciet bedoelt de schrijver juist het tegenovergestelde.

Beoordeling
Ari Rappoport en zijn collega’s, onderzoekers aan de Hebrew University in Jeruzalem, hebben software ontwikkeld die online sentimenten in kaart kan brengen, inclusief de sarcastische opmerkingen. Eerst leerden ze hun software een heleboel sarcastische zinnen. De software zocht naar patronen in deze zinnen, zodat hij in de toekomst zelf sarcastische zinnen zou kunnen aanwijzen. Vervolgens hebben de onderzoekers hun software getest op bijna 6 miljoen twitterberichten en 66.000 beoordelingen op Amazon.com. De resultaten van deze test vergeleken de onderzoekers met de mening van drie mensen, die ook alle berichten op sarcasme hadden beoordeeld. Het oordeel van de software over de twitterberichten kwam in 83% van de gevallen overeen met de mening van de beoordelaars. Voor de productbeoordelingen op Amazon.com lag deze score op 78%.
Lang niet slecht, zeker als je beseft dat het zelfs voor veel mensen moeilijk is om sarcasme te herkennen. Ook het gebrek aan context (zeker in de twitterberichten) maakt de beoordeling er niet makkelijker op. “We kunnen nu vaststellen dat computers net zo goed zijn als mensen in het overeenstemmen welke zinnen sarcastisch zijn met andere mensen”, aldus de Amerikaanse taaltechnoloog David Traum tegen NewScientist. Ook Lillian Lee, taaltechnoloog aan de Cornell University in New York is enthousiast over de resultaten. “Ik had niet verwacht dat we al in staat waren om het probleem van sarcasme aan te pakken.”
Het automatisch detecteren van sarcasme is niet alleen handig voor opinion mining, de Israëlische onderzoekers zien nog veel meer mogelijkheden voor toepassingen van hun systeem. Zo zullen dialoogsystemen, waarbij je belt met een computer, ook beter werken als ze kunnen herkennen wanneer een uitspraak sarcastisch bedoeld is. Ook software die teksten kan samenvatten zal flink gebaat zijn bij een dergelijke toevoeging. De makers van deze systemen zaten natuurlijk al járen op dit nieuws te wachten.
Bron:
Oren Tsur, Dmitry Davidov, Ari Rappoport. Semi-Supervised Recognition of Sarcastic Sentences in Twitter and Amazon. Computational Natural Language Learning (CoNLL) 2010.
Lees ook:
Oeps: Onbekende tag `feed’ met attributen {"url"=>"https://www.nemokennislink.nl/kernwoorden/text-mining.atom", “max”=>"5", “detail”=>"normaal"}