Je leest:

Automatische opiniepeilingen via Twitter

Automatische opiniepeilingen via Twitter

Auteur: | 13 mei 2010

Het afnemen van opiniepeilingen kost veel tijd – en dus geld. Amerikaanse onderzoekers tonen aan dat automatische analyse van tweets de resultaten van de peilingen al aardig benaderen. Zijn automatische peilingen via Twitter de toekomst?

Taaltechnologie zou Maurice de Hond in de toekomst een hoop werk uit handen kunnen nemen. Momenteel vraagt hij elke week in een grote opiniepeiling aan een paar honderd Nederlanders op welke partij zij bij de komende Tweede Kamerverkiezingen zullen stemmen. Een opinie die ook terug te vinden is in de berichten op Twitter. Volgens onderzoekers van de Carnegie Mellon University in Amerika geeft een automatische analyse van deze tweets ongeveer dezelfde resultaten als de dure, tijdsintensieve opiniepeilingen. Deze vorm van opinion mining zou de peilingen kunnen aanvullen – en op den duur misschien zelfs vervangen.

Medium

Elke dag worden er meer dan zeven miljoen berichten gepost op Twitter. Deze tweets van maximaal 140 tekens (gemiddeld 11 woorden) bevatten vaak een mening over een recente gebeurtenis. Gemopper over prijsstijgingen of bewondering voor de snedige taal van een politicus. Met opinion mining kunnen deze online sentimenten in kaart gebracht worden. Speciale software analyseert de tweets en kan zo nauwkeurig in beeld brengen hoe positief ‘het volk’ over een bepaald onderwerp denkt.

Sentimenten

Brendan O’Connor, onderzoeker aan CMU, heeft op deze manier een miljard tweets geanalyseerd die werden gepost in 2008 en 2009. Eerst selecteerde hij uit deze berichten de tweets over drie onderwerpen: het consumentenvertrouwen, de steun voor Obama en de verkiezingen van 2008. De computer behield alleen de tweets waarin de woorden ‘economy’, ‘job’, ‘jobs’, ‘Obama’ en ‘McCain’ voorkwamen. Dagelijks ging 0,1 tot 0,5% van alle tweets over één van deze drie onderwerpen. Dit lijkt misschien weinig, maar elke dag kwamen er wel honderden tot duizenden berichten over elk onderwerp bij.

Vervolgens kon het echte opinion minen echt beginnen. Aan de hand van een speciale woordenlijst met 1600 positieve en 1200 negatieve woorden stelde de computer van elke tweet vast hoe positief er over het onderwerp gesproken werd. Zo konden de onderzoekers van dag tot dag vaststellen hoeveel vertrouwen men in de economie had, hoeveel steun Obama kreeg en hoe positief men over de verkiezingen dacht. Deze sentimenten heeft O’Connor vervolgens vergeleken met opiniepeilingen over dezelfde onderwerpen. Gemiddeld kwamen deze rond de 75% met elkaar overeen.

Large
De correlatie tussen de analyse van één miljard tweets (groen) en een telefonische opiniepeiling (blauw) over het vertrouwen in de economie is 73%.
CMU

Sms-taal

75 procent is misschien nog niet zo heel hoog, maar de onderzoekers zien veel mogelijkheden om deze correlatie in de toekomst flink te verhogen. Ten eerste komen er natuurlijk nog iedere dag meer twitteraars bij. Meer twitteraars betekent meer tweets, en meer tweets betekent een betere benadering van de online sentimenten. Daarnaast kan met de toename aan twitteraars ook beter rekening gehouden worden met de achtergrond van de twitteraars. Opiniepeilers kunnen dan bijvoorbeeld alleen de tweets analyseren van mensen uit een geselecteerde steekproef, die een representatieve afspiegeling van de gemeenschap vormen.

Daarnaast kan ook aan de taalkundige analyse van de tweets nog het een en ander verbeteren. Zo is de woordenlijst met positieve en negatieve woorden momenteel gebaseerd op formeel taalgebruik. In tweets gebruiken mensen echter eerder sms-taal, inclusief alle afkortingen en smileys die daarbij horen. Een woordenlijst op basis van dit informele taalgebruik zal tot een betere analyse van de tweets leiden. Maurice de Hond kan zijn opiniepeilingen de komende weken dus nog maar beter zelf doen, maar in de toekomst kan hij heel wat geld en tijd besparen door de berichten op Twitter automatisch te analyseren.

Bron

Brendan O’Connor e.a. in From Tweets to Polls: Linking Text Sentiment to Public Opinion Times Series, Proceedings of the International AAI Conferende on Weblogs and Social Media.

Lees ook:

Oeps: Onbekende tag `feed’ met attributen {"url"=>"https://www.nemokennislink.nl/kernwoorden/text-mining.atom", “max”=>"5", “detail”=>"normaal"}

Dit artikel is een publicatie van NEMO Kennislink.
© NEMO Kennislink, sommige rechten voorbehouden
Dit artikel publiceerde NEMO Kennislink op 13 mei 2010

Discussieer mee

0

Vragen, opmerkingen of bijdragen over dit artikel of het onderwerp? Neem deel aan de discussie.

NEMO Kennislink nieuwsbrief
Ontvang elke week onze nieuwsbrief met het laatste nieuws uit de wetenschap.