Je leest:

Imago te berekenen met Opinion Mining

Imago te berekenen met Opinion Mining

Auteur: | 5 november 2008

Met behulp van Opinion Mining (OM) is het mogelijk om online sentimenten te analyseren. Bedrijven kunnen zo bijvoorbeeld zien of hun nieuwe product goed valt bij de doelgroep of dat ze beter nog wat aan hun imago kunnen werken. Wat is Opinion Mining precies en hoe gaat het in z’n werk?

Bedrijven doen van alles om hun nieuwe product of dienst positief onder de aandacht van mogelijke klanten te brengen. Ze plaatsen advertenties op sites en in bladen, maken spotjes voor radio en tv en zorgen dat hun website er mooi uitziet. Alles om maar zo goed mogelijk uit de verf te komen. Uit onderzoek blijkt echter dat mensen meer vertrouwen hebben in meningen van andere consumenten, dan in de reclamecampagnes van de commerciële bedrijven. In 2007 heeft het vakblad Advertising Age zelfs ‘de consument’ benoemd tot ‘advertising agency of the year’.

Uit onderzoek blijkt dat consumenten het meest vertrouwen op mond-tot-mondreclame. Bron: Trust in Advertising: a global Nielsen consumer report, October 2007

Vroeger stapte je voor advies naar de buurvrouw als je op het punt stond een grote aankoop te doen, tegenwoordig kan je op internet meningen en ervaringen van andere consumenten lezen voor je een keuze maakt. Iedere dag komen er weer nieuwe blogs, vergelijkingssites, forums en discussiegroepen bij waarop iedereen overal zijn mening over kan geven. Al deze sites hebben niet alleen directe gevolgen voor de verkoopaantallen, maar indirect bepalen ze ook het imago van het product en van het bedrijf dat erachter zit. Een YouTube-filmpje dat laat zien hoe je eenvoudig een AXA-slot kunt openbreken, doet niet veel goeds voor het imago van AXA.

Het is voor bedrijven daarom enorm belangrijk om te weten hoe er online over hen wordt gesproken. Of consumenten enthousiast zijn over hun pas gelanceerde product of elkaar juist afraden het te kopen. Alleen op die manier kan een bedrijf snel reageren op trends in de markt om eventuele schade te voorkomen. Als Nokia bijvoorbeeld adequaat had gereageerd op de sites die schreven over hun exploderende batterijen, hadden ze misschien minder verlies geleden.

Marktonderzoek

Het bijhouden van je reputatie is niet specifiek verbonden aan het internettijdperk. De Nieuwsmonitor deelt bijvoorbeeld alle artikelen uit de Nederlandse dagbladen handmatig in categorieën in en voorziet ze van labels die aangeven of er positief of negatief over dat onderwerp wordt geschreven. Communicatiebureaus voeren regelmatig marktonderzoek uit waarbij groepen proefpersonen om hun mening over een merk wordt gevraagd. Deze bureaus surfen ook rond op internet om te peilen hoe de goede naam van hun klant ervoor staat.

Er zijn enorm veel websites waar bezoekers actief kunnen deelnemen door te reageren op berichten of zelf nieuwe berichten te plaatsen. Al deze user generated content is van grote invloed op het gedrag van consumenten. Bron: Teezir

Opinion Mining

Het is echter onmogelijk om deze online sentimenten compleet handmatig in kaart te brengen. In december 2007 waren er alleen al ruim 112 miljoen weblogs, terwijl er wereldwijd elke dag ongeveer 120.000 bijkomen. Per dag plaatsen webloggers in totaal 1,5 miljoen posts. Dit komt overeen met 5000 kranten die elke dag worden geschreven. Al zou je al deze data handmatig willen analyseren, dan zou je daar zo lang mee bezig zijn dat je te laat bent om adequaat op trends te kunnen reageren.

De oplossing is dus automatische analyse van online sentimenten. Deze techniek heet Opinion Mining (OM). Bedrijven die gespecialiseerd zijn in zoektechnologie, zoals bijvoorbeeld het Utrechtse Teezir, bieden de mogelijkheid aan om automatisch te laten onderzoeken hoe het imago van je bedrijf er online voorstaat. Dit scheelt veel tijd en het kan gedetailleerder gebeuren dan wanneer het bedrijf het zelf zou doen. Zo kan Opinion Mining worden toegespitst op een bepaald tijdsframe, bijvoorbeeld om te kijken hoe consumenten reageren op een nieuwe reclamecampagne. Ook kunnen in de zoekanalyse alleen bepaalde bronnen worden opgenomen, bijvoorbeeld om te zien of jongerensites anders staan tegenover een product dan een ‘volwassenensite’.

Crawlen

Eerst verzamelt speciale crawling-technologie heel veel data van online bronnen die relevant zijn voor de klant. Deze bronnen zijn vooral weblogs, reviewsites en nieuwsgroepen die van te voren zijn vastgesteld voor de sector die onderzocht gaat worden. Vervolgens bekijkt de computer automatisch welke pagina’s van de site interessant zijn voor de analyse. Alleen pagina’s met user generated content zijn relevant; dit zijn de pagina’s waar bezoekers zelf berichten kunnen posten. De computer deelt de pagina op in individuele posts .

Van al deze posts wordt vervolgens metadata geregistreerd. In de metadata staat extra informatie over de gegevens. Zo staat onder andere in van welke bron de data afkomstig is, wanneer het geplaatst is en in welk deel van de site. Zo kan later altijd nog teruggevonden worden waar een reactie vandaan komt of kan een zoekopdracht specifieker gemaakt worden.

Het proces van Opinion Mining verloopt in 5 stappen: eerst (1) wordt data verzameld van relevante online bronnen. Van deze data wordt de bijbehorende metadata geëxtraheerd (2). Met behulp van een taalanalyse (3) wordt vervolgens van elke post vastgesteld hoe positief of negatief de inhoud is. Al deze gegevens worden opgeslagen in een index (4) waar ze ook weer makkelijk teruggevonden kunnen worden om in een uitgebreide berekening te kunnen worden opgenomen (5). Bron: Teezir

Taalanalyse

Door te kijken naar de woorden en zinnen die de consument in zijn post heeft gebruikt, kan de computer vervolgens vaststellen hoe positief of negatief de geuite mening is. Hiervoor beschikt het programma over een lijst termen met positieve of juiste negatieve lading. Iedere post wordt met behulp van deze gegevens geanalyseerd. Daarnaast kijkt het programma ook naar de context waarin die woorden staan. ‘Meter’ in het werkt voor geen meter heeft een hele andere lading dan in goed te lezen vanaf 20 meter. Met deze contextafhankelijke betekenis van woorden moet het programma rekening houden.

Bovendien houdt de software ook nog rekening met woorden die de meningen versterken (“extreem”, “heel” of “mega”), afzwakken (“beetje”, “af en toe” of “iets”) of juist helemaal omkeren, zoals ontkenningen. De computer neemt al deze afwegingen mee in zijn berekening van het eindoordeel. Deze taalkundige analyse van de data is erg taalspecifiek. Iedere taal heeft zijn eigen woorden en regels. Om data in een andere taal te kunnen analyseren, moet de software eerst een nieuwe set aan regels van die nieuwe taal aangeleverd krijgen.

Na deze analyse beschikt de computer over een groot aantal data (de posts) met de bijbehorende metadata en de berekening van de inhoud van de post. Als een bedrijf wil weten hoe er over hem gesproken wordt, kan met behulp van een zoekmachine antwoord gegeven worden. Eerst selecteert de software alle relevante posts. Dankzij de metadata kan specifiek worden gezocht binnen een bepaalde periode of binnen bepaalde bronnen. De computer neemt vervolgens alle relevante posts mee in zijn berekening van het eindoordeel. Niet alle posts zullen even relevant zijn voor het onderwerp, daarom weegt de software sommige posts zwaarder mee dan andere.

Aan het eind van de analyse krijgt de klant in overzichtelijke grafiekjes te zien hoe het imago van zijn bedrijf of product er online voor staat. Daarnaast kan hij ook nog individuele posts nalezen, zodat hij precies weet wat hij nou zo goed doet, of wat hij in het vervolg juist beter anders kan aanpakken.

Zie ook:

Oeps: Onbekende tag `feed’ met attributen {"url"=>"https://www.nemokennislink.nl/kernwoorden/text-mining.atom", “max”=>"5", “detail”=>"normaal"}

Dit artikel is een publicatie van NEMO Kennislink.
© NEMO Kennislink, sommige rechten voorbehouden
Dit artikel publiceerde NEMO Kennislink op 05 november 2008
NEMO Kennislink nieuwsbrief
Ontvang elke week onze nieuwsbrief met het laatste nieuws uit de wetenschap.