Je leest:

Amerikanen twitteren in dialect

Amerikanen twitteren in dialect

Auteur: | 12 januari 2011

De taal in Amerikaanse tweets is net zo regionaal gekleurd als de spreektaal. Dat blijkt uit een recent artikel van de hand van onderzoekers van de Carnegie Mellon Universiteit in Pittsburgh.

Twitter is een wereldwijd medium. Toch is de taal in Amerikaanse Twitterberichten of tweets net zo regionaal gekleurd als de spreektaal. Dat blijkt uit een artikel van de hand van onderzoekers van de Carnegie Mellon Universiteit in Pittsburgh (VS). Zij lieten een computermodel los op grote hoeveelheden Amerikaanse tweets. Vervolgens konden zij de auteur lokaliseren op basis van zijn woordgebruik. Niet alleen weerspiegelen tweets bestaande regionale verschillen, er worden ook nieuwe verschillen gecreëerd, aldus de auteurs.

Twitter op de smartphone.

Informeel taalgebruik

Dialectonderzoek is meestal gebaseerd op mondelinge interviews. Geschreven tekst leent zich over het algemeen niet voor dit type onderzoek. Dat komt omdat geschreven tekst meestal een stuk formeler is dan mondeling taalgebruik. Regionale varianten komen er weinig in voor. Twitter is echter – net als andere social media – een informeel geschreven medium. Een bijkomend voordeel voor het onderzoek van Jacob Eisenstein en zijn collega’s was dat veel mobiele twitteraars hun berichten voorzien van GPS-coördinaten. Daardoor kun je precies zien waar het bericht vandaan komt.

Het onderzoeksteam van Eisenstein verzamelde tweets van Amerikaanse twitteraars uit de eerste week van maart 2010. De onderzoekers selecteerden berichten die voorzien waren van GPS -coördinaten afkomstig van actieve twitteraars. Allemaal hadden ze minimaal 20 berichten gepost in deze periode. Reclameboodschappen werden uitgefilterd door te letten op het aantal followers en de aanwezigheid van url’s in de tweets.

Al met al resulteerde dit in een databank van 9.500 twitteraars en 380.000 berichten. Een nadeel van dit onderzoeksmateriaal is dat er behalve herkomst weinig bekend is over de groep taalgebruikers. Naar leeftijd bijvoorbeeld kun je slechts raden. Toch gaan de onderzoekers er vanuit dat mensen die hun tweets versturen via hun mobiele telefoon meestal net iets jonger zijn dan de gemiddelde twitteraar. De onderwerpen waarover geschreven werd leken dit te bevestigen.

Tabel: regionale varianten per gespreksonderwerp. Toelichting bij gebruikte slang: af as fuck (very); coo cool; dl download; fasho for sure; gna going to; hella very; hr hour; iam I am; ima I’m going to; imm I’m; iono I don’t know; lames lame (not cool) people; jk just kidding; jp just playing (kidding); koo cool; lol laugh out loud; nm nothing much; od overdone (very); omw on my way; smh shake my head; suttin something; wassup what’s up; wyd what are you doing?.
Jacob Eisenstein

Geografische trends

Hoewel variatie in tweets onder andere ontstaat door het beperkte aantal lettertekens (140), zijn er ook duidelijk geografische trends aan te wijzen. Jacob Eisenstein en zijn collega’s laten dit zien aan de hand van een statistisch model. Daarmee kunnen ze de locatie van twitteraars vrij nauwkeurig voorspellen. Dat gebeurt niet alleen op basis van namen (regionaal bekende basketbalspelers of muzikanten zijn duidelijk te lokaliseren), maar ook op basis van lokaal gekleurde slang.

Een paar voorbeelden: de gemiddelde Amerikaanse twitteraar klaagt dat hij very tired is; maar mensen in het noorden van Californië zijn hella tired; New Yorkers zijn deadass tired en mensen uit Los Angeles tired af. Soms creëren twitteraars ook regionale verschillen in hun spelling. In het noorden van Californië schrijven twitteraars bijvoorbeeld koo voor ‘cool’, in het zuiden coo.

Het is dus een misverstand om te denken dat mondiale computernetwerken leiden tot meer homogeniteit in taal. Dit onderzoek laat zien dat de sociale netwerken sterk geografisch bepaald zijn. En net als in het dagelijks leven, zijn gebruikers van social media toch vooral opzoek naar mensen met dezelfde levensstijl en interesses. Aan een soort Esperanto voor het World Wide Web lijkt voorlopig dus geen behoefte te zijn.

Bron

  • Eisenstein, O’Connor, Smith & Xing (2011): A Latent Variable Model for Geographic Lexical Variation. Presented on Jan. 8 at the Linguistic Society of America annual meeting in Pittsburgh.

Zie ook:

Dit artikel is een publicatie van NEMO Kennislink.
© NEMO Kennislink, sommige rechten voorbehouden
Dit artikel publiceerde NEMO Kennislink op 12 januari 2011
NEMO Kennislink nieuwsbrief
Ontvang elke week onze nieuwsbrief met het laatste nieuws uit de wetenschap.