Je leest:

Hoe maak je een dialectkaart?

Hoe maak je een dialectkaart?

Auteur: | 1 januari 2007

Dialectkaarten, waarop de dialectgebieden elk een eigen kleur hebben, worden tegenwoordig gemaakt met behulp van de computer. Eén methode is clustering: het samenvoegen van items in groepen. Hieronder een korte uitleg.

Stel, je hebt overal in het land mensen ondervraagd, en hun uitspraak van een groot aantal woorden genoteerd. Nu wil je weten in welke plaatsen hetzelfde dialect gesproken wordt. Met andere woorden, je zou een overzicht willen maken van de dialectgebieden in het land. Hoe doe je dat?

Om te beginnen kun je voor elk woord kijken hoeveel de uitspraak verschilt tussen twee plaatsen. Dat verschil kun je in een getal uitdrukken. (Een van de technieken om dat verschil te bepalen is de Levenshteinmeting. Hiervan vind je elders een demonstratie en een korte uitleg.) Als je het gemiddelde berekent van de verschillen tussen alle woorden zoals die in die twee plaatsen worden uitgesproken, dan heb je een getalsmaat voor het verschil tussen die twee plaatsen. Herhaal je dit voor alle combinaties van twee plaatsen, dan krijg je een tabel van verschillen. Je hebt dan een afstandstabel voor heel het land, een tabel waar geen geografische afstanden in staan, maar uitspraakverschillen.

Het samenvoegen van plaatsen in groepen: clustering

Laten we als voorbeeld de volgende tabel nemen, met daarin de afstanden tussen de plaatsen A, B, C en D:

Laten we nu eens de twee plaatsen met het kleinste onderlinge verschil samenvoegen. Het kleinste verschil is 1,4. Deze waarde komt toevallig twee keer voor, dus we kiezen gewoon een van de twee: A en B. Deze voegen we samen, en we maken een nieuwe afstandstabel:

De plaatsen A en B zijn nu vervangen door één element, genaamd A+B. Het verschil tussen A+B en C stellen we gelijk aan het gemiddelde van het verschil tussen A en C en het verschil tussen B en C. Hetzelfde doen we voor A+B en D. (Het gebruik van het gemiddelde van de oude afstanden is slechts een van verschillende methodes om de nieuwe afstand te bepalen.)

Nu zoeken we weer naar de kleinste waarde in de (nieuwe) tabel, en dat is het verschil tussen C en D. Deze voegen we samen, net als daarnet A en B:

Nu hebben we nog maar twee elementen over, een cluster van de plaatsen A en B, en een cluster van de plaatsen C en D. Dit samenvoegen van plaatsen in steeds grotere clusters, tot je nog maar enkele clusters over hebt, wordt, hoe kan het ook anders, clustering genoemd. De stappen van de clustering zoals hierboven gedaan kun je grafisch weergeven:

Zo’n afbeelding als hierboven wordt dendrogram genoemd. De verticale verbindingslijnen geven de afstand weer tussen de clusters toen ze werden samengevoegd. In dit dendrogram kun je weer zien dat A en B bij elkaar horen en C bij D.

Nu doen we hetzelfde met een tabel voor 186 plaatsen in Duitsland. Het dendrogram dat je dan krijgt staat hieronder:

Met het dendrogram hebben we nog iets speciaals gedaan. We hebben een verticale streep getrokken (de grijze lijn) en hebben elk cluster dat in z’n geheel links van die lijn ligt een eigen kleur gegeven. Wat je krijgt is een opdeling, een clustering, in acht groepen. Hoe die groepen dan verder nog samen te voegen zijn tot grotere clusters wordt door de zwarte verbindingslijnen aangegeven.

De plaatsnamen zijn in bovenstaand dendrogram weggelaten, waardoor de lijnen wat dichter bij elkaar gezet konden worden. Die plaatsnamen hebben we niet nodig, want het gaat nu even om de kleur die door de clustering aan elke plaats wordt gegeven. Die kleuren kunnen we gebruiken om een clusterkaart te tekenen:

Andere methoden

Er zijn ook andere manieren om een dialectkaart te maken. Het voert te ver om die hier eveneens te bespreken. Meer uitleg vind je door op de links hieronder te klikken.

Dit artikel is een publicatie van Rijksuniversiteit Groningen (RUG).
© Rijksuniversiteit Groningen (RUG), alle rechten voorbehouden
Dit artikel publiceerde NEMO Kennislink op 01 januari 2007
NEMO Kennislink nieuwsbrief
Ontvang elke week onze nieuwsbrief met het laatste nieuws uit de wetenschap.