Naar de content

Hoeveel woorden heeft het Nederlands?

Hoeveel woorden heeft de Nederlandse taal? Niet alle woorden staan in de dikke Van Dale. Op internet zijn bijvoorbeeld veel meer woorden te vinden.

Hoeveel woorden heeft de Nederlandse taal? Die vraag is moeilijk te beantwoorden, bijvoorbeeld omdat je er elke dag woorden bij kunt maken.

Stel bijvoorbeeld dat een biologe morgen ergens een nieuwe salamander ontdekt met een grauw koppie. Omdat er ook “geelkopsalamanders” bestaan, kan zij die salamander dan bijvoorbeeld zo noemen:

“grauwkopsalamander”

Dat is dan een heel nieuw woord, dat nog nooit iemand eerder gezegd of gehoord heeft, en dat toch bij het Nederlands hoort. Als nu iemand ontdekt dat deze grauwkopsalamanders heel raar springen, kunnen we het voortaan hebben over:

“grauwkopsalamandersprong”

Iemand die zich daarin uitgebreid verdiept, is dan een

“grauwkopsalamandersprongspecialist”

En als de mensen die zich hierin verdiepen zich verenigen krijg je een:

“grauwkopsalamandersprongspecialistenvereniging”

Het is niet heel erg waarschijnlijk dat dit laatste woord heel erg vaak gebruikt wordt, maar het kán wel. Omdat deze pagina op internet staat, wordt het woord bovendien nu ook op een Nederlandse internetpagina gebruikt. Is het nu een Nederlands woord?

Het woord “geelkopsalamander” is niet opgenomen in de grote Van Dale.

Opdracht 1: Ontbrekende woorden in Van Dale

Neem een pagina uit een recent Nederlands woordenboek. Probeer minstens drie woorden te bedenken die alfabetisch op deze pagina zouden passen, maar er toch niet opstaan. Gebruik een internetzoekmachine — bijvoorbeeld Google — om te bewijzen dat deze woorden wel degelijk door Nederlandstaligen gebruikt worden.

Hoeveel woorden heeft het Nederlands? (2)

We kunnen dus niet echt tellen hoeveel woorden het Nederlands heeft, omdat er steeds nieuwe woorden bijkomen. Maar kunnen we wel schatten hoeveel woorden er tot nu toe gebruikt zijn?

Ook dat is weer heel moeilijk. Mensen gebruiken taal op twee manieren: om te lezen en schrijven, en om te praten en te luisteren. Als het op school over ‘taal’ gaat, wordt er vaak heel veel aandacht besteed aan lezen en schrijven. Maar in het dagelijks leven wordt er veel meer gepraat en geluisterd dan gelezen en geschreven. Zelfs beroepsschrijvers zullen waarschijnlijk op een dag meer woorden zeggen dan dat ze schrijven. En zelfs beroepslezers zullen meer woorden horen dan zien.

Gesproken woorden zijn vluchtig, je kunt ze niet vangen en niet bewaren (tenzij je ze opneemt). We zullen nooit precies weten hoeveel woorden mensen elke dag zeggen, of welke woorden dat dan zijn. Voor het geschreven woord is het wat gemakkelijker te bepalen. In theorie kunnen we alles wat er ooit geschreven is, opsporen en dan alle woorden gaan tellen. Ook dat is in de praktijk niet te doen.

Als taalonderzoekers iets willen weten, bijvoorbeeld hoe vaak een bepaald woord gebruikt wordt, werken ze daarom vaak met steekproeven. Ze proberen een grote verzameling met zinnen of teksten aan te leggen waarvan ze denken dat deze voldoende gemiddeld zijn. Als dat klopt, kunnen ze dus aannemen dat wat geldt voor de ene tekst, ook zal gelden voor de andere tekst. Zo’n steekproef heet ook wel een corpus (van het Latijnse woord voor ‘lichaam’; het meervoud is corpora).

Op internet zijn allerlei van die corpora te vinden. Veel kun je gratis bekijken, voor sommige moet je eerst wat betalen of in ieder geval eerst toestemming vragen. Maar het internet is zelf een enorm groot corpus, met heel veel Nederlandse woorden.

Opdracht 2: Aantal Nederlandse woorden in Google

Hoeveel Nederlandse woorden zijn er op het internet te vinden? Je zou hiervoor een zoekmachine kunnen gebruiken zoals Google. Maar ook die zegt niet meteen hoeveel Nederlandse woorden er te vinden zijn. Hoe kun je de schatting dan maken?

Hoeveel woorden heeft het Nederlands? (3)

In een woordenboek als Van Dale staan honderdduizenden verschillende woorden. Op het internet staan er nog veel meer. Maar hoeveel woorden ken jij? En hoeveel woorden kennen andere mensen?

Mensen blijken een enorm geheugen te hebben als het om woorden gaat. In de eerste twintig jaar van hun leven leren Nederlandstaligen (die bijvoorbeeld het vwo hebben gevolgd) ongeveer 60.000 woorden. Dat betekent dat ze in die eerste twintig jaar gemiddeld per dag tien nieuwe woorden geleerd hebben.

Waar andere vormen van taalverwerving na een bepaalde leeftijd tot een stilstand komen, leren mensen bovendien hun hele leven steeds weer nieuwe woorden bij (zoals “grauwkopsalamander”).

Waar dat allemaal goed voor is, weten we eigenlijk nog niet. De meeste mensen gebruiken actief veel minder woorden. Een bloemrijke schrijver als Shakespeare heeft naar verluid in zijn hele werk niet meer dan zo’n vijftienduizend verschillende woorden gebruikt. Natuurlijk is het handig als je wat meer woorden kent dan je zelf gebruikt; dat maakt het mogelijk om ook mensen die heel anders praten dan jij te begrijpen. Toch blijft onze woordenschat mysterieus hoog, als je kennelijk met veel minder woorden toe kan om alles te zeggen wat Shakespeare al zei.

De eerste twintig jaar van je leven leer je tot wel tien nieuwe woorden per dag.

Opdracht 3: Test je woordenschat

Zoek in je omgeving kinderen van verschillende leeftijden, en test hun woordenschat.

Dit artikel is een publicatie van Meertens Instituut