Naar de content

Nieuwe leesbaarheidsformule voor begrijpelijke teksten

Een paar regels tekst en een liniaal eronder. Zinslengte en woordlengte zijn klassieke voorspellers van de leesbaarheid van een tekst.
Een paar regels tekst en een liniaal eronder. Zinslengte en woordlengte zijn klassieke voorspellers van de leesbaarheid van een tekst.
Mathilde Jansen voor NEMO Kennislink

Een tekst wordt niet begrijpelijker als je enkel woorden en zinnen inkort. Het is belangrijker dat je bekende woorden gebruikt, en dat je grammaticale eenheden bij elkaar zet. Dat blijkt uit promotieonderzoek van Suzanne Kleijn (UU), die een nieuwe leesbaarheidsformule ontwikkelde.

Een paar regels tekst en een liniaal eronder. Zinslengte en woordlengte zijn klassieke voorspellers van de leesbaarheid van een tekst.

Woordlengte en zinslengte zijn klassieke voorspellers van de leesbaarheid van een tekst.

Mathilde Jansen voor NEMO Kennislink

Hoe weet je of je tekst begrijpelijk genoeg is voor je lezers? Naar die vraag wordt al decennialang onderzoek verricht. Om de moeilijkheidsgraad van een tekst te voorspellen, worden van oudsher leesbaarheidsformules ontwikkeld. Woordlengte en zinslengte zijn daarbij de klassieke voorspellers: hoe langer de woorden en de zinnen in een tekst, des te hoger de moeilijkheidsgraad.

Het problematische van die klassieke voorspellers is dat het nogal oppervlakkige kenmerken zijn. Zodra je een tekst wilt verbeteren, heb je er niks aan. Promovendus Suzanne Kleijn legt uit hoe dat komt: “Voorspellers kunnen heel dom zijn: tussen een voorspeller en de leesbaarheid van een tekst hoeft geen causaal verband te bestaan.”

Samen met collega’s zocht ze naar de ingrediënten van een betere leesbaarheidsformule. De formule die eruit rolde ligt aan de basis van een computerprogramma dat niet alleen het niveau van een tekst kan bepalen, maar ook kan aangeven welke woorden en zinnen een probleem vormen voor de leesbaarheid.

Makkelijke woorden

Om te bepalen welke tekstkenmerken een struikelblok zijn, voerden de Utrechtse onderzoekers een groot scholierenonderzoek uit. In totaal deden 2900 veertien- en vijftienjarige leerlingen mee van verschillende onderwijsniveaus: van vmbo tot vwo. De leerlingen kregen teksten voorgelegd die verschilden in moeilijkheidsgraad: van bestaande teksten werden aangepaste, ‘makkelijkere’, versies gemaakt. In de teksten waren woorden weggelaten (zogenaamde ‘gatenteksten’) die de leerlingen moesten invullen. Meer correct ingevulde woorden wezen op een beter tekstbegrip.

In de aangepaste teksten zaten bijvoorbeeld makkelijkere woorden. Daar hadden vooral de vmbo-kaderleerlingen en leerlingen uit de gemengde theoretische leerweg baat bij. “Bij vmbo-basisleerlingen merkten we weinig verschil: voor hen waren de woorden die we ervoor in de plaats zetten, nog steeds vrij moeilijk. En ook voor havo/vwo was het effect gering: waarschijnlijk waren de woorden die we als moeilijk hadden bestempeld voor deze groep al niet zo ingewikkeld.” Uit een oogbewegingstest bleek wel dat alle leerlingen een tekst sneller lazen als er makkelijkere woorden in stonden.

In de tang

In de ‘makkelijke’ tekstversies waren ook de zinnen aangepast. Niet alleen de lengte daarvan, maar vooral ook de zinsstructuur. Uit de analyse bleek dat zinsstructuur veel bepalender is voor de begrijpelijkheid dan zinslengte. Kleijn licht toe: “Bij een tangconstructie staat er veel informatie tussen bijvoorbeeld een persoonsvorm en het gezegde. Als lezer moet je dat allemaal overbruggen voordat je de zin uit kunt lezen.” Het verband dat vaak gevonden is tussen zinslengte en moeilijkheidsgraad, kun je daaruit verklaren: veel lange zinnen bevatten een tangconstructie, en dat maakt ze moeilijk. Maar lange zinnen die bijvoorbeeld een opsomming bevatten, zijn níet moeilijk te lezen.”

Voorbeeld van een tangconstructie: Ik ga na wekenlang offline geweest te zijn nu eindelijk weer eens mijn tijdlijn op Facebook bekijken. De bijzin kun je ook naar voren plaatsen: Na wekenlang offline geweest te zijn, ga ik nu eindelijk weer eens mijn tijdlijn op Facebook bekijken. Voorbeeld van een lange zin die niet moeilijk is: Ik kwam thuis, gooide mijn jas in een hoek, plofte op de bank, en viel als een blok in slaap.

Naast woorden en zinsstructuur hadden verbindingswoorden een positief effect op de leesbaarheid. Dat zijn woorden die twee zinnen met elkaar verbinden zoals maar, want, hoewel en omdat. Uit eerder onderzoek was al gebleken dat teksten met korte zinnen zonder verbindingswoorden, moeilijker te begrijpen zijn dan iets langere zinnen mét verbindingswoorden.

Een persoon leest een boek die op schoot ligt.
Flickr, .brioso. via CC BY 2.0

Voorspellers

Vervolgens zocht Kleijn naar voorspellers die gebruikt kunnen worden in een leesbaarheidsformule. Daarvoor maakte ze gebruik van hetzelfde scholierenonderzoek. Uit statistische analyses van de makkelijkste teksten kwamen vijf voorspellers naar voren. Die vormden de ingrediënten voor een nieuw computeralgoritme, dat het niveau van een tekst kan bepalen. Die voorspellers kwamen verrassend genoeg niet direct overeen met de factoren die effect hadden in het voorgaande experiment. De verbindingswoorden bijvoorbeeld haalden het niet. “Als voorspeller was deze factor niet sterk genoeg, waarschijnlijk omdat het maar één signaal van samenhang is. Je kunt samenhang ook op andere manieren bewerkstelligen: bijvoorbeeld door het gebruik van alinea’s.”

De 5 voorspellers uit het onderzoek zijn:
  • woordfrequentie: hoe vaker een woord voorkomt in het dagelijks taalgebruik, hoe beter;
  • concreetheid van woorden: hoe concreter de woorden, hoe beter;
  • informatie per deelzin: hoe minder informatie per deelzin, hoe beter;
  • de afstand tussen grammaticale eenheden: hoe korter de afstand, hoe beter – dus geen tangconstructies;
  • het voorkomen van bijvoeglijk gebruikte voltooid deelwoorden zoals ‘overeengekomen niveaus’: hoe minder, hoe beter.

De tool geeft op basis van die voorspellers een indicatie van het niveau van een tekst. “In principe kan je straks je tekst intypen of uploaden als txt-file”, zegt Kleijn. “Vervolgens zet het programma die af tegen teksten van verschillende genres, van makkelijke tot moeilijke teksten. En het markeert de woorden en zinnen die een probleem vormen voor de leesbaarheid.”

Een persoon zit op een jas op de grond in kleermakerszit een boek te lezen.
Pixabay, Tania Dimas via CC0

Juiste balans

Hoef je bij het gebruik van deze tool ook minder na te denken als je een tekst schrijft? Nee, zeker niet, waarschuwt de onderzoeker. “Onze tool biedt een diagnose, waar je verstandig mee om moet gaan. In het verleden was het advies om lange zinnen te vermijden. Maar het is geen oplossing om altijd maar korte zinnen te schrijven. Soms hoort bepaalde informatie gewoon bij elkaar, en is een lange zin onvermijdelijk. Hetzelfde geldt voor passiefconstructies: die zijn in sommige contexten gewoon het beste. We moeten leerlingen ook blijven uitdagen om complexere structuren te begrijpen. Uit onderzoek blijkt dat leerlingen die goed zijn onderwezen in passiefconstructies, hier helemaal geen moeite mee hebben. Het is soms ook een kwestie van het trucje kennen. Van weten hoe het zit.”

Een goeie tekstschrijver zoekt altijd naar de balans tussen te moeilijk en te makkelijk. “Bij sommigen leeft nog het idee dat je intelligenter klinkt als je ingewikkeld schrijft. Daar moeten we vanaf. Sommige dingen zijn gewoon ingewikkeld, maar dan moet je wel je best doen om het zo begrijpelijk mogelijk op te schrijven. Maar het moet ook niet kinderachtig overkomen, je wilt dat de lezer zich gewaardeerd voelt. En dat werkt altijd twee kanten op.”

Bron

Suzanne Kleijn: Clozing in on readability: How linguistic features affect and predict text comprehension and on-line processing. Proefschrift Universiteit Utrecht, verdediging op 6 april 2018. Onderzoek gefinancierd door NWO.

ReactiesReageer