Je leest:

Verdraaide leugens

Verdraaide leugens

Auteur: | 1 september 2011

Heeft u meer dan het gemiddelde aantal oren? Is uw salaris lager dan gemiddeld? Wanneer komt de volgende bus? Ben Parker probeert ons te overtuigen van het nut van statistiek, indien correct toegepast.

Of het nu de schrijver Mark Twain was of de politicus Bejamin Disraeli die voor het eerst de gedachte uitsprak dat er drie soorten onwaarheden zijn – “leugens, verdomde leugens en statistiek” – dat gevoel heerst nog steeds. Statistici zijn manipulatieve, verraderlijke types, erop uit om onze geest te vervuilen met betekenisloze en misleidende informatie die ons ertoe brengt om te stemmen op hun favoriete politieke partij, hun aantoonbaar effectieve huidcrème te gebruiken of het kattenvoer te kopen dat hun eigen huisdieren het liefst eten. Voor mij – als statisticus – wordt het tijd om een paar mythen te ontzenuwen.

Onze moderne wereld zit vol met statistiek en hoewel er ook schokkend slechte statistiek rondwaart, hoop ik u ervan te kunnen overtuigen dat in de meeste gevallen de fout ligt in de presentatie ervan.

(V)ooruit

Ik zou zonder aarzelen met u willen wedden dat u meer dan het gemiddelde aantal oren heeft. Waarom? Laten we aannemen dat er zes miljard mensen op onze dichtbevolkte planeet wonen, van wie meer dan 99% twee oren heeft. Er zijn echter een paar bijzondere mensen die – door een ongeval of een aangeboren afwijking – één oor of helemaal geen oren hebben. Voor zover ik weet zijn er geen mensen met drie oren (Captain Kirk uit de televisieserie Star Trek is helaas verzonnen, maar hij had drie oren: een linkeroor, een rechteroor en ten slotte een middenvoor-oor).

Als we vervolgens het gemiddelde berekenen (alle oren optellen die de mensheid momenteel bezit en dat delen door het aantal mensen), dan krijgen we het sommetje ‘iets minder dan 12 miljard’ gedeeld door 6 miljard’, en dat is dus iets minder dan twee. Dit betekent dat, aangezien veruit de meeste mensen in de wereld twee oren hebben, ze iets meer dan het gemiddelde toebedeeld hebben gekregen, dus ik zou die weddenschap winnen.

Wat betekent dat?

Wel, bovenstaande is natuurlijk alleen maar een statisticus die pedant doet. Er zijn echter voorbeelden bij de vleet die maar ietsje minder onzinnig zijn. Statistieken over hoe een bepaalde groep mensen minder verdient dan een bepaald percentage van het gemiddelde nationale inkomen worden als voetballen heen en weer geschopt in de politiek. Het gebeurt maar al te vaak dat we commentaren lezen in de kranten over hoe schandalig het is dat mensen maar een x percentage verdienen van het gemiddelde nationale inkomen en dat dat allemaal de schuld is van de (Britse) Labour-regering, van het eerdere Conservative kabinet, de Europese Unie of zonnevlekken.

Verdeling van weekinkomens per huishouden 2004/2005: Aantal individuen (miljoenen), Groot-Brittannië. Bron: ‘Housholds below Average Income (HBAI) 1994/95-2—4/05’, Department for Work and Pensions.

De verdeling van inkomens, volgens het UK Department for Work and Pensions (Britse departement voor werk en pensioenen), zie de afbeelding hierboven, is zodanig dat er relatief weinig mensen zijn die enorm veel geld verdienen (helaas vallen statistici niet in deze hoge-inkomensgroep).

Dit betekent dat het gemiddelde inkomen, dat door het Departement is berekend als £ 427 per week voor een stel zonder kinderen (zie deze pdf), veel meer is dan wat de meerderheid van de mensen verdient, geheel parallel met het voorbeeld hierboven van het aantal oren. Een paar uitzonderlijke mensen – of ze nu minder dan twee oren hebben of gigantisch veel geld verdienen – verschuiven het gemiddelde weg van de situatie van de meerderheid van de mensen.

Natuurlijk hadden mensen al gauw door dat dit veelgebruikte gemiddelde – berekend door alles op te tellen en dan te delen door het aantal dingen dat je had opgeteld, en wat eigenlijk het rekenkundig gemiddelde heet – gemakkelijk verkeerd geïnterpreteerd kon worden. Daarom wordt vaak het concept van de mediaan gebruikt in de praktijk. Als we alle mensen in Groot-Brittannië op een rij zouden zetten op volgorde van hun inkomen, dan zou het mediane salaris het bedrag zijn dat de persoon die precies in het midden staat verdient. Het mediane inkomen – zo’n £ 349 in dit voorbeeld – geeft meestal een beter idee van wat ‘normaal’ is.

De kreukels gladstrijken

Erger dan journalisten – maar nog niet zo erg als politici – zijn adverteerders. Een recente televisiereclame van een cosmetisch bedrijf beweert over hun nieuwste anti-rimpelcrème dat 8 van de 10 klanten tevreden zijn, gebaseerd op een onderzoek onder 134 mensen.

We kunnen het bedrijf de kleine steekproef misschien nog wel vergeven, maar de cruciale vraag is hoe ze het onderzoek hebben uitgevoerd. Alleen vragen of het product bevalt, is dubieus. In de netste wetenschappelijke tests zou men graag zien dat de prestaties van deze crème objectief worden vergeleken met die van ander merk of een placebo, om te zien of willekeurige mensen een positief effect van de crème ondervinden.

Adverteren op zich is geen probleem: filosofen beweren dat adverteren een essentieel onderdeel is van een sterke democratie. Het is prima als adverteerders mensen van hun product op de hoogte stellen en de voordelen ervan benadrukken. Echter, het is niet acceptabel als een dun vernislaagje van wetenschap rond de reclame wordt aangebracht.

Hoewel het slim is gebracht, als de methode niet wordt uitgelegd, zegt dat getal ‘8 van de 10’ helemaal niets. Het is net zo onzinnig als zeggen dat ‘onze auto een topsnelheid heeft van 800 km per uur’, zonder daarbij te vermelden dat die snelheid gehaald wordt als je meet hoe snel de auto uit een vliegtuig valt: het is waar, maar het is misleidend.

Wachttijdparadox

Misschien is het niet helemaal eerlijk om alle schuld bij de boodschappers te leggen in plaats van bij de statistiek zelf. Er zijn best wat echte, lastige, niet-intuïtieve feiten die door de statistiek worden uitgespuugd en waarvan de waarheid maar erg moeilijk te vatten is. Stel dat u op de bus staat te wachten en u kijkt op het rooster, dat u vertelt dat er vijf bussen per uur komen. Hoe lang denkt u op uw bus te moeten wachten?

Gewone logica vertelt ons dat als er 5 bussen per uur komen, de gemiddelde tijd tussen twee bussen dan 12 minuten is. Als we dus aannemen dat u bij de halte aankomt op een willekeurige tijd tussen twee bussen, dan kunt u verwachten dat u zes minuten moet wachten. Logisch, maar helaas over het algemeen niet correct.

We weten dat bussen niet op de minuut rijden. Ze verlaten het depot wellicht op tijd, maar allerlei toevalsfactoren beïnvloeden hun voortgang op verschillende manieren, waardoor de bussen niet strikt regelmatig bij de halte arriveren. We hebben méér kans bij de halte te arriveren tijdens een groot tijdsgat tussen twee bussen dan tijdens een klein tijdsgat, omdat zo’n groot gat nu eenmaal meer tijd inneemt dan een klein tijdsgat.

Als we dus in zo’n groter gat arriveren, dan weten we ook dat de periode tussen twee bussen méér dan 12 minuten is (ook al zijn er nog steeds 5 bussen per uur). Dus de gemiddelde wachttijd, gegeven dat we op elk willekeurig punt in het tijdsgat kunnen arriveren met dezelfde waarschijnlijkheid, is meer dan 6 minuten.

Dit staat bekend als de wachttijdparadox (het was ooit een vraag in de Nationale Wetenschapsquiz: vraag 2 in 2005), en het valt niet mee om je hersens eromheen te buigen. Het is echter een echt fenomeen en het wordt gebruikt door verkeersplanners en logistieke onderzoekers, die bijvoorbeeld moeten uitzoeken wat de handigste manier is om rijen in het postkantoor op te stellen; hoewel ze het soms prompt lijken te vergeten.

Dit artikel biedt een geestige blik op hoe statistiek wordt misbruikt in het leven van alledag. Het zou te begrijpen moeten zijn voor leraren, studenten en algemene lezers uit de hele wereld. Op school zou het gebruikt kunnen worden als een inleiding in statistiek om leerlingen ertoe aan te zetten na te denken over hoe statistiek kan worden gebruikt en misbruikt. Dit artikel verscheen eerder in +Plus Magazine en werd door Carolien de Kovel vertaald voor Science in School. Voor Kennislink is het artikel enigszins bewerkt.

Dit artikel is een publicatie van NEMO Kennislink.
© NEMO Kennislink, sommige rechten voorbehouden
Dit artikel publiceerde NEMO Kennislink op 01 september 2011
NEMO Kennislink nieuwsbrief
Ontvang elke week onze nieuwsbrief met het laatste nieuws uit de wetenschap.