Je leest:

Statistiek in de rechtszaal

Statistiek in de rechtszaal

Auteur: | 28 mei 2004

‘Denkt u dat statistiek eigenlijk wel een plaats heeft in de rechtszaal?’ Dit was was een van de vragen die gesteld werden door de voorzitter van het gerechtshof in Den Haag aan de professoren Ronald Meester en Michiel van Lambalgen tijdens het proces in hoger beroep tegen Lucia de B.

Het antwoord was dat statistiek en kansrekening veel kunnen bieden, maar dat men er wel heel voorzichtig mee om moet gaan, zoals besproken wordt in het artikel van Ronald Meester in dit nummer van STATOR. In dit artikel zal ik betogen dat statistiek en kansrekening een essentieel onderdeel zijn van vele soorten bewijsmiddelen en hun plaats in de rechtszaal allang al veroverd hebben, zij het misschien niet zo opvallend als in de zaken tegen de verpleegster Lucia de B. en de crècheleidster Bianca K. Ik zal ook ingaan op het statistische bewijs in de zaak Lucia de B.

In de rechtszaak tegen Lucia de B. stond de statistiek veel in de belangstelling. Ik ben niet bij deze zaak betrokken geweest, maar heb hem wel zoveel mogelijk gevolgd, voornamelijk via de media. Daaruit kwam het beeld naar voren van wetenschappers die het totaal met elkaar oneens waren over de waarde van het statistiek bewijs. Terwijl prof. dr. Henk Elffers beweerde ‘het was geen toeval dat patiënten stierven precies op de momenten dat de verdachte dienst had’ (Haagsche courant, 30 januari 2004), bleek dat Meester en van Lambalgen ‘grote moeite hadden met de methode die hun collega had gevolgd om tot zijn uitspraken te komen’ (Haagsche Courant, 10 maart 2004). Daarna verscheen er een pagina groot stuk in de kranten van dr. Aart de Vos, waarin werd voorgerekend ‘als de statistiek het enige bewijs is, is de kans 80 procent dat ze onschuldig is’ (Trouw, zaterdag 13 maart 2004).

Interpretatie van bewijs: de Bayesiaanse benadering

De oorzaak van de schijnbare tegenstelling tussen de uitkomsten van de klassieke methode van Elffers (2003) en de Bayesiaanse methode van de Vos (2004) is van fundamentele aard en heeft te maken met het kansbegrip dat deze stromingen gebruiken. De klassieke statistiek is gebaseerd op een frequentistische definitie van kans, of op de axioma’s van Kolmogorov. Hierbij zijn kansen op bepaalde gebeurtenissen gedefinieerd, maar niet op hypothesen. De Bayesiaanse statistiek hanteert een wat ruimere en subjectieve definitie van kans, namelijk de mate van geloof, die ook op hypothesen kan worden toegepast. Waar een Bayesiaan dus uitspraken kan doen over de kans dat de verdachte de dader is, daar zal een klassieke statisticus beweren dat de verdachte de dader is of niet, maar dat een kansuitspraak hierover niet gedefinieerd is.

In het rechtssysteem, waar de vraag die de rechter moet beantwoorden uiteindelijk is of de verdachte schuldig dan wel onschuldig is, past een Bayesiaanse benadering mijns inziens beter dan een klassieke benadering (Sjerps 2000, 2004). Een invloedrijke stroming in de zogenaamde forensische statistiek is gebaseerd op Bayesiaanse ideeën (Robertson en Vignaux 1995, Aitken en Taroni 2004). Hierin staat de regel van Bayes centraal.

Thomas Bayes (1702-1761) was een achttiende-eeuwse dominee. Na zijn dood werd zijn essay – Essay Towards Solving a Problem in the Doctrine of Chances – gepubliceerd. De Franse wiskundige Laplace accepteerde Bayes’ resultaten, terwijl Boole en anderen die sindsdien in twijfel getrokken hebben. Ondanks die twijfel is de regel van Bayes een geaccepteerd onderdeel van de moderne statistiek.

Om deze regel overzichtelijk te kunnen opschrijven is het handig om eerst wat afkortingen in te voeren. Als we “de kans op …” afkorten met P[…] (van het Engelse probability) en een hypothese met de letter H, dan is P[H] dus de kans op H, ofwel de kans dat de hypothese H juist is. In een rechtszaak dragen zowel de aanklager (prosecution) als de verdediging (defence) een hypothese aan; laten we deze Hp en Hd noemen. Verder is er natuurlijk een bewijsmiddel (evidence) te beschouwen; laten we dit afkorten met de letter E.

De rechter is dan geinteresseerd in de verhouding van de kansen op Hp en Hd. Is die kansverhouding bijvoorbeeld 1:10, dan zal de rechter de verdachte niet veroordelen, maar is de kansverhouding 100.000:1, dan zal hij waarschijnlijk wel veroordelen. De kansverhouding die de rechter in gedachten heeft wordt beinvloedt wanneer er een nieuw bewijsmiddel wordt aangevoerd. Een nieuw gegeven verandert de kansen in zogenaamde voorwaardelijke kansen, in dit geval de kans dat een bepaalde hypothese H juist is, gegeven het bewijsmiddel E. Zo’n kans wordt genoteerd als P[H|E]: het gegeven, of de voorwaarde waaronder de kans wordt uitgerekend, staat achter de verticale streep. De regel van Bayes geeft weer hoe de kansverhouding van Hp en Hd verandert door de introductie van het bewijsmiddel E:

of in woorden: a posteriori kansverhouding = a priori kansverhouding · LR

De laatste term is de afkorting van Likelihood Ratio (ook wel bekend als aannemelijkheidsquotiënt). Volgens de genoemde stroming is het de taak van de deskundige om deze LR te rapporteren. Het inschatten van de a priori kansverhouding moet de deskundige echter overlaten aan de rechter; immers, de deskundige heeft alleen speciale kennis over het ene bewijsmiddel E. Als gevolg hiervan zou de deskundige dus ook geen uitspraken moeten doen over de a posteriori kansverhouding.

Deze opvatting over de rol van de deskundige past goed binnen de wettelijke bepalingen over deze rol. In 344 Sv lid 1 sub 4 staat dat deskundigen verslag moeten uitbrengen ’behelzende hun gevoelen betreffende hetgeen hunne wetenschap hen leert omtrent datgene wat aan hun oordeel onderworpen is", terwijl de Hoge Raad beslist heeft dat de deskundige niet vooruit mag lopen op het aan de rechter voorbehouden oordeel en de rechter ook geen beslissingen mag opdragen. Omdat de wetenschap van de deskundige hem veelal alleen iets leert over de LR, zou hij niet moeten speculeren over het aan de rechter voorbehouden oordeel over de kansverhouding van de hypothesen.

De zaak Lucia de B.

Met de bovengenoemde LR theorie in het achterhoofd beschouw ik de analyse van Elffers in de zaak Lucia de B. als het uitrekenen van de noemer van de LR. Heel losjes gezegd zijn de hypothesen die hij beschouwt: Hd: er is geen verband tussen de momenten dat de verdachte dienst had en het aantal incidenten, en Hp: er is een verband tussen de momenten dat de verdachte dienst had en het aantal incidenten. Zijn conclusie dat Hd verworpen moet worden baseert hij op het inschatten van de kans dat de verdachte bij een groot aantal incidenten betrokken is, als er geen verband is, ofwel P[E| Hd], de noemer van de LR. De Bayesiaanse theorie maakt echter duidelijk dat dit slechts een deel van het verhaal is: de teller van de LR en de a priori kansverhouding Hp:Hd spelen ook een rol.

De teller van de LR, P[E| Hp], is in dit geval de kans dat de verdachte bij een groot aantal incidenten betrokken is, als er wel een verband is. Zonder dit verband nader te specificeren is deze kans niet goed uit te rekenen, maar het moge duidelijk zijn dat de kans om betrokken te raken bij een groot aantal incidenten veel groter is als er wel een verband is dan als er geen verband is (de Vos (2004) schat zijn teller grofweg op ½).

Naast de teller van de LR speelt met name de a priori kansverhouding Hp:Hd een beslissende rol in het bepalen van de uiteindelijke kans dat Hd waar is. De Vos (2004) illustreert dat laatste heel goed met rekenvoorbeelden die laten zien dat bij een extreem kleine a priori kansverhouding Hp:Hd ook de a posteriori kansverhouding Hp:Hd klein zal zijn. Zonder dergelijke rekenvoorbeelden zullen veel mensen dit effect van a priori kansen niet beseffen bij het vernemen van de “klassieke” conclusie dat de hypothese Hd moet worden verworpen met een bepaalde p-waarde.

Wanneer deze conclusie dan ook nog ‘vertaald’ wordt in de rechtszaal als ‘het was geen toeval’ (een stap die ook een klassiek statisticus niet kan maken: de statistische prietpraat is er tenslotte niet voor niks) dan wordt het voor een leek wel heel moeilijk om de rol van de a priori kansen op waarde te schatten. De Vos gaat echter op zijn beurt weer te ver naar mijn smaak door de suggestie te wekken dat het aan de deskundige is om deze a priori kansen in te schatten. Hij gaat hiermee pontificaal op de stoel van de rechter zitten, zoals boven uitgelegd.

Mijn bovengenoemde definitie van het bewijsmateriaal E is eigenlijk wat te slordig. Bij het klassieke hypothese toetsen wordt immers de p-waarde berekend: in dit geval de kans dat Lucia betrokken was bij tenminste een x-tal incidenten. Bovendien moet er nog een post-hoc correctie worden toegepast voor het selectie-effect: Lucia staat in de belangstelling juist omdat zij betrokken is geraakt bij een x-tal incidenten. Beide manoeuvres zijn enigszins arbitrair, zoals al eerder door de Vos (p-waarde; 2004) en van Lambalgen en Meester (post-hoc correctie; 2004) is bekritiseerd.

Een mooi aspect van de Bayesiaanse benadering is dat dergelijke manoeuvres overbodig zijn. Het bewijsmateriaal E is dat Lucia betrokken was bij een x-tal incidenten, en de LR kan gewoon worden uitgerekend zonder dit te vervangen door tenminste een x-tal. Wanneer wij voor het selectie-effect zouden corrigeren door de hypothese Hp te vervangen door bijvoorbeeld H’p: er is een verband tussen de momenten dat één van de 27 verpleegsters op de afdeling dienst had en het aantal incidenten, dan zou de teller van de LR ongeveer een factor 27 kleiner worden, maar de a priori kansverhouding Hp:Hd ongeveer een factor 27 groter. De lagere bewijswaarde als we H’p kiezen in plaats van Hp wordt dus weer gecompenseerd door een grotere a priori kansverhouding, zodat de a posteriori kansverhouding hetzelfde blijft. Ook wanneer we niet op de afdeling willen focussen maar op een nog grotere groep zal er een soortgelijk compensatie-effect optreden. De a priori kansverhouding corrigeert dus op een heel natuurlijke wijze voor het selectie-effect.

Dat er grote verschillen zijn tussen de ‘klassieke’ benadering en de ‘Bayesiaanse’ zal inmiddels wel duidelijk zijn. Toch is hun boodschap uiteindelijk niet zo heel erg verschillend: waar de klassieke stroming Hd verwerpt ten gunste van Hp, komt de Bayesiaanse stroming uit op een grote LR. Beiden concluderen dus min of meer dat het bewijsmateriaal veel waarschijnlijker is als Hp waar is dan als Hd waar is, en in die zin een sterke aanwijzing vormt voor Hp ten opzichte van Hd. Deze sterke aanwijzing moet nu door de rechter gecombineerd worden met de a priori kansverhouding tussen Hp en Hd.

DNA-profielen kunnen worden gebruikt om achtergelaten cellen aan verdachten te koppelen- of juist om te bewijzen dat zij het celmateriaal niet achterlieten. De kans dat een willekeurig gekozen individu hetzelfde volledige DNA profiel heeft als het celmateriaal is kleiner dan 1 op een miljard. Voor verwanten is de kans op een overeenkomend profiel wat groter (een-eiige tweelingen hebben zelfs identieke DNA profielen).De piekhoogte (eigenlijk oppervlakte) geeft de hoeveelheid materiaal weer: hoe hoger de piek, hoe meer materiaal. De plaats van de piek op de horizontale as geeft weer om welk allel het gaat. De getallen die erbij staan zijn de namen van de allelen. Het bijschrift erboven vermeldt om welke loci het gaat. Dit is het profiel van 1 vrouw (dat kun je zien aan het amelogenine locus: dat is X/X, zie links in de grote versie).
Nederlands Forensisch Instituut, Afdeling Biologie

Een parallel met DNA

Een parallel met DNA bewijs is misschien op dit punt verhelderend. Stel dat bij een misdrijf een bloedvlek wordt gevonden die van de dader afkomstig is, en dat hiervan een DNA profiel wordt gemaakt. De analyse lukt slechts gedeeltelijk vanwege de slechte kwaliteit van de bloedvlek, en het resultaat is een zogeheten partieel DNA profiel. Stel verder dat de kans dat een willekeurige persoon dit profiel heeft 1 op 100.000 is, en dat de verdachte hetzelfde DNA profiel bezit. Deze laatste waarneming is, net als bij Lucia, extreem onwaarschijnlijk onder de nulhypothese dat de bloedvlek niet van de verdachte is. Het zal echter ook onmiddellijk duidelijk zijn dat dit niet vertaald kan worden als ‘de nulhypothese is onjuist’. De kans dat de bloedvlek al dan niet afkomstig is van de verdachte hangt namelijk af van de a priori kansverhouding. Wanneer je hier aannamen over doet, zoals de Vos deed in de zaak Lucia, bijvoorbeeld dat er behalve de verdachte nog een half miljoen potentiële daders zijn die allen even waarschijnlijk als de verdachte de bloedvlek achterlieten, dan kun je berekenen wat de kans is dat de bloedvlek van de verdachte afkomstig is. De DNA deskundige zal zich hier echter niet aan wagen, en dat is maar goed ook, want het doen van dergelijke aannamen is niet zijn expertise. Hij zal zich beperken tot het rapporteren van de bovengenoemde match kans 1 op 100.000, een getal dat rechtstreeks is gerelateerd aan de LR (de LR van het bewijsmateriaal ‘bloedvlek en verdachte hebben DNA profiel X’ voor de hypothesen ‘de bloedvlek is afkomstig van de verdachte’ versus ‘de bloedvlek is afkomstig van een willekeurige niet-verwante persoon’ is gelijk aan 1/match kans van profiel X, als we labfouten e.d. negeren).

Andere toepassingen van statistiek in het strafrecht

In de zaken Bianca K en Lucia de B. stond de statistiek in de schijnwerpers. Maar ook in andere zaken speelt de statistiek een belangrijke rol, zij het minder opvallend. Gaat het om technisch bewijs, dan zijn statistiek en kansrekening vaak gebruikt om de conclusie te onderbouwen. Het DNA profiel ontleent zijn grote bewijskracht aan de extreem lage match-kans, het milieu-onderzoek drijft volledig op representatieve monstername en adequate analyse van de data. In feite zijn er voorbeelden te over waarbij statistiek en kansrekening een rol spelen in de vergaring of waardering van het strafrechtelijk bewijsmateriaal: steekproeven in drugszaken, automatische sprekerherkenningstechnieken, snelheidsbepalingen van auto’s, de Oslo confrontatie (de ‘line-up’ van verdachten), de geuridentificatieproef door honden, kansspelen, epidemiologische aspecten van de toxicologie. Statistiek en kansrekening zijn daarmee mijns inziens al heel lang geaccepteerd in de rechtszaal. Heel stiekem denk ik dat juristen eigenlijk ook deel uitmaken van onze beroepsgroep: het inschatten en combineren van waarschijnlijkheden op basis van vaak wankele informatie om tot een beslissing te kunnen komen vereist beslist enig gevoel voor ons vak.

Statistiek en kansrekening zijn al heel lang een geaccepteerd en een essentieel onderdeel van verschillende soorten bewijsmiddelen in het strafrecht. De zaak Lucia de B. leverde veel publiciteit, waarbij het leek of de deskundigen tegenstrijdige conclusies trokken. Mijn mening is dat de verschillende stromingen in essentie de boodschap brengen dat het grote aantal incidenten waarbij Lucia betrokken was een sterke aanwijzing is dat er een verband is tussen deze incidenten en de momenten waarop zij dienst had. Deze aanwijzing moet door de rechter echter gecombineerd worden met de a priori kans op een dergelijk verband, die volgt uit het overige bewijsmateriaal.

Over de auteur

Marjan Sjerps studeerde Wiskunde aan de Katholieke Universiteit Nijmegen met als specialisatie statistiek en operations research. Na haar afstuderen in december 1998 begon zij een promotie-onderzoek aan de Universiteit Leiden in de theoretische biologie (evolutionaire ecologie). Sinds 1993 is zij als statisticus verbonden aan het Nederlands Forensisch Instituut. Zij adviseert de onderzoekers van dit instituut op statistisch terrein, treedt soms op als deskundige in rechtszaken en doet onderzoek binnen het fascinerende gebied van de “forensische statistiek”.

Dit artikel verschijnt in STAtOR, periodiek van de Vereniging voor Statistiek en Operations Research (VVS-OR). In hetzelfde nummer zijn ook de meningen te lezen van andere statistici die bij de zaak Lucia de B. betrokken waren, zoals Henk Elffers en Ronald Meester.

Literatuur

Aitken C.G.G. en Taroni, F. (2004) Statistics and the evaluation of evidence for forensic scientists, 2nd ed., Chichester: Wiley.

Elffers, H. (2003) Bij toeval veroordeeld? Nederlands JuristenBlad 34, 1812-1814.

Lambalgen, M. van, en Meester, R. (te verschijnen in 2004) Wat zeggen al die getallen eigenlijk? – de statistiek rond het proces tegen Lucy de B., Nederlands JuristenBlad

Robertson B. en Vignaux G.A. (1995) Interpreting evidence, Chichester: Wiley

Sjerps, M. (2000) Pros and Cons of Bayesian reasoning in Forensic Science, in: J.F. Nijboer and W.J.J. M. Sprangers (eds) Harmonization in Forensic Expertise, Series Criminal Sciences, Amsterdam: Thela Thesis, 2000, pp557-585

Sjerps, M. (2004) Forensische statistiek, Nieuw Archief voor Wiskunde 5 (5), 4-9

Vos, A. F. de (2004) Door statistici veroordeeld? Nederlands JuristenBlad 13, 686-688

Dit artikel is een publicatie van NEMO Kennislink.
© NEMO Kennislink, sommige rechten voorbehouden
Dit artikel publiceerde NEMO Kennislink op 28 mei 2004

Discussieer mee

0

Vragen, opmerkingen of bijdragen over dit artikel of het onderwerp? Neem deel aan de discussie.

NEMO Kennislink nieuwsbrief
Ontvang elke week onze nieuwsbrief met het laatste nieuws uit de wetenschap.