Naar de content

Politie voorspelt criminaliteit dankzij big data

Op basis van datasets uit het verleden voorspelt het Criminaliteits Anticipatie Systeem de toekomst

Alexandre Carvalho (CC BY 2.0)

Het is een bekend plaatje in politieseries op tv: detectives staren naar een plattegrond aan de muur, volgeprikt met foto’s van plaatsen delict en gekleurde draden. Aan een digitale versie daarvan werkt Dick Willems voor de Nederlandse Politie.

Waar plegen boeven een inbraak, beroven ze iemand of mollen vandalen een bushokje? Algoritmes helpen om de antwoorden hierop te vinden, door te voorspellen waar de kans op criminaliteit het grootst is. Dit gebeurt dankzij het zogeheten Criminaliteits Anticipatie Systeem (CAS), dat Willems optuigde voor de Nederlandse Politie. In de zomer van 2017 is de laatste pilot afgerond, dus nu wordt zijn systeem landelijk in gebruik genomen.

In het CAS wordt een stad, dorp of ander gebied opgedeeld in vakjes van 125 bij 125 meter. Per stukje berekent het systeem de kans op bepaalde criminaliteit door gebruik te maken van datasets van de politie; registraties van inbraken, straatroven en vandalisme bijvoorbeeld, of de adressen van bekende plegers. “Je kunt het CAS zien als een trechter”, zegt Willems. “De data die je erin gooit worden gefilterd op relevantie en geprojecteerd op een kaart.”

Beeld uit het CAS tijdens de eerste pilot; een voorspelling van bepaalde criminele gedragingen in Amstelveen.

Dick Willems

Waar slaan inbrekers toe?

Het is de bedoeling dat informatiespecialisten CAS gebruiken als gereedschap bij het maken van werkopdrachten, de documenten die bepalen waar en wanneer er wordt gesurveilleerd. Elke week geeft CAS in de vorm van een kaart met gekleurde vakjes een voorspelling van de criminaliteit van de komende zeven dagen erop. Tijdgrafieken geven daarbij piekmomenten aan.

Willems benadrukt dat de agenten niet blind op het systeem varen: de informatiespecialist toetst bevindingen uit het CAS door onderzoek te doen in politiesystemen of even te bellen met de wijkagent. “Die menselijke duiding en lokale kennis is belangrijk bij het voorkomen van valse causaliteit”, zegt Willems. Factoren die samen stijgen hoeven elkaar immers niet te beïnvloeden. Het CAS kan goed patronen herkennen die anders onopgemerkt waren gebleven, maar het is geen vervanging van bestaand politiewerk. Willems: “Met gekleurde vierkantjes alleen gaan we de wereld niet redden.”

Dick Willems werkte als analyst in het bedrijfsleven voordat hij bij de politie aan de slag ging. Toen hij het systeem bouwde voerde hij veel gesprekken met wetenschappers van de politie, onder anderen criminologen en sociologen. “Ik wist toen niets over het gedrag van criminelen”, vertelt Willems. “Inbrekers bijvoorbeeld: slaan ze toe in hun eigen buurt of juist elders? Dat soort dingen moet je weten om een goed werkend algoritme in elkaar te zetten.” Willems leerde dat er een groep inbrekers bestaat die in hun eigen leefgebied toeslaan, maar dat die met name in grotere steden voorkomen. Dat betekent voor het algoritme dat de kans op inbraak in een gebied beïnvloed kan worden door inbraken in de buurt, maar ook door in de buurt wonende veroordeelde inbrekers.

Willems zette het systeem in 2012 op in SPSS Modeler, een programma voor voorspellende analyses dat ook gebruikt wordt door de Highway Patrol in de Verenigde Staten. Aan de basis van het systeem is in al die jaren weinig veranderd. “Nu draait het programma op een standalone server, eigenlijk niet meer dan een uit de kluiten gewassen pc”, vertelt Willems. “Er wordt straks een nieuw systeem gebouwd met het big data-framework Hadoop dat minder tijd nodig zal hebben voor berekeningen.” Uiteindelijk krijgen agenten misschien wel op hun smartphone toegang tot de kaarten.

Openbare verlichting en afvalverwerking

De voorspellingen van het CAS zijn gebaseerd op patronen die algoritmes in de gegevens vinden. Sinds de recente reorganisatie van de politie is er een datacenter waarin alle datasets van de politie worden bewaard, het zogenaamde central data warehouse. Het CAS is daarop aangesloten en kan al die gegevens gebruiken, maar daar blijft het niet bij. “Onze eigen informatie vullen we aan met datasets van onder andere het Centraal Bureau voor de Statistiek”, zegt Willems. “Het gaat dan vooral om demografische en socio-economische variabelen.”

Het is bij datasets van buiten de politie waar Willems de grootste mogelijkheden voor uitbreiding ziet. “We hebben al geëxperimenteerd met het meenemen van data uit Open Street Maps, een project met open source kaartinformatie. Je kunt je voorstellen hoe waardevol het is om te weten waar de op- en afritten van de snelweg zijn, in verband met mogelijke vluchtroutes.” De preventie van criminaliteit is volgens Willems niet alleen een zaak van de politie, maar van de maatschappij. “Ik ben benieuwd welke verbanden je kunt ontdekken als je datasets uit bijvoorbeeld openbare verlichting of afvalverwerking in het CAS combineert met politiedata.”

Omdat het systeem nu landelijk wordt uitgerold, is Willems een groot gedeelte van zijn tijd kwijt aan het geven van praatjes en workshops. Als hij terugdenkt aan de tijd dat hij in zijn eentje het eerste systeem neerzette gaat het weer kriebelen. “Ik zou zeker weer willen sleutelen aan CAS, maar het is beter dat anderen er nu naar gaan kijken. Ik heb zelf wel ideeën, maar het is mooier als het doorontwikkeld wordt door de politie als organisatie, niet door mij.” Als een nieuw team straks het CAS overneemt kan Willems elders een nieuw project uit de grond stampen. Hij kijkt al rond naar de volgende organisatie om te leren met big data om te gaan. “Ik weet dat de recherche op zoek is naar manieren om data-analyse toe te passen. Wie weet…”

De werking van het CAS in het kort uitgelegd. Bron: Cihan Ozdemir voor NEMO Kennislink

ReactiesReageer