Je leest:

Wie is er écht Man of the Match?

Wie is er écht Man of the Match?

Bepaal de beste voetballer met de computer

Auteur: | 24 juni 2010

Man of the Match, de beste speler van het team, dat wil elke voetballer wel zijn. Belangrijk dus dat dit zo objectief mogelijk bepaald moet worden. Een computerprogramma ontwikkeld aan de Northwestern University (Illinois, VS) kan hierbij helpen.

Wesley Sneijder. Hij zou volgens de FIFA de beste speler zijn geweest tijdens Nederland-Denemarken én Nederland-Japan. Dat klinkt best aannemelijk als je niet gekeken hebt, want hij is tenslotte erg goed. Maar dat was niet zo te zien tijdens de eerste twee poulewedstrijden van het Nederlands Elftal. Had de titel Man of the Match naar iemand anders gemoeten? Maar naar wie dan?

Flickr: DazMSmith

Om dat goed te kunnen bepalen, zul je de prestaties van de spelers objectief moeten beoordelen. Dat is geen mensenwerk, want wij kunnen onze mening maar lastig buiten beschouwing laten; een computer zou dat echter wel moeten kunnen.

Dat vond ook Luís Amaral, een professor aan Northwestern University (Illinois, VS). Hij ontwikkelde met zijn onderzoeksteam een computerprogramma dat objectief kan bepalen welke speler het best heeft gepresteerd.

Van statistieken naar netwerk

Een computer kijkt niet zoals wij naar een voetbalwedstrijd, de beelden hebben geen betekenis. Met getallen kan een computer echter goed overweg en die zijn volop beschikbaar. De UEFA heeft namelijk van het Europees Kampioenschap 2008 een grote hoeveelheid statistieken online gepubliceerd. Door software te schrijven die deze gegevens downloadt en verwerkt, kon Amaral aan de slag met zijn ‘voetballer-meet-systeem’.

Ook tijdens het WK 2010 worden weer statistiek verzameld. De NOS doet dat zelfs real-time. Je kunt via internet het ‘Tweede Scherm’ volgen, waarop de wedstrijd live van statistieken wordt voorzien.

De kern van Amaral’s systeem is een flow network, een gerichte graaf. In dit netwerk is elke speler een node en de verbindingen tussen de nodes representeren passes tussen de spelers. Bij elke verbinding hoort dan ook een getal: het aantal passes dat succesvol de ander bereikt. Daarnaast zijn er nog twee extra nodes toegevoegd. De ene is ‘schot op doel’ en de ander ‘schot naast’. Verbindingen van speler-nodes naar de schot-nodes geven aan hoeveel van zulk soort schoten een speler gelost heeft.

Zo zou (een stukje van) het flow network eruit kunnen zien. Je ziet dan bijvoorbeeld dat Nigel de Jong de bal vrijwel even vaak naar Wesley Sneijder speelt als naar Rafael van der Vaart (6 om 5). Daarnaast zie je dat Robin van Persie de meeste ballen van Sneijder krijgt (11) en dat hij op doel schiet: 2 belanden er tussen de palen en 4 gaan naast. Het blauwe pad geeft aan hoe een doelpunt tot stand is gekomen.

Het meten van belangrijkheid

Maar hoe komt Amaral van dit netwerk nou naar een waarde voor ‘belangrijkheid’ voor iedere speler? Hiervoor moet je eerst vaststellen wat ‘belangrijkheid’ precies is. Amaral definieert dat als volgt: de mate waarin iemand tussen anderen in staat, de bal doorgeeft en verdeelt, en hierdoor bijdraagt aan het uiteindelijke doel, namelijk scoren. Als je dit verhaal ‘vertaalt’ naar het flow network, dan komt het neer op meten hoe vaak een node op een route ligt die naar een doelpunt leidt.

Betweenness geeft centraalheid

Er zijn verschillende manieren om de ‘centraalheid’ van een node te bepalen. De betweenness-maat zegt dat een node heel centraal is wanneer hij vaak op de kortste weg ligt tussen twee nodes. Ook in de echte wereld is dat te zien: iemand die telkens de communicatie tussen twee mensen onderschept (en fungeert als doorgeefluik), beschikt over veel informatie. Dit maakt hem een belangrijk persoon in de groep.

Om dit te kunnen meten, kun je de betweenness van een node uitrekenen. Dit is een maat die aangeeft hoe vaak een node op de kortste weg ligt tussen twee andere nodes. Amaral heeft deze standaardmaat aan de huidige situatie aangepast door als eind-node de ‘schot op doel’- node te nemen. Wanneer je dán de betweenness uitrekent, bereken je dus hoe vaak een speler deel uitmaakt van een aanval die een doelpunt oplevert. Amaral noemt deze maat de flow centrality.

Kansen en nauwkeurigheid

Het uitrekenen van de betweenness (en dus de flow centrality) heeft alles te maken met kansen. Volgens de formule van de betweenness moet je namelijk de kans berekenen dat de speler deel uitmaakt van een route naar een score.

In principe kan bij elke speler het pad beginnen dat uiteindelijk naar een doelpunt leidt. Daarnaast kan elke speler in deze route gebruikt worden. Maar de kans dat een bepaalde speler daadwerkelijk onderweg een bal krijgt, hangt af van twee dingen: de pass-nauwkeurigheid en de schot-nauwkeurigheid van de spelers.

Dat Spanje een sterke ploeg is, is hier wel duidelijk. In een oefenwedstrijd tegen Polen (8 juni 2010) lieten de spelers zien dat het met hun pass – en schotnauwkeurigheid wel goed zit.

Wanneer de pass-nauwkeurigheid laag is, verkleint de kans dat de speler de bal krijgt. Er wordt dan niet goed overgespeeld dus is er ook minder kans dat een individuele aangespeeld wordt. Is de schot-nauwkeurigheid laag, dan wordt er weliswaar goed overgespeeld, maar misschien weer niet gescoord aan het einde van de route. Dan is de kans dat de speler meehelpt aan een doelpunt ook kleiner. De pass – en schot-nauwkeurigheid bepalen dus voor een groot deel hoe belangrijk een speler in het team is.

Resultaten in beeld

Het systeem van Amaral berekent de pass – en schot-nauwkeurigheid aan de hand van de verzamelde statistieken. Daarna berekent het voor elke voetballer de benodigde kans: hoe waarschijnlijk is het dat de speler een rol speelt bij het doelpunt? Deze kansen gebruikten Amaral en zijn team ten slotte om een lijst te maken van de beste spelers van het EK 2008 (zie tabel in onderstaande afbeelding). En wat blijkt? Die klopt heel behoorlijk met de algemene opinie! Daarnaast hebben ze een leuke visualisatie van de netwerken gemaakt.

Links zie je de lijst met beste spelers die Amaral en zijn team maakte voor het EK2008. Niet slecht, want veel van de spelers werden ook genoemd in het ‘Team of the Tournament’ (gemaakt door de UEFA). Rechts staan de visualisaties van de flow networks van Spanje en haar tegenstanders in de kwartfinale, halve finale en de finale.

In de afbeelding zie je de netwerken van de wedstrijden die Spanje speelde in de knock-out fase. De rondjes (nodes) zijn de spelers, met bijbehorend rugnummer. De kleur van de node representeert de pass-nauwkeurigheid, waarbij geldt hoe roder, hoe beter. Ook de grootte is interessant: een groter rondje geeft aan dat de speler erg belangrijk is. Hetzelfde principe geldt bij de lijnen. Die geven de passes tussen de spelers aan en hoe vaker die goed gaat, hoe dikker de lijn. De blokjes in het midden geven schot-informatie. Lijntjes naar de ‘G’ representeren schoten op doel en de lijntjes naar de ‘W’ zijn schoten die naast gingen.

Uit de visualisatie blijkt dat Spanje geheel terecht het EK heeft gewonnen, want hun nodes zijn over het algemeen een stuk groter dan die van de tegenstander. Zo’n soort situatie zul je straks ook zien voor de WK-finale, alleen zijn wíj dan degenen met de super-nodes!

Literatuur

Duch J, Waitzman JS, Amaral LAN, “Quantifying the Performance of Individual Players in a Team Activity.” PLoS ONE 5(6): e10937. 2010

Lees meer over voetbal en statistiek op Kennislink:

Oeps: Onbekende tag `feed’ met attributen {"url"=>"https://www.nemokennislink.nl/kernwoorden/voetbal/statistiek/index.atom?m=en", “max”=>"7", “detail”=>"minder"}

Dit artikel is een publicatie van NEMO Kennislink.
© NEMO Kennislink, sommige rechten voorbehouden
Dit artikel publiceerde NEMO Kennislink op 24 juni 2010
NEMO Kennislink nieuwsbrief
Ontvang elke week onze nieuwsbrief met het laatste nieuws uit de wetenschap.