Je leest:

Onderzoek uitgelicht: informaticus Jan-Mark Geusebroek

Onderzoek uitgelicht: informaticus Jan-Mark Geusebroek

Auteur: | 10 oktober 2007

Van het besturen van een vliegtuig tot het voorspellen van het weer; de mens gebruikt computers voor de meest uiteenlopende zaken. Maar kan een computer ook goed zien en zelfs oordelen of iets mooi of lelijk is? Informaticus Jan-Mark Geusebroek werkzaam bij het Intelligent Systems Lab Amsterdam (ISLA) van het Instituut voor Informatica, onderzoekt hoe hij een computer net als de mens kan leren kijken.

Geusebroek houdt zich bezig met verschillende onderzoeksrichtingen binnen de informatica. Op het moment werkt hij aan het zo compact mogelijk representeren van beelden waarbij alleen de belangrijkste kenmerken over blijven. ‘Ik ben op zoek naar dé features (kenmerken) die een object omschrijven’, zegt Geusebroek. ‘De computer moet deze kenmerken leren, zodat hij begrip krijgt van dingen.’ Om zijn onderzoek inzichtelijk te maken, leert Geusebroek een robothondje objecten te herkennen, waarbij een wereldwijd netwerk van computers het ‘brein’ vormt van het hondje.

Foto: UvA, Bob Bronshoff

Klik hier voor een demonstratiefilmpje van de robothond

Het robothondje herkent na een paar jaar onderzoek al zo’n duizend dingen. ‘Het kost ongeveer 20 milliseconden voor hem om een nieuwe foto te ’leren’ en per object zijn zes tot tien foto’s nodig.’ In theorie zou het hondje dus binnen een paar minuten duizend nieuwe objecten moeten kunnen leren herkennen, mits de foto’s allemaal al gemaakt zijn. Geusebroek geeft toe dat het maken en voorschotelen van de foto’s nog wel veel tijd kost. Bovendien weet hij niet hoe het beestje zich gaat gedragen bij het identificeren van zeer grote aantallen objecten, bijvoorbeeld in een warenhuis met al gauw zo’n twintig- tot vijftigduizend voorwerpen. Ondanks de haken en ogen die er nu nog aan kleven, is vanuit het bedrijfsleven wel interesse in het slimme robothondje.

Een groot deel van Geusebroeks onderzoek zit in de vraag ‘Wat moet een computer leren om objecten te herkennen?’ Hiervoor zet hij afbeeldingen om in statistieken. Geusebroek kwam erachter dat de zogeheten Weibull-statistiek informatie levert die belangrijk is voor objectherkenning. ‘Je zet je camera aan, maakt een foto en overal in je beeld zit uiteindelijk die Weibull-verdeling! Dat vind ik echt frappant’, vertelt Geusebroek enthousiast. ‘Dat deze verdeling terugkomt was al bekend, maar ik ontdekte dat dit echt een elementaire feature is voor beeldherkenning.’

Foto: UvA, Bob Bronshoff

‘Niemand anders nog had de Weibull-statistiek hiervoor gebruikt, integendeel. Toen ik vier à vijf jaar geleden hierover een artikel schreef, kreeg ik het commentaar dat het belachelijk was. Uiteindelijk heb ik het wel gepubliceerd, maar dan als onderdeel van de methodiek.’ Inmiddels maakt een groot deel van de ISLA-groep gebruik van de methode, en met succes. Tijdens vergelijkende proeven waaraan teams van verschillende onderzoekinstituten meededen, scoorde het ISLA steeds zeer goed.

Weibull-statistiek

Stel, je bekijkt iemands cijferlijst en diegene heeft zevens, wat zesjes, een paar achten, een negen en een vijf behaald. Als je een grafiekje maakt van die cijfers en het aantal keer dat het cijfer is gehaald, krijg je een mooie Gaussische verdeling, een klokvorm. Bij Weibull-statistiek sorteer je de cijfers en neem je steeds het verschil tussen de opvolgende cijfers. Vervolgens zet je de afstand tussen twee opeenvolgende getallen en het aantal keer dat dit voorkomt in een grafiekje. Dit levert een Weibull-verdeling op. Geusebroek vindt deze verdeling terug in veel afbeeldingen, waarbij de exacte vorm van de uiteindelijke grafiek kenmerkend is voor de ruimtelijke structuur van het object.

Kijken als mens

Geusebroek denkt dat er veel te leren valt van hoe mensen kijken. ‘Een mens wordt geboren met hersenen, een heel ingewikkelde structuur die in miljoenen jaren zo geëvolueerd is. Ik kijk naar de buitenwereld en ga ervan uit dat de mens daarop is aangepast. Stel, je ziet je hoofd als een grote rekenmachine, wat moet je dan uitrekenen om van het plaatje dat je ziet, te komen tot gedachten over dat plaatje? Op die manier probeer ik mijn computer te laten kijken, dus steel ik wat onderdelen van de menselijke perceptie, zoals drie kleurkanalen. Meer kleurkanalen zou waarschijnlijk beter werken, maar dat kost ook meer pixelruimte; meer kleur is dus minder resolutie. Minder kleurkanalen is niet handig, want dan ben je kleurenblind. Mensen zijn ook heel gevoelig voor bewegingen. Daarbij let je zowel op bewegingen in intensiteitsverschil als in kleurcontrast, dus je ziet bewegende randen. Dit gebruik ik vervolgens in de computeralgoritmiek.’

Of de computer ooit zal zien als de mens is nog maar de vraag. ‘Over twintig jaar hebben computers waarschijnlijk dezelfde rekenkracht als het menselijk brein. Maar wat nog mist is de algoritmiek. We krijgen wel steeds een beter beeld. Neurobiologen en psychologen weten dankzij nieuwe fmri-technieken ongeveer welke gebieden in de hersenen op welk moment een rol spelen. We hebben echter geen idee wat er nu precies wordt uitgerekend. Ik vergelijk het werk van neurologen wel eens met het bekijken van een pentium-4-processor onder een microscoop en dan proberen te zien hoe het werkt. Het is supercomplex.’

Geusebroek is op zoek naar het rechtstreekse gevolg van de natuurkunde op de statistiek. ‘Als de zon ondergaat, hoe verandert dan het contrast in het gras? Kun je met een algoritme exact beschrijven hoe de structuren veranderen ten gevolge van die ondergaande zon?’ Geusebroek ontwikkelde dankzij zijn onderzoek een andere manier van observeren. ‘Ik heb geleerd zorgvuldiger te kijken, ben in een foto op zoek naar een structuur. Ik kijk misschien langer dan anderen naar een stuk boomschors.’

Geusebroeks hoofddoel, het leren kijken van de computer net als de mens, komt in de eerste plaats voort uit nieuwsgierigheid. Lachend geeft hij toe ‘Het zou ook wel handig zijn als mijn computer echt iets ziet. Dan ga ik zelf achterin de auto zitten, en laat ik mijn computer lekker rijden.’

Foto: UvA, Bob Bronshoff

Beeldverwerking

Geusebroek kwam bij de UvA terecht via de LTS-electrotechniek en de HTS-electronica. ‘Ik deed mijn vervangende dienst aan de UvA en liep gecombineerd stage bij moleculaire celbiologie en bij het Instituut voor Informatica. De bedoeling was dat ik van een korrelige beeltenis van prachtige driedimensionale dna-structuren, een echt mooi plaatje ging maken. Dit was mijn introductie in de beeldverwerking.’ Geusebroek kon als aio terecht bij het ISLA. ‘Een Belgisch farmaceutisch bedrijf wilde monsters analyseren, grote platen met celpreparaten. Om een monster van levende cellen lange tijd te volgen is het belangrijk dat de microscoop gefocust blijft, maar dat ging vaak mis. Ik ontwierp een algoritme dat een microscoop continu in focus houdt.’ Geusebroeks onderzoek leidde tot een wereldwijd patent. Een volgende uitdaging vond Geusebroek in het analyseren van kleuren binnen de preparaten. ‘De kleuring werd door mensen beoordeeld. Het was arbeidsintensief en subjectief werk. Ik heb me in de standaardisatie verdiept.’ Na zijn promotie op dit onderwerp ontving Geusebroek een VENI-beurs van NWO voor het onderzoek naar ‘kijkende’ computers.

Erotische plaatjes

Inmiddels begeleidt Geusebroek drie aio’s. Een van hen onderzoekt in samenwerking met onderzoekers uit Groningen hoe het oog beweegt tijdens het kijken naar een afbeelding. ‘Als je iemand een plaatje van een persoon laat zien, kijken veel mensen als eerste naar het gezicht. Maar het duurt ongeveer 100 milliseconden voor je überhaupt een gezicht ziet. Waar kijk je in die eerste milliseconden naar? En hangt dat af van de inhoud van het plaatje?’

Geusebroek werkt ook samen met de universiteit van Bonn. ‘We schotelen mensen plaatjes voor met emotionele inhoud, bijvoorbeeld zielige, gewelddadige of erotische plaatjes. De fmri-scanner laat zien welke gebieden in de hersenen oplichten. Wij kijken vervolgens in hoeverre de beeldinhoud bepalend is voor de emoties. Zien we als we bijvoorbeeld de kleursetting standaardiseren nog steeds emoties?’

In samenwerking met de Utrechtse afdeling psychofysica onderzoekt Geusebroek ook de gevoeligheid van het oog voor het onderscheiden van kleuren en structuren. ‘Hoe ziet een mens een boom? Je neemt niet elk blaadje afzonderlijk op, toch krijg je de indruk ’boom’. Hoe komt deze indruk tot stand?’

Uiteindelijk hoopt de informaticus te kunnen voorspellen waarnaar mensen kijken bij een plaatje. Wanneer dat bekend is kan deze informatie gebruikt worden om de computer beter te laten kijken. ‘We hopen dat we het systeem ook subjectieve beoordelingen kunnen leren, zodat het robothondje straks niet alleen dingen herkent, maar ook onderscheid maakt tussen wat mooi en niet mooi is.’

Dit artikel is een publicatie van Universiteit van Amsterdam (UvA).
© Universiteit van Amsterdam (UvA), alle rechten voorbehouden
Dit artikel publiceerde NEMO Kennislink op 10 oktober 2007

Discussieer mee

0

Vragen, opmerkingen of bijdragen over dit artikel of het onderwerp? Neem deel aan de discussie.

NEMO Kennislink nieuwsbrief
Ontvang elke week onze nieuwsbrief met het laatste nieuws uit de wetenschap.