Je leest:

Vormen herkennen

Vormen herkennen

Auteur: | 1 januari 2003

Een hele klus is het, om de oregano tussen al die kruidenpotjes te vinden. Het zou een stuk gemakkelijker zijn als het oreganopotje een rood deksel had. Eén ding is zeker: zoeken is niet eenvoudig, en zoeken naar een theorie die alle waarnemingen verklaart al helemaal niet.

Daar sta je dan, bij de poorten van het Pinkpopfestival in Landgraaf. Je had met je vrienden afgesproken bij de ingang, maar daar staan ze niet meer. Had je ook maar niet te laat moeten komen. Dat wordt nog lastig zoeken tussen 60.000 muziekminners. Wat zou het gemakkelijk zijn als er wat minder mensen waren. Of als je vrienden de fluorgroene vlag hadden meegenomen die jullie normaal gebruiken om elkaar te vinden.

Opvallend. Het is gemakkelijk om een rode tomaat snel te vinden tussen groene tomaten.

Zoektaken maken deel uit van ons dagelijks leven, of het nu op een terras is naar de tafel met familieleden of thuis naar de schaar. De Pinkpopganger heeft de twee belangrijkste variabelen die een rol spelen, al genoemd. Aan de ene kant is dat het aantal dingen waartussen je op zoek moet naar je doel, aan de andere kant de opvallendheid van het doel.

Psychologen bestuderen die visuele zoektaken al decennialang. Van begin jaren tachtig stamt de theorie van de Amerikaanse onderzoeker Anne Treisman, die aanvankelijk al die waarnemingen prachtig leek te verklaren. Andere onderzoekers scherpten echter de laatste tijd hun statistische messen, met als gevolg dat er van Treismans mooie theorie weinig overblijft. Een compleet andere aanpak is vereist.

Ja- of nee-knop

Experimenteel onderzoek naar zoektaken gaat met een beeldscherm. Proefpersonen kijken naar een scherm waarop zich een aantal voorwerpen bevindt, en moeten zo snel mogelijk beoordelen of een vooraf getoond voorwerp (het doel) wel of niet aanwezig is. Staat er een blauw vierkant tussen de gele driehoeken? Dat geven ze aan door op de ja- of de nee-knop te drukken. De computer meet de reactietijd. Hoe gemakkelijker de taak, hoe korter de tijd. Uit de verschillen in reactietijd tussen soortgelijke zoektaken proberen psychologen af te leiden wat de ene taak gemakkelijker maakt dan de andere.

Om geen verkeerde conclusies te trekken, moeten de onderzoekers het aantal fouten verrekenen. Je kunt je reactietijd namelijk aanzienlijk versnellen door het niet zo nauw te nemen. Zou een proefpersoon zonder te kijken gewoon een van de twee knoppen indrukken, dan is zijn reactiesnelheid zeer hoog maar ligt het aantal fouten rond de vijftig procent. De reactiesnelheid zegt in dat geval niets over de zoektaak of de herkenning van het voorwerp op het scherm, omdat de persoon helemaal niet heeft gekeken. Onderzoekers zijn allergisch voor deze speed accuracy trade off. In de praktijk komt de extreme vorm (drukken zonder te kijken) niet snel voor. Soms komen de verschillen in reactietijden niet door de moeilijkheid van de taak, maar doordat de proefpersoon bij de ene taak bereid is meer fouten te maken dan bij de andere. Op zichzelf is dat een interessante constatering, maar voor de onderzoeker betekent het een mislukt experiment.

Zoektaken

Het aantal voorwerpen op het beeldscherm varieert in deze experimenten. Om de een of andere reden is het gebruikelijk geworden om één, zes of twaalf voorwerpen op het beeldscherm te zetten. Bij één voorwerp is er geen sprake van een echte zoektaak, maar leert het experiment of het überhaupt mogelijk is om het doel van de andere voorwerpen (de afleiders) te onderscheiden. Als één voorwerp al een heleboel fouten oplevert, betekent dat dat mensen slecht zijn in het onderscheiden van dingen die sterk op elkaar lijken.

In de begindagen van het psychologisch onderzoek op dit gebied bleek dat een taak als het zoeken van een rode bol tussen groene bollen schijnbaar verschilt van iets als het zoeken van een rode T tussen rode X’en en groene T’s. De taken van het type rode-bol-tussen-groene-bollen staan bekend als parallel, en de andere als serieel.

Bij parallelle zoektaken blijft de reactietijd constant. Proefpersonen zien tussen zes groene bollen even snel of er een rode tussen zit, als tussen twaalf of nog meer bollen. Bovendien maakt het voor de reactiesnelheid niet uit of de rode bol aanwezig is of niet. Het lijkt of de proefpersoon tegelijkertijd (parallel) én alle groene bollen negeert én de rode waarneemt.

Bij seriële zoektaken varieert de reactietijd wel met het aantal voorwerpen. De zoektocht naar de rode T wordt moeilijker (en dus de reactietijd langer) naarmate er meer rode X’en en groene T’s op het beeldscherm staan. Proefpersonen reageren bovendien sneller als de rode T aanwezig is dan wanneer ze afwezig is. Blijkbaar is de zoektaak eenvoudiger als het doel er staat.

Als je in een grafiek de reactietijd uitzet tegen het aantal voorwerpen op het scherm, krijg je een heel ander beeld bij de seriële taken dan bij de parallelle. De seriële taak (de T’s en de X’en) toont een stijgende curve. De reactietijd neemt toe met het aantal letters op het scherm. Die toename kun je uitdrukken in de richtingscoëfficiënt (de helling van de grafiek). Dat is het aantal milliseconden extra per toegevoegde letter. Als de taak moeilijker wordt – bijvoorbeeld als je een lichtgroene T tussen lichtgroene X’en en donkergroene T’s zoekt – wordt de grafiek steiler en neemt de richtingscoëfficiënt toe, tot meer dan 200 milliseconden per letter.

De parallelle zoektocht naar de rode bol tussen de groene toont echter een reactietijd die nauwelijks afhangt van het aantal groene bollen. De curve is vlak; de richtingscoëfficiënt is vrijwel nul. Bovendien zijn de grafieken hetzelfde mét en zonder rode bol.

Je ziet die groene bollen niet eens

Parallelle taken. Het model voorspelt dat bij parallelle taken de reactietijd onafhankelijk is van het aantal voorwerpen op het scherm (de grafiek toont dan ook een horizontale lijn). Proefpersonen reageren bovendien even snel, of het doel nu aanwezig is of niet.

Seriële taken. Bij een seriële taak neemt de reactiesnelheid toe met het aantal voorwerpen op het scherm. De proefpersoon moet zijn ‘zoeklicht’ een voor een op de voorwerpen richten. Dat betekent dat de reactietijd bij afwezigheid van het doel twee keer zo groot is als bij aanwezigheid.

Anne Treisman was de eerste die met een model op de proppen kwam. Ze gebruikte de namen serieel en parallel niet lukraak, maar verwees ermee naar de manier van kijken. Bij seriële taken zou de proefpersoon alle voorwerpen één voor één bekijken, terwijl hij bij een parallelle zoektaak alleen globaal het computerscherm hoeft te bezien.

Centraal in Treismans theorie staan de zogenaamde feature maps (‘kenmerkenkaarten’). Een feature map zou een gebied zijn in het visueel systeem dat vaststelt of een bepaald kenmerk (bijvoorbeeld de kleur rood) in het gezichtsveld aanwezig is. De kleur rood heeft een map, en groen ook. Kijk je naar een scherm met rode en groene bollen, dan raken beide mappen geactiveerd. Als je een rode bol zoekt tussen groene bollen, is de kleur rood een unieke eigenschap van het doel. Om te zien of er een rode bol op het scherm staat, hoef je helemaal niet naar de groene bollen te kijken. Je hoeft alleen maar te kijken of er in de rode map activiteit is. Hoeveel afleiders er zijn en hoeveel activiteit er in de groene map is, doet er niet toe. Is er geen activiteit in de rode map, dan is de zaak ook duidelijk: geen rode bol op het scherm.

Afzonderlijk inspecteren

Bij seriële zoektaken bestaat er daarentegen geen unieke eigenschap die het doel van de afleiders onderscheidt. Dat kan bijvoorbeeld doordat de eigenschap waarin doel en afleiders van elkaar verschillen, geen feature map heeft. Zo ontdekten Nijmeegse onderzoekers – tegen alle verwachting in – dat er geen map is voor symmetrie. Een ander geval is ons voorbeeld van de rode T tussen de rode X’en en de groene T’s. De rode map is immers niet alleen actief bij de rode T (het doel), maar ook bij de rode X. En de map ‘horizontaal’ (het streepje van de T) is actief bij de rode én bij de groene T. Een dergelijke taak heet ook wel een conjunctietaak. Je kunt die niet vervullen door uitsluitend af te gaan op activiteit in beide mappen, nee, je moet beide mappen voor elk voorwerp afzonderlijk inspecteren. Het doel is pas gevonden als je voor één letter activiteit in zowel de map ‘rood’ als de map ‘horizontaal’ aantreft. Bij parallelle taken beschijnt de bundel van je zoeklicht als het ware alle voorwerpen tegelijk, terwijl je ze bij een seriële taak één voor één af moet.

Dit model verklaart tevens waarom de seriële zoektaak bij aanwezigheid van het doel korter duurt dan bij afwezigheid. Als de rode T op het scherm staat, ben je klaar als je hem hebt gevonden, en dat is gemiddeld nadat je de helft van alle letters op het scherm hebt geïnspecteerd. Staat de rode T er niet, dan weet je dat pas als je alle letters hebt gehad. En dat duurt langer – gemiddeld twee keer zo lang, om precies te zijn. De helling van de grafiek is bij zoeken zonder dat het doel aanwezig is, dus twee keer zo groot als met doel.

Meer features, minder theorie

Het zoeken van feature maps werd een populaire bezigheid onder wetenschappers. Het leek immers tamelijk eenvoudig om vast te stellen of een eigenschap inderdaad een eigen map heeft. Verzin een zoektaak en kijk of die parallel is. Zo ja, dan heb je een map gevonden. De psychologisch onderzoekers stelden als grens een richtingscoëfficiënt van tien milliseconden per voorwerp in. Eronder was parallel, erboven serieel. Het probleem is dat elk verschil tussen het doel en de afleiders de beslissende eigenschap kan zijn. Daarvoor moet je controle-experimenten uitvoeren, maar dat heeft onderzoekers er niet van weerhouden een bonte verzameling van mappen te vinden. Afhankelijk van wie je gelooft zijn het er tien à vijftien.

Blokkendoos

Treismans theorie zag er aanvankelijk prachtig uit. De mappen sloten prima aan bij de toenmalige ontdekking van elektrofysiologen dat afzonderlijke hersengebieden op afzonderlijke aspecten van een beeld reageren. Pas later voegen de hersenen alle aspecten weer bij elkaar tot de uiteindelijke waarneming. Treismans theorie volgt dit atomisme en gaat ervan uit dat het menselijk visueel systeem werkt als een soort blokkendoos, die met eenvoudige bouwstenen ingewikkelde waarnemingen bouwt. Dat de eigenschappen in een map eenvoudige eigenschappen zijn, is een stilzwijgende aanname – en bleek precies onwaar te zijn. Zo bestaan er mappen voor driedimensionale eigenschappen. Naarmate er meer mappen bekend werden, brokkelde Treismans theorie dan ook verder af. Daarnaast kan een conjunctietaak (zoals de samenvoeging van ‘rood’ en ‘T-vormig’) tóch parallel zijn. Een rood huis met gele ramen is parallel te onderscheiden van blauwe huizen met gele ramen en rode huizen met blauwe ramen. Kennelijk gebeurt er een stuk meer tijdens visueel zoeken dan je op grond van een atomaire theorie verwacht.

Wolfe laat niets heel

Treismans theorie kampt met nog veel grotere problemen dan alleen de complexiteit van de bepalende eigenschappen. In 1998 vond de Amerikaanse onderzoeker Jeremy Wolfe, verbonden aan Harvard, dat er geen echt onderscheid tussen serieel en parallel bestaat. Deze opmerkelijke conclusie volgde uit een meta-analyse waarin hij alle gegevens van zoektaken die hij de afgelopen tien jaar in zijn laboratorium had uitgevoerd, op een grote hoop gooide. Als er een principieel onderscheid is tussen parallelle en seriële zoektaken, had Wolfe twee groepen richtingscoëfficiënten moeten vinden: eentje in de buurt van de nul, de andere een stuk hoger, bijvoorbeeld rond de twintig milliseconden per voorwerp. Wolfe vond maar één piek, in de buurt van de acht milliseconden per voorwerp.

Verder ontdekte Wolfe dat de richtingscoëfficiënt van een zoektaak mét doel méér dan twee keer zo groot is als die zonder doel. Dat is opmerkelijk. Blijkbaar klopt het niet dat je bij een seriële zoektaak de voorwerpen in willekeurige volgorde afgaat. Om het karwei helemaal af te maken, liet Wolfe ook weinig heel van de grens van tien milliseconden per voorwerp, die zovelen hanteerden.

Losse schroeven

Overeenkomsten tellen. Het model van Duncan en Humphreys verklaart dat een zoektaak gemakkelijker (efficiënter) wordt naarmate afleiders meer op elkaar lijken en minder op het doel. Hoe efficiënter de taak, hoe korter de reactietijd.

Wolfe zette het model van Anne Treisman op losse schroeven, maar zijn resultaten sloten redelijk aan bij een ander soort zoekmodellen. Deze alternatieve modellen repten niet over parallel en serieel, maar maakten een gradueel onderscheid van inefficiënte tot heel efficiënte zoektaken. De Britse onderzoekers John Duncan en Glynn Humphreys zetten hiervoor de toon. Hun model verklaart waarom een zoektaak sneller gaat naarmate de afleiders meer op elkaar lijken en minder op het doel. Overigens had ook Treisman hiervoor in haar model een voorziening getroffen.

De meta-analyse van Wolfe heeft zijn laatste klap nog niet uitgedeeld. Ook voor de modellen zonder principieel onderscheid tussen parallel en serieel bevat ze een nare verrassing. Ze toont namelijk dat proefpersonen bij seriële zoektaken zonder doel langer doorzoeken dan bij parallelle taken zonder doel, zelfs al stoppen ze bij beide taken even snel als het doel wel aanwezig is. Op de een of andere manier gebeurt er dus toch iets bijzonders als proefpersonen een parallel doel – dus een doel met een unieke eigen map – zoeken. De mappen kunnen dus niet helemaal overboord.

De man van de meta-analyse, Jeremy Wolfe, ontwierp zelf ook een model. Het borduurt voort op de mappen van Anne Treisman, maar maakt geen onderscheid tussen parallelle en seriële taken. Wolfe heeft zijn model tamelijk concreet uitgewerkt – concreet genoeg om een computer soortgelijke resultaten te laten verkrijgen als een proefpersoon. Duidelijk minpunt van het model is dat het zo veel vrije parameters bevat dat iemand eens heeft gezegd dat je ‘er een olifant mee kunt fitten’.

Worst in plakjes

Dat het model zelfs met een overvloed aan vrije parameters nog niet alle resultaten omvat, bewijst dat het onderzoek met een fundamenteel probleem zit. We begrijpen het visuele systeem domweg niet goed genoeg. Bij het model van Wolfe kijkt er geen elektronisch oog naar het beeldscherm. Wolfe zélf bekijkt het scherm, en vertelt de computer welke mappen actief zijn. Deze werkwijze gaat voorbij aan het hele pad van beeldscherm via netvlies en oogzenuw naar hersenactiviteit. Of het concept van de mappen inderdaad een tegenhanger heeft in de werkelijkheid, valt nog te bezien. “Dat je een worst in plakjes kunt snijden, betekent nog niet dat de worst uit plakjes is opgebouwd”, zei een visueel onderzoeker uit Utrecht ooit. Je kunt aan een visuele stimulus diverse eigenschappen onderscheiden, maar het is nog niet gezegd dat het visuele systeem die eigenschappen ook voor de waarneming van de stimulus gebruikt.

Na vijfentwintig jaar onderzoek naar visueel zoeken, zijn we nog niet waar we wezen moeten. De huidige trends dicteren een volledig andere aanpak. Het is tijd om afscheid te nemen van pure psychologische modellen die geen rekening houden met de fysiologie van de hersenen. Gedaan met het luie meten van reactietijden. We moeten oogbewegingtesten gebruiken, nagaan wáár iemand tijdens een zoektaak naar kijkt. Dat weerspiegelt over het algemeen waar iemands aandacht op is gericht. Op deze manier heeft Wolfe (hij weer) al vastgesteld dat proefpersonen niet systematisch alle voorwerpen op het computerscherm afgaan, maar dat ze doodleuk terugkeren naar voorwerpen die ze al hebben gehad. Oogbewegingtesten zullen dit onderzoek hopelijk verder helpen. In de tussentijd kunnen we concertbezoekers alleen maar het volgende aanraden: kom op tijd, of zorg ervoor dat je vrienden een herkenningsteken meenemen.

Dit artikel is een publicatie van Natuurwetenschap & Techniek.
© Natuurwetenschap & Techniek, alle rechten voorbehouden
Dit artikel publiceerde NEMO Kennislink op 01 januari 2003

Discussieer mee

0

Vragen, opmerkingen of bijdragen over dit artikel of het onderwerp? Neem deel aan de discussie.

NEMO Kennislink nieuwsbrief
Ontvang elke week onze nieuwsbrief met het laatste nieuws uit de wetenschap.