De IAT, een onbetrouwbaar, maar nuttig psychologisch instrument

Dit artikel is gepubliceerd in het zomernummer van Skepter, 2019.

Lange tijd was de Impliciete Associatietest het lievelingetje van de sociale psychologie. Wetenschappers, politici en journalisten prezen het meetinstrument de hemel in. Maar inmiddels begint de ijzersterke reputatie af te brokkelen. Meet de test echt onze intuïtieve vooroordelen? En is hij een goede voorspeller van discriminerend gedrag?

Toen de eerste resultaten van de Impliciete Associatietest (IAT) eind vorige eeuw in de kranten verschenen, schrok het publiek zich rot. Driekwart van de Amerikanen koestert onbewust vooroordelen ten opzichte van zwarte mensen, zo bleek uit de test. Ook de onderzoekers zelf, Mazharin Banaji, hoogleraar psychologie aan Harvard, en Anthony Greenwald, hoogleraar aan de Universiteit van Washington, waren niet zonder zonden: Banaji schaamde zich diep voor haar scores op de test, zei ze tegen de Washington Post. En Greenwald noemde zijn eerste sessie met de IAT een moment van schokkend zelfinzicht.

Ook onder wetenschappers sloeg het nieuws in als een bom: de IAT werd een revolutie in de sociale psychologie genoemd, briljant in zijn eenvoud. Doordat hij gebaseerd was op reactietijd en niet op zelfrapportage, kreeg de test bovendien het aureool van exactheid en objectiviteit, iets waar andere psychologische meetinstrumenten, zoals persoonlijkheidstesten, een puntje aan konden zuigen.

De eerste versie van de test ging alleen over intuïtieve voorkeuren voor zwart of wit, de Race-IAT, maar later kwamen er varianten bij, zoals leeftijd, gender en lichaamsgewicht. En al snel maakten de architecten van de IAT een website waar je de test kon doen, gehost door Harvard. Inmiddels hebben de onderzoekers de data van meer dan 17 miljoen mensen verwerkt en is het psychologisch meetinstrument ook buiten de wetenschap bekend. Zo refereerde Hillary Clinton in haar eerste debat met Donald Trump aan de test door te zeggen dat we allemaal ‘impliciet bevooroordeeld’ zijn. Iets wat Trump later vrij vertaalde als: ‘Ze suggereert dat iedereen, inclusief onze politie, racistisch is.’

Na de eerste schokkende resultaten volgden nog meer persberichten over de onbewuste vooroordelen van het Amerikaanse volk. De meeste mensen leggen een sterker verband tussen zwart en wapens dan tussen wit en wapens, zo bleek uit de test. Zelfs zwarte Amerikanen doen dit in meerderheid. Tachtig procent van de Amerikanen hebben een sterkere associatie met jong en goed, dan met oud en goed. En driekwart van de mannen legt sneller een verband tussen man & werk en vrouw & gezin dan het tegenovergestelde. Tachtig procent van de vrouwen doet dit trouwens ook.

Dat het grote publiek de Impliciete Associatietest omarmde, komt doordat de test een gemakkelijke verklaring biedt voor een complex verschijnsel: racisme en maatschappelijke ongelijkheid. En bovendien voedt de test de hoop dat er een oplossing is voor dit probleem: als we ons bewust worden van onze vooroordelen, kunnen we er iets aan doen. In een tijd waarin zwarte piet tot emotionele debatten leidt, etnische profilering van politieagenten aan de kaak wordt gesteld, en diversiteit op de werkvloer wordt gestimuleerd, is de IAT dan ook een welkom instrument.

Zo liet programmamaker Sunny Bergman in haar documentaire Zwart als roet uit 2014 een aantal mensen de IAT maken. Bijna allemaal hadden ze een impliciete voorkeur voor witte boven zwarte mensen. En op Facebook schreef Bergman dat er zelfs een verband was tussen de IAT-uitslag van leerkrachten en het studieadvies dat ze aan allochtone leerlingen gaven: ‘Bij de leerkrachten die slecht scoorden op de IAT-test was de CITO-uitslag van de allochtone kinderen in de klas significant lager.’

Betrouwbaarheid onder de maat

De populariteit van de test zorgde ervoor dat de kritische discussie over de IAT lange tijd in besloten kring werd gevoerd. In gerenommeerde wetenschappelijke tijdschriften discussieerden ambassadeurs en critici over de vraag of de IAT nu wel of niet een diagnostisch instrument was: kon de test discriminerend gedrag voorspellen? Maar toen The New York Times in 2017 op zijn website een longread publiceerde van wetenschapsjournalist Jesse Singal, was de beer los en stroomde de kritiek van voorgaande jaren naar buiten.

Al eerder was namelijk gebleken dat de IAT niet voldoet aan de kwaliteitseisen die normaliter voor psychologische meetinstrumenten gelden. De betrouwbaarheid is onder de maat (r=.55), de kans is groot dat je een andere uitslag krijgt als je de test nog een keer doet. Ook de validiteit van de test werd betwist. Want wat berekent de test eigenlijk, behalve de reactiesnelheid? Het is de vraag of de test echt onze onbewuste vooroordelen meet. Misschien stelt de test alleen vast of we bekend zijn met culturele stereotypen en zegt hij niets over een onbewuste waardering ervoor.  

Om de theorie van de culturele stereotypen te onderzoeken, deed Eric Luis Uhlmann met nog twee psychologen van Yale University in 2006 een experiment waarin ze proefpersonen lieten kennismaken met fictieve groepen: de Noffians en de Fasites. De deelnemers leerden de Noffians te associëren met negatieve woorden als ‘onderdrukking’, en de Fasites met positieve woorden als ‘privilege’. Vervolgens moesten ze de IAT maken, waar Noffians en Fasites respectievelijk stonden voor ‘Zwart’ en ‘Wit’. Wat bleek? De deelnemers legden een snellere associatie met Noffians en Slecht dan met Noffians en Goed. Niet omdat ze het slechte mensen vonden, maar omdat ze dachten de Noffians slechter af waren.

Behalve kritiek op de methodologie kwam er ook commentaar op de conceptuele kant van de IAT, want de pretenties van de Banaji en Greenwald reiken ver. Wie onbewust bevooroordeeld is, gedraagt zich in het echte leven ook discriminerend, beweren ze in hun in 2013 verschenen boek Blindspot. Hidden Biases of Good People. Een testuitslag met een impliciete sterke voorkeur voor witte mensen correleert positief met bijvoorbeeld discriminerend gedrag bij sollicitatieprocedures en bij de spoedeisende hulp. De test voorspelt dit veel beter dan uitspraken van mensen zelf, schrijven de psychologen. Wie durft immers openlijk toe te geven dat hij discrimineert?

Maar om nou te beweren dat een onbewust vooroordeel tot discriminerend gedrag leidt, is jumping to conclusions. Integendeel: de score op de IAT is een slechte voorspeller van discriminerend gedrag, concludeert de Amerikaanse psycholoog Frederick Oswald in een meta-analyse van 46 studies. ‘De voorspellende waarde van de IAT’, zo schertsen zijn Zweedse collega’s Rickard Carlsson en Jens Agerström, ‘kun je vergelijken met het testen van regenjassen op een zonnige dag. We zouden niet verbaasd zijn als de regenjassen een slechte score kregen, maar dat wil niet zeggen dat ze onbruikbaar zijn als het regent.’ Volgens de Zweedse psychologen kan de test een nuttig instrument zijn voor onderzoekers, managers, docenten en studenten om vooroordelen en stereotyperingen op het spoor te komen.’

Spontane schrikreactie

Ook Kees van den Bos, hoogleraar sociale psychologie aan de Universiteit van Utrecht, is dubbel over de IAT: ‘Enerzijds heeft de test een intuïtieve aantrekkingskracht - het is geen zelfrapportage, maar anderzijds heeft hij inderdaad conceptuele en methodologische beperkingen.’ Toch ziet ook Van den Bos het nut ervan in: hij gebruikt de test in zijn colleges voor eerstejaars. Hij laat de studenten de test maken, zodat ze zich bewust worden van hun vooroordelen en erover gaan nadenken.

‘Stel dat je ’s avonds laat over straat loopt,’ zegt Van den Bos, ‘je hoort voetstappen achter je, kijkt om en ziet drie donkere jongens met capuchons op je afkomen. Je schrikt. Ben je dan racistisch? Dat hoeft niet zo te zijn, je kunt een automatische snelle reactie hebben, die gebaseerd is op een cultureel stereotype. En dat stereotype kan in strijd zijn met je opvattingen.’

Van den Bos haalt onderzoek aan van de Amerikaanse psycholoog Patricia Devine, waaruit blijkt dat we stereotypen automatisch activeren als we worden geconfronteerd met leden van de gestereotypeerde groep. ‘Als het stereotiepe beeld niet overeenkomt met je overtuiging, moet je die reactie bewust onderdrukken,’ zegt Van den Bos, ‘en dat kost tijd. Je kunt dus een spontane schrikreactie krijgen bij het zien van drie donkere jongens, ook als je absoluut niet vooringenomen of racistisch bent.’

Gedrag wordt door veel meer bepaald dan alleen onze impliciete voorkeuren, stelt de hoogleraar. ‘Impliciete voorkeuren zijn het resultaat van categorisering, een heel normaal menselijk proces. Zo’n automatische reactie kan een indicator zijn van bepaald gedrag, maar dat hoeft niet per se. En stel dat het zo is, dan kun je zo’n automatische reactie onderkennen en er iets aan veranderen.’ En dat is precies wat Van den Bos beoogt bij zijn studenten.

Hoe werkt de Impliciete Associatietest?

De IAT werkt met vier categorieën: wit, zwart, goed en slecht. Wie de test doet, krijgt op zijn computer eerst gezichten te zien, met de opdracht om die te categoriseren in witte en zwarte mensen. Daarna komen er categorieën bij: negatieve woorden zoals ‘pijn’, ‘horror’ en ‘slecht’, en positieve woorden zoals ‘vrede’, ‘liefde’ en ‘genot’. Vervolgens krijg je de opdracht om zwarte gezichten te koppelen aan negatieve woorden, en witte gezichten aan positieve. In de volgende fase van de test worden de categorieën gemixt, en moet je zwart aan positief linken en wit aan negatief.

De gedachte achter de test is dat je sneller reageert als het woordpaar overeenkomt met je onbewuste associatie. Dus als je een zwart gezicht sneller associeert met een negatief dan met een positief woord, wil dat zeggen dat je impliciet een voorkeur hebt voor wit boven zwart.

------------------------------------------------------------------------------------------------------

Doe de test op www.implicit.harvard.edu

Literatuur

 https://www.thecut.com/2017/01/psychologys-racism-measuring-tool-isnt-up-to-the-job.html

Eric Luis Uhlmann, Victoria L. Brescoll, Elizabeth Levy Paluck, Are members of low status groups perceived as bad, or badly off? Egalitarian negative associations and automatic prejudice. Journal of Experimental Social Psychology 42 (2006) 491–499.

Mazharin Banaji en Anthony Greenwald, Blindspot. Hidden Biases of Good People, Random House, 2013.

Oswald, FL. et al, Predicting ethnic and racial discrimination: a meta-analysis of IAT criterion studies. J Pers Soc Psychol. 2013 Aug;105(2):171-92.

Rickard Carlsson & Jens Agerström, A closer look at the discrimination outcomes in the IAT literature, Scandinavian Journal of Psychology, 2016 Aug;57(4):278-87.