Welke grondbeginselen en toepassingen horen bij psychologisch testen? - Chapter 1

Onderwerp 1A: Wat is de aard en toepassing van testen?

Consequenties van testen

Gedurende de hele levensduur worden er testen afgenomen bij mensen zoals de Apgar-test voor het meten van de gezondheid van zuigelingen, rij- en schoolexamens bij pubers, ontwikkelingstesten, etc. De uitkomst van alle psychologische testen kan een grote invloed hebben op de levensloop. Een gedegen kennis van testen is dus noodzakelijk voor iedereen in het werkveld van de psychologie. Iemand die binnen de psychologie of het onderwijs testen ontwikkelt en evalueert noemen we een psychometrist. Persoonlijkheids- en intelligentietesten zijn op dit moment de meest essentiële testen binnen de psychologie.

Definitie van een test

Testen kunnen heel verschillend zijn in hun doeleinden en opzet maar over het algemeen delen ze de volgende kenmerken.

Een test is een gestandaardiseerde procedure voor het inventariseren van gedrag en het beschrijven hiervan door middel van categorieën of scores. Er zijn een aantal definiërende kenmerken van testen. Een test is ten eerste gestandaardiseerd, wat wil zeggen dat de procedures voor het afnemen ervan gelijk zijn binnen verschillende settings. Ten tweede is een test gebaseerd op een steekproef van het gedrag dat je wilt meten. De items binnen de test hoeven niet gelijk te zijn aan het gedrag dat je bekijkt, zo lang ze maar relevant zijn. Belangrijk is dat de gedragingen in de steekproef het gedrag, dat voorspeld wordt met de test, goed representeert. Ten derde moet het mogelijk zijn om uit de test categorieën of scores af te leiden. Hierbij moet altijd rekening gehouden worden met een bepaalde mate aan meetfout: X=T+e, waarbij X de geobserveerde score is, T de ware score is en e de error is. Een testontwikkelaar moet proberen de error zo klein mogelijk te maken.

Ook moet men niet vergeten dat het abstracte kenmerk dat gemeten wordt door een test niet een fysiek ‘iets’ in de wereld representeert. Ten vierde is het noodzakelijk een norm te vestigen waarmee scores van deelnemers vergeleken kunnen worden. Dit gebeurt door middel van een gestandaardiseerde steekproef, deze steekproef moet representatief zijn voor de populatie waar de test voor bedoeld is. De norm geeft aan wanneer mensen afwijken. Ten slotte zijn testen bedoeld om andere gedragingen te voorspellen. Een test kan dus meer dan één doel hebben. Om te weten of het gedrag ook echt voorspeld wordt door de test wordt er gebruik gemaakt van validatieonderzoek, maar dat kan pas worden gedaan nadat de test is uitgebracht.

Ander onderscheid bij testen

De meerderheid van de testen zijn norm-referenced, waarbij de score van elke deelnemer geïnterpreteerd wordt in vergelijking met een relevante gestandaardiseerde steekproef. Andere testen zijn criterion-referenced, waarbij het doel is om vast te stellen waar een deelnemer staat met betrekking tot duidelijk gedefinieerde criteria. Schoolexamens vallen bijvoorbeeld onder deze categorie. Hierbij vergelijk je dus niet met een referentiegroep.

Een ander belangrijk onderscheid dat gemaakt wordt is tussen assessment en testen. Assessment is een term die gebruikt wordt voor meer omvattend onderzoek en verwijst naar het gehele proces van het verzamelen van informatie over een persoon, op basis waarvan iets gezegd kan worden over eigenschappen en gedrag. Tests zijn dus slechts één bron van informatie voor een geheel assessment proces.

Verschillende soorten testen

Testen kunnen grofweg verdeeld worden in groepstesten, die grotendeels met pen en papier en bij meerdere deelnemers tegelijk kunnen worden afgenomen en individuele testen, die één-op-één worden afgenomen. Hieronder worden de verschillende categorieën testen besproken, die in verschillende vormen voorkomen (norm-referenced, criterion-referenced, individuele en groepstesten).

  • Intelligentietesten: hierbij wordt het algemene intellectuele niveau van een individu gemeten, gebaseerd op de in een bepaalde cultuur belangrijke vaardigheden. Er zijn subscores, maar er wordt meestal naar de algemene score gekeken. De test bestaat over het algemeen uit een heterogene combinatie van items die verschillende aspecten van de intelligentie meten.

  • Bekwaamheidstesten: hierbij worden één of meer specifiekere aspecten van vaardigheid gemeten. Dit soort testen wordt vaak gebruikt om succes op een bepaalde baan of studie te voorspellen.

  • Prestatietesten: hierbij wordt de mate van leren, succes of prestatie van een individu met betrekking tot een bepaald onderwerp gemeten. Het verschil met de bekwaamheidstest is het doel en de inhoud van de test. Prestatietesten meten het verloop van de prestaties van individuen, bekwaamheidstesten meten het niveau van iemand op het testmoment.

  • Creativiteitstesten: hierbij wordt de vaardigheid om nieuwe ideeën, inzichten of creaties te ontwikkelen gemeten. Voor deze testen moet je divergent kunnen denken: verschillende oplossingen zoeken voor een complex probleem. Er wordt nog wel eens getwijfeld of creativiteit niet een vorm is van toegepaste intelligentie.

  • Persoonlijkheidstesten: hierbij worden kenmerken of gedragingen gemeten die de individualiteit van een persoon vaststellen.

  • Interesse-inventarissen: hierbij wordt de voorkeur van een individu voor bepaalde activiteiten of onderwerpen gemeten.

  • Gedragsmatige procedures: hierbij worden de antecedenten en consequenties van gedrag gemeten.

  • Neuropsychologische testen: deze worden gebruikt voor het onderzoeken van personen met mogelijke hersenschade. Het zijn lange en intensieve één-op-één testen.

Verschillende soorten gebruik van testen

Er zijn 5 manieren op psychologische testen te gebruiken:

  • Classificatie: het toewijzen van personen aan bepaalde categorieën. Dit kan onderverdeeld worden in plaatsing (het toewijzen aan verschillende programma’s op basis van vaardigheden), screening (korte testen om personen met speciale behoeften of kenmerken te identificeren), certificatie (waarbij het halen van een test bepaalde privileges oplevert) en selectie (waarbij certificatie toegang verleent tot ‘besloten’ kringen zoals de universiteit of een vereniging).

  • Diagnose: het vaststellen van de aard en oorzaak van abnormaal gedrag en het classificeren van het gedrag binnen een geaccepteerd diagnostisch systeem. Diagnose moet meer zijn dan een label, maar er moet met achterliggende informatie ook rekening worden gehouden. De diagnose wordt ook gebruikt bij de planning van het eventuele behandelplan.

  • Zelfkennis: het verkrijgen van meer inzicht in jezelf door middel van een test.

  • Evaluatie van educatieve of sociale programma’s: het evalueren van het succes van bepaalde programma’s.

  • Onderzoek: het testen van hypothesen door middel van tests.

De doelen van testen overlappen vaak, wat het moeilijk maakt om onderscheid te maken. Veel testen kunnen ook voor meerdere doeleinden gebruikt worden binnen één afname.

Er zijn verschillende factoren die invloed kunnen hebben op de betrouwbaarheid van een test. Deze factoren worden hieronder besproken.

Gestandaardiseerde procedures bij testafname

Niet-gestandaardiseerde testen kunnen de resultaten significant beïnvloeden, waardoor deze onbruikbaar worden. Daarnaast kunnen ze niet valide zijn. In sommige gevallen is het echter wel gewenst, soms zelfs noodzakelijk, om flexibel te zijn met de procedure. Dit is bijvoorbeeld het geval bij deelnemers met een handicap. Afwijkingen van de standaard moeten echter altijd opzettelijk en goed doordacht zijn.

Gewenste afnameprocedures

Voor individueel testen is het belangrijk dat de proefleider goed bekend is met het materiaal, de instructies die hij/zij moet geven en de manier waarop details en scores genoteerd worden. Daarnaast is het zeer belangrijk dat alle deelnemers de geschreven en gesproken instructies kunnen begrijpen. Ook moet rekening gehouden worden met eventuele beperkingen van de deelnemer in bijvoorbeeld gehoor, zicht, spraak of motorische controle.

Voor mensen met verminderd gehoor is het in eerste instantie belangrijk dat de proefleider hiervan op de hoogte is en hier goed op inspeelt, zodat de testresultaten niet beïnvloed worden. Net als bij zichtbeperking geven de meeste volwassenen dit uit zichzelf aan maar bij kinderen komt het vaak voor dat ze eventuele beperkingen niet noemen. Ten slotte moet rekening gehouden worden met mogelijke beperkingen in motorische controle of spraak. Dit is belangrijk bij tests waarbij gebruik wordt gemaakt van tijd-reacties. Testen kunnen een klein beetje worden aangepast voor mensen met een beperking zonder dat de validiteit of betrouwbaarheid van de test achteruit gaat. Soms zijn er ook speciale vormen van een test die inspelen op een bepaalde beperking.

Ook voor groepstesten zijn er een aantal belangrijke punten die in acht genomen moeten worden door de proefleider. Zo is het bij testen met een tijdslimiet belangrijk dat er genoeg tijd beschikbaar is en dat deze goed bijgehouden wordt. Daarnaast moeten instructies duidelijk en niet te snel worden voorgelezen en niet worden geparafraseerd. Ook achtergrondgeluiden moeten zoveel mogelijk beperkt worden. Bovendien is het belangrijk om duidelijk aan te geven of gokken, als de deelnemer het antwoord niet weet, consequenties heeft. Veel testen hebben een ingebouwde gok-correctie.

Invloeden van de proefleider

Het is belangrijk dat de proefleider voor ‘rapport’ zorgt, een goede verstandhouding met de deelnemers creëert en voor een comfortabele en motiverende sfeer zorgt. Dit verhoogt de coöperatie van de deelnemer. Uit onderzoek blijken tegenstrijdige resultaten over de invloed van ras, ervaring en geslacht van de proefleider op de resultaten. In sommige unieke gevallen blijkt dit wel degelijk van invloed te zijn.

Achtergrond en motivatie van de deelnemer

Verschillende aspecten van de deelnemer kunnen de testresultaten beïnvloeden. Testangst verwijst naar alle gedragsmatige reacties die meekomen met zorgen over mogelijk falen van een test. Uit onderzoek blijkt dat testangst zowel een oorzaak als consequentie is van slechte prestatie op testen. Vooral bij testen met tijdsdruk kunnen de resultaten van deelnemers met testangst sterk beïnvloed worden.

Daarnaast komt het soms voor dat deelnemers valse resultaten forceren om een bepaalde testuitslag te krijgen. Ook moet er rekening worden gehouden met de motivatie van de deelnemer. Een ongemotiveerde deelnemer kan zorgen voor onbetrouwbare resultaten.

Onderwerp 1B: Wat omvat de ethiek van testen en wat zijn de sociale aspecten van testen?

Professionele standaarden voor testen

Meestal worden testen op verantwoordelijke wijze uitgevoerd maar er zijn natuurlijk ook uitzonderingen waarbij het onverantwoordelijk toepassen of uitwerken van een test soms desastreuze gevolgen kan hebben. Daarom zijn er richtlijnen voor verantwoordelijk testgebruik ontwikkeld door professionele organisaties zoals de American Psychological Association (APA). Hieronder worden achtereenvolgens de verantwoordelijkheden van testontwikkelaars en testgebruikers beschreven.

Verantwoordelijkheden van testontwikkelaars

Uitgevers van testen moeten met verschillende factoren rekening houden. Ten eerste moeten testen aan alle richtlijnen voldoen voor ze worden uitgegeven. Zo is het bijvoorbeeld verplicht om technische en gebruikershandleidingen mee te leveren met de test. Ten tweede moet eventuele marketing en adverteren van de test op accurate en oprechte wijze plaatsvinden. Een test mag pas gepubliceerd worden wanneer de betrouwbaarheid en validiteit onderzocht is. Bij de test moet vermeld zijn op wat voor manier de betrouwbaarheid en validiteit onderzocht is en wat daarvan de uitkomsten waren. Ook moet duidelijk zijn wie de test mag gebruiken en welke kwalificaties iemand hiervoor moet bezitten. Vaak zijn voor gebruik bepaalde certificaties benodigd.

Verantwoordelijkheden van testgebruikers

Onder andere de APA heeft ethische richtlijnen en professionele standaarden gepubliceerd voor testgebruik om het welzijn van de deelnemers en het netwerk om hem/haar heen te garanderen. Hieronder valt bijvoorbeeld de richtlijn dat testen altijd in het voordeel moet zijn van de cliënt. Vertrouwelijkheid is daarnaast een plicht van de proefleider, hoewel deze ook verplicht is ernstige bedreigingen voor het slachtoffer of andere te rapporteren.

Daarnaast is het noodzakelijk dat de proefleider de benodigde expertise heeft om een test af te nemen. Informed consent is een andere belangrijke voorwaarde. Dit houdt in dat alle deelnemers van te voren ingelicht worden over het onderzoek en daarvoor hun toestemming verlenen. Verder moet rekening gehouden worden met wat de zorgstandaard is voor een bepaald geval, oftewel welke methode of test op dat moment het meest gebruikt wordt en het meest geaccepteerd is.

Zo moet men bijvoorbeeld oppassen met het gebruik van gedateerd materiaal. Daarnaast moeten testresultaten op correcte wijze medegedeeld worden met de deelnemer, waarbij effectieve en constructieve feedback gegeven wordt. Hierbij mag niet buiten de grenzen van de expertise van de tester worden getreden. Het psychologisch rapport dat over het onderzoek wordt geschreven moet direct en concreet zijn.

Dit is van belang omdat de inhoud van het rapport impact kan hebben op het leven van de deelnemer, bijvoorbeeld wanneer het rapport wordt opgevraagd door een werkgever. Ten slotte is respect en erkenning van individuele verschillen erg belangrijk bij testgebruik.

Het testen van culturele en linguïstische minderheden

Psychologische testen zijn voornamelijk gericht op westerse bevolkingsgroepen. Het kan niet zonder meer aangenomen worden dat bestaande testen ook geschikt zijn voor alle bevolkingsgroepen. Vanaf de jaren 30 is er een opkomst in cultuur-sensitief testen, maar het werk is nog lang niet compleet. Andere culturen kunnen ander normen, waarden of overtuigingen hebben. Dit kan ervoor zorgen dat zij anders tegen een test aankijken of anders reageren op de resultaten.

De invloed van culturele achtergrond op testresultaten

Uit onderzoek blijkt dat mensen van verschillende culturele achtergrond testen op verschillende manieren interpreteren en invullen. Zo blijkt bijvoorbeeld dat inheemse volkeren in de VS een andere conceptie van tijd laten zien dan de witte middenklasse in Amerika.

Daarnaast blijkt dat bijvoorbeeld Afro-Amerikanen kwalitatief anders reageren op testen dan Anglo-Amerikanen; kinderen van Afro-Amerikaanse afkomst bleken minder spontaan uit te weiden met betrekking tot hun antwoorden. Soortgelijke verschillen zijn ook zichtbaar bij volwassenen. Daarnaast kan bij testen het gevaar van stereotypering bestaan, waarbij de deelnemers onbewust het negatieve stereotype bevestigen dat over hun eigen groep bestaat. Dit wordt ook wel stereotype threat genoemd. Testscores zijn niet altijd hetzelfde bij individuen maar komen tot stand binnen een sociaalpsychologisch veld dat beïnvloed wordt door verschillende culturele factoren.

Onbedoelde effecten bij belangrijke testen

Een ander effect dat een rol kan spelen bij testen is fraude. Dit speelt met name bij testen waarvan de resultaten veel invloed hebben, bijvoorbeeld bij een selectie voor een baan of studie. Massale fraude komt sporadisch voor. Echter, ook fraude met behulp van ouders of leraren komt voor.

Een ander aspect van fraude wordt beschreven door het Lake Wobegon Effect, wat verwijst naar het feit dat op veel scholen meer dan 50% van de leerlingen bovengemiddelde cijfers hebben. Dit komt voornamelijk doordat onze maatschappij veel nadruk legt op prestatie en het uitblinken van scholen. Leraren helpen de leerlingen te frauderen door hen onder andere te coachen op toetsantwoorden, antwoordformulieren te veranderen of meer tijd te geven voor toetsen.

Het lijkt dus dat de nationale drang naar prestatietests voor selectie en evaluatie ongewenst gedrag in de hand helpt, maar het is niet duidelijk hoe groot en verspreid het probleem is.

Heb je niet de volledige tekst in beeld, log dan eerst in
 

Aansluiten bij JoHo als abonnee of donateur

The world of JoHo footer met landenkaart

Partners: met impact

Partnerselectie: inspiratie & activiteiten in binnen- en buitenland

JoHo: crossroads via de bundel

  Chapters 

Teksten & Informatie

JoHo: paginawijzer

JoHo 'chapter 'pagina

 

Wat vind je op een JoHo 'chapter' pagina?

  •   JoHo chapters zijn tekstblokken en hoofdstukken rond een specifieke vraag of een deelonderwerp

Crossroad: volgen

  • Via een beperkt aantal geselecteerde webpagina's kan je verder reizen op de JoHo website

Crossroad: kiezen

  • Via alle aan het chapter verbonden webpagina's kan je verder lezen in een volgend hoofdstuk of tekstonderdeel.

Footprints: bewaren

  • Je kunt deze pagina bewaren in je persoonlijke lijsten zoals: je eigen paginabundel, je to-do-list, je checklist of bijvoorbeeld je meeneem(pack)lijst. Je vindt jouw persoonlijke  lijsten onderaan vrijwel elke webpagina of op je userpage
  • Dit is een service voor JoHo donateurs en abonnees.

Abonnement: nemen

  • Hier kun je naar de pagina om je aan te sluiten bij JoHo, JoHo te steunen en zelf en volledig gebruik te kunnen maken van alle teksten en tools.

Abonnement: checken

  • Hier vind je wat jouw status is als JoHo donateur of abonnee

Aantekeningen: maken

  • Dit is een service voor wie bij JoHo is aangesloten. Je kunt zelf online aantekeningen maken en bewaren, je eigen antwoorden geven op tests, of bijvoorbeeld checklists samenstellen.
  • De aantekeningen verschijnen direct op de pagina en zijn alleen voor jou zichtbaar
  • De aantekeningen zijn zichtbaar op de betrokken webpagine en op je eigen userpage.

Prints: maken

  • Dit is een service voor wie bij JoHo is aangesloten.  Wil je een tekst overzichtelijk printen, gebruik dan deze knop.
JoHo: footprint achterlaten