Je vertrek voorbereiden of je verzekering afsluiten bij studie, stage of onderzoek in het buitenland
Study or work abroad? check your insurance options with The JoHo Foundation
Wij mensen baseren onze kennis op vooronderstellingen, oftewel ideeën over hoe we denken dat dingen in elkaar zitten. Zo was ooit de aderlating een van de populairste medische ingrepen en werd verondersteld dat autisme werd veroorzaakt door slechte opvoedtechnieken van de ouders. Deze laatste vooronderstelling werd nog niet heel lang geleden pas ontkracht door een onderzoek. Dit onderzoek toonde aan dat ouders van niet-autistische kinderen niet wezenlijk verschilden in opvoedstijl van ouders van autistische kinderen. Onze ideeën over hoe de wereld in elkaar zit blijven bestaan als ze niet worden gecheckt. Het onderzoeken en testen van vooronderstellingen is essentieel in dit proces.
Er komt tegenwoordig veel informatie op ons af. Hoe kunnen we filteren wat goede informatie is en welke informatie niet klopt? Dit doen we door te onderzoeken waarom we denken dat iets waar is en of we vinden dat hier goede argumenten voor zijn.
We gebruiken verschillende manieren om te weten of iets klopt. Er zijn grofweg vier manieren van ‘weten’ die we gebruiken. Het gaat hierbij om weten door het toekennen van autoriteit aan een ander die het voor ons kan weten, het weten door algemeen bekende en aanvaardde waarheden c.q. ons gezond verstand, het weten door persoonlijke ervaring en het weten door intuïtie.
We verwachten dat een persoon die volgens ons bekwaam is in een bepaald veld het antwoord op onze vraag kan weten (autoriteit). We kunnen het idee zelf niet testen, maar weten wel dat het getest is en de testen heeft doorstaan. Echter, ook deze vooronderstellingen zullen aan kritische vragen onderworpen moeten worden. Nog niet zo lang geleden werd door ‘experts’ verondersteld dat vrouwen niet intelligent genoeg waren om een universitaire studie aan te kunnen. Ze zouden daarnaast een te fragiel zenuwstelsel bezitten en studeren zou hun vermogen om zich voort te planten ernstig verstoren. Gelukkig is deze stelling onderzocht en is gebleken dat vrouwen wel degelijk konden meekomen in een universitaire studie en zelfs meer dan dat. Een kritische blik wat betreft de expert en de manier waarop het idee onderzocht is te allen tijde wenselijk.
Meestal beginnen de ideeën vanuit ons algemeen bekend, gezond verstand met de woorden: ‘iedereen weet toch dat…’ of ‘het is toch logisch dat…’. Veel van deze ideeën bleken niet te kloppen met de data beschikbaar door onderzoek. We noemen bijvoorbeeld het idee dat je gevoelens nooit liegen en het idee dat ervaren therapeuten beter dan een leek zouden kunnen voorspellen of iemand gewelddadig zal worden in de toekomst. Beide ideeën bleken niet te kunnen overleven tegenover een aanzienlijk aantal van testgegevens.
Een andere manier van weten is door middel van persoonlijke ervaring. Enkele problemen duiken de kop op waardoor de resultaten van een onderzoek gekleurd of vertroebeld kunnen zijn. Deze problemen zijn bijvoorbeeld bevooroordeeldheid van de waarnemer (‘observer bias’) en het samen voorkomen van verschijnselen (zogenaamde ‘confounded’ oftewel verstrengelde variabelen).
De zogenaamde ‘observer bias’ is het verschijnsel dat we zien wat we denken te zien en dat we vinden wat we verwachten te vinden. De uitslag van een onderzoek kan beïnvloed worden door de verwachtingen die de onderzoeker of de proefleider heeft aangaande de uitslagen van het onderzoek.
Het probleem van de ‘confounded’ variabelen is als volgt uit te leggen. In een niet gecontroleerde omgeving kunnen meerdere verschijnselen en te meten variabalen samen voorkomen. Het is in zo’n geval moeilijk zo niet onmogelijk te bepalen welk effect door welk verschijnsel wordt veroorzaakt. De variabele waarover je iets wilt kunnen zeggen is niet los te bekijken van andere variabelen en wordt daarom verstrengeld of ‘confounded’ genoemd.
Een wetenschapper en wetenschappelijk onderzoek zijn niet immuun voor het beïnvloed worden door bovenstaande verschijnselen. Wel houdt een goede onderzoeker rekening met het mogelijk voorkomen van deze verschijnselen en controleert hij hiervoor zoveel en zover als mogelijk is.
De laatste manier van weten is intuïtief weten. Je weet gewoon dat iets zo is of zo werkt, maar je kunt het niet echt uitleggen of beargumenteren. Dit lijkt lijnrecht te staan tegenover de wetenschap die juist nieuwsgierig is naar de uitleg en de argumenten achter een conclusie. Bovendien is er een gevaar bij het gebruiken van intuïtie als manier van weten. Intuïtie is in principe gebaseerd op het weten van één persoon en daarom mogelijk niet geldig voor andere personen. Wel kan intuïtie handig zijn voor een onderzoeker en hem een eerste ingeving geven voor het opzetten van een onderzoek. Een onderzoeker is vervolgens uitvoerig bezig zijn eerste intuïtieve ingevingen aan onderzoek te onderwerpen en te zien of ze stand houden bij het testen.
Dit testen wordt voornamelijk gedaan door uit te gaan van het falsificatieprincipe. Het falsificatieprincipe houdt het volgende in.
Er kan voorlopig van uitgegaan worden dat een uitspraak juist is als hij testen op de mogelijkheid dat de uitspraak niet juist zou zijn, heeft doorstaan. Belangrijk is ten eerste dat de relevante zaken worden getest. Bovendien moeten de voorwaarden waaronder getest wordt ervoor zorgen dat de eventuele onjuistheid van de uitspraak aan het licht komt.
Een goede onderzoeker staat open voor het corrigeren van zijn fouten en zou volgens het volgende basisprincipe dienen te werken.
Op het moment dat we onze ideeën testen, komen we te weten of onze ideeën standhouden. Op het moment dat we beseffen dat onze ideeën niet blijken te kloppen, kunnen we ze veranderen.
Wanneer is er sprake van goed onderzoek en wanneer van slecht onderzoek? Er zijn gegevens bekend van onderzoek dat simpelweg niet klopt. Zo bleken de experimenten naar subliminale reclameboodschappen in bioscopen nooit te zijn uitgevoerd. De conclusie van het onderzoek, dat een subliminale (onder het bewustzijnsniveau aangeboden) frisdrank reclame zorgde voor meer verkoop van frisdrank in de pauze, mag dan ook niet worden aangenomen. De onderzoeker gaf toe de resultaten van dit onderzoek verzonnen te hebben om onderzoeksgeld te verkrijgen.
Los van frauderen kan er nog veel meer mis zijn met een onderzoek. Zo kan onderzoek gebaseerd zijn op zeer persoonlijke criteria voor bijvoorbeeld het effect van een behandeling. Een voorbeeld hiervan is een behandeling die effectief is, omdat de therapeut zegt dat de cliënt genezen is. Als niet aantoonbaar kan worden gemaakt dat het hier gaat om een effect wat voor andere therapeuten ook te zien en te meten zou zijn, gaat het om onbekwaam uitgevoerd onderzoek.
Naar aanleiding van conclusies van een onderzoek kun je verschillende vragen stellen aan jezelf en indirect aan de onderzoeker. Had de onderzoeker goede redenen om te onderzoeken wat hij heeft onderzocht? Heeft de onderzoeker de ideeën op een goede manier onderzocht, oftewel, waren de metingen goed? Geloof ik de conclusies op basis van de testresultaten?
Zowel voor de praktiserend onderzoeker als de gebruiker van resultaten van wetenschappelijk onderzoek is het belangrijk zich te verdiepen in methoden van onderzoek. Beiden moeten de juiste vragen weten te stellen aangaande een onderzoek. Wat zou de onderzoeker moeten doen om een goed antwoord op deze vraag te krijgen? Heeft hij of zij het benodigde gedaan? Waar heeft hij of zij fouten kunnen maken en heeft hij of zij gedaan wat nodig was om deze fouten te voorkomen? Welke problemen zouden we tegen kunnen komen op weg naar een antwoord op deze vraag? Een verdieping in mogelijke problemen die we kunnen tegenkomen is onontkoombaar.
In de basis wordt gesproken van twee soorten van onderzoek. Zo kan gesproken worden van toegepast onderzoek en meer basis, theoretisch onderzoek.
De toegepaste onderzoeker werkt vanuit een probleem dat zich in de praktijk voordoet. Meestal is hij op zoek naar manieren om een gegeven te verbeteren of te voorspellen hoe een bepaald verschijnsel zich in de toekomst gaat ontwikkelen.
De theoretische onderzoeker heeft als doel uit te zoeken hoe een verschijnsel werkt en in elkaar steekt. Deze kennis van basisprincipes van verschijnselen kan later van pas komen. Als we de basisprincipes van een verschijnsel beter begrijpen, kunnen we ook makkelijker naar manieren zoeken om te verbeteren of in te grijpen. Dit laatste ligt dan weer meer op het terrein van het toegepaste onderzoek.
Het onderscheid tussen theoretisch en toegepast onderzoek is belangrijk. Echter, beide soorten van onderzoek kunnen niet zonder elkaar en kunnen zeer goed van elkaar profiteren. Een theoretisch onderzoek kan leiden tot een toegepast onderzoek dat meer gericht is op een resultaat in de praktijk. Een toegepast onderzoek vanuit een praktisch probleem kan op haar beurt weer bijdragen aan het bijschaven van een theorie. Daarnaast kan een onderzoeker (tegelijkertijd of achtereenvolgens) bezig zijn met zowel theoretisch als toegepast onderzoek.
Veel psychologiestudenten zijn nogal bang voor het statistiek gedeelte van hun studie psychologie. Dit is echter geheel niet nodig, vindt de schrijver. Je hoeft namelijk geen wiskundeknobbel te hebben om statistiek te kunnen begrijpen. Enkele uitgangsprincipes zijn belangrijk om je wiskunde-angst met betrekking tot statistiek wilt overwinnen.
Statistiek is logisch
Ten eerste is statistiek niet meer dan het gebruiken van logica. Een voorbeeld van logisch denken is ‘als A, dan B’ en ‘als niet A, dan ook niet B’.
Je gebruikt vaker statistiek dan je denkt
Ten tweede weet je waarschijnlijk al meer van statistiek dat je beseft. Zo gebruik je voor het nemen van beslissingen al enkele belangrijke basisprincipes binnen de statistiek. Bijvoorbeeld als je in een voetbalwedstrijd moet beslissen aan wie je de bal toespeelt voor een mogelijk beslissend doelpunt. Speel je de bal toe aan de speler van wie 72% van de schoten doelpunten waren of de speler van wie 58% van de schoten treffers waren?
Een percentage van 72% winnende doelpunten is een samenvatting van statistische gegevens (principe van samenvattende statistiek). We denken dat het meer waarschijnlijk is dat de speler met 72% in de toekomst het doel treft met een schot dan de speler van 58% (principe van waarschijnlijkheid). Gemiddeld denken we dat de 72% speler de rest van het seizoen ook hoger zal scoren dan de 58% speler (principe van correlatie). Als laatste verwachten we dat de speler met de hoogste gemiddelde score de meeste kans heeft op scoren van welk schot dan ook en het volgende schot in het bijzonder (principe van voorspellen op basis van gegevens uit het verleden).
Ten derde is het gebruik van statistische symbolen en formules bedoeld ter vereenvoudiging en ter werkbesparing van het uitschrijven van ingewikkelde zinnen en niets meer. Zo betekent het sigma-symbool Σ niets meer dan ‘de som van…’.
Een grafiek heeft als doel in een oogopslag te kunnen zien wat de ontwikkeling van een verschijnsel (een zogenaamde trend) is. Zowel een puntlijngrafiek als een staafdiagram kunnen informatie handig en beknopt weergeven. Er wordt een voorbeeld gegeven van zowel een lijngrafiek als een staafdiagram. We willen weten welk percentage van de stellen in de periode van 1945 tot 1965 samenwoonde en welk percentage getrouwd was. Op de horizontale x-as worden de jaartallen weergegeven en op de verticale y-as de percentages getrouwde en samenwonende stellen. In de lijngrafiek worden door middel van verbonden punten de percentages in twee lijnen opgetekend. Er is een lijn voor de getrouwde stellen en een lijn voor de samenwonende stellen. In de staafgrafiek worden de percentages weergegeven door middel van twee verschillende kleuren balken. Zowel in de lijngrafiek als het staafdiagram is in een oogopslag te zien dat het percentage stellen dat samenwoonde omhoog is gegaan in de periode van 1945 tot 1975. Het percentage getrouwde stellen is duidelijk gedaald in deze tijdsperiode.
Wanneer we op de lichtknop drukken en het licht niet brandt, constateren we dat er een probleem moet zijn. De simpelste conclusie is dat de gloeilamp kapot is en de oplossing is de gloeilamp te verwisselen. Doordat we een manipulatie doen (lamp verwisselen) en observeren wat er gebeurt (gaat het licht aan of niet) hebben we zojuist een experiment gedaan. Als het licht niet aangaat na het verwisselen van de lamp is er iets anders aan de hand en gaan we op zoek naar andere mogelijke problemen.
Een basis uitgangspunt bij het doen van een onderzoek is dat we de data geloven, ook al zouden we liever hebben dat er iets anders uit het experiment zou komen. Daarnaast is het belangrijk om slechts één verandering per keer in te voeren, omdat we anders niet weten welke verandering welk effect heeft gehad. Als laatste doe je wat vanuit de theorie de meest waarschijnlijke uitkomst is.
Een theorie laat zich als volgt omschrijven. Een theorie is
Een stelling van algemeen werkbare principes die leidt tot een verklaring van een verschijnsel of verschijnselen.
Vanuit een theorie kunnen vergelijkbare verschijnselen worden begrepen en kan gegeneraliseerd worden naar een meer algemeen toepasbare theorie. Daarnaast kan een theorie gebruikt worden voor het toepassen van kennis in verschillende gebieden.
Er is sprake van een hiërarchie van theorieën. Zo is de theorie van hoe elektriciteit werkt een theorie op redelijk laag niveau en zijn de relativiteitstheorie van Einstein of kwantummechanica-theorieën voorbeelden van theorieën op hoog niveau.
Wat betreft de psychologie worden psychologische processen zoals de werking van het geheugen nog veel minder goed begrepen dan bijvoorbeeld de werking van elektriciteit.
Bekend is bijvoorbeeld dat je iemands naam beter kan onthouden als je die naam een paar keer hardop tegen jezelf zegt als de ander aanwezig is. Dit is het principe van associatie, beter gezegd het geheugen heeft een aanwijzing nodig om het stukje informatie terug te halen.
Een theorie is meer dan zomaar een ideetje in iemands hoofd. Tenminste, de theorieën waar we over spreken als we het over wetenschappelijk onderzoek hebben. Een theorie kan heel goed beginnen als een ideetje in iemands hoofd en later goed gefundeerd en bevestigd worden door het verkrijgen van systematische data die de theorie ondersteunen.
We testen een theorie door te werken met zogenaamde hypotheses. Een hypothese is niet meer dan een vooronderstelling van het type: ‘Als deze theorie klopt, dan zal X gebeuren.’ Als X niet gebeurt, dan is er iets mis met de theorie of iets mis met de manier waarop het experiment is uitgevoerd of geïnterpreteerd. Ook kan er sprake zijn van bepaalde randvoorwaarden waaronder de theorie wel of niet geldt. In dit geval zal de theorie aangescherpt dienen te worden.
Als X wel gebeurt, wil dit niet gelijk zeggen dat de theorie juist is. X kan immers gebeuren om een heel andere reden dan om onze theorie. De meest waarschijnlijke verklaring van het feit dat X gebeurt, terwijl we X hadden voorspeld met onze theorie is dat we voorzichtig kunnen zeggen dat we een klein beetje meer bewijs hebben gevonden in de goede richting van onze theorie.
Bij het doen van onderzoek maken we gebruik van de theorie-data-cirkel. Een theorie leidt tot een onderzoek, wat leidt tot onderzoeksgegevens. Uit deze onderzoeksgegevens komen conclusies die iets betekenen ten aanzien van de theorie. Dit kan weer leiden tot meer en andere onderzoeken en onderzoeksgegevens, et cetera.
Een theorie kan serieus genomen worden als het te testen is, oftewel ‘falsificeerbaar’ is. Er moet een mogelijke uitkomst van een onderzoek zijn die het ongelijk van de theorie zou kunnen bewijzen. Als er geen test bedacht kan worden die de theorie ongelijk zou kunnen bewijzen, is de theorie niet falsificeerbaar.
Stanovich legt uit hoe makkelijk het is een theorie te bedenken die niet ongelijk bewezen kan worden, maar die ook nergens op slaat. Zijn theorie ter voorbeeld is dat er groene mannetjes in je hersenen verantwoordelijk zouden zijn voor alle processen. Echter, als ze indringing in de hersenen constateren, verdwijnen ze. Als je ze probeert te onderzoeken, zie je ze niet. Dit bevestigt de theorie. En als je ze wel zou zien, dan bevestigt het ook de theorie.
Het verschijnsel dat buitenzintuiglijke krachten zo subtiel zijn, dat ze gemakkelijk verdwijnen zodra een scepticus aanwezig is, wordt de ‘Catch22’ van ESP (Extra Sensory Perception) onderzoek genoemd. De onderzoekers blijken altijd een verklaring te hebben voor een negatief resultaat. Een dergelijke theorie wordt data-proof genoemd.
De bewijzen van de psychoanalyse
Veel wetenschappers zijn het erover eens dat de theorieën van de psychoanalyse veelal niet te testen zijn. Als X gebeurt, geeft de analyticus deze verklaring. Als X niet gebeurt, geeft hij een andere verklaring. Of de psychoanalyse gefundeerd is op sterke theorieën is om deze reden simpel weg niet te meten en dus niet te weten.
Het wegen van bewijzen
Een onderzoek zou nooit een theorie kunnen bewijzen of ontkrachten. Wel leiden de gegevens van een onderzoek voor gewicht in de schaal van de bewijzen voor of tegen de theorie. Een voorbeeld van een theorie met veel bewijs aan de kant van voor de theorie is de theorie over de kegeltjes en staafjes die verantwoordelijk zijn voor het zien. Tot nog toe is nog geen bewijs gevonden tegen de theorie.
Er zijn twee gangbare theorieën over de hechting van baby’s aan hun verzorgers.
Bij baby-aapjes werd onderzocht welke theorie meer zou kloppen. Er werden twee surrogaatmoeders neergezet, waartussen het aapje kon kiezen. De eerste moeder was van koud staal, maar bevatte een flesje met melk. De tweede moeder was van een zacht en warm materiaal gemaakt, maar bevatte geen voeding.
De baby-aapjes brachten 12 tot 18 uur per dag bij de zachte moeder door en gingen even naar de stalen moeder om te drinken als ze honger kregen. Als er een ‘gevaarlijk’ speelgoedaapje neer werd gezet, kroop het aapje naar de stoffen moeder voor troost maar bleef in een hoekje zitten als alleen de stalen moeder aanwezig was. De data gelden als bewijs meer in richting van de contact-behoefte-theorie en als tegenbewijs tegen de levensbehoeften-theorie.
Latane en Darley onderzochten in 1970 voor het eerst het zogenaamde ‘bijstanders-effect’. Wat is de reden waarom mensen in een menigte bij nood niet te hulp schieten?
Het rokende kamerexperiment
Proefpersonen wachten in de wachtkamer tot het experiment zou beginnen. Dan komt er rook onder de deur de kamer door. De vraag was of de proefpersoon in actie zou komen om weg te gaan of hulp te zoeken. In de eerste conditie was de proefpersoon alleen. In de tweede conditie waren de proefpersonen in een groepje van drie toen de rook de kamer binnenkwam.
De mensen die alleen wachtten, schoten veel eerder te hulp dan de mensen die in groepjes waren. Uit ander onderzoek blijkt ook dat wanneer de bijstander denkt dat andere mensen aanwezig zijn, hij minder snel zelf te hulp zal schieten. Het lag dus niet zo zeer aan de interne staat of persoonskenmerken van de personen, maar eerder aan de sociale context of een proefpersoon te hulp zou schieten.
De techniek van het therapeutisch aanraken is over de hele wereld bekend. Het aanraken van het energetisch veld om het lichaam heen zou kunnen helpen bij allerlei disbalansen in het geval van ziekte. Om te onderzoeken of er daadwerkelijk sprake was van een energetisch veld wat waargenomen zou kunnen worden, zetten Rose en collega’s het volgende experiment op.
Het Emily Rose experiment
21 getrainde Therapeutic Touch beoefenaars werden gescheiden door een scherm met de onderzoeker. De onderzoeker kwam vervolgens dicht met zijn hand bij de hand van de TT-er. De TT-er kreeg de taak om te beoordelen of onderzoeker bij zijn of haar linker- of rechterhand kwam.
De TT-ers scoorden iets onder kansniveau (47%) voor het goed identificeren van de hand. Alternatieve verklaringen werden geopperd. De eerste was dat een hand die is ‘aangeraakt’ een geheugen zou achterlaten. Echter, latere proeven verschilden niet van eerdere proeven. Ten tweede werd gezegd dat de linkerhand meer de ontvangende hand was. Echter, de linker hand was niet meer accuraat dan de rechter in het identificeren.
Het onderzoek van Harlow is door een aantal andere onderzoeken bevestigd. Ook voor de uitkomsten van het bijstanderonderzoek is steun gevonden vanuit andere onderzoeken. Tot nu toe zijn er geen aanwijzingen gevonden voor het feit dat het energieveld om het lichaam bestaat. Elke studie is er maar 1, maar deze legt wel gewicht in de schaal in een bepaalde richting.
De condities in een onderzoek lijken soms zo specifiek, dat het onderzoek triviaal lijkt Echter, de volgende zaken moeten we onthouden als we hebben over specifieke onderzoeken:
Het idee van statistische significatie is als volgt.
De nulhypothese is de veronderstelling dat de data zouden komen door toeval. Als de waarschijnlijkheid dat de gegevens op kans berusten (=p-waarde ) kleiner of gelijk is aan 5%, dan verwerpen we de nul hypothese.
Als de steekproef niet te groot is en er een onafhankelijke variabele is die twee waarden kan aannemen, kunnen we de p-waarde gemakkelijk berekenen op basis van kansberekening. Als de aantallen groter worden, kunnen we in een p-waarde-tabel kijken.
Als de p-waarde groter is dan .05 kunnen we geen conclusies uit de uitkomsten trekken.
De kansberekening van de p-waarde is hier gebaseerd op het gegeven, dat de metingen onafhankelijk zijn van elkaar. Als de data afhankelijk zouden zijn van elkaar, is het een ander verhaal.
Wanneer we het effect van een behandeling willen meten, dienen we vergelijkingsmateriaal te hebben. Als in de tijd van de aderlatingen gegevens waren bijgehouden van zowel mensen die wel en mensen die niet werden behandeld, was een vergelijking mogelijk geweest. Dan zou men hebben geweten dat de niet-behandelde groep eigenlijk beter af was.
Het feit dat een patiënt beter is geworden, steunt niet noodzakelijkerwijs een bepaalde theorie. Beter in vergelijking met wat? Met hoe hij er daarvoor aan toe was of beter dan een vergelijkbare patiënt die niet is behandeld? Als een patiënt niet beter wordt, kan gezegd worden dat de patiënt te ziek was om nog te kunnen herstellen. Wederom gaat het hier om een niet falsificeerbare theorie.
Minstens zo belangrijk als gegevens over welke patiënten zijn behandeld en beter werden, zijn gegevens over patiënten die wel behandeld en niet beter werden. Ook gegevens van onbehandelde patiënten zijn belangrijk; hoeveel van hen zijn wel of niet verbeterd? Het is dus belangrijk de gegevens in alle vier de cellen te weten.
Hier volgt een voorbeeld van een gebrek aan vergelijkingsmateriaal. De reden waarom je in het vliegtuig noodinstructies krijgt, wordt uitgelegd als volgt. 90% van de overlevenden van vliegtuigrampen hadden een vluchtroute in hun hoofd, dus hielp dit om te kunnen overleven. Maar wat zegt dit over de niet-overlevenden? Misschien had 100% van hen ook de vluchtroute in hun hoofd?
We kunnen alleen iets met iets anders vergelijken als beiden variëren. Oftewel een vergelijking is nodig tussen de ene en de andere waarde van een variabele.
Een variabele is iets wat kan variëren; het kan dit zijn of dat zijn. Er zijn verschillende soorten variabelen.
Te eerste zijn er categorische variabelen, bijvoorbeeld man of vrouw en wel behandeling of geen behandeling. Ten tweede zijn er de kwantitatieve variabelen. Deze zijn uit te drukken in een getal, bijvoorbeeld gewicht, afstand of tijd.
Bij het stellen van een onderzoeksvraag zijn we specifiek geïnteresseerd in een relatie tussen verschillende variabelen. Zoals bijvoorbeeld in het experiment van Harlow. We zijn geïnteresseerd in het verband tussen aan de ene kant de variabele soort moeder (staal of stof, categorisch) en aan de andere kant de variabele contactduur (in tijd, kwantitatief).
Operationaliseren is iets specifieks doen om een doel te bereiken. Een operationalisatie in onderzoek is een specifieke beslissing die wordt gemaakt met als doel een begrip uit te werken. Bij het maken van de twee verschillende surrogaatmoeders zijn verschillende soorten beslissingen gemaakt.
Een voorbeeld van het objectief verzamelen van gegevens is bijvoorbeeld door middel van een machine of een waarnemer gebeurtenissen te laten tellen.
Er wordt bijvoorbeeld gemeten hoeveel een rat heeft gegeten of welke afstand wordt afgelegd.
Pavlov wilde de hoeveelheid speeksel die een hond produceerde bij het eten van voedsel meten. Echter, na een paar metingen begon de hond al te kwijlen als de assistent kwam aanlopen met het eten. Dit bracht Pavlov op het idee van zijn beroemde experimenten.
Het experiment werd begonnen met een signaal wat voor de hond nog niets te maken had met eten: een belletje. Korte tijd daarna werd door middel van een apparaat eten in de bek van de hond gestopt. Na een aantal keren ging de hond kwijlen voordat het eten in zijn bek kwam, enkel door het horen van het belletje. De speekselreactie van de hond noemen we de geconditioneerde respons of reflex.
We beginnen met een stimulus (UCS, unconditioned stimulus) die gevolgd wordt door een reactie (UCR, unconditioned response). Conditionering is een geleidelijk proces, waarbij de respons geleidelijk wordt gekoppeld aan het voorafgaande signaal.
Bij een ander onderzoek werd het blazen in iemands oog voorafgegaan door een toon. Ook hier zien we geleidelijk conditionering optreden. Na een tijdje trad de respons ook op na slechts het horen van de toon.
Elke variabele in het Pavlov-experiment is objectief te meten, dat wil zeggen door iedereen met dezelfde uitkomst te meten. In de hersenen kunnen we niet kijken om te zien hoe associaties werken, maar wel kunnen we observeren hoe een hond of mens in zijn gedrag reageert.
De laboratoriumexperimenten van Pavlov en Harlow lijken ver van de realiteit te staan. Ze kunnen ons echter wel meer inzicht verschaffen in de werking van bijvoorbeeld angsten. Ook kan conditionering een rol spelen in onze houding ten opzichte van mensen en zaken. Daarnaast roepen ze ook vragen op met betrekking tot leren en de werking van ons bewustzijn.
De vraag of conditionering ook zou kunnen optreden zonder bewustzijn van de betreffende is op de volgende wijze onderzocht.
Er werden twee omstandigheden gecreëerd in dit onderzoek. In de eerste conditie werd tijdens het aanbieden van een toon op de oogbol geblazen. In de tweede conditie werd een korte pauze gehouden tussen het aanbieden van de toon en het blazen in de oogbol. Achteraf werd gevraagd of de proefpersonen een verband hadden waargenomen tussen het signaal en het oogblazen. Oftewel: waren ze zich bewust van dit verband?
Wanneer er een pauze zat tussen het signaal en de respons, zorgde bewustzijn voor een steeds groter wordend verband tussen signaal en respons (conditionering). Het lijkt dus af te hangen van de omstandigheden of bewustzijn een rol speelt bij conditionering.
In deze experimenten werden zowel objectieve metingen, zoals de vraag ‘Knippert iemand met zijn ogen?’, als subjectieve metingen gebruikt, zoals de vraag ‘Was je je bewust van het verband tussen de toon en het blazen in je oog?’
Soms bestaan subjectieve metingen uit oordelen van waarnemers. Het probleem hierbij is dat het oordeel van een persoon gekleurd kan zijn en dus niet echt betrouwbaar is. Meerdere metingen te doen bij meerdere beoordelaars is daarom belangrijk.
Subjectieve metingen kunnen gekleurd zijn door vooroordelen van de waarnemer. In het onderzoek van Langer en Abelson (1974) werd aan een panel van hulpverleners een videotape getoond van een jongeman in gesprek met een oudere man. Aan de helft van de beoordelaars werd verteld dat de man een sollicitant was, aan de andere helft dat hij een patiënt was.
De beoordelingen van het gedrag van de jonge man verschilden aanzienlijk tussen de twee groepen. De hulpverleners in de sollicitantgroep beoordeelden de man als aantrekkelijk en innovatief, terwijl de hulpverleners in de patiëntgroep de man als defensief en gespannen beoordeelden.
Zelfrapportage is een belangrijke methode om meer te weten te komen over dingen die we niet direct kunnen meten, zoals wat iemand voelt of droomt.
Er wordt veel gebruik gemaakt van zelfrapportage om een gevoelsdrempel te bepalen. Vragen kunnen dan zijn: ‘Voel je dit, zie je dit?’. Ondertussen wordt de intensiteit van een stimulus opgevoerd, totdat de proefpersoon iets waarneemt. De drempelwaarde is dan een omgekeerde maat van sensitiviteit. Hoe lager de drempel, hoe hoger de sensitiviteit.
Zelfrapportage kan een belangrijke en betrouwbare meting zijn in een onderzoek. Dit is met name het geval wanneer de uitkomsten worden gerelateerd aan andersoortige metingen. Op deze manier kan het een bijdrage leveren aan de constructvaliditeit.
In de jaren 50 begon het zogenaamde slaap-laboratorium onderzoek. Tijdens het slapen werden van een proefpersoon door middel van elektroden hersenactiviteit en oogbewegingen gemeten. Direct na een zogenaamde REM-slaap die wordt gekenmerkt door snelle oogbewegingen, werd de proefpersoon gevraagd wat hij droomde.
Om de inhoud van een droom te weten te komen, zijn we afhankelijk van zelf-rapportage van de persoon. Een mogelijkheid waar we rekening mee dienen te houden is dat iemand de gaten in zijn herinneringen opvult met wat hij erbij verzint. Dit noemt men confabulatie.
Echter, volgens nieuwer onderzoek is de gerapporteerde droominhoud veelal in relatie met een activering in het gebied van de hersenen wat de droom betreft. Bij een visuele droom is het visuele gebied van de hersenen actief, bij een gedroomde conversatie is het taalgebied in de hersenen actief.
Neisser en Harsch (1992) deden onderzoek naar de zogenaamde ‘flashbulb’ ervaringen van mensen. Flashbulbs zijn heldere geheugen flitsen die te binnen schieten als je denkt aan een bepaalde belangrijke gebeurtenis in het verleden.
De dag na de ontploffing van de raket Challenger in 1986 werden eerstejaarsstudenten gevraagd naar hun herinneringen van dat moment; waar waren ze en wat waren ze aan het doen? Een paar jaar later vroegen de onderzoekers dezelfde studenten opnieuw naar hun herinneringen bij het moment van ontploffen.
De relaties tussen eerdere verhalen en de verhalen van een paar jaar later waren opvallend laag. Bij een kwart van de studenten kwam het verhaal totaal niet overeen met het verhaal van een paar jaar eerder.
Opvallend was ook, dat het zelfvertrouwen waarmee de studenten het verhaal vertelden totaal niet gerelateerd was aan de accuraatheid van het verhaal. Studenten die er totaal naast zaten, zeiden het even goed weer voor zich te zien als de studenten die het zich beter herinnerden.
Bovendien corrigeerden de studenten hun geheugen niet nadat ze hadden gehoord dat ze een paar jaar geleden iets anders hadden gezegd. Ze bleven volhouden dat ze het zich anders herinnerden. Dit lijkt ook wel weer logisch. Als we inderdaad vergeten zijn wat er een paar jaar geleden was gebeurd, hebben we geen intern vergelijkingsmateriaal om te weten dat de herinnering van nu niet klopt met die van vroeger. De kopie van vroeger lijkt er simpelweg niet meer te zijn.
Uit meerdere geheugenonderzoeken komen dezelfde soort conclusies:
Dit zet veel vraagtekens bij bijvoorbeeld de verklaringen van oogtuigen, die tot op heden een zeer belangrijke rol spelen in het rechtssysteem. Dagboekgegevens die zijn bijgehouden op het moment zelf of er kort na lijken daarentegen weer erg precies en accuraat te zijn.
We proberen zoveel mogelijk objectieve metingen te gebruiken bij onderzoek. Harlow vroeg aan beoordelaars de tijd te meten dat de aapjes bij de moeders kropen en niet hoe gehecht zij vonden dan de aapjes waren aan beide moeders. Latane en Raley keken welke personen te hulp schoten in plaats van te vragen hoe graag ze wilden helpen.
Objectieve metingen zijn metingen die zijn verkregen onafhankelijk van de waarnemer, dat wil zeggen elke waarnemer zou tot dezelfde uitkomst komen.
Als iemand moet beschrijven welke beelden hij in zijn hoofd heeft, gaat het om een subjectieve meting. Als gevraagd wordt deze beelden te gebruiken bij de oplossing van een taak, kunnen we dit meer objectief meten.
De trend in klinisch onderzoek is meer objectieve metingen te gebruiken, bijvoorbeeld observatie van specifiek target behaviour (doelgedrag).
De eerste foutieve gedachte over objectieve metingen is dat we mensen als objecten, als nummers zouden behandelen. Als je op een objectieve manier mensen wilt meten, zeg je enkel: ‘Ik wil een meting doen zo onafhankelijk mogelijk van zowel mijn als jouw ideeën en verwachtingen, rekening houdend met onze menselijke feilbaarheid’.
De tweede mythe over objectiviteit is dat we geen aandacht zouden besteden aan menselijke emoties, gedachten en gevoelens. Dat we op een objectieve manier willen meten, zegt niets over de inhoud van wat we willen meten. Ook deze subjectieve dingen kunnen we proberen op een objectieve manier te meten.
Het objectief meten zegt meer over de manier van meten dan over de inhoud van de metingen.
Hoe beoordelen we of onze metingen goed zijn en of ze ons een goed antwoord op onze vragen zullen geven? Dit doen we door middel van de begrippen betrouwbaarheid en validiteit.
In welke mate kunnen we vertrouwen op een meting? Dat wil zeggen, kunnen we erop vertrouwen dat als we het opnieuw zouden testen of iemand anders dat zou doen, er hetzelfde uit zou komen?
Er zijn verschillende soorten betrouwbaarheid.
Naar welk soort betrouwbaarheid je op zoek bent is afhankelijk van je onderzoeksvragen. Als je verwacht dat een variabele verandert over tijd, dan ligt test-hertest-betrouwbaarheid niet zo voor de hand. Dan is het oordeel van meerdere waarnemers zinvoller. Maar als je wilt weten of iemand chronisch depressief is, dan is een test-hertest meting erg nuttig.
De overeenkomst van de metingen tussen twee waarnemers kunnen in een zogenaamd puntengrafiek (scatterplot) worden weergegeven. Op de x-as zijn de beoordelingen van waarnemer A geplaatst, op de y-as de beoordelingen van waarnemer B. Als de waarnemingen dicht op een lijn liggen, die begint op het nul-nul punt en een hoek van 45 graden met x- en y-as volgt, is de betrouwbaarheid zeer hoog te noemen. Oftewel de overeenkomst tussen de beoordelingen van de waarnemers is 100%.
Als de betrouwbaarheid zeer laag blijkt te zijn, kunnen we zoeken naar meer betrouwbaardere meetinstrumenten of wellicht beter getrainde waarnemers.
Een scatterplot geeft de waarden en de richting van de relatie tussen twee variabelen weer, in dit geval de relatie tussen de beoordelingen van twee waarnemers. De punten van de scatterplot zijn de punten waarop de lijnen vanuit de x-as (waarnemer A) en de y-as (waarnemer B) elkaar raken.
Een meetinstrument is valide als het meet wat we willen meten. Een meetinstrument kan hoog scoren op betrouwbaarheid, maar laag op validiteit. Een voorbeeld is het meten van lengte van de grote teen als maat voor intelligentie. Een meetinstrument dat daarentegen niet in zichzelf consistent is (betrouwbaar), kan ook niet valide zijn.
De mate van validiteit wordt belangrijk als datgene wat we willen meten, niet direct te meten is. We hopen een schatting te kunnen maken op basis van een andere variabele, bijvoorbeeld een test waarvan we hopen dat het datgene meet wat we eigenlijk willen meten.
We hopen bijvoorbeeld intelligentie te meten door middel van een standaardtest of door middel van het laten oplossen van een probleem. Een dergelijke afgeleide meting kan meer of minder valide zijn, oftewel in meer of mindere mate in staat zijn daadwerkelijk intelligentie te kunnen meten.
De mate waarop een meetinstrument op het eerste gezicht kan meten wat het moet meten, is de mate van ‘face validity’. Het is alsof je een panel van juryleden zou vragen: ”Hoe geloofwaardig vind je deze methode om intelligentie te meten?” Het meten van grote teenlengte zou laag op deze vorm van validiteit scoren.
In welke mate is ons meetinstrument in staat later gedrag te voorspellen? We willen bijvoorbeeld verkoopvaardigheden meten. We doen dit door middel van een vragenlijst. We kunnen vervolgens kijken of een hoge score op de test daadwerkelijk correleert met een hoge score op verkoopvaardigheden, later gemeten door middel van bijvoorbeeld iemands verkoopquota.
Als de punten in de punten grafiek weer dicht op een lijn liggen, heeft de test een hoge validiteit. De test kan vervolgens gebruikt worden om te bepalen welke mensen aan te nemen. De mensen die hoog scoren op de test, scoren namelijk ook hoog op daadwerkelijk verkoopgedrag.
Als zou blijken dat de lengte van de grote teen ook een groot verband zou hebben met de mate van intelligentie later gemeten, kunnen we om iemands intelligentie te meten ook slechts zijn grote teen meten. Dit zou een voorbeeld zijn een lage face validiteit maar een hoge predictieve validiteit.
Een voorbeeld van een meting met hoge face validiteit en lage predictieve validiteit is het vragen naar herinneringen. Het zelfvertrouwen waarmee proefpersonen hun herinneringen vertellen, lijkt totaal niet te voorspellen hoe accuraat die herinneringen zijn.
Een meting heeft een hoge constructvaliditeit als hij hoog correleert met andere zinnige metingen van hetzelfde concept. Intelligentie kan bijvoorbeeld gemeten worden door intelligentietesten, schoolprestaties en latere prestatie op een baan.
Om een aanzienlijke hoeveelheid data overzichtelijk weer te geven gebruiken we frequentieverdelingen. Een voorbeeld is een weergave van het aantal proefpersonen dat een bepaalde score had op een test. Dit geeft een overzicht van de verdeling van de scores over de proefpersonen.
In grafiekvorm ziet dit er als een staafdiagram of histogram uit. De waarde van de score op de x-as en de lengte van de staaf uitgezet op de y-as representeert het voorkomen van een bepaalde score. X-as en y-as kunnen omgedraaid worden om een hangende frequentieverdeling te krijgen in plaats van een liggende.
Als de frequenties per score laag zijn, kan je er voor kiezen de frequenties gegroepeerd weer te geven. Ook als er veel mogelijke scores zijn, kan het noodzakelijk zijn de scores in te delen in groepen van bijvoorbeeld tijdsintervallen.
Met een frequentieverdeling is ook goed te zien wat de waarschijnlijkheid is dat een score in een bepaalde score-groep valt. Die kans is bijvoorbeeld een derde dat een score in groep A ligt als deze groep 33,3% van het gehele aantal score in beslag neemt. Waarschijnlijkheid correspondeert met proportie in het diagram.
In een experimenteel onderzoek wordt een variabele gemanipuleerd en wordt er gekeken naar wat het effect van deze manipulatie is. Als er geen manipulatie plaatsvindt, spreken we van een observatie-onderzoek.
Een voorbeeld van observationeel onderzoek zijn casestudies, oftewel gevalsbeschrijvingen.
Psychiater Broca had een patiënt die alleen het woord Tan kon zeggen. Na zijn dood vond Broca dat een bepaald gebied van de hersenen van de patiënt was beschadigd (later Broca’s gebied genoemd). Patiënten met Broca’s afasie leiden aan expressieve afasie, oftewel de onmogelijkheid om spraak te produceren. Zes maanden later vond Broca een patiënt bij wie hetzelfde aan de hand was.
Dit onderzoek vertelt ons over patiënten met dit specifieke probleem en deze specifieke beschadiging van de hersenen. Echter, het geeft ook stof ter discussie over hoe onze hersenen werken en waar de geest of ziel van iemand zich bevindt.
Case studies kunnen ons veel vertellen over wat kan gebeuren, niet zozeer over wat altijd bij iedereen zal gebeuren. Freud concludeerde dat wat hij bij zijn cases vond, waar was voor alle mensen. Deze conclusies mogen we echter niet trekken op basis van casestudies. Zijn patiënten maakten bovendien deel uit van een zeer selecte groep, namelijk welgestelde mensen uit Wenen.
Ten tweede zijn case studies zeer gevoelig voor twee soorten van meetfouten.
Met een populatie-onderzoek willen we erachter komen wat waar is voor een bepaalde groep mensen, oftewel een populatie. Voorbeelden van dergelijk onderzoek zijn marktonderzoeken en opiniepeilingen.
Om de volgende vraag te beantwoorden, is een onderzoek uitgevoerd. Is het een goed idee eerst samen te gaan wonen voordat je gaat trouwen?
Je zou samenwonen kunnen zien als een proef die een latere scheiding kan voorkomen. Of het feit dat mensen gaan samenwonen, zegt iets over de geneigdheid om het samenwonen als een experiment te zien en de gemakkelijkheid waarmee ze zouden scheiden als het huwelijk tegen zou vallen.
De uitkomsten van diverse onderzoeken vertellen ons, dat mensen die eerst samenwonen eerder scheiden dan mensen die niet eerst samenwonen. Let op: Dit betekent niet noodzakelijkerwijs dat samenwonen leidt tot eerder scheiden. Het kan net zo goed zo zijn, dat bepaalde mensen eerder zullen samenwonen en ook eerder scheiden. Blijkbaar maakt samenwonen een latere scheiding niet minder waarschijnlijk dan niet samenwonen.
Vaak wordt bij populatie-onderzoek slechts een bepaalde groep als populatie genomen, waar we meer over willen weten. Een voorbeeld zijn de onderzoeken op de Bennington Universiteit in de dertiger jaren. Bennington had een reputatie om behoorlijk progressief te zijn. Onderzoeker Newcomb wilde weten wat er gebeurde met van huis uit conservatieve studenten wanneer ze op Bennington kwamen en hoe het ze daarna verging.
Nieuwe studenten werd gevraagd naar hun politieke voorkeur. Tweederde gaf aan voor de conservatieve kandidaat te kiezen bij de aankomende verkiezingen. Studenten die al langer op de school zaten verkozen de liberale kandidaat in de verhouding 3 staat tot 1. Er bleek grote sociale druk vanuit de oudere studenten te zijn om de populairdere liberale mening aan te nemen.
Veranderden de nieuwkomers daadwerkelijk in hun politieke houding of keerden zij terug naar hun oorspronkelijke houding als de sociale druk minder was, zoals na hun studietijd?
25 jaar later interviewden de onderzoekers 94% van de vrouwen opnieuw. De Bennington alumni werden vergeleken met een vergelijkbare groep vrouwen in leeftijd en klasse. De Bennington studentes bleken inderdaad nog steeds liberaler in hun opvattingen.
Vervolgens werden de Bennington vrouwen vergeleken met hun zussen of schoonzussen, die naar een andere universiteit waren gegaan. Weer bleek dat de Bennington alumni meer liberale ideeën hadden.
Beredeneerd werd, dat het de sociale druk was die de houding van de studentes veranderde, maar dat het vanuit sociale steun was, dat deze houding bleef. De Bennington vrouwen waren na school geneigd gelijk denkenden aan te trekken.
De conclusies van dit onderzoek lijken overeen te komen met ander onderzoek naar de invloed van sociale druk. Iemand met een afwijkende mening wordt onder druk gezet om de populaire mening aan te nemen. Als hij of zij dit niet doet, is er grote kans op afwijzing.
Miller (1984) vergeleek twee culturele groepen met elkaar: Hindoe’s in India en Amerikanen in Amerika. Ze gaf beiden voorbeelden van gedrag van vrienden met de opdracht uit te leggen wat de reden was van het gedrag van die vriend.
De Amerikanen waren meer geneigd het gedrag van de vriend te verklaren vanuit persoonskenmerken. De Indiërs waren meer geneigd gedrag te verklaren vanuit de situatie.
Nu kon het zo zijn dat Amerikanen gewoon vaker denken aan situaties die waren toe te schrijven aan persoonlijk kenmerken en Indiërs aan situaties die werden bepaald door een situationele context. Dit bleek niet het geval. Zelfs voor de verhalen van de Indiërs dachten Amerikanen eerder aan persoonskenmerken en voor de verhalen van de Amerikanen dachten Indiërs eerder aan situationele factoren.
In de jaren 50 ontstond er een geloofsgroep met in het midden mw. Keech, die geloofde dat een paar maanden later de wereld overspoeld zou worden door een grote vloed en dat zij en haar volgelingen gered zouden worden door een ruimteschip.
Een groep onderzoekers besloot om van binnen in de groep te observeren wat er zou gebeuren als de voorspelling niet uit zou komen: als de overstroming dus niet zou komen.
De gelovers, Seekers genaamd, waren ‘normale’ mensen die niet druk bezig waren met mensen overtuigen. Het moment van voorspelling was daar. En er kwam geen vloed. Toch leken de groepsleden nog sterker te geloven in de voorspellingen dan voorheen. Ze begonnen zelfs actiever acties te ondernemen om anderen te overtuigen, iets wat ze voorheen niet deden. De mensen die bij de groep bleven waren niet meer betrokken dan de mensen die hun geloof opzegden. Wederom zien we hier de invloed van aanvankelijk sociale druk en later sociale steun bij het blijven geloven van de binnen de groep ‘populaire’ mening. Wat gebeurde hier?
Festinger et al. gaven als verklaring de cognitieve dissonantie-theorie. We voelen ongemak als onze handelingen niet overeenkomen met onze overtuigingen en waarden. ‘Ik heb nu al deze moeite gedaan, ik kan het me nu niet veroorloven het niet meer te geloven’.
Het voortplantingsgedrag van de driedoornige stekelbaars is onder de loep genomen. Het stekelbaarsmannetje reageert op twee manieren op een andere stekelbaars. Als een mannetje nadert, gaat hij met zijn kop naar beneden en vinnen gespreid in zijn dreighouding (gedrag A). Als er een vrouwtje nadert, maakt hij een zigzag paringsdans (gedrag B). Een paringsritueel volgt.
Deze observaties leveren nogal wat vragen op. De volgende vraag is uitgewerkt in een experiment. Wat zorgt ervoor dat het mannetje gedrag A of gedrag B vertoont? Oftewel wat zijn de signalen van herkenning van een vrouwtje dan wel een ander mannetje?
Een mannetje heeft een rode onderbuik en zelfs grof uitgewerkte nepvissen, die een rode onderbuik hadden, bleken de dreigreactie op te wekken (in tegenstelling tot zelfs gedetailleerde nepvissen zonder rode buik). Een gezwollen onderbuik was voldoende signaal voor het mannetje dat het om een vrouwtje ging. Ook hier maakte het niet uit hoe gedetailleerd de nepvis verder was.
Zelfs vissen grootgebracht in geïsoleerd gevangenschap bleken dergelijk gedrag te vertonen. Door dit onderzoek was de gedachte van instinctief aanwezig gedrag in plaats van alleen aangeleerd gedrag weer actief geworden.
Observaties van mensen over de hele wereld vertellen ons dat het wenkbrauwen optrekken ter begroeting van een vriend, universeel is. Dit geldt ook voor een brede lach als teken van blijdschap.
Gezichtsuitdrukkingen kunnen gemaakt worden zonder dat ze ooit zijn geleerd. Wel kunnen we leren ze later te veranderen. Een voorbeeld hiervan is dat men in Japan wordt geleerd elke negatieve emotie te maskeren met een lach. Een wenkbrauw lift wordt hier simpelweg als grof bestempeld en daardoor vaak onderdrukt.
Verschillende onderzoeken hebben bevestigd dat er een verschil is tussen mannen en vrouwen wat betreft de manier waarop ze hun boeken dragen. Mannen dragen hun boeken eerder aan de zijkant en vrouwen zijn geneigd ze voor hun borst te dragen.
Roken en overeten lijken beide gedragingen die erg moeilijk zijn te veranderen, in elk geval voor langere tijd. Behandelprogramma voor deze groepen laten een terugval zien van 80% of meer. Een ander beeld wordt geschetst als gekeken werd naar mensen die geen hulp hadden gezocht, maar zelf hun probleem hadden overwonnen. Maar liefst 40% van hen was rookvrij of op gewicht gebleven (Schachter, 1982).
Waarom zijn de data van de klinieken meer ontmoedigend? Misschien zaten in de klinieken de mensen met de ergste problemen. Inderdaad bleken degenen die hulp hadden gezocht voor hun probleem meer overgewicht te hebben of een zwaardere roker te zijn dan degenen die geen hulp hadden gezocht.
Wat is het beste om te doen als je baby huilt terwijl hij net gevoed, verschoond in bed ligt? Is het beter te luisteren en naar hem toe te gaan of hem te laten huilen? Voor beide opvoedmethoden bestaan ongeveer evenveel argumenten.
Laten huilen, want:
Niet laten huilen, want:
De eerste kan de ‘reinforcement’ theorie genoemd worden, de tweede de ‘attachment’ theorie.
Voorspellingen vanuit de reinforcement theorie zijn:
Voorspellingen vanuit de attachment’ theorie zijn:
Bell en Ainsworth onderzochten hoe vaak baby´s huilden en hoe vaak en hoe snel hun moeders naar ze toegingen.
De correlatie tussen responsiviteit van de moeders en de mate waarin hun baby´s huilden, was negatief. Meer responsieve moeders neigden naar het hebben van minder vaak huilende baby´s dan minder responsieve moeders.
Deze bevinding suggereert dat het de kinderen zijn die het meest veelvragend en verwend overkomen, het meest waarschijnlijk degenen zijn met de moeders die het minst geneigd zijn of lang wachten om het huilen van hun kinderen te beantwoorden.
Let op! Het gaat in dit onderzoek om een correlationeel verband dat is gevonden voor responsieve moeders en minder vaak huilende kinderen. Dit zegt nog niets over een oorzakelijk verband.
De responsiviteit van de moeder is op verschillende manieren geoperationaliseerd. Gemeten werd het aantal keren dat de baby huilde en het aantal keren dat de moeder antwoordde. Ook werd de tijd gemeten tussen een huil en het moment dat een moeder in actie kwam. De interbeoordelaarsbetrouwbaarheid was hoog voor deze maten. De metingen zijn dus redelijk objectief te noemen.
Het verzamelen van data door observationeel onderzoek, kan heel goed leiden tot het stellen van specifiekere vragen en het vervolgens uitvoeren van specifieker onderzoek.
Hoewel we geen causaliteit kunnen vaststellen met een correlationele studie, kan een dergelijk onderzoek wel de voorspelling van een alternatief causaal verband ontkrachten.
We kunnen data nog meer vereenvoudigd weergeven dan in frequentieverdelingen. Een paar getallen kunnen al veel vertellen over de data. Deze worden beschrijvende statistieken genoemd.
De ‘typische score’ kan op verschillende manieren uitgedrukt worden. Er zijn drie soorten scores waar individuele scores om heen gecentreerd zijn:
De modus is de score die door de meeste proefpersonen werd behaald. Een probleem hierbij is dat er meerdere modi kunnen zijn, oftewel meerdere scores die het vaakst zijn behaald. De modus wordt gebruikt om aan te wijzen wie de winnaar is van een verkiezing; degene met de meeste stemmen wint.
De mediaan is de score die de frequentieverdeling doormidden deelt. Evenveel proefpersonen scoren boven als onder deze score. Als het niet mogelijk is deze score eenvoudig exact te bepalen kunnen we een schatting maken.
De gemiddelde score oftewel mean wordt berekend door alle scores bij elkaar op te tellen en te delen door het aantal scores, oftewel
Het optellen van alle deviaties van het gemiddelde (de ene of de andere kant op, + of -) geeft een score van nul.
Een nadeel van het gebruiken van het gemiddelde is zijn gevoeligheid voor zeer afwijkende scores (uitbijters). Hierdoor kan een vertekend beeld ontstaan van de verdeling van de scores. Daarom is het verstandig naast berekening van het gemiddelde te kijken hoe de frequentieverdeling er uitziet.
Hoe typisch het gemiddelde daadwerkelijk is voor een frequentie verdeling hangt af van de variatie van scores.
De mate van variabiliteit van data wordt uitgedrukt door middel van de standaarddeviatie. De standaarddeviatie is de afstand van een score tot het gemiddelde in het kwadraat (positieve of negatieve score vanaf gemiddelde maakt niet uit) gedeeld door het aantal scores, oftewel:
SD= som (X-M)/N
Een vergelijking tussen gemiddelde scores zegt niets over een vergelijking tussen individuele scores. Mannen zijn over het algemeen langer dan vrouwen. Dit betekent niet dat elke man langer is dan elke vrouw.
Vaak worden beweringen gedaan puur op basis van de mate waarin men verbeterd is door een bepaalde behandeling/product (‘bouquet’). Daarbij wordt niets vermeld over de verbetering die mensen zonder behandeling hebben ervaren.
We hebben de neiging veel waarde te hechten aan niet-typische gevallen, terwijl dit vaak niets zegt over de algehele werking van iets. We hechten bijvoorbeeld veel waarde aan een verhaal dat de auto die we willen kopen voor persoon X een rampscenario was (‘brickbat’).
Technische problemen bij het verkrijgen van gegevens door middel van observaties zijn de volgende.
Bovenstaande problemen komen trouwens niet enkel voor bij observationeel onderzoek, maar ook bij het doen en interpreteren van experimenten.
Over welke groep van mensen of dieren wil je uitspraken gaan doen? Naar welke populatie wil je de conclusies van dit onderzoek generaliseren?
Bij onderzoek in het algemeen is het een streven een zo representatief mogelijke steekproef van de samenleving te krijgen. In psychologisch onderzoek gaat het vaker om een specifieke groep van mensen, bijvoorbeeld patiënten in een kliniek. In de psychologie is het lang niet altijd noodzakelijk om de conclusies uit een groot onderzoek te halen, zoals bijvoorbeeld een opiniepeiling. De conclusies van veel psychologisch onderzoek hangen af van meerdere onderzoeken.
Als we een populatie met een pan soep vergelijken, kunnen we veronderstellen dat we een redelijke indruk krijgen van de smaak van de soep door het proeven van een lepel soep.
Als we de soep voor het proeven niet geroerd hebben, krijgen we misschien niet een heel goed idee ver hoe de soep in zijn geheel smaakt. De zware ingrediënten kunnen bijvoorbeeld naar de bodem gezakt zijn, zodat we ze niet proeven als we een lepel nemen. We spreken dan van een vertekende steekproef oftewel een biased sample.
100.000 Amerikaanse vrouwen werd gevraagd naar hun houding ten opzicht van Amerikaanse mannen. 4500 vragenlijsten werden teruggestuurd, waarbij de mannen er over het algemeen niet goed afkwamen.
Deze steekproef had zichzelf echter geselecteerd (self-selected). Vooral de vrouwen die een sterke mening hadden en deze graag wilden ventileren, stuurden de vragenlijst terug.
Als een enquêteur zelf zijn proefpersonen zou uitzoeken, gaat het niet om willekeurige steekproeftrekkingen, oftewel random sampling. Als hij bijvoorbeeld alleen langs mensen zou gaan die op de begane grond wonen, ontstaat al een vertekend beeld. Daar kunnen namelijk wel eens de rijkere mensen wonen dan op de bovenetages.
Het literaire tijdschrift Digest deed een peiling voor de verkiezingen en voorspelde dat Langdon (republikein) zou winnen. Echter, Franklin Roosevelt won de verkiezingen. Hoe heeft deze peiling zo fout kunnen gaan?
Er werd lange tijd gedacht dat het hier ging om een telefonisch interview. Lang niet iedereen had in die tijd een telefoon, zodat de peiling ten gunste van de republikeinse kandidaat zou zijn (hogere inkomens, meer kans op het hebben van een telefoon). Echter, het ging om een schriftelijke enquête. Degenen die de vragenlijst terugstuurden waren vaker degenen die Langdon stemden, misschien omdat ze voelden dat hij de underdog was in deze verkiezing en deden ze daarom meer moeite hun mening te uiten.
Random sampling houdt in dat op die manier een steekproef wordt getrokken zodat ieder lid van de populatie even veel kans zou hebben om geselecteerd te kunnen worden. Er kunnen papiertjes uit een hoed worden getrokken of dit kan door middel van de computer gebeuren. Deze methode gaat als volgt:
Het is nu makkelijker mensen te benaderen door middel van telefoonboeken en lijsten dan vroeger. Echter, nog steeds vallen mensen zonder telefoon, met een geheim nummer, of mensen die weigeren mee te werken, buiten de steekproef.
Een populatie is hoe je hem definieert. Studenten nu aanwezig in een collegezaal zijn geen random sample van alle studenten die zich hebben ingeschreven voor dit vak. De studenten die ziek zijn of op een andere manier afwezig zijn, hebben geen kans gehad gekozen te worden voor dit sample.
Als we een random steekproef van Amerikaanse kiezers willen hebben, kunnen we in verschillende fases een steekproef nemen. We nemen bijvoorbeeld een lijst van alle gemeentes, nemen dan een random sample van de straten en dan weer een random sample van alle kiezers.
Als je van tevoren nog niet weet uit wie je populatie zal bestaan, kan je ook een formule formuleren op basis waarvan je een steekproef gaat trekken. Vanaf nummer n (1-10 random te trekken) neem ik steeds de m-de persoon (1-10 random te trekken).
‘At random’ een steekproef trekken garandeert niet dat de steekproef representatief zal zijn, maar maakt het zeer onwaarschijnlijk dat de steekproef heel erg zal verschillen van de gehele populatie.
Soms willen we meer weten over een bepaalde groep mensen. Het is dan niet de bedoeling de steekproef te generaliseren naar mensen in het algemeen. Onze uitspraken zullen zich dan beperken tot: ‘bij proefpersonen als deze…’. Bijvoorbeeld, de Bennington studenten werden uitgekozen, juist omdat de Bennington Universiteit bekend stond om zijn andere, meer progressieve studenten
Vaak wordt het nemen van een steekproef bepaald door praktische omstandigheden. Het zou vaak veel te veel moeite en tijd kosten een random sample van de hele populatie te trekken. Vaak wordt gekozen voor makkelijk beschikbare studenten.
Als een steekproef is genomen uit praktische overwegingen en niet perse representatief is voor de gehele bevolking, is het bezwaarlijk te generaliseren naar die bevolking. Conclusies dienen dan geformuleerd te worden in de zin van “Dit geldt voor personen, zoals deze welke we onderzocht hebben”. Daarbij is het zeer goed mogelijk dat we belangrijke onderzoeksgegevens missen over andere groepen dan studenten.
Het generaliseren van onderzoeksgegevens naar andere groepen van de populatie gebeurt in de psychologie niet zozeer door middel van de representativiteit van de proefpersonen in een studie. Wanneer verschillende onderzoeken onder meerdere verschillende steekproeven soortgelijke resultaten laten zien, kunnen ook meer algemene conclusies gemaakt worden.
We hebben wel een representatieve steekproef nodig als we onze conclusies wel willen generaliseren naar de algemene bevolking. Dit is bijvoorbeeld het geval voor een peiling van de verkiezingsuitslagen. We willen dan graag weten op wie een meerderheid van de gehele bevolking gaat stemmen.
Wat een proefpersoon doet wordt mogelijk beïnvloed door onze aanwezigheid als waarnemer. Als hij zich hierdoor anders gedraagt, is er sprake van een zogenaamd observer effect oftewel waarnemerseffect.
In Duitsland was er een paard bekend, genaamd Hans, die wiskundige sommen leek te kunnen oplossen. Als hem gevraagd werd naar de som van 4 en 7, trapte hij 11 keer met zijn hoef. Tot er een onderzoeker kwam, die twee mensen apart van elkaar de twee getallen tegen Hans liet fluisteren.
Beide observatoren wisten zo niet het antwoord. En Hans ook niet, hij bleef doortrappen. Het bleek dat degene die de som aan Hans vertelde, ander gedrag ging vertonen als Hans bij het juiste antwoord was aangekomen. Hans pikte dit op en zag dit als een signaal om te stoppen met trappen.
Autistische kinderen leken coherente teksten te kunnen typen, zelfs als ze niet konden spreken. Dit kon met behulp van een facilitator, die hun handen boven het toetsenbord hield. Er werd vervolgens onderzocht wat er gebeurde als het kind een ander beeld te zien kreeg wat hij moest benoemen dan de facilitator. Het bleek dat de kinderen typten wat de facilitator zag, hun typegedrag werd dus op een subtiele manier bepaald door de facilitator. Ook zijn minder onschuldige gegevens bekend van het feit dat facilitators kinderen beschuldigingen lieten intypen van misbruik of incest.
De manier van vragen stellen lijkt zeer bepalend voor het antwoord dat we krijgen. Een onderzoek van Loftus en Palmer (1974) toonde aan dat de antwoorden die personen geven op vragen over een videotape afhankelijk waren van de vraagstellingen. De vragen waren: ‘Hoe snel gingen de auto’s toen ze elkaar raakten?’, en: ‘Hoe snel gingen de auto’s toen ze op elkaar knalden?’. De personen met de tweede vraag herinnerden het zien van gebroken glas (was er niet) en schatten de snelheid hoger in dan de personen met de eerste vraag.
Hoe kunnen we voorkomen dat we de proefpersoon beïnvloeden in hun gedrag?
Er zijn verschillende mogelijkheden.
Het is ook mogelijk dat niet de data, maar onze waarneming van de data verstoord wordt. Dit heet observer bias. Een voorbeeld was het experiment met hoe de jongeman gezien werd; als patiënt of als sollicitant. De waarneming van het gedrag van de jongeman werd verstoord door de vooroordelen die de beoordelaars hadden ten opzicht van een sollicitant of een patiënt.
In 1903 kondigde een natuurkundige professor aan dat hij een nieuw soort straling had ontdekt: N-straling. Onderzoekers reisden naar zijn lab om te straling te onderzoeken. Echter niemand kon de straling waarnemen. Een slimme onderzoeker verwijderde het prisma apparaat dat de straling zou moeten genereren. Nog steeds zagen de professor en zijn collega’s de straling, nu gegenereerd door hun eigen verwachtingen.
De goochelaar Randi kondigde in een talkshow aan dat hij op weg naar de studio een formatie UFO’s had gezien. Even later stond de telefoon roodgloeiend van mensen die ook UFO’s hadden waargenomen.
Blind observeren kan ook gebruikt worden om de observer bias te controleren.
Beoordelaars blind houden is bijvoorbeeld zorgen dat zij niet weten wat voor iemand ze tegenover zich hebben of in welke conditie diegene zit. Ook kan de waarnemer blind gehouden worden voor de theorie die wordt onderzocht of de verwachtingen die de onderzoeker heeft.
Als we objectieve maten gebruiken, is er minder kans dat bias een rol gaan spelen. Bij Harlow werd bijvoorbeeld de tijd gemeten dat het aapje bij de ene moeder was en niet het oordeel van een waarnemer over zijn gehechtheid. Ook kunnen subjectieve metingen gecheckt worden met objectieve metingen.
We kunnen kijken in hoeverre er sprake is geweest van een observer bias door te kijken naar de interobserveerderbetrouwbaarheid. Als de betrouwbaarheid hoog is, is er meer kans op dat er daadwerkelijk gebeurd is wat de waarnemers hebben gezien (tenzij ze dezelfde bias hebben). Als de betrouwbaarheid laag is, dient er gekeken te worden naar meer objectieve maten.
De mogelijkheid om achterstevoren boodschappen te kunnen ontvangen en deze vaardigheid te kunnen trainen, werd de auteur aangeboden via email. Op de vraag of bekend was, of als meerdere personen de tapes luisterden, zij hetzelfde hoorden, kwam geen antwoord.
Ook al zitten onze data goed in elkaar, toch kunnen we de verkeerde conclusies uit de data trekken. Dit is de zogenaamde inferential bias.
De bekendste inferential bias is het verwarren van een correlationeel verband met een causaal verband.
Stanovich noemt als voorbeeld de toaster-methode van geboortebeperking. Het blijkt dat hoe meer elektrische apparaten er in een huishouden zijn, des te minder kinderen er zijn. Dus als je het aantal kinderen wilt limiteren, moet je veel broodroosters in huis nemen! Dit zou een erg vreemde conclusie zijn. Beide blijken namelijk door een derde variabele veroorzaakt te worden: namelijk een hoger inkomen.
In het onderzoek naar responsiviteit bij moeders was de responsiviteit van een moeder negatief gecorreleerd aan huilen van de baby. Deze uitkomst geeft problemen voor de reinforcement theorie die zegt het huilen van de baby wordt bevorderd door het beantwoorden. Het bevestigt echter nog niet de attachment theorie. Er zijn immers drie mogelijkheden:
Bij een correlationeel verband tussen X en Y is het dus noodzakelijk aan deze drie opties te denken. Dit is duidelijk een fout die vaak wordt gemaakt, zeker door de media.
Niet zo lang geleden kwam in het nieuws dat mensen die veel koffie dronken, langer seksueel actief bleven. Er zijn weer drie mogelijke verklaringen:
Kinderen met een hogere waarde van zelfvertrouwen presteren beter op school. Het wordt dan ook als een belangrijke taak van een leraar gezien om het zelfvertrouwen van leerlingen te stimuleren. Maar weer zijn er drie mogelijke manieren van uitleggen:
Kinderen die wachten met het naar de kleuterschool gaan, laten in 70% van de gevallen gedragsproblemen zien. Dus moeten we ervoor zorgen dat kinderen eerder naar school gaan, wordt vervolgens gezegd. Ook hier gaat het om een correlationeel verband, dat als volgt uitgelegd kan worden:
Getrouwde mensen leven langer en zijn minder vaak depressief dan niet getrouwde mensen. Dus een huwelijk zorgt voor een lang en gelukkig leven?
Studenten met een muzikale achtergrond waren beter in het onthouden van een lijst met woorden dan studenten die geen muzikale training hadden gehad. Ook hier is mogelijk dat een muzikale training leidt tot een beter verbaal geheugen. Maar er zijn ook nog de twee andere opties.
Bij een correlationeel verband kunnen we vaststellen dat er drie opties zijn:
Een correlatie wil zeggen: als er meer van het een is, dan is er ook meer van het ander. We verwachten bijvoorbeeld dat een hogere hitscore in een jaar voetballen positief gecorreleerd is met de kans dat de persoon nu zal scoren.
De formule voor het berekenen van de correlatiecoëfficiënt is
r² = 1 – (SE²/SD²)
Dit betekent het volgende. SE staat voor de standaardfout van schatting. Dit is de afstand van een score tot de best passende regressielijn die door alle scores getrokken kan worden. (SE²/SD²) staat voor de afstanden van alle scores tot de regressielijn in vergelijking met de standaarddeviaties (afstand van de scores tot het gemiddelde).
Als het gaat om een perfecte correlatie, is de standaardfout 0 en de correlatiecoëfficiënt 1 (of –1, afhankelijk van formulering van de correlaties).
Als we willen weten wat door wat wordt veroorzaakt, is het doen van een experiment een goede manier om dit te onderzoeken.
Een experiment wordt meestal geassocieerd met een steriel laboratorium, maar in feite kan een experiment overal plaatsvinden. Een experiment wordt gekenmerkt door het volgende:
De onderzoeker manipuleert iets en observeert vervolgens wat er gebeurt.
Een onderzoeker gaat uit van de volgende redenering:
De onderzoeker manipuleert A; hij zorgt ervoor dat A varieert. Als B verandert en we kunnen andere oorzaken uitsluiten, dan moet A wel B hebben veroorzaakt.
Door het doen van een experiment hebben we de mogelijkheid om verschillende variabelen uit elkaar te halen, bijvoorbeeld voeding van de moeder en comfort van de moeder in het experiment van Harlow. Op een andere manier zouden we niet te weten zijn gekomen wat er precies voor zorgt dat het aapje bij zijn moeder wil zijn.
Op de vraag of het veel tijd het kost om een zenuwprikkel van de hersenen naar de spieren te sturen, voerde Helmholz in 1850 het volgende onderzoek uit.
Hij stimuleerde direct een zenuw en nam dan de tijd tussen de prikkel en de samentrekking van de spier. Echter, hij had nu nog niet de snelheid van de prikkel gemeten. De tijd werd immers ook gedeeltelijk bepaald door de tijd die het kostte om de spier te spannen. Hij vergeleek de gevonden reactietijd daarom met de tijd die het de zenuw kostte een langere weg af te leggen naar de spier. De snelheid was dan het verschil in afstand gedeeld door het verschil in tijd. Zo kwam hij op een snelheid van ongeveer 30 meter per seconde. In die tijd was dit een hele ontdekking.
Shepard en Metzler (1971) onderzochten de vraag hoe veel tijd het kost om beelden in ons hoofd te manipuleren. Proefpersonen moesten driedimensionale figuren in hun gedachten roteren. Vervolgens moesten zij concluderen of van figuur A figuur B gemaakt kon worden.
De mate waarin de figuren in gedachten geroteerd moesten worden werd gevarieerd. Het mentaal roteren van de figuren leek net als in de fysieke werkelijkheid tijd te kosten. De proefpersonen deden langer over hun conclusies als de rotatiehoek groter was en het figuur dus meer geroteerd moest worden. Ook hier werd snelheid van het roteren weer gemeten door het verschil in rotatie te delen door het verschil in tijd nodig voor het oplossen van de taak.
In dit onderzoek werd proefpersonen niet gevraagd hun mentale beelden te beschrijven, maar ze te gebruiken om een bepaalde taak op te lossen. Het oplossen van de taak, het gedrag, kon uiteindelijk op een objectieve manier gemeten worden, door middel van tijd. Subjectieve gebeurtenissen kunnen zo objectief gemeten worden.
Smaakaversie bij ratten en bij mensen
Uit de experimenten van Pavlov bleek dat een tijd van ongeveer een halve seconde tussen aanbieding van de CS en de UCS optimaal was voor een goed conditioneringseffect. Bij een groter tijdsinterval is de mate van conditionering zwak of simpel afwezig.
Het fenomeen van het ontstaan van smaak aversie lijkt hier niet mee te stroken. Conditionering kan reeds plaatsvinden na een koppeling van CS met UCS, zelfs als ze meerdere uren van elkaar verwijderd zijn.
Ratten kregen een injectie van sacharine (normaliter lekker voor ratten) en werden vervolgens ziek gemaakt. Na drie dagen, als ze hersteld waren, kregen ze nogmaals sacharine te drinken. De ratten dronken nog weinig van de sacharine. Zelfs als ze pas ziek werden een uur nadat ze de sacharine hadden gedronken, trad er smaakaversie op.
Misschien wilden de ratten sowieso niets meer drinken nadat ze ziek waren gemaakt? Om dit uit te sluiten voegden de onderzoekers een controle groep in. Deze ratten werden ziek gemaakt zonder van te voren de sacharine te krijgen. Drie dagen later kregen ook zij opnieuw sacharine. Ze dronken het evengoed als niet behandelde ratten deden.
Hier is iets anders aan de hand dan in de experimenten van Pavlov: deze vorm van conditionering ontstaat veel sneller en lijkt veel krachtiger.
Smaakaversie bij mensen. Bernstein’s experiment (1978)
Smaakaversie bij mensen onderzoeken is wat lastiger; mensen ziek maken is niet zo ethisch verantwoord. Vandaar dat Bernstein (1978) een groep adolescenten onderzocht die chemotherapie voor een vorm van kanker kregen.
Er werden drie groepen gemaakt. De eerste groep kreeg een ijsje met de nieuwe smaak Maple Toff voorafgaand aan de chemotherapie. De tweede groep kreeg een spelletje voorafgaand aan de chemotherapie. De derde groep kreeg het ijsje maar kregen daarna geen chemotherapie.
Twee tot vier weken later werden allen gevraagd of ze liever een ijsje wilden eten of een spelletje wilden spelen. Van de controle groep koos 67% een ijsje, van de kinderen die een ijsje kregen voor hun chemo, koos slechts 21% voor het ijsje. Bij de follow-up kozen de kinderen in de experimentele conditie significant minder voor de smaak Maple Toff dan een andere smaak ijs in vergelijking met de kinderen in de controle groep.
Eerder stelden we de vraag of bewustzijn belangrijk is voor het proces van conditionering. Het bovenstaande experiment laat zien dat smaakaversie optrad ondanks het bewustzijn van de proefpersonen; ze wisten immers dat de misselijkheid kwam van de chemotherapie en niet door het ijsje.
Pavlov ziet de menselijke psyche meer als een onbeschreven blad, waar elke associatie nog gemaakt kan worden. Het experiment van Bernstein suggereert echter ook dat bepaalde stimuli makkelijker aan bepaalde reacties gekoppeld kunnen worden. Bij de koppeling smaak en misselijkheid zou het kunnen gaan om een gespecialiseerd mechanisme.
Een experiment wordt gekenmerkt door het doen van een manipulatie. De onderzoeker laat iets variëren. Dit wordt een onafhankelijke variabele genoemd.
Een variabele dient minstens twee waarden te hebben, meestal condities genoemd. Zo wordt in het smaakexperiment het eten van ijs wel of niet gevolgd door chemotherapie. In het bijstanderexperiment zijn er 1 of 3 mensen aanwezig in de wachtkamer.
Vervolgens kijken we naar hoe het resultaat afhangt van de waarde van de onafhankelijke variabele. De onafhankelijke variabele is de interventie en de afhankelijke variabele is de data, datgeen we waarnemen.
Controle variabelen
Idealiter zou de onafhankelijke variabele die we manipuleren de enige zijn die van invloed is op de afhankelijke variabele.
Echter, proefpersonen kunnen verschillen op andere vlakken dan de gemanipuleerde onafhankelijke variabelen. Ze kunnen verschillende persoonskenmerken meebrengen, in verschillende stemmingen zijn en wel of niet veel gegeten hebben. Toch trachten we om zo veel mogelijk de invloed van andere factoren uit te kunnen sluiten, ofwel te controleren.
Een belangrijke regel is:
We controleren wat we kunnen controleren en wat we niet kunnen controleren, randomiseren we.
Waar we voor wensen te controleren ligt ook aan onze vraagstelling. Wat in het ene experiment een onafhankelijke variabele is, is voor het andere experiment een controlevariabele.
Voorbeeld. Voedselonthouding
We willen het effect weten van voedselonthouding. We willen hierin zeker weten dat de aantrekkelijkheid van het eten voor alle proefpersonen ongeveer gelijk is. Het zou een zinloze vergelijking zijn mensen die honger hebben aantrekkelijk voedsel voor te zetten en mensen die geen honger hebben niet aantrekkelijk voedsel. De aantrekkelijkheid van het eten is hier dus een controle variabele.
Nu willen we de invloed van aantrekkelijkheid van eten weten op de hoeveelheid die wordt gegeten. In dit geval willen we controleren op de hoeveelheid honger die proefpersonen van te voren hadden. Honger is hier de controlevariabele.
Elk experiment moet een vergelijking bevatten. Bij het bijstanderexperiment was dit of er wel of niet andere mensen aanwezig in de wachtruimte. Bij het ijsjesexperiment was dit ijs wel of niet gevolgd werd door misselijkheid.
Elk experiment bevat een vergelijking. Er is een onafhankelijke variabele die verschillende waarden aanneemt, uitgedrukt in verschillende experimentele condities. Dan zien we hoe het gedrag van de proefpersonen (afhankelijke variabele) afhangt van deze onafhankelijke variabele. Voor andere invloeden dan de onafhankelijke variabele controleren we. Of we zorgen ervoor dat deze invloeden zo veel mogelijk gelijk verdeeld zijn over de verschillende condities.
In dit design worden proefpersonen at random in twee of meer condities ingedeeld. De condities verschillen op één kenmerk, voor de rest zijn ze zoveel mogelijk identiek. Het bijstanderexperiment is een voorbeeld hiervan; proefpersonen zaten alleen of met twee anderen in de wachtkamer. Er wordt gesproken van twee groepen, wat niet wil zeggen dat de proefpersonen contact met elkaar hebben of tegelijkertijd aanwezig waren.
Within-subjects design
In dit design is slechts één groep proefpersonen. In het simpelste geval maakt de proefpersoon een keuze tussen verschillende waarden van de onafhankelijke variabele. Het experiment van Harlow is hier een voorbeeld van. De aapjes moesten kiezen tussen de stalen en stoffen moeder. De afhankelijke variabele was de hoeveelheid tijd die zij bij elke moeder doorbrachten.
Niet alle vragen kunnen gereduceerd worden tot een keuzeprobleem. Soms zijn aparte groepen nodig, bijvoorbeeld wanneer twee condities elkaar uitsluiten.
Within-subjects design: herhaalde metingen
Als we twee condities niet tegelijkertijd aan een proefpersoon kunnen aanbieden, kunnen we ze op verschillende tijdstippen aanbieden. De proefpersoon wordt dan met zichzelf vergeleken onder een andere conditie.
Voordelen
Een voordeel is dat we ons niet druk hoeven te maken om vergelijkbaarheid van de groepen; er is maar een groep. Een ander voordeel is dat op deze manier gecontroleerd kan worden voor individuele verschillen.
Als het meemaken van de ene conditie het gedrag in de andere conditie beïnvloedt spreken we van een carry-over effect. Voorbeelden van carry-over effecten zijn beïnvloeding door leren, moeheid of verveling.
Counter-balancing
Een manier om de effecten hiervan in elk geval gelijk te verdelen over de condities is het principe van counter-balancing. Om een volgorde effect te voorkomen kan de helft van de proefpersonen bijvoorbeeld eerst A doen en dan B en de andere helft omgekeerd.
Hier gaat het verschillende condities, maar het gaat nog steeds om een within-subjects design. Proefpersonen worden met zichzelf vergeleken.
Dit gebeurt vaak bij meerdere kortdurende condities. Willekeurig wordt bepaald in welke volgorde de proefpersoon de condities ondergaat. Zo is er evenveel kans op welke volgorde dan ook per proefpersoon.
Soms is het niet mogelijk om twee verschillende condities na elkaar te doen. Dit geldt bijvoorbeeld voor twee methoden om te leren fietsen. Of eerst het rookexperiment alleen doen en vervolgens met twee anderen. De eerste conditie heeft dan duidelijk een blijvend (leer)effect op het gedrag in de tweede conditie.
Maar voor bijvoorbeeld het mentale rotatie-experiment was het een oplossing verschillende condities in een willekeurige volgorde aan te bieden. Leereffecten zouden op deze manier verspreid worden over de condities.
Er is nog een manier om te checken op carry-over effecten, namelijk weer terug te gaan naar de eerste conditie. Als de afhankelijk variabele dan weer de oorspronkelijke waarde aanneemt, weten we dat het carry-over effect niet speelt. .
In een bekend onderzoek dienden ratten zelf op een hendel te drukken om hun eten te krijgen. Aanvankelijk waren er 6 drukken voor nodig, daarna 12 daarna 24. Om te weten of de ratten niet gewoon steeds meer gingen drukken, werd weer teruggegaan naar 6 drukken die nodig waren om voedsel te krijgen. De ratten gingen weer minder drukken. De ratten drukten dus meer omdat er meer voor nodig was voedsel te krijgen, niet omdat ze meer geoefend waren in het drukken.
We vergelijken hier een proefpersoon niet met zich zelf maar met een persoon vergelijkbaar met henzelf op een bepaalde variabele. Persoon A wordt dan ingedeeld in conditie A en Persoon B in conditie B (of andersom; gebeurt at random). Een voorbeeld is dat na het afnemen van een IQ test de twee personen met de hoogste IQ score worden gematched en vervolgens aan conditie A en B worden toegewezen.
Randomized-block design
Proefpersonen hoeven niet in paren te hoeven gematched, dit kan ook in groepen. Bijvoorbeeld de mensen met IQ scores boven de 110, met IQ scores tussen de 90 en 110 en met IQ scores lager dan 90 worden at random toegewezen aan conditie A of B.
Dit design maakt enige controle over individuele kenmerken mogelijk, maar niet zo veel als een within-subjects design. Daarbij geeft het meer verzekering dan puur globale randomisering dat de groepen vergelijkbaar zijn. Er kunnen geen carry-over effecten zijn, want elke persoon zit slechts in één conditie.
Een nadeel van een dergelijk design zijn de kosten. Een extra meting van bijvoorbeeld intelligentie kost tijd en geld. We kunnen ons afvragen of de moeite die het kost mensen te matchen op individuele kenmerken opweegt tegen de extra controle die we verkrijgen.
Beperkingen van experimenten
Experimenten die interessant zijn om hun onderzoeksvraag, zijn soms praktisch of ethisch gezien niet mogelijk. Verder werkt het doen van experimenten zeer langzaam. We weten dat dit zo en zo werkt onder deze condities. Maar hoe zit het onder andere omstandigheden of bij een andere groep? Elk vraag vereist weer een nieuw op te zetten experiment. Een experiment zegt slechts iets over de manipulatie die we hebben gedaan en niets over andere invloeden die een verschil kunnen maken.
Bij een ANOVA wordt de variabiliteit wordt gesplitst in twee componenten:
Het aantal vrijheidsgraden staat gelijk aan het aantal scores dat ‘vrij’ is om te variëren, oftewel hoeveel scores je nodig hebt om een bepaalde score te kunnen weten. De formule voor het aantal vrijheidsgraden is
Df = N – 1
De t-waarde staat voor de mate waarin de verschillende groepen van elkaar verschillen gedeeld door de mate waarin de individuen binnen een groep van elkaar verschillen. De noemer is dan het effect van een conditie op de onafhankelijke variabele en de teller kan uitgelegd worden als de door individuele verschillen veroorzaakte ‘verstoring’ van dit effect.
Er zijn drie zaken die bepalend zijn voor de waarde van t of F en dus significantie bepalen:
Idealiter wordt de onafhankelijke variabele die we willen meten slechts beïnvloed door de afhankelijke variabele die we manipuleren en zijn er verder geen storende invloeden.
Helaas is dit niet altijd het geval. We kunnen wel zoveel mogelijk doen om de effecten van die storende factoren te minimaliseren. Dat heet controleren.
Controle problemen
Er kunnen zich twee soorten situaties voordoen waar we graag voor zouden willen controleren:
Een nulresultaat
Een niet-significante uitkomst wordt vaak een nulresultaat genoemd. Er zijn twee mogelijke oorzaken voor het vinden van een nulresultaat.
Deze tweede optie willen we proberen te voorkomen waar mogelijk.
Ineffectieve manipulaties
Een mogelijkheid is dat we de onafhankelijke variabele niet genoeg gevarieerd hebben. Een onderzoeker roept bijvoorbeeld zacht ‘boe’ met als doel iemand bang te maken. De groepen zullen dan niet van elkaar verschillen, want door een enkele ‘boe’ is geen angst opgewekt.
Onderzoeker Adolph wilde onderzoeken of ratten meer zouden eten als het voedsel lekkerder was. De ene groep ratten kreeg standaard eten. De andere groep kreeg eten gezoet met sacharine. Adolph vond geen verschil tussen de groepen.
Een later experiment liet zien dat de ratten wel degelijk meer zouden eten als het eten maar aantrekkelijk genoeg was. De onderzoekers lieten zien dat de ratten soms drie keer in gewicht toenamen als hen allerlei lekkernijen werd voorgeschoteld.
Blijkbaar had Adolph de aantrekkelijkheid van het voedsel niet voldoende gevarieerd om een effect te krijgen.
Om te weten te komen of een bepaalde manipulatie het gewenst effect heeft gehad, kunnen we een manipulatiecheck uitvoeren. We kunnen bijvoorbeeld fysiologische metingen doen om te checken of iemand daadwerkelijk angstig is geworden of het aan de persoon vragen (zelf-rapportage).
Een meetfout is een fout die veroorzaakt wordt door het meetinstrument dat we gebruiken. Het meetinstrument kan bijvoorbeeld te subjectief zijn of te grof om goed te meten wat we willen meten. We behandelen bijvoorbeeld een groep met een medicijn dat honger zou kunnen verminderen. De tweede groep krijgt geen medicijn. Op het eind vragen we de proefpersonen op een 12-puntenschaal aan te geven hoeveel honger ze hebben.
De scores zouden meer iets zeggen over hoe de personen geneigd zijn op deze vraag te antwoorden, dan over hoeveel honger ze daadwerkelijk hadden.
Er kan een hoop tijd en moeite gaan zitten in de ontwikkeling van precieze meetinstrumenten. Het aantal keren dat een rat likt aan een voedingsfles werd bijvoorbeeld geregistreerd door een elektrisch signaal dat was aangesloten op een nauwkeurige computer. Voor het mentale rotatie-experiment werd een installatie ontwikkeld die nauwkeurig de begintijd en het moment dat de persoon voor het antwoord op een knop drukte mat.
We spreken van een plafondeffect als de taak die een proefpersoon krijgt te makkelijk is. Zo makkelijk dat (bijna) alle personen de taak goed kunnen uitvoeren. Een mogelijk verschil tussen mannen en vrouwen kan bijvoorbeeld niet gemeten worden door het laten oplossen van de som 7x5.
Het bodemeffect treedt daarentegen op als een taak te moeilijk is voor (bijna) alle proefpersonen. Ook dan zijn verschillen tussen groepen niet te zien of te meten.
Eigenlijk gaat het om een zelfde soort effect. Als een taak te makkelijk is, zitten de goede scores aan het plafond en de fouten die ze hebben gemaakt op de bodem.
Stel dat we de mate van hongergevoel willen meten. Als de proefpersonen zojuist thuis hebben gegeten, zal er niet veel variatie tussen de personen zijn. De proefpersonen zitten zo vol, dat er niet veel meer bij kan (plafondeffect) en hun voedselinname zullen zo laag zijn dat ze niet veel lager kunnen (bodemeffect).
Er kunnen ook te grote individuele verschillen zijn die de data vertroebelen.
In het hongerexperiment is bijvoorbeeld het volgende aan de hand. Persoon A. heeft een medicijn gekregen dat zijn eetlust heeft verlaagd. Maar hij eet nog steeds meer dan ieder ander.
Een within-subjects design zou dit kunnen oplossen. Er wordt bij elke persoon gekeken hoeveel hij met of zonder medicijn eet. In dit geval wordt een proefpersoon twee keer getest. Er is dan de helft van de proefpersonen nodig voor hetzelfde aantal scores.
Om voor een carry-over effect (bijvoorbeeld verveeld raken van hetzelfde eten) te controleren, kreeg de helft van de proefpersonen het medicijn eerst en de andere helft kreeg het medicijn bij de tweede keer.
Ook zou gekozen kunnen worden voor een matched group design, waarin de grootste eters aan elkaar gekoppeld worden etc. Vervolgens worden de proefpersonen at random worden ingedeeld in de condities wel en geen medicijn. Er zijn nu twee keer zoveel proefpersonen nodig en we moeten data hebben van een baseline meting (een test die meet wat voor eters de deelnemers zijn).
Verschillen in de externe situatie kunnen ook ruis veroorzaken in de data. Dit zou bijvoorbeeld het geval zijn als we het mentale rotatie-experiment in een drukke straat zouden houden. Daarnaast kunnen er verschillen zijn in de interne situaties van de proefpersonen, zoals bijvoorbeeld de hoeveelheid koffie die ze hebben gedronken of dat ze meer afgeleid zijn omdat ze voor een tentamen zitten.
Voor belangrijke factoren (waarvan je veel invloed verwacht) kun je proberen zo veel mogelijk te controleren. Voor de experimenten van Pavlov werd bijvoorbeeld een speciaal laboratorium gebouwd om omgevingsgeluiden en invloeden buiten te sluiten en om de honden van hun proefleiders te kunnen scheiden.
Moderne laboratoria zijn meestal ook geluidsdicht en steriel gemaakt om zo min mogelijk afleiding te veroorzaken. Proefpersonen worden bijvoorbeeld geobserveerd door camera’s om aanwezigheid van de proefleider te voorkomen. Afhankelijk van wat je wenst te meten, controleer je voor ongewenste effecten. Die controle kan cruciaal zijn, bijvoorbeeld bij een onderzoek naar de reukzin. Drastische maatregelen moeten dan voorkomen dat de persoon zelfs maar zijn eigen huid zou kunnen ruiken (plastic pakken etc.)
Voor welke variabelen wil je nu controleren en in welke mate?
In een ideale wereld zou de onafhankelijke variabele gevarieerd worden en alles erom heen constant gehouden worden. Alles controleren is echter simpelweg niet mogelijk. Wat je wel wilt controleren is afhankelijk van wat je wilt meten.
De belangrijkste variabelen om te controleren zijn die waarvan je verwacht dat ze de grootste invloed zouden hebben op de afhankelijke variabele. Variabelen die we niet controleren, randomiseren we.
In het honger-experiment controleren we bijvoorbeeld voor hoeveel proefpersonen van tevoren hebben gegeten. In het bijstander-onderzoek verwachten we dat de hoeveelheid die mensen gegeten hebben geen invloed heeft op wat we willen meten. Mogelijk zou de mate van koffie drinken invloed kunnen hebben. Echter, aangezien het zeer lastig is en te ingrijpend in het leven van de proefpersonen, controleren we hier niet voor. We kunnen wel rekening houden met een effect voor koffiegebruik en hierop vervolgens randomiseren. Voor elke mogelijke variabele kunnen we een kosten-baten analyse maken: wat kost het om deze variabele te controleren en wat levert het op?
Of we een goede beslissing hebben gemaakt is aan de data te zien. Als de onafhankelijke variabele een duidelijk effect laat zien, weten we dat de ongecontroleerde variabelen niet een erg storende rol hebben gehad. Wel kan er nog steeds sprake zijn van confounded variables.
In een laboratorium vereenvoudigen we een situatie en controleren we voor ongewenste ruis. In een veldexperiment laten we externe factoren voor wat ze zijn en hopen we dat onze manipulatie sterk genoeg is om een effect te kunnen aantonen.
Latany en Darley (1970) onderzochten of het bijstanderseffect stand hield in een natuurlijke situatie.
De onderzoekers gingen een drankenhandel binnen en stalen een fles drank als de verkoper achter in de winkel was. Ook hier bleek dat de klanten (de proefpersonen) eerder de actie meldden tegen de verkoper als zij alleen waren dan als er meerdere mensen aanwezig waren. Hier was het niet nodig te controleren voor de individuele kenmerken van de klanten, het lawaai buiten of het weer. Wel manipuleerden de onderzoekers de situatie door voor dieven te spelen.
Er bestaat een soort vogel die als er gevaar dreigt voor haar eieren, doet alsof ze gewond is om de bedreiging af te leiden van haar nest. Met de vraag of zij bewust probeert de bedreiger voor de gek te houden, startte Ristau zijn experiment (1991).
Eerst observeerden de onderzoekers de vogels. Ze bleken ook te reageren op menselijke indringers, in een specifiek patroon te bewegen en te reageren op het gedrag van de indringer. Vervolgens stelden de onderzoekers de vraag of de vogel ook leerde om dit gedrag niet te vertonen als het niet nodig bleek. Eén onderzoeker benaderde het nest agressief terwijl een andere er nonchalant voorbij liep. Elf van de 13 vogels reageerden meer met hun gedrag bij de ‘gevaarlijke’ indringer dan bij de niet-gevaarlijke indringer. Dit bewijst niet dat de vogel bewust de indringer voor de gek wil houden (we kunnen niet in zijn gedachten kijken) maar sluit wel andere alternatieven uit.
In beide voorbeelden is er geen poging gedaan alle omgevingsfactoren te controleren. Wel is in beide gevallen een manipulatie ingebracht. Deze leek krachtig genoeg om een effect te laten zien. We kunnen meer vertrouwen hebben in onze gegevens als we ondanks natuurlijke variabiliteit een effect waarnemen.
Het onderscheid tussen een veld- en laboratoriumexperiment is niet absoluut. Zowel in het veld als in het laboratorium kunnen dingen meer of minder gecontroleerd worden. Vergelijk Pavlov’s lab met het rookexperiment. Bij een veldexperiment is de intentie meer de omgevingsfactoren te laten dan te controleren. Wanneer is wat een goede keuze?
Subtiele effecten zijn lastig te meten in het veld. Bijvoorbeeld de snelheid van mentale rotatie is lastig te meten op een drukke straat. Als er een effect gevonden wordt is dit wel een teken van de kracht van het effect, dat zelfs door de ruis heen zich toont.
We kunnen gebruik maken van de natuurlijke variatie van variabelen buiten het laboratorium. Als bijvoorbeeld ondanks de variaties in temperatuur een effect te zien is, is dit nuttige informatie. Maar ook als de wisselende temperaturen (indien wel gemeten) wel een effect hadden op de uitkomsten, is dit handig om te weten.
Het is altijd de vraag hoe we gegevens verkregen in een laboratoriumsetting kunnen vertalen naar het echt leven. Bij een veldexperiment hoeven we die vertaalslag niet te maken. Niet elk experiment heeft de intentie toepasbaar te zijn op het echte leven. Een experiment kan ook bedoeld zijn om een theorie te testen.
Om erachter te komen hoe onze data er globaal uit zullen zien, kunnen we eerst een vooronderzoek doen op kleine schaal. Mogelijk krijgen we dan al een beter idee voor welke variabelen we willen controleren en welk onderzoeksdesign we willen gebruiken.
De mate van significatie van een uitkomst meten we door middel van een t-test. Met een t-test testen we de significatie van het verschil tussen twee groepen die we vergelijken. Als we naar de formule van de t-test kijken, zien we dat deze uit drie delen bestaat.
1. Het verschil tussen de groepsgemiddelden
Als het verschil tussen de gemiddelden van de twee groepen groter wordt, wordt t groter. Bij een plafond- of bodemeffect zal dit getal dan ook zeer klein zijn.
2. De aantallen van proefpersonen in de groepen
Hoe meer proefpersonen, des te hoger t, bij gelijke waarden van de andere variabelen.
3. De mate waarin de proefpersonen binnen een groep variëren met betrekking tot een bepaalde variabele. Als deze variatie groot is, zal t kleiner worden. De proefpersonen zijn aan dezelfde condities blootgesteld. Als er dan veel verschillen zijn binnen een groep, zijn er dus veel ongecontroleerde variabelen die effecten hebben.
Oftewel, we kunnen eerder een significant effect verwachten als
Als een van deze gebieden zwak is, dienen we die te compenseren met kracht op een ander vlak.
Om de mate van significantie van een effect te meten, willen we weten wat de kans is op het vinden van een t-waarde zo hoog als die van ons. Om dit te doen maken we een denkbeeldige frequentieverdeling van mogelijke t-waarden.
Bij een type 1 fout is er sprake van vals alarm; er lijkt een effect te zijn, maar dit blijkt toeval te zijn. Bij een type 2 fout wordt er geen effect gevonden, hoewel deze er wel is. Er is sprake van een misser.
We bepalen dat een verschil significant is als er een kans is van minder dan 5% dat de uitkomst aan toeval te wijten is. Afhankelijk van wat acceptabele waarden zijn van deze kans, kunnen we deze significantiedrempel verlagen of verhogen. 5% is echter het meest gebruikelijk.
Als we kans op een fout in beide richtingen willen meten, dienen we een two-tailed t-test doen. Soms willen we enkel een type 1 fout uitsluiten, bijvoorbeeld als we dezelfde beslissing zouden maken bij geen effect als bij een effect gevonden in tegenovergestelde richting. Het voldoet dan om een one-tailed t-test te doen. Een voordeel van een one-tailed t-test is dat de t-waarde minder hoog hoef te zijn om toch significant te zijn.
Een significante uitkomst (p<.05 met="" een="" lage="" n="" proefpersonen="" is="" even="" veelbetekenend="" als="" significante="" uitkomst="" bij="" hoge="" n.="" immers="" de="" kans="" op="" p="" waarde="" erg="" klein="" maar="" hij="" significant="" laag="" heeft="" die="" significantie="" evenveel="">
De mate van significantie dient niet verward te worden met het belang van deze uitkomst en de praktische implicaties daarvan.
Confounded variables zijn variabelen die verwarring scheppen over de oorzaken van een effect. Een oorzaak wordt door elkaar gehaald, oftewel verward met een andere. Een confounded variabele varieert mee met de onafhankelijke variabele die we willen meten.
Er zijn meerdere redenen dan het geven van een behandeling voor het verbeteren van patiënten. Percentages weergeven van verbeterde patiënten zegt dus weinig. De volgende processen kunnen aan de hand zijn:
Het placebo-effect is een belangrijke soort van niet-specifiek effect. Echte verbetering kan optreden door het geven van een behandeling zonder actieve werkzaamheid. Enkele misopvattingen over het effect van placebo’s:
Hoe een placebo precies werkt, is niet duidelijk. Het effect kan te maken hebben met de kracht van suggesties of geconditioneerde responsen in ons zenuwstelsel, zoals bijvoorbeeld beïnvloeding op het endorfinesysteem.
De mate waarin een effect significant is, hoe groot de steekproef is of hoe duidelijk en consistent de data zijn, biedt geen enkele bescherming tegen het optreden van confounded variabelen.
Double blind placebocontrole
Een manier om wel te controleren voor confounded variabelen is om behandelde proefpersonen te vergelijken met niet-behandelde proefpersonen. Of beter nog: met proefpersonen die denken dat ze worden behandeld.
In een ‘double blind’ experiment weten noch proefpersoon noch proefleider of de persoon daadwerkelijk het medicijn heeft gekregen of het placebo. Op alle vlakken zijn de condities dus gelijkwaardig. De enige variabele waarop de condities verschillen is of het medicijn is genomen of niet. Als er dus een effect is, weten we zeker dat dit effect komt door het medicijn.
Het doen van een dergelijk experiment roept enkele vragen op:
In de klinische psychologie zouden we bijvoorbeeld een nieuw soort behandeling kunnen aanbieden tegenover de gangbare behandeling als controlegroep. Toch blijft het lastig om te weten te komen welke soort van therapie effectief is en waarom. Daarnaast worden veel beweringen gedaan over effectiviteit van therapieën die met een grote korrel zout dienen te worden genomen.
Verschillen die al aanwezig zijn tussen individuen voordat het experiment begon kunnen het effect op de afhankelijke variabele verstoren. Op de volgende manieren kan hiervoor gecontroleerd worden.
We verdelen de proefpersonen willekeurig over de condities. Elke persoon heeft dus dezelfde kans om in elke conditie terecht te komen. We kunnen een random-nummertabel gebruiken.
Hoe groter de groep is, des te groter de kans is dat individuele verschillen gelijkmatig over de groepen zijn verdeeld. Als er een significant verschil is tussen de groepen weten we dat het heel onwaarschijnlijk is dat dit verschil door toevalsfactoren is veroorzaakt.
Replicatie van het onderzoek met meer en andere proefpersonen geeft meer gewicht in de schaal voor of tegen een bepaalde conclusie.
Proefpersonen random toewijzen aan een bepaalde conditie is iets anders dan random je steekproef trekken. Random toewijzen gebeurt op het moment dat de steekproef al bepaald is. Random een steekproef trekken is een manier om te bepalen wie in de steekproef komen.
Enkele problemen kunnen ontstaan als gevolg van het niet-random toewijzen van proefpersonen aan een bepaalde behandeling:
Een probleem van interventieonderzoek is de mensen die afvallen gedurende het onderzoek. Wellicht zijn de afvallers wezenlijk verschillend van de volhouders op bepaalde kenmerken, bijvoorbeeld hun motivatie om mee te doen. Er zou dan een verschil zijn tussen de motivatie van de uiteindelijke therapiegroep en de controlegroep (zullen minder snel afhaken). We kunnen hier achteraf vaak statistisch voor controleren. Als dit niet mogelijk is, moeten we de conclusies aanpassen aan deze constatering.
Er is een soort hormoon bekend, CCK dat ervoor zorgt dat een verzadigingsgevoel optreedt tijdens het eten. Injecties bij ratten met CCK zorgden voor een verminderde voedselinname. De onderzoeksvraag was of het innemen van CCK er ook voor zorgt dat mensen minder voedsel innemen.
Methoden
Proefpersonen werden ingespoten met een injectie met CCK als ze begonnen te eten. Op een ander moment kwamen zij terug en kregen weer een injectie, maar nu zonder CCK. Voor de helft van de proefpersoon waren deze momenten omgewisseld. Het experiment werd double blind uitgevoerd; noch proefpersoon, noch proefleider wisten of er CCK in de injectie zat. De verwachtingen waren gelijk in de groepen, net als de hoeveelheid stress ervaren door het prikken. Voor deze mogelijk confounding variabelen is dus gecontroleerd in dit onderzoek.
Tevens controleerden de onderzoekers voor de mogelijkheid dat de CCK een gevoel van ziekte opwekte en proefpersonen daarom minder wilden eten. Daarom vroegen ze naar hoe ziek ze zich voelden na de injecties. Proefpersonen zeiden zich niet ziek te voelen na de CCK-injectie.
Dit onderzoek is een voorbeeld van hoe data verzameld bij dieren nuttig kunnen zijn voor experimenten bij mensen. Het CCK-onderzoek is een meer theoretisch onderzoek. Het daadwerkelijk innemen van CCK is niet praktisch; in pilvorm is het niet werkzaam en de werking is zeer kort. Wel kunnen we met dergelijk onderzoek beter begrijpen hoe onze spijsvertering werkt.
De vraag werd onderzocht of bedreigende woorden later werden waargenomen dan woorden zonder een negatieve of angstopwekkende lading.
McGinnies onderzocht dit door middel van een tachiscoop. De tijd waarin een woord was te zien werd hierbij steeds opgevoerd, totdat de drempel van waarnemen was bereikt en de proefpersoon op een knop kon drukken.
De tijd die nodig was om een woord waar te nemen dat bedreigend was, was inderdaad langer dan de tijd die nodig was om een neutraal woord waar te kunnen nemen.
Zagen de proefpersonen de woorden daadwerkelijk minder snel of werden ze slechts minder snel benoemd? Daarbij kwamen de bedreigende woorden in geschreven tekst veel minder vaak voor en zouden daardoor ook minder snel herkend kunnen worden.
Onder hypnose zouden mensen herinneringen kunnen terughalen die ze vergeten waren. Was het nu zo dat hypnose daadwerkelijk het geheugen kon opfrissen of was er sprake van de neiging om te bevestigen wat de hypnotiseur vroeg?
Deze effecten zullen gescheiden dienen te worden om een goed antwoord te krijgen op deze vraag. Dit is gedaan in meerdere onderzoeken, waar uitkwam dat hypnose niet het geheugen verbeterde. Hypnose bleek alleen eerder ja-zeggen te veroorzaken omdat suggestie van de hypnotiseur ‘compliance’ bevorderde.
Het valse geheugen-syndroom
Er zijn veel verhalen bekend over hulpverleners die cliënten hielpen zich bepaalde gebeurtenissen te herinneren. Niet altijd waren dit daadwerkelijk gebeurde feiten.
De vraag of valse herinneringen daadwerkelijk in ons hoofd geplant kunnen worden is op verschillende manieren onderzocht.
Het bleek heel goed mogelijk te zijn om proefpersonen gebeurtenissen uit hun jeugd te laten herinneren die verzonnen waren door de onderzoekers.
Naar aanleiding van dit onderzoek kan getwijfeld worden aan de echtheid van schuldbekentenissen waar ze mogelijk zijn uitgelokt. In 1992 is zelfs de False Memory Foundation opgericht die opkwam voor rechten van ouders die abusievelijk beschuldigd werden van misbruik.
Er zijn drie manieren om het optreden van confounded variables te bestrijden.
Een statistisch significante uitkomst biedt geen bescherming tegen het mogelijk voorkomen van een confounded variabele. Er zijn wel statistische technieken om voor sommige confounds te controleren.
Vanuit een regressielijn kunnen we een voorspelling maken van de Y-score van een individu met een bepaalde X-score. De afstand die de werkelijke score verwijderd is van de voorspelde score kunnen we de schattingsfout noemen.
Op deze manier is bijvoorbeeld te zien dat scores van een voormeting allemaal aan een kant van de regressielijn liggen en scores van een nameting aan de andere kant.
Covariantie-analyse
Door te kijken naar afstanden tot de regressielijn hebben we gecontroleerd voor begineffecten. De regressie is immers gemaakt vanuit voorspellingen vanuit de beginscores.
Partiele correlatie
Bij het bepalen van de partiele correlatie, bijvoorbeeld enkel het verband tussen A en B, houden we C constant en kijken dan naar de overgebleven correlatie tussen A en B.
Bennington studie
In de Bennington studie leverden een correctie voor de begin scores van de studentes in mate van conservatisme nog steeds een erg sterk verband tussen hun scores uit 1960 en die van 25 jaar later.
In meer ingewikkeldere experimenten komt het vaak voor dat twee of meer variabelen met elkaar interacteren. Dit houdt in dat het effect van een onafhankelijke variabele op een afhankelijke variabele afhangt van een andere variabele. Een voorbeeld hiervan is het experiment met de gloeilamp. Het lampje verwisselen heeft geen effect als de stekker niet in het stopcontact zit.
Een factorieel design kenmerkt zich door:
Een 2x2 design met twee mogelijke waarden voor beide onafhankelijke variabelen zou er zo uitzien.
Waarden variabelen | B1 | B2 |
A1 | A1+B1 | A1+B2 |
A2 | A2+B1 | A2+B2 |
Voorbeeld 1A. Emotie-afhankelijk geheugen
Een geheugenexperiment werd uitgevoerd waarbij één groep blij en één groep proefpersonen verdrietig werd gemaakt door middel van hypnose. De taak was om woorden te onthouden. Binnen de groepen werd wederom een verdeling gemaakt tussen mensen die blij werden gemaakt en mensen die verdrietig werden gemaakt, terwijl ze de eerder geleerde woorden op een later tijdstip probeerden te herinneren.
Het gaat hierbij ook om een 2x2 design, dat er als volgt uitziet.
Waarden variabelen | Verdrietig herinneren | Blij herinneren |
Verdrietig leren | Verdrietig Verdrietig | Verdrietig Blij |
Blij leren | Blij Verdrietig | Blij Blij |
De vraag is, of woorden beter worden onthouden als iemand verdrietig of blij is tijdens het herinneren. De conclusie is dat dit afhangt van hoe de stemming was tijdens het leren.
Woorden die worden geleerd tijdens een verdrietige stemming worden beter herinnerd als de persoon op dat moment ook verdrietig is en woorden geleerd tijdens een vrolijke stemming worden beter teruggehaald bij een vrolijke stemming.
Er is hier sprake van een zogenaamd ‘cross-over’ interactie-effect. De datalijnen kruisen elkaar, oftewel een effect van de manipulatie kan de andere kant opgaan afhankelijk van een tweede variabele.
Een soortgelijk experiment is uitgevoerd door Godden en Baddely (1975). In plaats van de condities blij en verdrietig hanteerden zij de condities onder en boven water. Hieruit bleek dat de mensen die onder water woorden hadden geleerd beter deze woorden konden herinneren als zij dit onder water probeerden dan op het land. De mensen die niet onder water waren geweest herinnerden zich de woorden het beste als ze boven water bleven.
Een 2x2 factorieel design werd toegepast bij een onderzoek naar de vraag of subliminale boodschappen op tapes werken voor het verbeteren van enerzijds het geheugen, anderzijds het zelfvertrouwen.
Om te testen of een effect niet alleen zou liggen aan het feit dat iemand denkt dat een tape effect heeft, werd het volgende bedacht. De groepen geheugen-tape en zelfvertrouwentape werden ook nog eens random toegewezen aan twee condities. Hun werd ofwel verteld dat ze naar een geheugen tape luisterden, ofwel dat ze naar een zelfvertrouwentape luisterden. Het design zag er als volgt uit.
Waarden variabelen | Verteld Geheugen | Verteld Zelfvertrouwen |
Geheugen-tape | Geheugen Denkt geheugen | Geheugen Denkt zelfvertrouwen |
Zelfvertrouwen-tape | Zelfvertrouwen Denkt geheugen | Zelfvertrouwen Denkt zelfvertrouwen |
Er werden geen hoofdeffecten gevonden voor het luisteren van de tapes op het geheugen of de mate van zelfvertrouwen. Wel werd er een effect gevonden voor de mate waarin hij of zij dacht verbeterd te zijn. Op het kenmerk waarvan de proefpersoon de tape dacht te hebben gehad, voelden ze zich meer verbeterd. Dit effect stond los van de daadwerkelijke inhoud van de tape.
Er is momenteel veel onderzoek die de conclusie ondersteunt dat subliminale tapes geen effect hebben. Toch geloven veel mensen nog in de kracht van subliminale boodschappen. Subliminale effecten zijn aantrekkelijk, omdat leren op deze manier minder moeite zou kosten en het geloof in de mysterieuze werking van onze geest kan bevestigen. Er zijn echter ook nare bijeffecten van dit ‘geloof’. Zo is veel geld verspild aan bijvoorbeeld een rechtszaak tegen een rockgroep die met subliminale boodschappen jongeren zou kunnen aanzetten tot zelfmoord.
Dit soort onderzoek is erg belangrijk. Echter, het gaat hier wel om misleiding van proefpersonen. Altijd zal afgewogen moeten worden of de ethische bezwaren van een dergelijk experiment opwegen tegen wat het kan opleveren.
In een factorieel design worden een between-groups design en een within-subjects design met elkaar gecombineerd. Een voorbeeld is het volgende soort klinisch onderzoek.
We willen weten wat het effect is van een bepaalde therapie. We doen voor- en nametingen van mensen die de therapie hebben gehad en voor en nametingen van mensen die een placebo hebben gehad. Als we slechts kijken naar de scores als punten, komen we er niet veel wijs uit. Op het moment dat we de punten van de verschillende meetmomenten van een persoon met elkaar verbinden, krijgen we duidelijkheid.
Elk individu in de therapiegroep is verbeterd op het tweede meetmoment ten opzichte van het eerste meetmoment. Deze verbetering is groter voor elke ‘therapiepersoon’ dan voor de ‘placebopersonen’. Ongeacht zijn of haar beginscore, want daar hebben we voor gecorrigeerd als we alleen maar kijken naar verschilscores. Door de variaties binnen een groep (verschil in beginscores) minder een rol te laten spelen, maken we een verschil tussen de groepen duidelijk.
Er is hier sprake van een hoofdeffect van verbetering voor en na. Echter, de mate van die verbetering is afhankelijk van of een persoon was behandeld met therapie of niet. De therapiemensen waren namelijk meer verbeterd dan de niet-therapiemensen.
In dit experiment werd honden geleerd om een elektrische schok te stoppen door over een barrière te springen in een zogenaamde ‘shuttlebox’ met twee compartimenten. De onderzoekers veronderstelden dat als de honden in een situatie hadden gezeten waarin ze geen controle hadden om de schokken te stoppen, ze hulpeloosheid zouden aanleren. Deze zou hen passief maken in een situatie waarin ze wel controle hadden.
Er werden drie groepen gecreëerd. De eerste groep kreeg enkel de shuttlebox-taak zonder eerdere ervaring of oefening. De tweede groep kreeg voor de shuttlebox-taak een serie schokken die ze niet konden stoppen. De derde groep kreeg voorafgaand aan de shuttlebox-taak ook een serie schokken, maar zij konden de schokken wel stoppen.
Eerdere ervaring met de schokken was de eerste onafhankelijke variabele. Dit was de tussen-groepen-component. De tweede onafhankelijke variabele was het aantal proeven (trials). Dit was de binnen-proefpersonen-component. De tijd die het duurde voordat de hond naar de andere kant sprong en zo de schok beëindigde, was de afhankelijke variabele (latency).
Zowel de eerste groep zonder ervaring als de derde groep met controleerbare ervaring leerde de taak snel, dat wil zeggen, sprongen steeds sneller naar de andere kant. De tweede groep echter sprong helemaal niet naar de overkant en wachtte af tot de onderzoeker na 20 seconden de schok beëindigde. Ze hadden eerder ervaren dat hun actie geen zin had en dus gedrag van hulpeloosheid aangeleerd.
De mate waarin de latency verandert na verschillende proeven, is dus afhankelijk van eerdere ervaring met het kunnen controleren van schokken.
De reactie van de honden met betrekking tot aangeleerde hulpeloosheid lijkt een grote parallel te vertonen met menselijk gedrag in het geval van een depressie. Aaron Beck vond grote gelijkenis tussen de cognities van depressieve mensen en het verschijnsel aangeleerde hulpeloosheid bij honden. Depressieve mensen scoren hoog op de mate van oncontroleerbaarheid die ze ervaren.
Een tweede onafhankelijke variabele kan uit zichzelf variëren en daarom puur gemeten worden, deze wordt niet gemanipuleerd. Het gaat dan om een subject variabele of individuele verschillen-variabele.
Op basis van een vragenlijst werden vrouwelijk studenten ingedeeld in ‘op dieet’ en ‘niet op dieet’ (eerste onafhankelijke variabele, individuele verschillen-variabele). Vervolgens werd hen gevraagd geen, één of twee milkshakes te drinken (tweede onafhankelijke variabele). Hierna werden de studentes uitgenodigd zoveel ijs te eten als ze wilden. (afhankelijke variabele).
Voor de niet-dieetgroep was de hoeveelheid ijs die ze aten afhankelijk van het aantal milkshakes dat ze van tevoren hadden gekregen. Bij de dieetgroep gebeurde het omgekeerde. Des te meer milkshakes zij van tevoren hadden gedronken, des te meer ijs zij daarna zouden eten. Er lijkt sprake te zijn van contra-regulatie; het gedrag gaat in tegen fysiologisch gedrag dat we meer voedsel zouden innemen als er minder binnen is.
Cognitief zou het volgende aan de hand kunnen zijn. Deelnemers op dieet zouden na het eten van de milkshakes kunnen denken: ‘Mijn dieet is nu toch al voor vandaag verpest. Nu maakt het ook niet meer uit’. Er is ook de mogelijkheid dat de milkshakes hun honger zouden hebben aangewakkerd.
Het laatste werd uitgesloten door een ander experiment. Enkel de deelnemers op dieet aan wie werd verteld dat de milkshake veel calorieën bevatte vertoonden het contra-regulatiegedrag. Deelnemers in de dieetgroep aan wie werd verteld dat hun milkshake weinig calorieën bevatte, vertoonden dit gedrag niet.
Bovenstaand onderzoek kan ons beter begrip geven van de ziekte Boulimia. Boulimia wordt gekenmerkt door vreetaanvallen, waarna de persoon zich zeer schuldig voelt en vervolgens nog strikter gaat lijnen, wat weer gevolgd kan worden door een vreetaanval etc..
Je zou kunnen denken dat het extreme lijnen een gevolg is van de vreetaanval. Maar je zou ook andersom kunnen denken. Namelijk dat een vreetaanval het gevolg kan zijn van het diëten. Als iemand met diëten continu minder eet dan waar haar lichaam om vraagt, negeert zij dus lichaamsignalen. Met cognitieve controle wordt het diëten volgehouden. Totdat er iets gebeurt waardoor de controle even weg is. Dan ontstaat het ‘Ach wat maakt het toch uit, het is nu toch al verpest’-effect.
Bij experimenten waarin er sprake is van meer dan twee onafhankelijke variabelen spreken we van een three-way oftewel driewegs-factorieel design. In tabelvorm zou dit design een driedimensionale vorm hebben.
Voorbeeld 1. Desensitisatietherapie
Davison (1968) voerde een experiment uit naar de effecten van desensitisatietherapie bij angst voor slangen. Bij desensitisatietherapie wordt diepe spierrelaxatie geconditioneerd aan een angstige situatie, zodat de mate van angst uiteindelijk wordt uitgedoofd. De vragen van het onderzoek waren
Er zouden namelijk andere werkzame mechanismes kunnen spelen. Puur het leren van de vaardigheid van de relaxatie zou voldoende kunnen zijn. Daarnaast zou puur het wennen aan de slang kunnen helpen, oftewel een proces van gewenning.
Het ging om een 2x2 factorieel design met een voor- en nameting binnen subjecten.
Voorafgaand en aan het einde van het experiment werd de mate van angst gemeten. Verder werden wel of niet beelden van slangen ingebeeld en wel of niet een relaxatie training gegeven. Zie hieronder.
Waarden variabelen | Relaxatietraining | Geen relaxatietraining |
Slangenbeelden | 1. Desensitisatietherapie | 3. Alleen slangenbeelden |
Geen slangenbeelden | 2. Alleen relaxatietraining | 4. Geen behandeling |
Wanneer gekeken werd naar verschilscores, oftewel de mate waarin de proefpersonen verbeterden van voor naar na de therapie, werd het volgende duidelijk. De eerste groep, de desensitisatiegroep, verbeterde significant meer dan de andere drie groepen. Bovendien waren de verschilscores voor-en-na van geen van de drie andere groepen significant in zichzelf.
De methode van desensitisatie blijkt dus effectief. Bovendien was noch het enkel voorstellen van beelden van slangen, noch het leren relaxen voldoende om een effect te weeg te brengen. Het koppelen van de slangenbeelden aan de relaxatie was dus hier de werkzame combinatie.
Voorbeeld 2: Conditionering en bewustzijn
We kijken terug op het experiment van Clark en Squire (1998) over de rol van bewustzijn in conditionering van een oogknipperrespons. Na afloop werden proefpersonen gescheiden in degenen die de connectie tussen de toon en het blazen in het oog door hadden en degenen die dit verband niet doorhadden. Er bleek geen effect te zijn voor de mate van bewustzijn voor de respons.
Maar nu bekijken we de tweede conditie, waarbij een halve seconde rust zat tussen de toon en het blazen. Hier vertoonden de mensen die zich van het verband bewust waren steeds meer ooglidreacties na meerdere proeven. De mate van conditionering was dus afhankelijk van bewustzijn van de proefpersonen. Het gaat hier om een drieweginteractie tussen aantal proeven, bewustzijn en wel/geen pauze. Alleen in het geval van een rustpauze tussen de stimuli was er een interactie tussen het aantal proeven en het bewustzijn van het verband.
Statistiek - Hoofdstuk 9. Factoriele variantieanalyse Hoe bepalen we de mate van significantie als er meer dan één onafhankelijke variabele is? De mate van variantie in de gehele groep dient hiervoor in drie delen gesplitst te worden. Drieweg ANOVA
Bij een drieweg ANOVA wordt gekeken naar de mate van variantie die wordt veroorzaakt door variabele A, de mate van variantie die wordt veroorzaakt door variabele B en de mate van variantie die veroorzaakt wordt door de interactie tussen A en B.
Een drieweg ANOVA kan verschillende soorten effecten aantonen. Wel of geen hoofdeffect voor variabele A, wel of geen hoofdeffect voor variabele B en wel of geen interactie effect voor variabele A met variabele B. Bij een zogenaamd ‘cross-over’ effect wordt bijna alle variantie verklaard door een interactie-effect.
Een experiment met een klein steekproef heeft de volgende kenmerken:
Wanneer is een fysiologisch stimulus sterk genoeg om te worden waargenomen? Wanneer is een toon bijvoorbeeld hard genoeg om gehoord te worden? Als een beeld of een toon langzaam in intensiteit wordt opgevoerd, komt er een moment waarop we het zien of horen. Dit is de drempelwaarde. De waarschijnlijkheid dat we de stimulus kunnen waarnemen wordt steeds groter.
Drempel als afhankelijke variabele
Vaak is de drempelwaarde afhankelijk van een aantal factoren. Dit is bijvoorbeeld het geval bij de sensitiviteit van ons visuele systeem.
Als we net een donkere ruimte binnenkomen, zien we aanvankelijk niets. Na een paar minuten kunnen we meer waarnemen. Onze ogen wennen aan het donker. De visuele drempel is lager geworden en onze sensitiviteit voor visuele stimuli groter.
Van een experiment waarbij een proefpersoon in het donker wordt gezet is een grafiek te maken. Na 4,5 minuten is de drempel om iets te zien het laagst, maar na een minuut of 7 zakt de drempel 20 minuten lang nog aanzienlijk. Het lijkt alsof er twee verschillende systemen actief worden als we in het donker zijn. Het eerste proces is snel, maar heeft relatief minder effect en het tweede proces is langzamer, maar heeft meer effect.
We weten vanuit de fysiologie dat zich twee soorten cellen in de oogbol bevinden; staafjes en kegeltjes. Nu zijn er experimenten gedaan betreffende de sensitiviteit van deze cellen. Beiden verbleekten als ze in het licht kwamen en werden weer hun normale kleur als ze in het donker kwamen.
De staafjes verbleekten echter langzamer dan de kegeltjes, maar hadden minder licht nodig (in het blauwgroene spectrum) om te verbleken De staafjes waren dus sensitiever. Het lijkt dus zo te zijn, dat de kegeltjes verantwoordelijk zijn voor het eerste, snel optredende proces bij gewenning aan het donker. De staafjes zouden zorgen voor een langzamere, maar effectievere aanpassing aan het donker.
Dit is onderzocht door proefpersonen een rode stip te laten zien. Op deze manier zouden selectief de kegeltjes meer gestimuleerd worden (rood licht en in centrum van gezichtsveld). En inderdaad, alleen de curve van het eerst optredende, snellere gewenningsproces was te zien.
De experimenten die we hebben besproken zijn voorbeelden van onderzoeken met een kleine N. Conclusies die we op basis van dergelijk onderzoek kunnen trekken kunnen vanuit verschillende disciplines gesteund worden, bijvoorbeeld uit de fysiologie, histologie en biochemie.
Een voorbeeld van hoe onderzoeksgegevens praktisch toegepast werden, was in de Engelse luchtmacht, tijdens de Tweede Wereldoorlog. De Engelse piloten moesten snel paraat staat om in het donker te kunnen vliegen om de Duitse bommenwerpers te kunnen onderscheppen.
Wat ze deden was gebaseerd op de wetenschap dat het een tijd kan duren voordat de ogen gewend zijn aan het donker, vanwege het aanpassen van de staafjes aan het donker. De piloten droegen rode brillen ter voorbereiding op het donker. De staafjes zijn gevoeliger voor blauwgroen licht dan voor rood licht. Het zou de staafjes dus minder moeite kosten van rood licht naar het donker te gaan.
Bij Pavloviaanse conditionering was sprake van een zogenaamde leercurve, waarin langzaam meer conditionering optrad. De focus was op het laten voorafgaan van een bepaald signaal aan de gewenste respons.
Bij operante conditionering is het gevolg van een bepaalde reactie belangrijk in plaats van het signaal ervoor. Als de consequentie maakt dat een reactie meer voorkomt is er sprake van een beloning, oftewel een ‘positieve reinforcer’ (versterker van gedrag).
Beroemd zijn de experimenten van Skinner, waarbij een rat of duif op een hendel kon drukken, waarna eten volgde. De dieren konden zelf kiezen of ze wel of niet op de hendel zouden drukken.
Als je het drukken beloont met eten, gaat de rat of duif vaker drukken. Als je stopt met het belonen van het drukken, dan dooft het drukken van het dier langzaam uit (‘extinction’).
Activeren van het gebied in de hersenen dat verantwoordelijk is voor het beloningssysteem, kan een beloning op zich zijn. Een proef met ratten die zichzelf konden ‘belonen’ met een hersenimpuls, liet zien dat zij steeds vaker op de hendel gingen drukken.
De vraag werd onderzocht of duiven in staat zijn om het concept van een mens te begrijpen. Dit werd als volgt getest.
Op de muur waar de hendel zich bevond, werden dia’s getoond waar mensen opstonden of niet. Als er een mens op de dia stond, werd het drukken op de hendel soms bekrachtigd. Als er geen mens te zien was, werd het drukken nooit bekrachtigd. Alle drie de duiven leerden snel dat het drukken weinig effect had bij de dia’s zonder mensen en deden dit snel steeds minder. Blijkbaar hadden de duiven het concept ‘mens’ begrepen.
Wat betekent het dat een duif, die zulke kleine hersenen heeft, in staat is om dit concept te snappen? Er werd lang gedacht dat het spreken en begrijpen van taal nodig is om een concept te herkennen. Uit dit onderzoek blijkt van niet.
In de jaren veertig ontdekten wetenschappers dat het hielp bij zware epilepsiepatiënten om het verbindingsstuk tussen de twee hersenhelften door te snijden. De patiënten leken na een dergelijke operatie normaal te functioneren. Toch werden er verschillen in hersenwerking waargenomen.
Als een plaatje aan de linkerkant van het gezichtsveld werd aangeboden, konden de patiënten dit benoemen. Als een plaatje echter werd aangeboden aan de rechterkant van het gezichtsveld, zeiden ze niets te zien. Ze konden het plaatje wel zien, maar er niet over praten. Het spraakgebied ligt namelijk aan de linkerkant van de hersenen. Dit onderscheid is niet absoluut, de rechter hersenhelft lijkt ook enige spraakcapaciteit te hebben.
Het was belangrijk het plaatje heel kort aan te bieden, omdat de patiënten anders met oogbewegingen het plaatje van rechts naar links in hun gezichtsveld konden plaatsen.
Twee aspecten maakten dit een krachtige studie, hoewel het maar om vijf patiënten ging.
Er was een experiment nodig om het verschil tussen deze patiënten en andere mensen duidelijk te maken. In het gewone leven zou dit niet observeerbaar zijn. Daarbij wekt het experiment veel vragen op over de zetel van het brein (of breinen) en de ziel-lichaam connectie.
Ebbinghaus heeft een hele serie experimenten betreffende het geheugen gedaan, met enkel zichzelf als proefpersoon.
Hij werkte met de volgende veronderstellingen:
Hij wilde materiaal gebruiken dat nog geen associaties bij hem opriep en maakte hiervoor kaartjes met onzinwoorden. De onzinwoorden werden gevormd door random een medeklinker, klinker en weer een medeklinker te kiezen.
Hij bestudeerde de lijst van onzinwoorden totdat hij ze allemaal terug kon halen. Hij noteerde het aantal keer dat er voor nodig was een woord te onthouden. Dan wachtte hij een tijdje en keek hoeveel woorden hij nog wist.
Als het hem de eerste keer tien keer herhalen kostte om een woord te onthouden en de tweede keer vijf keer, dan was het percentage van onthouden 50%. De letters werden één voor één omgedraaid op het ritme van een metronoom en Ebbinghaus noteerde wat hij dacht dat de volgende letter zou worden.
Herinneringen verzwakken over tijd. Het onderzoek van Ebbinghaus laat zien dat deze verzwakking heel snel kan gaan. Na het eerste uur na het leren, zakte het vermogen tot terughalen aanzienlijk, tot minder dan 50%. Vlak voor een examen nog het materiaal overkijken kan nuttig zijn:
Ebbinghaus gebruikte alleen zichzelf als proefpersoon. Toch zijn deze conclusies door meerdere onderzoeken met een grotere N gerepliceerd. Ebbinghaus gebruikte slechts nonsenswoorden en associaties tussen letters om herinneringen te onderzoeken. Dit maakte dat hij slechts conclusies kon trekken over vergelijkbare vormen van geheugen ( zogenaamde ‘rote’ memory).
Bartlett vroeg proefpersonen een indiaans volksverhaal te onthouden en dit 15 minuten later na te vertellen. Wat waren de opvallendste constateringen?
Veel proefpersonen zeiden zich vooral beelden te herinneren van het verhaal. Die beelden reconstrueerden ze vervolgens zelf om het verhaal opnieuw te kunnen vertellen.
Het reconstrueren van het geheugen zoals bij het onderzoek van Bartlett lijkt een andere wijze van herinneren dan de wijze die Ebbinghaus vond. Echter, er kan gesteld worden dat beiden een andere vorm van geheugen onderzochten. Er komt steeds meer bewijs voor het idee dat er globaal gezegd twee soorten geheugen zijn:
Het eerste soort geheugen zou goed te trainen zijn met meerdere herhalingen. De tweede vorm van geheugen zou beter getraind kunnen worden met het maken van zo veel mogelijk verschillende verbindingen (associaties) tussen de concepten.
De procedures bij experimenten met een kleine groep zijn vaak als volgt:
Het geheugen voor het onthouden van woorden van de demente Miss S. werd getraind op twee manieren. De eerste manier was woorden steeds te herhalen, totdat ze deze zou onthouden. Miss S. echter vertoonde geen verbetering in het leren van de woorden door herhaling. Een andere methode werd geprobeerd. Deze methode heette de methode van ‘expanded rehearsel’ en hield in dat bij het correct onthouden van een woord de herhaling over een twee keer zo lang tijdsinterval zou zijn. Bij het niet onthouden van een woord werd het tijdsinterval gehalveerd. Dit werkte bij Miss S.
Miss S. is één geval, maar dit onderzoek is succesvol gerepliceerd. De methode van ’expanded rehearsel’ wordt vaak toegepast bij mensen die lijden aan nominale afasie.
Omdat de scores van Miss S. stabiel bleven gedurende de eerste training, kunnen we dit tijdsinterval als goede baselinemeting gebruiken.
Meerdere baselines
Soms laten baselinemetingen een grillig patroon zien. Zoals bij een autistisch meisje dat werd geobserveerd voor typische gedragingen. Wel was goed in de data-grafiek te zien dat na de interventie (een methode van overcorrectie) de gedragingen consequent nog heel weinig voorkwamen.
Omdat het hier om drie typen gedragingen ging (die in grafiekvorm hetzelfde soort grillige patroon voor de baseline en consequent lage scores na de interventie toonden), kunnen we zeggen dat het hier om een werkelijk effect van de interventie ging.
Reversal designs
Een ‘reversal design’ kan meer vertellen over doorlopende effecten van bijvoorbeeld een behandeling. Een behandeling zou bijvoorbeeld even onderbroken kunnen worden om te zien wat er gebeurt, om daarna weer vervolgd te worden. Er is dan sprake van een tweede baselinemeting.
Een veldexperiment werd uitgevoerd bij een vrouw die depressief was. Haar gezin werd gevraagd depressief gedrag te negeren en ‘goed’ coping-gedrag te bekrachtigen. Dit bleek te werken; de vrouw ging meer goed coping-gedrag vertonen en minder depressief gedrag. Toen de interventie even werd stopgezet had de vrouw direct een terugval. De interventie werd vervolgd en de vrouw ging weer steeds minder depressief en meer goed coping-gedrag vertonen.
Experimenten met een kleine N verschillen op een aantal vlakken van experimenten met een grote N. Echter, ze lijken ook veel op elkaar. Beiden kunnen gevoelig zijn voor volgorde- of carryover-effecten en zal waar nodig gecorrigeerd dienen te worden voor observer bias effecten. Bij kleine experimenten kan voor confounded variabelen gecontroleerd worden door een (of meerdere) goede baselinemetingen te doen of door een reversal design te gebruiken.
Kleine N experimenten moeten het vaak hebben replicatie, oftewel meerdere metingen van één persoon.
Bij het doen van een keuzetaak met twee mogelijke antwoorden (ja of nee), zijn de volgende vier situaties mogelijk:
Het verband tussen het aantal hits en het aantal vals alarm-scores kan in een grafiek worden uitgezet. De mate waarin een persoon accuraat antwoord geeft wordt bepaald door de mate waarin de hit rate boven de vals alarm rate uitkomt.
De naam van de theorie komt van een experiment naar het horen van een geluidssignaal dat steeds sterker wordt gemaakt. Proefpersonen konden ja of nee antwoorden op de vraag of ze het signaal konden horen.
Op dezelfde manier werden mensen gevraagd aan te geven of er een X aanwezig was in een plaatje (geheugenexperiment). Vervolgens werden ze onder hypnose gebracht. Op deze manier kon gekeken worden naar het effect van hypnose op het geheugen en het effect van hypnose op de neiging om ja te zeggen.
Wat vinden we erger: een vals alarm of een misser? Iemand onschuldig veroordelen of een schuldige vrij laten? Bij elke vraag kan bepaald worden wat een acceptabel responscriterium is.
Vanwege praktische of ethische bezwaren is het niet altijd mogelijk om voor een onderzoeksvraag een experiment uit te voeren. Het doen van een quasi-experiment kan dan een oplossing zijn.
Een quasi-experiment is een experiment zonder manipulatie. Er wordt echter wel geprobeerd een oorzakelijk verband te onderzoeken. Het probeert door selectie een causaal verband te isoleren.
De onderzoekers maakten gebruik van de aanwezigheid van twee bruggen om een rivier over te steken. Er was een gevaarlijke touwbrug en een stevige houten brug. Mannen die een van de twee bruggen overstaken, waren de proefpersonen. De mannen rapporteerden dat de meer gevaarlijke brug veel stress en angstgevoelens op wekte. De onderzoeksvraag was of de mannen de angst die de brug opwekte verwarden met het aantrekkelijk vinden van een vrouw?
Aan de overkant van beide bruggen stond een vrouwelijke onderzoeker die de mannen vroeg een verhaal te vertellen, wat later gescoord werd op het bevatten van seksueel getinte beelden. Daarnaast gaf de onderzoekster haar telefoonnummer. Dit konden de mannen later bellen om meer informatie over het onderzoek te verkrijgen (de tweede maat voor hoe aantrekkelijk de mannen de onderzoekster vonden).
Maar liefst 50% van de mannen die de gevaarlijke brug namen, belden de onderzoekster op. Dit stond tegenover een percentage van 12% van de mannen die de veilige brug namen. Ook bevatte het verhaal van de mannen die de gevaarlijke brug namen meer seksueel getinte beelden dan het verhaal van de andere mannen.
Kon het zijn dat de mannen die de gevaarlijke brug namen meer bereidheid in zich hadden om risico’s te nemen en zo ook eerder op de onderzoekster af zouden stappen?
Om dit te onderzoeken werd een tweede studie gedaan. Mannen die de gevaarlijke brug namen werden of direct na de brug benaderd of een tijdje erna, als de mate van angst gezakt zou moeten zijn. Van de mannen die direct werden benaderd belde 65% de onderzoekster op, tegenover 30% van de mannen die niet direct werden benaderd. Dit neemt de mogelijkheid weg dat het een persoonskenmerk zou zijn van de mannen om risicovoller gedrag te vertonen. Het bevestigt het idee dat mannen hun staat van opwinding door de brug verwarden met de aantrekkelijkheid van de vrouw.
We kunnen niet direct in onze emoties kijken. Meestal gebruiken we cognities om een emotionele staat te interpreteren. Vaak blijkt dat we ons helemaal niet zo goed bewust zijn van onze emoties of de redenen waarom we doen wat we doen. Meer van ons denken wordt ingezet om onze beslissingen te rechtvaardigen dan om ze te maken (Zajonc, 1984).
In bepaald gezinnen lijkt alcoholisme veel voor te komen. Wat betekent dit? Is er een genetische aanleg voor alcoholisme? Of groeien kinderen met alcoholistische ouders op met een bepaald rolmodel dat ze gaan imiteren?
Een mogelijkheid om dit te onderzoeken is door te kijken naar geadopteerde kinderen. Goodwin en collega’s kozen ervoor om medische dossiers te gebruiken om de mate van alcoholisme vast te stellen in biologische vaders en hun door anderen geadopteerde zonen.
Het gebruik van medische dossiers was een methode meer op afstand, maar wel objectiever dan bijvoorbeeld zelf-rapportages of rapportages door bekenden (waarschijnlijk beiden erg vertekend bij alcoholisten). De mensen die onterecht een diagnose van alcoholisme hadden gekregen of onterecht geen diagnose hadden, werden op de koop toe genomen en waren hopelijk gelijk verdeeld over de groepen.
Kinderen met een biologische vader die alcoholist was, hadden een vier keer zo grote kans om ook een alcohol probleem te hebben dan kinderen met een niet-alcoholistische vader. Daarbij was de kans dat een kind in het pleeggezin alcoholisme zou ontwikkelen nog steeds erg klein (maximaal 20%). Er was dus relatief veel invloed van genetische aanleg bij het ontwikkelen van alcoholisme. Daarbij waren kinderen betrekkelijk veilig af in een pleeggezin, zelfs als ze een alcoholistische biologische vader hadden.
Een quasi-experiment kan ook een within-subjects design bevatten. Het bestaat dan bijvoorbeeld uit verschillende metingen over tijd van eenzelfde persoon.
De onderzoeksvraag was: Hoe beïnvloedt het gebruik van internet ons sociaal functioneren en psychisch welzijn? Bij het beantwoorden van deze vraag kan er op twee manieren geredeneerd worden.
Kraut en collega’s (1998) deden een longitudinaal onderzoek, waarbij proefpersonen twee jaar lang werden gevolgd in hun internetgebruik, de omvang en het gebruik maken van hun sociale netwerk en hun mate van depressiviteit.
In het kort bleek uit dit onderzoek dat meer depressieve gevoelens aan het begin van de studie niet leiden tot meer internetgebruik. Wel leidde meer internetgebruik later tot meer depressieve gevoelens. Sociale geïsoleerdheid aan het begin leidde niet tot meer internetgebruik. Maar wel leidde meer internetgebruik tot meer sociale geïsoleerdheid later in het onderzoek.
Lewinsohn en Rosenbaum (1987) volgden 1000 mensen over een periode van 15 maanden. Sommigen waren depressief aan het begin van de studie, maar niet meer aan het einde. Sommigen waren niet depressief aan het begin, maar wel aan het einde. Sommigen werden depressief tijdens het onderzoek, maar herstelden hier tijdens het onderzoek ook weer van.
Er werd een groot verschil gevonden tussen de manier waarop de proefpersonen hun jeugd beschreven op het moment dat ze depressief waren en wanneer ze niet depressief waren. De depressieve proefpersonen beschreven hun jeugd als erg negatief en hun ouders als afwijzend. Dezelfde personen beschreven voor of na hun depressie gemiddeld hun jeugd als even positief/negatief als personen die nooit depressief waren geweest.
Deze uitkomst strookt met het fenomeen van staatafhankelijk geheugen. Proefpersonen die depressief zijn denken eerder aan onplezierige herinneringen dan proefpersonen die niet depressief zijn.
Therapeuten zeggen dat het belangrijker is hoe de persoon de jeugd heeft ervaren dan wat er daadwerkelijk is gebeurd. Wel moet er hier vermeld worden dat het gaat om het feit dat de persoon zich herinnert dat zijn ouders afwijzend waren. Deze gegevens stellen niet vast dat dit daadwerkelijk is gebeurd. Ook kunnen we op basis van dit onderzoek niet concluderen dat afwijzing van ouders leidt tot depressiviteit in kinderen.
We willen bijvoorbeeld onderzoeken hoe schizofrene mensen verschillen van niet-schizofrene mensen op bepaalde kenmerken. Bepalen wie wel of niet schizofreen is, is niet uitvoerbaar. Daarom nemen we een groep mensen bij wie schizofrenie is vastgesteld en een groep waarbij dit niet het geval is.
Dergelijk onderzoek is uitgevoerd in de jaren 50. Hieruit bleek dat de chemische samenstelling van het bloed van schizofreniepatiënten verschilde van dat van een controlegroep. Echter, het probleem was dat de schizofrene patiënten in meer kenmerken verschilden van de controlegroep. Ze waren namelijk gehospitaliseerd en kregen voor langere tijd ziekenhuisvoeding.
Het onderzoek werd gerepliceerd (Snyder, 1974), nu met een controlegroep van andere ziekenhuispatiënten. Deze hadden een niet-psychiatrische ziekte, maar kregen hetzelfde voedsel. In beide groepen bevatte het bloed vergelijkbare chemische bestanddelen. Het was dus het dieet en niet de ziekte die zorgde voor een andere chemische samenstelling van het bloed.
Het probleem van quasi-experimenten blijft dat een causaal verband lastig is vast te stellen. Als we proefpersonen selecteren die verschillen op basis van variabele X, kunnen ze ook verschillen op een andere variabele Z, die mee varieert met X. We zullen ons moeten afvragen op welke kenmerken de experimentele en controlegroep nog meer van elkaar kunnen verschillen. Er wordt bij quasi-experimenten gesproken van een non-equivalente controlegroep.
Het voordeel van een quasi-experiment is niet zozeer het kunnen vaststellen van een causaal verband maar het kunnen ontkrachten van een ander causaal verband (een alternatieve hypothese). Verder kan het heel goed gebruikt worden als de basis voor een volgend, meer gecontroleerd experiment.
Geweldsmisdrijven schijnen vaker voor te komen in de Zuidelijke staten van de VS dan in de Noordelijke staten. Mogelijke redenen hiervoor zijn:
Nisbett en Cohen (1996) gingen al deze mogelijkheden af, simpelweg door hun selectie van de data. Ten eerste bleek de stelling inderdaad te kloppen; het aantal moordzaken lag hoger in het Zuiden dan in het Noorden.
Een etnische groep werd bekeken, namelijk blanke niet-Spaanstaligen. Het verschil bleef tussen Noord en Zuid. Verder bleek dat het verschil in aantal moordzaken in de kleinere steden groter was tussen Noord en Zuid. Temperatuur (gelijk in grote en kleine steden) speelde dus geen grote rol. Noch deed de mate van armoede terzake. Dit bleek uit het resultaat dat in meer droge gebieden het aantal moordzaken hoger was dan in vochtige gebieden. Wat was er aan de hand?
In de vochtige gebieden leefden de mensen grotendeels van de landbouw, in de droge gebieden van het houden van veelteelt. Het leven van een veehouder bestond historisch gezien uit meer gevaren vanuit andere mensen dan het leven van een landbouwer. Het vroeg om een agressievere houding naar mensen die probeerden het vee te stelen.
Een eercultuur karakteriseert het Zuiden meer dan het Noorden. Het wordt als positief en mannelijk gezien om bereid te zijn tot geweld en bereid te zijn je gezin en eer te verdedigen. In een dergelijk eercultuur zou een moord eerder gepleegd worden vanuit een eerkwestie, zoals een persoonlijk geschil, dan vanuit bijvoorbeeld een onpersoonlijke roof of inbraak. De moorden in het Zuiden bleken inderdaad vaker ruziegerelateerd te zijn dan onpersoonlijk.
De onderzoekers legden blanke mannen van het platteland van het Noorden en van het Zuiden vragenlijsten voor. Mannen uit het Zuiden vonden geweld meer geoorloofd om hun bezittingen, familie of eigenwaarde te verdedigen dan de mannen uit het Noorden. Over het geheel gezien hadden de mannen uit het Zuiden niet meer voorkeur voor geweld dan de mannen uit het Noorden.
Het vragenlijstonderzoek ging over de houding die de mannen hadden ten opzichte van geweld. Maar hoe zouden de mannen reageren in een echte situatie?
Proefpersonen werden gevraagd een vragenlijst in te vullen en die aan de balie van de bibliotheek in te leveren. Onderweg werden ze echter beledigd en geduwd door een assistent van de onderzoekers. Reageerden de mannen uit het Zuiden anders dan de mannen uit het Noorden? De mannen die opgegroeid waren in het Zuiden werden eerder boos dan de mannen uit het Noorden, die eerder geamuseerd leken. Ondanks andere variabelen die een rol konden spelen (zoals dat de mannen uit het Zuiden naar het Noorden waren gekomen om te studeren en dus anders konden zijn dan andere mannen uit het Zuiden, of dat het hier zou gaan om rijke mannelijke studenten), was er een verschil tussen mannen uit het Zuiden en mannen uit het Noorden van Amerika.
Er lijkt een belangrijk verschil te zijn tussen het Noorden en het Zuiden van Amerika in de bereidheid van geweld om de eer te verdedigen. Deze eercultuur lijkt teruggevonden te worden in de straatcultuur van jonge mannen levend in grote steden. Het zelfvertrouwen van dergelijke jongemannen lijkt vooral bepaald te worden door hun bezittingen en het oordeel van hun vrienden. Dit leidt tot constante paraatheid van de jongeman om zijn status en eer te moeten verdedigen.
Deze test is een manier om significantie te testen wanneer er meer dan twee mogelijke waarden van de onafhankelijke variabelen zijn.
Er is bijvoorbeeld de mogelijkheid om uit drie verkiezingskandidaten te kiezen. De kans dat voor elk van de kandidaten wordt gekozen is 33,3%; een derde kans, oftewel 333,3 personen uit een populatie van 1000 mensen.
Het daadwerkelijke aantal mensen dat voor kandidaat A heeft gekozen is de verkregen score, oftewel O. De op basis van kans verwachte score is E. Nu is de richting voor het gecorrigeerde aantal deviaties van de verwachte score in het kwadraat, gedeeld door het aantal scores de maat voor Chi-kwadraat. Oftewel
χ² = (O-E)²/ E
Bij een chi-kwadraattest kunnen we kijken naar significante verschillen tussen alle combinaties van groepen. We gaan weer uit van onafhankelijke metingen.
Tevens kunnen we berekenen hoe een gehele dataset verschilt van een andere dataset waarin dezelfde zaken gemeten zijn (bijvoorbeeld eerdere en latere verkiezingen).
Een chi-kwadraattest kan ook gebruikt worden voor het meten van de constingentie van gegevens, oftewel het voorkomen van een bepaalde combinatie van variabelen. Berekend kan worden hoe ver een bepaalde combinatie van variabelen afligt van de verwachte score.
Wanneer er sprake is van het gebruik van categorische variabelen is het ongebruikelijk om te werken met r als correlatiecoëfficiënt. Er wordt dan een berekening gemaakt van Phi, waarbij Phi de waarde heeft van chi-kwadraat, gedeeld door het aantal scores, keer het aantal vrijheidsgraden (aantal rijen min 1). De waarde van Phi kan net als r liggen tussen 0 en 1.
Een significante uitkomst geeft ons een redelijk goed vertrouwen in het feit dat als de studie herhaald zou worden, er dezelfde uitkomst zou zijn (hoge betrouwbaarheid).
Het repliceren van een eerder onderzoek is het exact nadoen van het eerste onderzoek. De onderzoeker kan zelf zijn eigen onderzoek repliceren of een andere onderzoeker kan dit doen. Het is duidelijk dat een onderzoek nooit exact nagedaan kan worden, maar het streven is wel zo veel mogelijk in de buurt te komen.
Een onderzoek systematisch repliceren houdt in dat we het onderzoek nadoen met een enkele variatie of meerdere variaties na elkaar. Afhankelijk van de uitkomst kan iets gezegd worden over de generaliseerbaarheid van de eerdere gegevens.
Latane en Darley repliceerden hun bijstanderonderzoek. Ze hanteerden nu echter andersoortige noodsituaties, zoals het iemand van zijn stoel af horen vallen. De uitkomsten waren vergelijkbaar. Dit geeft meer vertrouwen in het idee dat de conclusies ook zouden gelden bij andere noodsituaties.
Bij een conceptuele replicatie wordt dezelfde onderzoeksvraag gesteld, maar met een andere procedure. Zo hebben het rookexperiment en het drankhandelexperiment dezelfde conceptuele vraag: als er meerdere mensen aanwezig zijn, zijn mensen dan nog geneigd om te helpen? Op een hoger niveau gaat het bij beide experimenten om het algehele principe dat situationele factoren enorme invloed kunnen hebben op het gedrag van mensen. Zo kan zelfs het volgende onderzoek in deze lijn van onderzoeken genoemd worden.
Studenten theologie werd gevraagd naar een gebouw verderop te gaan voor een lezing over de barmhartige Samaritaan. In het ene geval werd gezegd dat ze er alvast rustig naar toe konden gaan. In het tweede geval werd gezegd dat ze zich moesten haasten. Onderweg kwamen ze een man tegen die in een portiek aan het zuchten en hoesten was. Zouden ze te hulp schieten? Van de studenten die geen haast hadden, schoot 63% te hulp, van de studenten die haast hadden, slechts 10%.
Ook hier werd de conclusie dat situationele factoren een grote invloed hebben op personen, ondersteund. Dit komt niet zo overeen met de neiging die we vaak hebben om gedrag (te)veel aan persoonskenmerken toe te schrijven (fundamentele attributiefout).
Mannen werden na het opwekken van fysieke opwinding door fietsen meer seksueel opgewonden tijdens het zien van een erotische film dan mannen die niet eerst fysiek opgewonden werden. Hun reactie had niets te maken met emoties, maar puur met de aanwezigheid van lichamelijke opwinding.
Er kunnen twee mogelijkheden zijn voor het verklaren van het verwarren van emoties. De eerste is dat we daadwerkelijk onze emoties verkeerd lezen; we verwarren de ene met de andere emotie (mis-attribueren). De tweede is de ‘spillover-theorie’. Een heftige emotionele of fysiek opgewonden staat slaat over op een andere staat. De persoon voelt in dit geval wel daadwerkelijk de emotie.
Het fietsonderzoek werd nog een stapje verder genomen door Valins (1996). Proefpersonen kregen hun hartslag te horen (dachten ze, in werkelijkheid was dit een bandje) tijdens het kijken naar foto’s van vrouwen. De mannen beoordeelden foto’s als aantrekkelijker als deze samengingen met een verhoogde hartslag (zoals ze die hoorden).
Verschillende studies kunnen vanuit verschillende kanten bewijzen leveren voor een bepaalde theorie. Conclusies van onderzoeken kunnen zowel op het praktische als theoretische vlak liggen. De beschreven onderzoeken gingen niet alleen om fietsen en seksuele opwinding of bruggen en seks. Ze gingen over het concept hoe goed we onze gevoelens kunnen identificeren en hoe dit proces werkt.
Als nu een onderzoek wordt gerepliceerd en er komt niet hetzelfde uit? Ook dit kan ons iets interessants vertellen over wat er aan de hand is. Het smaakexperiment week af van de conditioneringsexperimenten van Pavlov, maar leverde wel nuttige informatie.
Er werd door Piliavin (1969) gekeken naar bijstandergedrag in de metro. Als reactie op het instorten van een persoon in de metro, was het aanbieden van hulp in hun studie niet gerelateerd aan het aantal omstanders. Kan er hier nog iets anders hebben gespeeld, ervan uitgaande dat zowel het eerdere bijstanderexperiment als dit experiment ‘klopt’?
Darley et al. deden een experiment waarbij mensen ofwel elkaars reactie konden zien of elkaar niet konden zien (stoelen tegenover elkaar of rug tegen rug) als een noodsituatie zich voordeed. Als ze elkaar konden zien, bleek 80% te hulp te schieten. Slechts 20% schoot te hulp als ze elkaar niet konden zien.
De mate van externe validiteit is vaak niet op het eerste oog te bepalen. Bijvoorbeeld bij Pavlov, waarbij het enkel leek te gaan om het kwijlen van een hond. Door het doen van meerdere onderzoeken kan blijken dat een onderzoek grote implicaties had op theoretische conclusies, oftewel een hoge externe validiteit had.
Het doel van dergelijk onderzoek is zo veel als mogelijk uitkomsten te generaliseren naar een grotere populatie. Marketingonderzoek is een voorbeeld hiervan. Vaak is de setting van een experiment belangrijk, evenals de manier waarop de steekproef wordt genomen.
Een groot deel van het onderzoek is echter helemaal niet bedoeld om te generaliseren. Dit onderzoek heeft meer consequenties voor de theoretische modellen die we kennen.
De steekproef van het responsiviteitonderzoek (coöperatieve families die de onderzoekers over de vloer wilden hebben, uit Baltimore) kan niet gegeneraliseerd worden naar de rest van de bevolking. Er kan puur iets worden gezegd over dit soort moeders en hun baby’s. Is dat erg?
Ander onderzoek met een andere steekproef kan meer uitsluitsel geven over of de principes ook daar gelden. Als er niet dezelfde uitkomsten zouden zijn bij ander onderzoek is het al interessant genoeg te onderzoeken wat er dan precies in Baltimore gebeurde.
Harlow probeerde geen uitspraken te doen over aapjes in het algemeen of moeders van staal of stof. Hij probeerde bewijs voor en tegen twee theoretische ideeën te verkrijgen.
Ook hier is de toepasbaarheid in het gewone leven ver te zoeken. In het gewone leven hadden de patiënten geen problemen omdat ze snel oogbewegingen konden maken.
Zowel laboratoriumonderzoek als onderzoek in een meer natuurlijke setting kan meer als doel hebben te generaliseren of meer theoretisch zijn.
Een onderzoek kan zowel als doel hebben data te generaliseren als ook een theoretische impact te hebben. Bijvoorbeeld een studie naar een behandeling tegen depressie. Natuurlijk willen we dat de personen in het echte leven ook minder depressief zijn dan alleen op een vragenlijst. Daarnaast blijft een conclusie hier van de aard ‘voor deze mensen, in deze omstandigheden, blijkt de behandeling effectief’.
Een onderzoek kan meer gewicht in de schaal leggen van een bepaalde theorie. Juist schijnbaar verschillende studies kunnen elkaars conclusies ondersteunen, als ze een zelfde soort onderliggend concept hebben onderzocht.
Focussen we op het belang van een onderzoek op de onderliggende concepten of op de specifieke kenmerken van dit onderzoek? Heeft Pavlov een manier gevonden om een hond te laten kwijlen of zegt zijn onderzoek meer? Als we gaan interpreteren welke impact een onderzoek heeft, kunnen we fouten maken. Daarbij kunnen we deze interpretaties weer verder onderzoeken.
Een methode om voor en tegens van bewijzen voor een theorie af te wegen is de meta-analyse. Maar hoe vergelijken we verschillende soorten onderzoeken?
Als we de effecten van een bepaalde therapie in een Z-score uitdrukken, is het mogelijk een vergelijking te maken tussen verschillende onderzoeken.
Smitt en Glass deden een meta-analyse betreffende de het effect van psychotherapie. Ze vonden een gemiddelde effectgrootte van.68. De gemiddelde cliënt was na behandeling beter af dan 75% van de controlecliënten. De therapieën hadden het grootste effect op angstreductie en toename van zelfvertrouwen.
Effectgrootte bleek niet te correleren met ervaring van de therapeut of met de duur van de therapie. Wel was het gecorreleerd met het IQ van de cliënt en gelijkheid van cliënt en therapeut.
De laatste tijd is er meer aandacht voor de ethische bezwaren van psychologisch onderzoek. Tegenwoordig verantwoordt een onderzoeker zijn ethische positie ten opzichte van de proefpersonen voor het uitvoeren van zijn onderzoek tegenover een ethische onderzoekscommissie.
De APA heeft een aantal richtlijnen opgesteld ten aanzien van een ethisch verantwoorde behandeling van proefpersonen.
Globaal gezien komen deze richtlijnen neer op twee basisprincipes:
Een onderzoeker moet zich goed bewust zijn van alle mogelijke gevolgen van de behandeling voor een proefpersoon. Ook de mogelijkheid van psychologische schade of ongemak moet bekeken worden.
Vaak hoort het meten van psychologische gevolgen van een manipulatie bij het onderzoek. Wel kan na afloop van het onderzoek in geval van een verwacht na-effect de proefpersoon een debriefing krijgen. Hij of zij krijgt dan te weten waar het onderzoek voor diende en er wordt aan hem verteld welke manipulatie is uitgevoerd. Er wordt bijvoorbeeld verteld dat het de bedoeling was om het zelfvertrouwen van de proefpersoon te verlagen. Het effect van het onderzoek wordt hier echter niet mee weggenomen. Bovendien kunnen gevoelens van verminderd zelfvertrouwen nog lang na een experiment blijven bestaan.
In 1974 voerde Milgram de gehoorzaamheidsexperimenten uit. Proefpersonen werden neergezet als leraar en dienden andere ‘proefpersonen’ een elektrische schok toe te dienen elke keer als ze een fout antwoord gaven. De intensiteit van de schokken werden opgevoerd en de leerling ging steeds meer protesteren. De proefpersonen werden echter gevraagd om door te gaan. 68% van de proefpersonen ging door tot de uiterste intensiteit van schokken.
Hoe was het nu voor de proefpersonen om dit over zichzelf te weten te komen? Dat zij zouden gehoorzamen als hen verteld werd schokken aan een ander, die duidelijk protesteerde, toe te blijven dienen. Het merendeel van de proefpersonen reageerde positief in de zin dat ze voelden dat ze iets belangrijks hadden geleerd over zichzelf. Het is beter de waarheid over jezelf te weten, toch? Maar is dit aan de onderzoekers om voor anderen te bepalen?
Waarschijnlijk zou soortgelijk onderzoek nu niet meer een ethische commissie doorkomen, maar het is wel van enorm belang geweest voor de psychologie. Ethische kosten en baten zullen bij elk onderzoek goed afgewogen dienen te worden.
Het feit dat een proefpersoon toestemming geeft mee te doen aan onderzoek betekent nog niet dat we alles met hem of haar kunnen doen. Zelfs niet als hij of zij ervoor betaald wordt. Daarnaast moet deelname vrijwillig kunnen blijven.
Wanneer is deelname daadwerkelijk vrijwillig? Moeten psychologiestudenten gedwongen worden mee te doen als proefpersoon aan onderzoeken omdat ze anders hun benodigde punten niet halen? Alternatieven zoals het schrijven van een werkstuk zouden aangeboden moeten worden.
Lastiger wordt dit als het de bedoeling is dat de proefpersonen niet weten dat ze aan een onderzoek meedoen, bijvoorbeeld bij het drankwinkelonderzoek. Moeten we de proefpersonen altijd later alles vertellen en om toestemming vragen? Misschien is het schadelijker voor een ‘proefpersoon’ later te horen dat hij geobserveerd werd of in de maling genomen is.
Valt het observeren van een persoon onder het schenden van de privacy? Wanneer valt het observeren onder publiek domein? Er mogen in elk geval geen filmopnames gemaakt worden zonder toestemming van de betrokkene. Ook het plaatsen van microfoons mag niet zonder toestemming.
Alle data die worden verzameld betreffende een proefpersoon dienen vertrouwelijk te worden behandeld. Dat wil zeggen dat geen informatie aan derden mag worden doorgegeven. Wat nu als de onderzoeker van mening is dat het informeren van een derde noodzakelijk is (bijvoorbeeld naar aanleiding van een hoge depressiviteitscore van een student)?
Wat nu als we willen weten hoe proefpersonen reageren op wat ze denken dat er aan de hand is? Oftewel, als het voor het onderzoek nodig is te liegen tegen de proefpersonen?
Nuttige data werden gevonden het laten luisteren van subliminale bandjes terwijl de proefpersonen dachten naar iets anders te luisteren. Een ander onderzoek over het effect van alcohol liet zien dat het denken teveel gedronken te hebben meer effect had op gedrag van mensen dan het drinken zelf. De hoeveelheden alcohol die in dit onderzoek werden gebruikt waren erg laag. Waarom? Vanwege ethische bezwaren van het weer op straat sturen van dronken proefpersonen.
De APA richtlijnen over deceptie zijn als volgt: deceptie mag alleen gebruikt worden als duidelijk is dat even effectieve alternatieve methoden niet beschikbaar zijn.
Andere mogelijkheden zijn de persoon een denkbeeldige situatie voor te leggen: wat zou je doen als? Dit zou echter in bijvoorbeeld het Milgram-onderzoek een totaal andere uitkomst zou geven. Soms komen we tot in zichzelf onoplosbare ethische dilemma’s, bijvoorbeeld het recht van vrije meningsuiting en het recht op een eerlijk proces.
Bij psychologen denken mensen vaak aan een onderzoeker die alleen maar ratten observeert of een therapeut die alles goed vindt wat een patiënt zegt.
Zelfhulpboeken kunnen nuttig zijn in het aanbieden van alternatieve manieren om naar dingen te kijken. Echter, we moeten de vele beschikbare zelfhulpboeken niet verwarren met ondersteunde onderzoeksresultaten uit de psychologie. Noch moeten we geloven in de soms bijna magische krachten die ‘experts’ zichzelf lijken toe te dichten. Zij maken soms claims die door onderzoek worden ontkracht. Vaak is dit een gebrek aan inzicht in onderzoeksmethoden of gebrek aan inzicht in onderzoeksgegevens. De claim bijvoorbeeld dat een therapeut een bepaald klinisch inzicht heeft vergaard na jaren van ervaring. Uit een onderzoek bleek dat de effectiviteit van een behandeling niet gecorreleerd was met ervaring van de therapeut.
Velen van ons hebben het gevoel intuïtief veel te weten over hoe mensen in elkaar zitten, omdat we al veel ervaring hebben met de mensen om ons heen en met onszelf. Vaak houden we echter onterecht vast aan deze illusie van ons begrip als intuïtieve psychologen.
Zoals we eerder hebben gezien zijn onze persoonlijke ervaringen onderhevig aan mogelijke observer effecten, observer bias en andere valkuilen die onze conclusies ten aanzien van gebeurtenissen kunnen vertekenen. Toch zou het teveel tijd en energie kosten elke veronderstelling te testen op zijn waarheidsgehalte. Daar hebben onderzoekers zich aan gewijd.
Niet lang geleden werd gedacht dat vrouwen intellectueel niet in staat waren te studeren en nog steeds zijn er (andere) redenen waarom vrouwen terughoudend zijn om intellectueel bezig te zijn. Waar zit het verschil tussen mannen en vrouwen precies?
IQ-scores van Afrikaanse Amerikanen liggen gemiddeld 15 punten onder scores van blanke Amerikanen. Waar ligt dit nu precies aan? Krijgen zij minder intellectuele mogelijkheden?
Mensen zijn geneigd om te stoppen met denken als ze een goed verhaal hebben gevonden, de zogenaamde Good Story heuristiek. Hier een voorbeeld.
Elke psychologie student die methoden van onderzoek heeft gedaan, weet dat als er sprake is van een correlationeel verband, er in feite drie mogelijke redeneringen zijn:
Nu, als studenten gevraagd werd naar de mogelijkheden van het voorbeeld met X, Y en Z, somden ze moeiteloos de drie mogelijkheden op. Als echter gevraagd werd naar de mogelijkheden naar aanleiding van een concreet voorbeeld van een correlatie, bleven ze steken in X->Y. Ze hadden een goed, logisch lijkend verhaal, dus stopten ze.
We weten vaak niet wat het werkzame element van iets is, tenzij we de verschillende mogelijkheden uit elkaar halen. Zo werd bij de subliminale tapes de daadwerkelijke boodschap gescheiden van de gedachte over de boodschap. En werd in het Therapeutic Touch experiment het voelen van een energieveld gescheiden van de intentie een energieveld te voelen.
Mensen zijn geneigd gelijksoortige mensen op te zoeken. Onze steekproef van gedrag dat we observeren is beperkt tot de mensen om ons heen, die vaak erg op ons lijken.
Het afgaan op een sollicitatiegesprek is nog heel gewoon als we een indruk van iemand willen krijgen. Dit, terwijl we weten dat dit gesprek niet echt representatief zal zijn voor iemands latere functioneren op een baan.
Bij het hebben van een eerste date met iemand zijn we ons derhalve wel bewust van het feit dat we beperkte informatie hebben over die persoon en dat we hem graag nog eerst in een andere context(en) willen zien.
Een belangrijk observer effect is de self-fulfilling prophecy. Je denkt bijvoorbeeld dat je niet goed bent in wiskunde, waardoor je je huiswerk niet meer doet en dus ook slecht scoort op een test. Daarnaast denkt ook je wiskundeleraar dat je er niets van bakt, en zie: je bakt er niets van.
Een ander voorbeeld van een observer effect is bijvoorbeeld het abusievelijk naar boven halen van ‘foutieve’ herinneringen bij kindermisbruik of incest.
Observer biases zijn een verstoring in het interpreteren van de data. Voorbeelden zijn de subliminale tapes en de UFO’s van goochelaar Randi.
Mensen zijn meer geneigd te denken aan informatie die voor hen het makkelijkst en meeste beschikbaar is. Dit wordt de beschikbaarheidsheuristiek, oftewel Pop-up theorie genoemd.
Mensen denken bijvoorbeeld dat de kans groter is om te komen door een brand dan door verdrinking. Het laatste komt veel vaker voor, maar komt minder vaak in het nieuws.
We zijn tevens geneigd sneller te denken aan gegevens die onze theorie (of de vraag op dat moment) positief ondersteunt, dan aan gegevens die niet in de theorie passen. Bij de vraag of mensen met rood haar een vuriger temperament hebben, denken we het eerst aan de mensen die we kennen die inderdaad rood haar hebben en vurig zijn.
Als we al beginnen met een theorie is het erg waarschijnlijk dat we informatie kunnen bedenken die deze kan bevestigen (bijvoorbeeld bij het lezen van je hand).
Verder zijn er voor elke theorie wel volkswijsheden of gevleugelde uitspraken beschikbaar, die elkaar vaak zelfs tegenspreken, zoals ‘uit het zicht, uit het hart’ en ‘afstand doet het hart verlangen’.
We zijn geneigd te denken, dat bepaalde dingen samen gaan met andere. De ene positieve eigenschap van iemand wordt gekoppeld aan de andere (halo effect; bijvoorbeeld dat een mooi iemand ook aardig zou zijn).
Een ander voorbeeld is het uitgaan van het rechtvaardige-wereldprincipe. ‘Voor wat, hoort wat’, en ‘mensen krijgen wat ze verdienen/hebben gezaaid’.
We houden van goede verhalen en stoppen dan vaak met denken. Dit wordt cognitief conservatisme genoemd. We kunnen data die niet kloppen in het verhaal negeren of herschrijven en kunnen zo vasthouden aan ons oorspronkelijk geloof.
Er is veel bewijs over het feit dat mensen hun eigen ideeën lijken te overschatten. Zoals het zeker weten van een herinnering. Ook onze voorspelling van ons eigen gedrag in de toekomst is vaak systematisch hoger dan ons daadwerkelijk gedrag.
In de ene groep werd studenten verteld dat er een hoge correlatie was tussen brandweermannen en hun neiging tot risico’s nemen. Aan de andere groep werd verteld dat deze correlatie negatief was. Beide groepen studenten konden heel goed een reden voor of tegen dit verband bedenken. Echter, als verteld werd dat deze data nergens op gebaseerd waren en ze moesten inschatten hoe zij dachten dat het verband zou zijn, bleven ze bij de mening die hun eerder was aangepraat.
Een onderzoeker is niet ongevoelig voor bovengenoemde effecten. Wel probeert hij zich bewust te zijn van mogelijke valkuilen en heeft hij meestal verstand van wat er aan gedaan kan worden als iets dergelijks speelt of gaat spelen.
Een onderzoeker is zich bewust van het feit of een vraag te onderzoeken is, op wat voor manier dit kan en kan nagaan of dit misschien al gedaan is.
Een onderzoeker werkt vanuit het idee van de falsificeerbaarheid. Hij is dus gericht op zoek naar mogelijke informatie die zijn idee kan ontkrachten. Daarbij weet een onderzoeker dat het belangrijk is om vergelijkingsmateriaal te hebben.
Een onderzoeker is zich bewust van de beperkingen van zijn conclusies en is bereid om ze aan te passen als hier bewijzen voor zijn.
Er zijn manieren voor de onderzoeker om zijn gegevens te laten checken. Dit kan gebeuren door middel van ‘peer reviews’ en replicatie van zijn onderzoek door anderen.
Als een onderzoeker een onderzoek wil laten publiceren in een wetenschappelijk tijdschrift wordt dit altijd voorafgegaan door het becommentariëren door mede- (onafhankelijke) onderzoekers. Als een onderzoek deze proef niet heeft doorstaan zegt dat meestal iets over kwaliteit van dat onderzoek.
Andere onderzoekers kunnen het onderzoek repliceren. Onderzoek waar niets van klopt komt zo uiteindelijk aan het licht.
Vaak gaan we bij het inschatten van waarschijnlijkheden uit van stereotypes in ons hoofd in plaats van wat statistisch gezien waarschijnlijk is. We zijn geneigd om extreme verhalen te onthouden. Dit bleek uit een experiment van Hamill et al.
In de eerste conditie kregen de proefpersonen een negatief stereotype stukje te lezen over Mw. Santana, die in de bijstand zat (en altijd wel zou blijven…). In een tweede conditie werden slechts statistische cijfers gegeven over het feit dat mensen over het algemeen maar twee jaar in de bijstand blijken te zitten.
Het lezen van het negatieve stukje had een veel groter effect dan het zien van de statistieken op de houding van de proefpersonen ten opzicht van bijstand in het algemeen. Blijkbaar zijn we eerder geneigd om extreme sprekende verhalen, die een beeld oproepen, te onthouden, dan statistieken, die meer werkelijke informatie bevatten over een groep.
Onze kennis is gebaseerd op vooronderstellingen, ideeën over hoe we denken dat dingen in elkaar zitten. Het onderzoeken en testen hiervan is erg belangrijk om foutieve ideeën te ontdekken.
Er zijn vier manieren om te weten of iets klopt: autoriteit toekennen aan een persoon die bekwaam is in een bepaald veld en het antwoord op de vraag kan weten, algemeen geaccepteerde waarheden, persoonlijke ervaring en intuïtie waarbij je weet dat iets op een bepaalde manier werkt, maar je dat niet per se kunt beargumenteren.
Observer bias is het verschijnsel dat men ziet wat men wil zien of verwacht te zien. Dit kan de resultaten van een onderzoek beïnvloeden.
Confounded variabelen zijn variabelen die niet los te zien zijn van andere variabelen die met elkaar verstrengeld zijn. Het is in zo’n situatie lastig te bepalen welk effect door welk verschijnsel wordt veroorzaakt. Een onderzoeker moet rekening houden met confounded variabelen.
Het falsificatieprincipe houdt in dat een aanname als juist wordt gezien, zolang deze testen doorstaat die de onjuistheid van de aanname zouden kunnen bewijzen.
Het is belangrijk goed onderzoek te scheiden van slecht onderzoek. Zo kan er onder andere gefraudeerd zijn met onderzoek en kan een onderzoek gebaseerd zijn op persoonlijke criteria. Als gebruiker van wetenschappelijk onderzoek is het daarom belangrijk je te verdiepen in de methoden van het onderzoek.
Toegepast onderzoek wordt gedaan vanuit een probleem dat zich in de praktijk voordoet. Dit heeft vaak als doel om manieren te vinden om iets te verbeteren of te voorspellen hoe iets zich gaat ontwikkelen in de toekomst.
Theoretisch onderzoek is fundamenteel en probeert de basisprincipes van een verschijnsel beter te begrijpen.
Toegepast en theoretisch onderzoek liggen vaak in elkaars verlengde of gaan samen op. Als ergens de basisprincipes van bekend zijn, kunnen er makkelijker manieren gezocht worden voor verbeteren.
Uitgangsprincipes bij angst voor statistiek zijn: statistiek is logisch, je gebruikt het vaker dan je denkt (principe van samenvattende statistiek, waarschijnlijkheid, correlatie en van voorspellen op basis van gegevens uit het verleden) en het gebruik van symbolen en formules zijn bedoeld ter vereenvoudiging.
Een grafiek heeft als doel heel simplistisch de ontwikkeling van een verschijnsel weer te geven (trend). Zowel een puntlijngrafiek als een staafdiagram kunnen informatie overzichtelijk weergeven.
Een basisuitgangspunt bij het doen van onderzoek is het geloven van de data, ook al is deze niet zoals verwacht. Daarnaast is het belangrijk één verandering per keer door te voeren, om goed te kunnen bepalen welke verandering effect heeft.
Een theorie is een stelling van algemeen werkbare principes die leidt tot een verklaring van een verschijnsel. Vanuit een theorie kan gegeneraliseerd worden naar vergelijkbare verschijnselen en kan informatie gebruikt worden om kennis toe te passen.
Er is een hiërarchie van theorieën, er zijn zowel theorieën van laag (werking van elektriciteit) als van hoog niveau (relativiteitstheorie van Einstein).
Een theorie wordt getest met hypotheses, dit zijn vooronderstellingen: als de theorie klopt, gebeurt X. Als X niet gebeurt, is de theorie niet juist of is het experiment niet juist uitgevoerd of geïnterpreteerd. Als X wel gebeurt, is dat niet direct bewijs dat de theorie juist is, maar wel een stap in de goede richting.
Een theorie leidt tot onderzoek, onderzoek leidt tot onderzoeksgegevens. De conclusies uit deze gegevens betekenen iets voor de theorie, wat kan leiden tot weer meer onderzoek. Dit wordt de theorie-data-cirkel genoemd.
Als een theorie falsificeerbaar is, kan deze serieus genomen worden. Er is dan een uitkomst mogelijk die het ongelijk van de theorie zou kunnen bewijzen.
Als onderzoekers altijd een verklaring denken te hebben voor een negatief resultaat wordt de theorie data-proof genoemd. Bijvoorbeeld de theorieën van de psychoanalyse zijn veelal niet te testen, er is altijd wel een verklaring te bedenken.
Er zijn twee theorieën over de hechting: de levensbehoeftentheorie (moeder verschaft voedsel) en de contact-behoefte-theorie (moeder biedt lichamelijk comfort en troost). De data van het onderzoek van Harlow gaf bewijs voor de tweede theorie en tegenbewijs voor de eerste theorie.
In het rokende kamerexperiment komt het bijstanders-effect naar voren. Dit laat zien dat de sociale context bepaalt of proefpersonen te hulp schieten in een noodsituatie. Mensen helpen eerder als ze alleen zijn dan wanneer ze in een groep zijn.
In het Emily Rose experiment werden Therapeutic Touch (TT) beoefenaars gescheiden van de onderzoeker door een scherm. Ze moesten beoordelen of de onderzoeker bij de linker- of rechterhand kwam. Ze scoorden net onder kansniveau. Alternatieve verklaringen waren dat een hand die is ‘aangeraakt’ een geheugen zou achterlaten end at de linkerhand de meer ontvangende hand was.
Drie zaken zijn belangrijk bij specifieke onderzoeken: onderzoek richt zich op hoe een bepaald proces kan werken in een versimpelde situatie, onderzoek staat niet alleen en een onderzoeker kan theorieën op meerdere niveaus tegelijk testen en zo met fundamentele vragen bezig zijn.
Bij statistische significantie wordt ervan uitgegaan dat data kan worden veroorzaakt door toeval, die kans wel klein is en dat men er bijna zeker van kan zijn dat er geen sprake is geweest van toeval.
De nulhypothese is de veronderstelling dat de data zouden komen door toeval. Als de waarschijnlijkheid dat de gegevens op kans berusten ≤ 5%, dan wordt de nulhypothese verworpen.
Als de steekproef niet te groot is en er een onafhankelijke variabele is die twee waarden aan kan nemen, kan de p-waarde berekend worden met kansberekening, mits de metingen onafhankelijk van elkaar zijn. Bij p > .05 kunnen geen conclusies getrokken worden.
Bij het vormen van een theorie, is het belangrijk dat er vergelijkingsmateriaal aanwezig is om een effect of verschil aan te tonen. Het is hierbij weer belangrijk dat het gaat om een falsifieerbare theorie. Daarom moet bijvoorbeeld vergeleken worden met een niet behandelde groep als het om het effect van een behandeling gaat.
Een variabele is iets wat kan variëren. Er zijn verschillende soorten. Kwantitatieve variabelen zijn uit te drukken in getallen (bijvoorbeeld gewicht of tijd). Categorische variabelen zijn kwalitatief en hebben kenmerken in plaats van getallen (bijvoorbeeld mannen versus vrouwen).
Operationaliseren is iets specifieks doen om een doel te bereiken.
Objectieve gegevens worden verkregen door bijvoorbeeld een machine te gebruiken, zodat de gegevens niet beïnvloed worden.
Fysieke metingen houden bijvoorbeeld de afstand in die af wordt gelegd of de hoeveelheid die gegeten wordt.
Conditionering houdt in dat de ongeconditioneerde reactie (UCR) die volgt op een ongeconditioneerde stimulus (USC) uiteindelijk een geconditioneerde reactie teweegbrengt doordat de stimulus gekoppeld wordt aan een bepaald signaal (zoals in de onderzoeken van Pavlov en het oogblaasonderzoek). Het hangt af van de omstandigheden of bewustzijn een rol speelt bij conditionering.
Pavlov liet, voordat hij een hond te eten gaf, een belletje rinkelen (UCS). De hond produceerde speeksel bij het eten van het voedsel (UCR). Na een paar keer ging de hond al kwijlen bij enkel het horen van het belletje, de geconditioneerde respons.
In het oogblaasonderzoek werd een toon afgespeeld waarna iemand in zijn oog geblazen werd. Ook hier trad conditionering op, slechts bij het horen van de toon kwam al de reactie.
In het oogblaasonderzoek waren twee condities, de eerste groep kreeg de toon en het blazen tegelijk en de tweede groep kreeg er een pauze tussen. Proefpersonen werd achteraf gevraagd of ze een verband hadden waargenomen. Het bleek dat bij de tweede groep bewustzijn zorgde voor een steeds groter wordend verband tussen signaal en respons.
Subjectieve metingen zijn metingen die gekleurd kunnen zijn door vooroordelen van de waarnemer, het is daarom belangrijk meerdere metingen te doen bij meerdere waarnemers. Uit onderzoek van Langer en Abelson bleek dat gedrag heel anders beoordeeld wordt door verschillende informatie vooraf. Dezelfde persoon werd als sollicitant beoordeel als aantrekkelijk en innovatief en als patiënt als defensief en gespannen.
Zelfrapportage is een belangrijke methode om meer te weten te komen over dingen die we niet direct kunnen meten en levert een bijdrage aan de constructvaliditeit.
Een drempelwaarde wordt bepaald door de intensiteit van een stimulus op te voeren tot een proefpersoon iets waarneemt, dit is het omgekeerde van sensitiviteit. Hoe lager de drempel, hoe hoger de sensitiviteit.
REM-slaap wordt gekenmerkt door snelle oogbewegingen. Zelfrapportage bij onderzoek naar dromen en de REM-slaap is belangrijk om meer te weten te komen over de inhoud van een droom. Gerapporteerde droominhoud is vaak te koppelen aan activering van bepaalde hersengebieden.
Confabulatie is het opvullen van gaten in de herinnering met verzonnen herinneringen. Flashbulbs zijn geheugenflitsen die te binnen schieten als gedacht wordt aan een bepaalde belangrijke gebeurtenis in het verleden.
Uit geheugenonderzoek komen vaak de conclusies dat het geheugen gevoelig is voor verstoring en dat zekerheid bij het herinneren niet gerelateerd is in de accuraatheid van het herinneren. Dit is ook terug te zien in het onderzoek Challenger, waarbij studenten werd gevraagd naar herinneringen. Een paar jaar later werd opnieuw naar deze herinneringen gevraagd, deze bleken lage relaties te hebben met de eerdere verhalen.
Objectieve metingen zijn metingen die zijn verkregen onafhankelijk van de waarnemer, elke waarnemer zou tot dezelfde uitkomst moeten komen.
Twee mythes over objectiviteit zijn dat we mensen als objecten zouden behandelen en dat we geen aandacht zouden besteden aan emoties, gedachten en gevoelens.
Test-hertest-betrouwbaarheid is het nogmaals meten van de variabele op een ander tijdstip. Tussen-waarnemers-betrouwbaarheid houdt in dat meerdere waarnemers een meting op hetzelfde tijdstip verrichten, dit kan weergegeven worden in een puntengrafiek (scatterplot).
In een scatterplot worden op de x-as de beoordelingen van de eerste waarnemer geplaatst en op de y-as de beoordelingen van de tweede waarnemer. Als de waarnemingen dicht bij elkaar liggen is de betrouwbaarheid hoog.
Validiteit geeft aan of gemeten wordt wat je wilt meten. Validiteit is bijvoorbeeld belangrijk wanneer een variabele of construct niet direct te meten is, er wordt dan een schatting gemaakt op basis van een andere variabele.
Face validiteit is de mate waarin een meetinstrument op het eerste gezicht meet wat het moet meten.
Predictieve validiteit is de mate waarin een meetinstrument kan voorspellen. Als bijvoorbeeld verkoopvaardigheden worden gemeten, wordt gekeken of een hoge score op de test correleert met een hoge score op de verkoopquota later.
Constructvaliditeit houdt in dat een meting hoog correleert met metingen die hetzelfde concept meten.
Een instrument dat betrouwbaar is, kan laag scoren op validiteit, maar een instrument dat niet betrouwbaar is, kan niet valide zijn.
Frequentieverdelingen geven overzichtelijk grote hoeveelheden data weer, in de vorm van een grafiek wordt dit een staafdiagram of histogram genoemd. Waarschijnlijkheid correspondeert met proportie in het diagram en is daarom handig te bepalen.
Observatieonderzoek is onderzoek waarbij geen manipulatie plaatsvindt zoals bij experimenteel onderzoek. Een voorbeeld van observatieonderzoek is een casestudie, een gevalsbeschrijving.
Psychiater Broca had een patiënt die alleen het woord Tan kon zeggen. Broca vond dat een specifiek gebied in de hersenen beschadigd was bij deze patiënt, het gebied van Broca. Hier is ook Broca’s afasie naar vernoemd, waarbij slecht spraak geproduceerd kan worden.
Resultaten van casestudies mogen niet gegeneraliseerd worden. Casestudies zijn gevoelig voor twee soorten van meetfouten: observer bias (de waarnemer ziet wat hij verwacht te zien) en observer effects (de waarnemer stuurt (on)bewust het gedrag van de proefpersoon).
Een populatieonderzoek kijkt naar wat waar is voor een bepaalde populatie. Sociale druk speelt in veel gevallen een rol in onderzoeken, dit bleek uit de Bennington studies. Studenten werden progressiever op de Bennington Universiteit door sociale druk vanuit de oudere studenten.
Er is onderzoek gedaan of het verstandig is om eerst samen te wonen voordat je gaat trouwen. Het bleek dat mensen die eerst samenwonen eerder scheiden dan mensen die niet eerst samenwonen. Dit betekent echter niet dat samenwonen leidt tot eerder scheiden. Er kan ook een andere factoren van invloed zijn.
Uit onderzoek van Miller blijkt dat Amerikanen meer geneigd zijn het gedrag van een vriend te verklaren vanuit persoonskenmerken en Indiërs vanuit de situatie.
Een geloofsgroep (de Seekers) met in het midden mw. Keech geloofde dat de wereld overspoeld zou worden door een grote vloed op een bepaald moment en dat zij gered zouden worden door een ruimteschip. Toen de vloed niet kwam, leken de Seekers nog sterker te geloven in de voorspelling dan eerst. Festinger en collega’s gaven als verklaring hiervoor de cognitieve dissonantie-theorie.
Cognitieve dissonantie is het verschijnsel waarbij onze handelingen niet overeenkomen met onze overtuigingen en waarden.
Een stekelbaarsmannetje reageert op twee manieren op een andere stekelbaars: met zijn kop naar beneden en vinnen gespreid in de dreighouding bij een mannetje (A) en met een paringsdans bij een vrouwtje (B). Na verder onderzoek bleek dat dit instinctief aanwezig gedrag is en niet alleen aangeleerd.
Gezichtsuitdrukkingen zijn over het algemeen universeel en worden niet aangeleerd. Echter kunnen we ze wel later veranderen. In Japan worden negatieve emoties gemaskeerd met een lach en het optrekken van een wenkbrauw wordt als grof bestempeld.
Roken en teveel eten zijn moeilijk te veranderen gedragingen. Er is veel terugval. Echter mensen die zelf hun probleem hadden overwonnen blijven veel vaker op gewicht of rookvrij bleek uit onderzoek van Schachter.
Er zijn twee methoden voor het omgaan met huilende baby’s. De reinforcement theorie stelt dat je het kind moet laten huilen, omdat het kind anders denkt zijn zin te krijgen bij huilen. De attachment theorie stelt dat je het kind moet pakken, omdat het dan leert dat er aan zijn behoeftes beantwoord wordt en het vertrouwen ontwikkelt.
Uit het Bell en Ainsworth onderzoek blijkt dat er een negatieve correlatie is tussen responsiviteit van moeders en de mate waarin hun baby’s huilen. Met een correlatie kan echter geen causaliteit worden vastgesteld. Wel kan een alternatief causaal verband ontkracht worden met behulp van correlaties.
Beschrijvende statistiek is een vereenvoudigde weergave van de data met voornamelijk kerngetallen.
De modus is de meest voorkomende score, de mediaan is de score die de frequentieverdeling doormidden deelt en het gemiddelde wordt berekend door alle scores op te tellen en dan te delen door het aantal scores. Het nadeel van het gemiddelde is dat een afwijkende score een erg vertekend beeld kan geven.
De standaarddeviatie geeft de variabiliteit van de data weer. Het is de afstand van een score tot het gemiddelde in het kwadraat, gedeeld door het aantal scores.
Het is goed om bewust te zijn van het feit dat een vergelijking tussen gemiddelde scores niet zegt over en vergelijking tussen individuele scores. Mannen zijn gemiddeld genomen langer dan vrouwen, maar niet elke man is langer dan elke vrouw.
Technische problemen bij het verkrijgen van data bij observeren zijn: sampling bias (groep die getest is, is anders dan de groep waarover men wat wil zeggen), observer effects (proefpersonen worden beïnvloe door de observaties), observer bias (onderzoeker ziet wat hij verwacht of hoopt te zien) en inferentie- of interpretatiefouten (fouten bij het interpreteren van data).
Bij een steekproef is het belangrijk dat deze representatief is. Als een steekproef vertekend is, wordt het een biased sample genoemd.
Er is sprake van een self-selected steekproef als alleen een bepaalde selectie van de uitgenodigde mensen een respons geeft.
Random sampling houdt in dat er een willekeurige steekproeftrekking plaatsvindt, ieder lid van de populatie heeft dan evenveel kans om gekozen te worden. Als bijvoorbeeld een tijdje geleden een telefonisch interview werd gehouden, wordt geen random steekproef gebruikt, want niet iedereen had in die tijd een telefoon.
Random sampling gaat als volgt: er wordt een lijst gemaakt van alle leden van een populatie, elk lid krijgt een nummer, willekeurig wordt een aantal nummers getrokken en de personen die corresponderen met de nummers worden uitgenodigd voor het onderzoek.
Multifase sampling is het nemen van verschillende steekproeven in verschillende fases. Systematische sampling wordt gedaan door bijvoorbeeld het maken van een formule voor de selectie.
Een doelgerichte steekproef wordt gebruikt als er informatie nodig is over een specifieke groep mensen, zoals bij de Bennington studenten.
Als verschillende onderzoeken bij verschillende steekproeven soortgelijke resultaten laten zien, kunnen de resultaten ook meer gegeneraliseerd worden.
Bij het Clever Hans onderzoek is sprake van observer effects, omdat het leek alsof het paard Hans sommen kon oplossen. Als hem een som voorgelegd werd, bleef hij met zijn hoef trappen tot het goede antwoord. Later bleek dat degene die de som voorlegde ander gedrag ging vertonen als Hans bij het goede aantal was aangekomen en dit pikte het paard op.
Onderzoek van Loftus en Palmer laat zien dat reacties beïnvloed kunnen worden door de vraagstelling. De vragen ‘Hoe snel gingen de auto’s toen ze elkaar raakten?’ en ‘Hoe snel gingen de auto’s toen ze op elkaar knalden?’ leverde op dat de inschatting van de snelheid bij de tweede vraag hoger was.
Er zijn verschillende manieren om observer effects te voorkomen. Zorgen dat de waarnemer niet gezien wordt, proefpersonen laten wennen aan de aanwezigheid van de waarnemer, doen alsof het geen onderzoek is, als onderzoeker niet aanwezig zijn in de situatie zelf, het gebruik van blinde observatoren, waarbij de onderzoekers geen verwachtingen hebben van het onderzoek.
Een voorbeeld van observer bias is dat een onderzoeker een nieuw soort straling had ontdekt, N-straling. De professor en collega’s zagen de straling nog steeds, terwijl het apparaat dat de straling genereerde verwijderd was. Dit kwam door hun eigen verwachtingen.
Met tussen-waarnemers-betrouwbaarheid kan getest worden in hoeverre er sprake is van observer bias. Als de betrouwbaarheid hoog is, is er meer kans dat er daadwerkelijk gebeurd is wat de waarnemers hebben gezien.
De bekendste inferential bias (inferentiefout) is het verwarren van een correlationeel verband met een causaal verband. Hierbij is de verklarende factor vaak een derde variabele die vergeten wordt.
Een voorbeeld van inferential bias is dat uit onderzoek van Stanovich bleek dat hoe meer elektrische apparaten er in huis waren, hoe minder kinderen. Een vreemde conclusie zou zijn dat je meer broodroosters moet nemen als je minder kinderen wilt. Er is hier een derde variabele in het spel: de hoogte van het inkomen.
Bij een correlationeel verband zijn er drie opties. X Y, Y X en Z X en Y.
Een correlatie wordt berekend met de volgende formule: r² = 1 – (SE²/SD²). SE is de standaardfout van schatting. SE²/SD² staat voor de afstanden van alle scores tot de regressielijn in vergelijking met de standaarddeviaties.
Bij een positieve correlatie betekent een hogere score op het een ook een hogere score op het ander. Bij een negatieve correlatie betekent een hogere score op het een, een lagere score op het ander. Bij een perfecte correlatie is de standaardfout 0 en de coëfficiënt 1 of -1.
Een experiment wordt gekenmerkt door het feit dat een onderzoeker iets manipuleert (onafhankelijke variabele) en vervolgens observeert wat er gebeurt (afhankelijke variabele).
Uit de experimenten van Pavlov bleek dat een halve seconde tussen de aanbieding van de CS en de USC optimaal was voor een goed conditioneringseffect. Bij meer tijdsverschil is de conditionering zwak. Dit blijkt echter niet zo te zijn bij smaakaversie.
In het Garcia, Ervin en Koelling experiment werd smaakaversie bij ratten getest. Ratten kregen sacharine en werden toen ziek gemaakt. Drie dagen later kregen ze nogmaals sacharine te drinken, ze dronken er toen nog weinig van. Een controlegroep werd ziek gemaakt zonder van tevoren sacharine te krijgen, zij dronken drie dagen later net zo goed van sacharine als onbehandelde ratten. Deze vorm van conditionering ontstaat dus veel sneller en is krachtiger dan in de experimenten van Pavlov.
Bernstein onderzocht smaakaversie bij mensen. Groep 1 kreeg een ijsje voorafgaand aan chemotherapie, groep 2 een spelletje voorafgaand aan therapie en groep 3 een ijsje maar geen therapie daarna. Later werd de keus gegeven of ze liever een spelletje wilden spelen of een ijsje eten. Degenen uit groep 1 kozen significant minder vaak voor het ijsje. Dit experiment suggereert dat bepaalde stimuli makkelijker aan bepaalde reacties gekoppeld kunnen worden (ondanks dat de personen bewust waren van het feit dat achteraf misselijkheid kwam van de chemo en niet van het ijsje).
Om invloed van andere factoren uit te sluiten worden controlevariabelen gebruikt. Een belangrijke regel bij experimenten is: controleren wat gecontroleerd kan worden en wat niet gecontroleerd kan worden, moet gerandomiseerd worden.
In elk experiment wordt vergelijken. Een onafhankelijke variabele heeft verschillende waarden, uitgedrukt in verschillende condities, deze worden met elkaar vergeleken.
Een independent group design houdt in dat participanten random in condities worden ingedeeld. De condities verschillen op één kenmerk en zijn verder zoveel mogelijk gelijk.
Bij een within-subjects design is er één groep proefpersonen. Bij een within-subjects design met herhaalde metingen, komt eenzelfde proefpersoon in meerdere condities op verschillende tijdstippen. Het voordeel hiervan is dat zo gecontroleerd wordt voor individuele verschillen.
Het carry-over effect houdt in dat het zitten in de ene conditie het gedrag in de andere conditie beïnvloedt. Om de effecten hiervan te verdelen, wordt counter-balancing gedaan: de helft van de proefpersonen doet dan eerst A en dan B en de andere helft doet deze volgorde andersom. Een andere manier is opnieuw de beginmeting uitvoeren: dan kan bepaald worden of dezelfde waarde eruit komt en of er sprake is van een carry-over effect.
Randomiseren houdt in dat proefpersonen willekeurig ingedeeld worden in een groep of in welke volgorde condities worden ondergaan.
Bij een matched subjects design wordt een proefpersoon vergeleken met een vergelijkbare proefpersoon, deze worden dan beiden ingedeeld in een andere conditie. Dit kan ook in groepen en wordt dan randomized-block design genoemd.
Een matched subjects design geeft meer verzekering dat groepen vergelijkbaar zijn dan randomisering, er kunnen ook geen carry-over effecten zijn. Een nadeel van dit design is dat het veel tijd en geld kost.
Beperkingen van experimenten zijn dat sommige experimenten praktisch of ethisch niet mogelijk zijn, dat het langzaam werkt en dat resultaten niet altijd te generaliseren zijn.
Bij een ANOVA wordt de variabiliteit opgesplitst in twee componenten, namelijk de deviatie van personen tot het gemiddelde van zijn groep en de deviatie van het groepsgemiddelde van het totale gemiddelde.
Het aantal scores dat vrij is om te variëren, is het aantal vrijheidsgraden (df).
Met de t-waarde wordt aangegeven in hoeverre groepen van elkaar verschillen, gedeeld door de mate waarin individuen binnen een groep van elkaar verschillen.
Drie factoren zijn belangrijk bij het bepalen van de significantie: verschillen tussen de groepsgemiddelden, variabiliteit binnen een groep en de grootte van de groep.
Er zijn twee soorten situaties waarvoor gecontroleerd moet worden: obscuring factors, waarbij de data zo onduidelijk is dat niet bepaald kan worden wat er aan de hand is en confounding variables, waarbij niet bepaald kan worden waar het effect vandaan komt.
Een nulresultaat is een niet-significant resultaat, hier zijn twee mogelijke oorzaken voor: de onafhankelijke variabele heeft geen effect op de afhankelijke variabele of heeft wel een effect op de afhankelijke variabele, maar er is een preciezer experiment nodig, dit kan komen omdat de onafhankelijke variabele niet genoeg gevarieerd is.
Als een onafhankelijke variabele niet genoeg gevarieerd is, wordt dat een ineffectieve manipulatie genoemd.
Adolph wilde weten of ratten meer eten als het eten lekkerder is. Een groep kreeg standaard eten en een groep kreeg gezoet eten. Er werd geen verschil gevonden. Latere experimenten laten zien dat er wel degelijk een verschil ontstaat, dus blijkbaar had Adolph de aantrekkelijkheid van het voedsel niet genoeg gevarieerd om een effect te krijgen.
Een manipulatiecheck kan uitgevoerd worden om te controleren of een manipulatie het gewenste effect heeft gehad, door bijvoorbeeld fysiologische metingen te doen of gebruik te maken van zelfrapportage.
Een meetfout is een fout veroorzaakt door een meetinstrument. Een instrument kan bijvoorbeeld te grof zijn of te subjectief.
Het plafondeffect houdt in dat een taak te makkelijk is voor een proefpersoon. Het bodemeffect houdt in dat een taak te moeilijk is voor een proefpersoon. In beide gevallen zijn de verschillen tussen de groepen niet te meten.
Ruis kan veroorzaakt worden door verschillen in de externe situatie. Hiervoor moet zoveel mogelijk gecontroleerd worden. Dit wordt bijvoorbeeld gedaan door experimenten uit te voeren in speciale laboratoria.
In een veldexperiment worden externe factoren gelaten voor wat ze zijn, hierbij is het belangrijk dat de manipulatie sterk genoeg is om een effect te laten zien. Subtiele effecten zijn dus ook lastig te meten in een veldexperiment. In veldexperimenten kan gebruik gemaakt worden van natuurlijke variatie van variabelen (bijv. temperatuur).
Latany en Darley deden onderzoek naar het bijstanderseffect in een natuurlijke situatie. Ze stalen een fles in een drankenhandel. Dit werd door klanten eerder gemeld als ze alleen waren dan wanneer er meerdere klanten aanwezig waren. In dit onderzoek is bijvoorbeeld niet gecontroleerd voor individuele kenmerken en het weer.
Een voorbeeld van een veldexperiment is het onderzoek van Ristau naar het al dan niet bewuste beschermingsgedrag van een soort vogel voor haar eieren. Ze gedraagt zich bij gevaar alsof ze gewond is en gedroeg zich meer zo wanneer een agressieve indringer bij het nest kwam dan wanneer een niet-gevaarlijke indringer langsliep. Dit bewijst niet dat het gedrag van de vogel bewust is, maar sluit wel alternatieven uit.
Bij een veldexperiment is het makkelijker om de resultaten te vertalen naar het echte leven, dit wordt lastiger bij een experiment uitgevoerd in een laboratorium.
Uit de drie delen van de t-test (zie H6) blijkt dat men eerder een significant effect kan verwachten als de manipulatie krachtig is, de controle over andere variabelen groot is en er veel proefpersonen gebruikt worden.
Een type 1 fout houdt in dat er een effect lijkt te zijn, maar dat dit op toeval berust (vals alarm). Een type 2 fout houdt in dat er geen effect wordt gevonden, maar dat dit effect er wel is (misser).
5% is de meest gebruikte significantiedrempel: er is een kans van minder dan 5% dat de uitkomst op toeval berust.
Er wordt een two-tailed t-test gedaan als de kans op een fout in beide richtingen gemeten moet worden. Een one-tailed t-test meet de kans op een fout in één richting, hierbij hoeft de t-waarde minder hoog te zijn om significant te zijn.
Een significante uitkomst met een lage N is even veelbetekenend als een significante uitkomst bij een hoge N. de kans op en lage p-waarde is namelijk heel klein bij een lage N, maar als hij significant laag is, heeft die significantie evenveel waarde als bij een hoge N.
Confounded variablen scheppen verwarring over de oorza(a)k(en) van een effect. Deze variabelen variëren mee met de onafhankelijke variabele die we willen meten.
Er kunnen verschillende redenen zijn voor verbetering bij patiënten, naast het geven van een behandeling, bijvoorbeeld: spontane remissie (verbetering zonder behandeling), regressie (extreme scores minder extreem bij tweede meting), observer bias (verbetering zien als dat verwacht wordt) en niet-specifieke effecten.
Een placebo-effect is een voorbeeld van een niet-specifiek effect, hierbij treedt verbetering op bij behandeling, zonder dat er actieve werkzaamheid in de behandeling zit.
Misopvattingen rond het effect van placebo’s zijn: het gaat om een ingebeeld effect (effecten kunnen echt fysiek aantoonbaar zijn), placebo is onschuldig (neppil kan ook een negatief effect hebben) en het placebo-effect kan groot zijn (slechts in een derde van de gevallen vindt verbetering plaats na een placebo).
Door dubbelblind placebo-onderzoek kan gecontroleerd worden voor confounded variabelen. In deze situatie weten noch proefpersonen noch proefleiders wie medicijn krijgen en wie placebo krijgen.
Dubbelblind placebo-onderzoek, roept vragen op. Is het ethisch verantwoord om mensen onwetend te houden? Is het eerlijk om een patiënt een medicijn te onthouden als verwacht wordt dat het werkt? En maakt het uit wat werkt? Een placebo scheelt in kosten als het even effectief is als het medicijn zelf.
Verschillen tussen individuen die al aanwezig zijn voordat het experiment begon, kunnen het effect op de afhankelijke variabele verstoren. Hiervoor kan gecontroleerd worden door randomiseren. Daarnaast is het goed om het onderzoek te repliceren met andere proefpersonen.
Random een steekproef trekken is een manier om te bepalen wie in de steekproef komt en random toewijzen gebeurt pas op het moment dat de steekproef al bepaald is.
Het afvallen van proefpersonen is een probleem van interventieonderzoek. Hier kan achteraf vaak statistisch voor gecontroleerd worden.
Een voorbeeld van hoe data verkregen door dieronderzoek ook nuttig kan zijn voor onderzoek bij mensen, is onderzoek naar het hormoon CCK. CCK geeft bij ratten een gevoel van verzadiging. Dit is ook op mensen getest en geeft een inkijkje in de werking van onze spijsvertering.
McGinnies onderzocht de perceptuele afweer, worden bedreigende woorden later waargenomen dan andere woorden? Dit bleek inderdaad waar te zijn, maar kan ook als reden hebben dat deze woorden minder vaak voorkomen (in geschreven tekst).
Door hypnose zouden herinneringen teruggehaald kunnen worden. Echter, uit onderzoek blijkt dat er eerder ‘ja’ werd gezegd, omdat de suggestie van de hypnotiseur ‘compliance’ veroorzaakte.
Het valse-geheugensyndroom kan optreden als valse herinneringen ontstaan in het hoofd doordat hulpverleners cliënten helpen zich bepaalde gebeurtenissen te herinneren.
Confounded variables kunnen bestreden worden door: de confounder weg te nemen, te corrigeren voor de confounder met behulp van een controlegroep en/of te checken of de confounder een rol heeft gespeeld.
Met een regressielijn kan een voorspelling gemaakt worden van de Y-score van een individu met een bepaalde X-score. De afstand tussen de werkelijke score en de voorspelde score is de schattingsfout.
Met een covariantieanalyse wordt gecontroleerd voor begineffecten door te kijken naar de afstanden tot de regressielijn.
Bij een partiële correlatie wordt C constant gehouden terwijl enkel gekeken wordt naar het verband tussen A en B.
Als het effect van een onafhankelijke variabele op een afhankelijke variabele afhangt van een andere variabele, wordt dat een interactie-effect genoemd.
Een factorieel design heeft als kenmerken: de aanwezigheid van twee of meer onafhankelijke variabelen en het random toewijzen van proefpersonen aan elke mogelijke combinaties van deze variabelen. Een voorbeeld hiervan is een 2x2 design, daarbij zijn er twee onafhankelijke variabelen en de twee variabelen kunnen twee mogelijke waarden aannemen.
Een voorbeeld van een 2x2 design is een geheugenexperiment waarbij groep 1 blij werd gemaakt en groep 2 verdrietig. De taak was om woorden te onthouden. Binnen deze twee groepen werd op een later tijdstip bij het herinneren van de woorden weer een onderverdeling gemaakt in blij en verdrietig. Zo ontstaan dus 4 combinaties: verdrietig leren + verdrietig herinneren, verdrietig leren + blij herinneren, blij leren + verdrietig herinneren en blij leren + blij herinneren. De conclusie was dat de staat waarin iemand zich iets moet herinneren, hetzelfde moet zijn als de staat waarin iemand het leerde.
Onderzoek door Godden en Baddely bewezen ditzelfde principe met een duikersexperiment. Mensen die woorden onder water hadden geleerd, konden woorden beter herinneren onder water en mensen die woorden boven water hadden geleerd, konden woorden beter herinneren op het land.
In een factorieel design worden een between-groups design en een within-subjects design met elkaar gecombineerd. Een voorbeeld hiervan is het therapeutische effect-onderzoek.
Bij therapeutische effect-onderzoek worden voor- en nametingen gedaan, om goed te kunnen bepalen wat het effect is van een bepaalde therapie.
Bij een onderzoek naar aangeleerde hulpeloosheid werd honden geleerd over een barrière heen te springen om een elektrische schok te stoppen. Groep 1 kreeg geen oefening vooraf, groep 2 kreeg vooraf een serie schokken die ze niet konden stoppen en groep 3 kreeg vooraf oefening waarbij ze wel de schokken konden stoppen. Groep 1 en 3 leerde snel, maar groep 2 sprong niet over de barrière en vertoonde aangeleerde hulpeloosheid.
Bovenstaand onderzoek heeft duidelijke parallellen met depressie bij mensen. Depressieve mensen ervaren een hoge mate van oncontroleerbaarheid.
Een tweede onafhankelijke variabele kan uit zichzelf variëren en daarom puur gemeten worden, deze wordt dan niet gemanipuleerd. Dit gaat dan om een subject variabele of individuele verschillen-variabele.
Er wordt gesproken van een driewegs-factorieel design als een experiment meer dan twee onafhankelijke variabelen heeft.
De significantie bij een factoriele variantieanalyse met meer dan één onafhankelijke variabele wordt bepaald door de mate van variantie in de gehele groep in drieën te splitsen.
Bij het onderzoek naar diëten en contra-regulatie door Polivy en Herman, werden studentes ingedeeld in ‘op dieet’ en ‘niet op dieet’, daarna werd hen gevraagd één of twee milkshakes te drinken en daarna zoveel ijs te eten als ze wilden. Bij de niet-dieetgroep was de hoeveelheid ijs die gegeten werd afhankelijk van het aantal milkshakes. Bij de dieetgroep was het zo dat hoe meer milkshakes ze gedronken hadden, hoe meer ijs ze aten. Dit lijkt contra-regulatie te zijn: gedrag wat ingaat tegen fysiologisch gedrag dat we meer voedsel zouden innemen als er minder binnen is.
Het bovenstaande onderzoek geeft beter begrip voor boulimia. Na een vreetaanval voelt een persoon zich schuldig en gaat nog strenger lijnen, wat weer een vreetbui tot gevolg kan hebben.
Clark en Squire deden onderzoek naar de rol van bewustzijn in conditionering van een oogknipperrespons. Er werd een toon afgespeeld voor het blazen in het oog. In het geval van een pauze tussen de toon en het blazen, bleek dat er meer respons was als er een hogere mate van bewustzijn was.
Bij een drieweg ANOVA wordt gekeken naar de mate van variantie die wordt veroorzaakt door variabele A, de mate van variantie die wordt veroorzaakt door variabele B en de mate van variantie die veroorzaakt wordt door de interactie tussen A en B. De effecten die aangetoond kunnen worden zijn: wel of geen hoofdeffect voor variabelen A en/of B en wel of geen interactie-effect voor variabele A met variabele B.
Een experiment met een kleine steekproef heeft verschillende kenmerken: elk individu wordt behandeld als apart experiment (within-subject design), er worden individuele scores gerapporteerd in plaats van groepsgemiddelden en betrouwbaarheid wordt verkregen door herhalingen.
Het moment waarop een stimulus waargenomen kan worden, wordt de drempelwaarde genoemd. Deze waarde is afhankelijk van verschillende factoren, zoals bij de sensitiviteit van het visuele systeem. Als je vanuit het licht in het donker komt, zie je eerst niets, je moet wennen. De visuele drempel is lager geworden en de sensitiviteit voor visuele stimuli groter.
De staafjes in de oogbol zijn sensitiever dan de kegeltjes. Kegeltjes zijn verantwoordelijk voor het snelle proces bij gewenning aan het donker en staafjes zijn verantwoordelijk voor de langzame, effectieve aanpassing aan het donker. Tijdens WOII werd van dit feit gebruik gemaakt, de piloten droegen rode brillen ter voorbereiding op het donker. Het kost staafjes namelijk minder moeite om van rood licht naar het donker te gaan, omdat ze minder gevoelig zijn voor rood licht.
Bij Pavloviaanse conditionering is er sprake van een leercurve, langzaam treedt steeds meer conditionering op. Operante conditionering houdt in dat de reactie op het gedrag belangrijk is. Als er sprake is van een positive reinforcer, wordt het gedrag versterkt en komt het meer voor.
Bekende experimenten omtrent operante conditionering, zijn die van Skinner. Een dier kon op een hendel drukken, waardoor het eten als beloning (positive reinforcer) kreeg. Het dier gaat vaker drukken.
Als de positive reinforcer uitblijft, dooft het gedrag van het dier langzaam uit, wat extinction genoemd wordt.
Operante conditionering werkt ook bij directe hersenstimulatie. Als dieren op een hendel drukten, werd het beloningssysteem in de hersenen gestimuleerd. Dit had meer drukken op de hendel tot gevolg.
Wetenschappers ontdekten in de jaren ’40 dat het doorsnijden van de verbinding tussen de twee hersenhelften hielp bij epilepsiepatiënten. Er werden echter wel verschillen in hersenwerking waargenomen. De hoge mate van controle en de krachtige manipulatie die werd gebruikt maakte het een goed opgezette studie.
Ebbinghaus heeft onderzoeken uitgevoerd met zichzelf als proefpersoon naar geheugen. Hij ging ervan uit dat herinneringen netwerken zijn van associaties en dat deze associaties variëren in kracht en worden versterkt door herhaling. Hij testte zichzelf op het onthouden van onzinwoorden (die dus nog geen associaties hadden). Het bleek dat herinneringen verzwakken over tijd.
Uit de onderzoeken van Ebbinghaus blijkt dat het overkijken van de stof vlak voor het tentamen nuttig kan zijn, mits je het van tevoren al goed hebt geleerd en als het gaat om het stampen van woorden of namen.
Bartlett liet proefpersonen een indiaans volksverhaal onthouden. Toen de proefpersonen dit moesten navertellen, bleek dat details werden weggelaten, het verhaal was verstoord en er werden details genoemd die de proefpersonen zelf hadden bedacht.
Er zijn globaal gezien twee soorten geheugen: het rote geheugen (feitenkennis of woorden leren) en het begrijpen van meer georganiseerde, betekenisvolle materie. Rote geheugen is te trainen met herhaling en de tweede vorm is beter te trainen met associaties.
Als er een kleine groep participanten is, wordt elke persoon behandeld als een experiment op zich en is de behandeling aangepast aan de proefpersoon. De betrouwbaarheid wordt bereikt door replicatie.
Het geheugen van de demente Miss S. werden op twee manieren getest. Eerst door de woorden steeds te herhalen, wat geen verbetering opleverde. Daarna door expanded rehearsel, waarbij bij het correct onthouden van een woord, de herhaling over een twee keer zo lang tijdsinterval zou zijn, bij het niet onthouden werd het tijdsinterval gehalveerd. Dit werkte wel.
Een baselinemeting is een meting waarmee vergeleken kan worden op een later moment.
Een reversal design laat zien wat de doorlopende effecten zijn van bijvoorbeeld een behandeling. Als de behandeling dan onderbroken wordt om te zien wat er gebeurt, wordt een tweede baselinemeting verkregen.
Grote en kleine steekproeven kunnen beide gevoelig zijn voor volgorde-effecten, carryover-effecten en observer bias effecten. Bij kleine steekproeven kan gecontroleerd worden voor confounded variabelen door goede baselinemetingen en het gebruik van een reversal design.
In de signaaldetectietheorie zijn er vier situaties: een persoon antwoordt ja en dat is het juiste antwoord (hit), antwoordt ja, maar dat is niet juist (vals alarm), antwoordt nee, maar het moet ja zijn (misser), antwoordt nee en dat is juist (correct geweigerd).
Bij elk experiment en bij elke vraag moet afzonderlijk bepaald worden welk responscriterium acceptabel is. Er moet bepaald worden of het erger is om meer valse alarmen te hebben of meer missers.
Een experiment zonder manipulatie wordt een quasi-experiment genoemd. Door selectie wordt geprobeerd een causaal verband te isoleren. Dit soort experimenten wordt gebruikt als door praktische of ethische bezwaren een ‘gewoon’ experiment niet uit te voeren is.
Uit onderzoek met mannen die een gevaarlijke of een stevige brug overstaken en daarna een vrouwelijke onderzoeker een verhaal moesten vertellen, bleek dat mannen hun staat van opwinding door de brug verwarden met de aantrekkelijkheid van de vrouw. Het blijkt dat mensen vaak niet helemaal bewust zijn van hun emoties of redenen achter hun gedrag.
Goodwin en collega’s onderzochten alcoholisme en erfelijke aanleg. Er bleek relatief veel invloed te zijn van genetische aanleg bij alcoholisme.
Een voorbeeld van een quasi-experiment met en within-subjects design is het longitudinale onderzoek van Kraut en collega’s naar internetgebruik. Meer internetgebruik bleek te leiden tot meer depressieve gevoelens en sociale isolatie, maar depressieve gevoelens en sociale isolatie leidden niet tot meer internetgebruik.
Lewinsohn en Rosenbaum gebruikten een mixed design in hun onderzoek naar depressie. Drie verschillende groepen werden 15 maanden gevolgd. Het bleek dat personen die depressief zijn eerder denken aan onplezierige herinneringen (staatafhankelijk geheugen), als deze personen uit hun depressie waren, dachten ze hetzelfde als personen die niet depressief waren geweest.
Het probleem van quasi-experimenten is dat een causaal verband lastig vast te stellen is. Als proefpersonen verschillen op variabele X, kunnen ze ook verschillen op variabele Y, die mee varieert met X. Wel kan het goed gebruikt worden voor het ontkrachten van een ander causaal verband (alternatieve hypothese) of als basis voor een volgend experiment.
Uit onderzoek bleek dat de chemische samenstelling van het bloed van schizofreniepatiënten verschilde van dat van een controlegroep. Snyder repliceerde dit onderzoek en controleerde voor meer variabelen. Het verschil bleek uiteindelijk als oorzaak het dieet te hebben wat de patiënten in de ziekenhuizen kregen en dus niet de ziekte die voor een andere samenstelling zorgde. Dit is een illustratie van het probleem dat quasi-experimenten lastig een causaal verband kunnen vaststellen.
Het blijkt dat geweldsmisdrijven vaker voorkomen in het zuiden van de VS dan in het noorden. Hierbij zijn verschillende redenen aan te dragen, maar het is lastig te bepalen wat de werkelijke oorzaak is. Uiteindelijk blijkt dat in het zuiden mannen geweld meer geoorloofd vonden om bezittingen, familie of eigenwaarde dan mannen in het noorden.
Met de chi-kwadraattest (χ2) wordt de significantie getest wanneer er meer dan twee mogelijke waarden van de onafhankelijke variabelen zijn. De formule is: χ² = (O-E)²/ E. Hierin is O de verkregen score en E is de op basis van kans verwachte score.
De chi-kwadraattest kan gebruikt worden voor het meten van de contingentie van gegevens, het voorkomen van een bepaalde combinatie van variabelen en hoever deze combinatie afligt van de verwachte score.
Als er met categorische variabelen wordt gewerkt, wordt een berekening gemaakt van phi in plaats van r. Phi wordt berekend door chi-kwadraat te delen door het aantal scores en dit te vermenigvuldigen met het aantal vrijheidsgraden.
Bij een significant resultaat, is er een hogere betrouwbaarheid, als de studie herhaald zou worden is er een goede kans op hetzelfde resultaat.
Replicatie houdt in dat een onderzoek zo exact mogelijk wordt nagedaan. Dit kan gebeuren door zowel de onderzoeker zelf als door een andere onderzoeker.
Systematische replicatie houdt in dat een onderzoek nagedaan wordt met een enkele variaties of meerdere variaties na elkaar. Afhankelijk van de resultaten, kan iets gezegd worden over de generaliseerbaarheid van eerdere gegevens.
Latane en Darley repliceerden hun bijstanderonderzoek. Ze gebruikten andere situaties, maar de resultaten waren vergelijkbaar. Dit geeft een hogere betrouwbaarheid en generaliseerbaarheid.
Conceptuele replicatie houdt in dat dezelfde onderzoeksvraag wordt behandeld, maar dan met een andere procedure.
Situationele factoren hebben vaak een grote invloed. Dit komt niet overeen met de neiging die we vaak hebben om gedrag toe te schrijven aan persoonskenmerken (fundamentele attributiefout). Zo werd studenten theologie gevraagd ofwel met haast of rustig naar een lezing te gaan over de barmhartige Samaritaan. Degenen die haast hadden schoten veel minder vaak een hulpbehoevende man te hulp dan degenen die rustig naar de lezing gingen.
Een voorbeeld van misattributie is dat mannen die fysieke opwinding kregen, meer opgewonden werden van een erotische film dan mannen die niet eerst fysieke opwinding kregen. Die reactie had niets te maken met emoties, maar kwam puur door de lichamelijk opwinding.
Een andere mogelijkheid voor het verwarren van emoties is de spillover-theorie. Een heftige emotionele of fysieke staat slaat over op een andere, een persoon voelt in dat geval wel werkelijk de emotie.
Darley en collega’s deden een experiment waarbij mensen elkaars reactie wel of niet konden zien als een noodsituatie zich voordeed. Als ze elkaar konden zien, bleek een veel groter percentage te hulp te schieten dan wanneer ze elkaar niet konden zien.
Er is controversie omtrent externe validiteit, omdat niet altijd direct te bepalen is welke mate van externe validiteit er is, zoals bij Pavlov, wiens onderzoeken uiteindelijk grote implicaties bleken te hebben.
Er zijn twee modellen van onderzoek: het generalisatiemodel (doel is de uitkomst te generaliseren naar een grotere populatie) en het theoretisch model (doel is theoretische modellen aanvullen).
Het kan ook dat onderzoek als doel heeft om de data te generaliseren naar een grotere populatie, terwijl het ook een theoretische impact heeft.
Of er wordt gefocust op het belang van een onderzoek op de onderliggende concepten of op de specifieke kenmerken van het onderzoek is een belangrijke vraag. Als we gaan interpreteren welke impact een onderzoek heeft, kunnen fouten gemaakt worden. Daarbij kunnen deze interpretaties weer verder onderzocht worden.
Bij een meta-analyse worden voor- en tegenbewijzen tegen elkaar afgewogen. Dit kan bijvoorbeeld door de effecten van een therapie in een z-score uit te drukken en zo een vergelijking te maken tussen verschillende onderzoeken.
Smitt en Glass voerden een meta-analyse uit voor het effect van therapie, waaruit bleek dat de effectgrootte niet correleerde met de ervaring van de therapeut of de therapieduur. Wel correleerde het met het IQ van de cliënt en gelijkheid van therapeut en cliënt.
De American Psychological Association (APA) heeft richtlijnen opgesteld wat betreft een ethische verantwoorde behandeling van proefpersonen. De twee basisprincipes zijn dat de proefpersoon recht heeft op veiligheid en een respectvolle behandeling.
Het is belangrijk dat de onderzoeker zich bewust is van de gevolgen van de behandeling voor een proefpersoon. In een debriefing krijgt een proefpersoon te horen waar het onderzoek voor diende en welke manipulatie is uitgevoerd.
Milgram voerde gehoorzaamheidsexperimenten uit. Proefpersonen waren leraar en dienden ‘anderen’ (deze waren niet echt) opvoerende elektrische schokken toe als deze foute antwoorden gaven. Ruim de helft ging door tot de uiterste intensiteit van de schokken, ondanks protest van de ‘ander’. Proefpersonen leerden op deze manier iets over zichzelf. Dit zou tegenwoordig echter niet meer door een ethische commissie komen.
Via een informed consent wordt aan een proefpersoon informatie over het onderzoek gegeven. Echter, wat als personen het doel van het onderzoek niet mogen weten, omdat dit de resultaten kan beïnvloeden? Soms moeten lastige beslissingen gemaakt worden.
Het is lastig wanneer iemands privacy geschonden wordt. Observatie mag onder publiek domein, maar er mogen geen film- of geluidopnames gemaakt worden zonder toestemming.
Vertrouwelijk omgaan met de data wil zeggen dat er geen informatie aan derden mag worden doorgegeven.
De APA richtlijnen over deceptie zijn dat het alleen gebruikt mag worden als duidelijk is dat even effectieve alternatieve methoden niet beschikbaar zijn. Een andere mogelijkheid is om een persoon een denkbeeldige situatie voor te leggen, echter levert die manier wel meer sociaal wenselijk gedrag op.
Een alternatieve manier om naar dingen te kijken is door het gebruik van zelfhulpboeken. Deze boeken moeten echter niet verward worden met ondersteunende onderzoeksresultaten, maar er moet ook opgepast worden met de magische krachten die ‘experts’ zichzelf toedichten. Dit is vaak een gebrek aan inzicht in onderzoeksmethoden of -gegevens.
Persoonlijke ervaringen zijn onderhevig aan observer effecten, observer bias en andere valkuilen die onze interpretaties van gebeurtenissen kunnen vertekenen.
De Good Story heuristiek houdt in dat mensen geneigd zijn om te stoppen met denken als ze een goed verhaal hebben gevonden.
Vaak weten we niet het werkzame element ergens van, tenzij de verschillende mogelijkheden uit elkaar worden gehaald. Zo werd in het Therapeutic Touch experiment het voelen van een energieveld gescheiden van de intentie een energieveld te voelen.
Mensen zoeken over het algemeen mensen op die op hen lijken. Het is belangrijk om daar bij observatie bewust van te zijn.
Een veel voorkomend observer effect is de self-fulfilling prophecy, waarbij je bijvoorbeeld denkt dat je iets niet goed kunt, waardoor je ook werkelijk slecht scoort. Een ander observer effect is het ophalen van herinneringen die niet kloppen (false memory syndrome).
De beschikbaarheidsheuristiek houdt in dat mensen sneller denken aan informatie die voor hen makkelijk en het meest beschikbaar is (pop-up theorie). Daarnaast komen mensen vaker met argumenten voor hun theorie dan tegen hun theorie.
Dat een bepaalde positieve eigenschap van een persoon wordt gekoppeld aan een andere positieve eigenschap, wordt het halo-effect genoemd. Een voorbeeld is dat een mooi persoon ook wel aardig moet zijn.
Het rechtvaardige-wereldprincipe is gebaseerd op het idee van ‘voor wat, hoort wat’ en ‘mensen krijgen wat ze verdienen’.
Cognitief conservatisme is het negeren of herschrijven van dingen die niet kloppen in het verhaal, zodat vastgehouden kan worden aan wat oorspronkelijk geloofd werd.
Mensen overschatten zichzelf vaak, bijvoorbeeld wat betreft de zekerheid over een herinnering of als mensen hun eigen gedrag voorspellen.
Twee groepen studenten werd verteld dat er een hoge of negatieve correlatie was tussen brandweermannen en hun neiging tot het nemen van risico’s. Beide groepen konden goede redenen bedenken bij deze verbanden. Toen verteld werd dat de data nergens op sloeg en gevraagd werd hoe ze het verband zelf zouden voorspellen, bleven ze bij het verband dat hen was aangepraat.
Als een onderzoeker op zoek gaat naar informatie die mogelijk zijn theorie kan ontkrachten, volgt hij het idee van falsifieerbaarheid.
Door middel van peer reviews en replicatie van onderzoek, kan een onderzoeker zijn gegevens laten checken.
Een peer review houdt in dat mede-onderzoekers het onderzoek van een onderzoeker becommentariëren voordat het gepubliceerd wordt. Deze onderzoekers moeten onafhankelijk zijn.
Uit onderzoek van Hamill en collega’s kwam naar voren dat mensen bij het inschatten van waarschijnlijkheden uitgaan van stereotypes. Extreme verhalen hebben een grotere invloed dan statistische cijfers, die eigenlijk meer werkelijke informatie bevatten.
Er zijn drie foute gedachten over statistiek te noemen: individuele scores zijn foutloos te voorspellen vanuit de statistieken, statistiek gebruiken om voorspellingen te doen over mensen is niet humaan (methode wordt met gebruiker verward) en statistiek kan gebruikt worden om alles uit te leggen (probleem ligt bij het trekken van foutieve conclusies).
Tabel 1: | Behandeld | Onbehandeld |
Verbeterd | 40 | 20 |
Niet verbeterd | 160 | 2 |
Tabel 2: | ||
Behandeld | Onbehandeld | |
Verbeterd | 40 | 20 |
Niet verbeterd | 160 | 980 |
16. De interbeoordelaarsbetrouwbaarheid is in de bovenstaande figuur:
6. De toegepaste onderzoeker werkt vanuit een praktisch probleem wat hij in gedachten heeft, bijvoorbeeld de zoektocht naar een betere manier om depressie te behandelen. Hij hoopt dat zijn bevindingen direct kunnen worden toegepast (applied) op de oplossing van een menselijk probleem. De basisonderzoeker, daarentegen, probeert niet direct bij te dragen aan een specifiek probleem. Zijn doel is simpelweg om ons begrip te verbeteren. De vraag die de basis onderzoeker stelt, is: Hoe werkt het?
(In hoofdstuk 1, pagina 16-17)
Je vertrek voorbereiden of je verzekering afsluiten bij studie, stage of onderzoek in het buitenland
Study or work abroad? check your insurance options with The JoHo Foundation
Je vertrek voorbereiden of je verzekering afsluiten bij studie, stage of onderzoek in het buitenland
Study or work abroad? check your insurance options with The JoHo Foundation
Add new contribution