Waarom dwingt een duivelse docent een student tot statistiek? - Chapter 1

In dit hoofdstuk wordt het belang van statistiek besproken, evenals de fundamentele concepten ervan. Er zijn gegevens nodig om verschillende vragen te beantwoorden. Daarom onderstreept een docent het belang van het werken met cijfers voor studenten, omdat deze cijfers een vorm van data zijn en onderdeel uitmaken van het onderzoeksproces.


Waarom is statistiek belangrijk?

Voor het beantwoorden van diverse vragen is data nodig. Een docent dwingt een student te werken met getallen, omdat deze getallen een vorm van data zijn en behoren tot het onderzoeksproces. Er kunnen naast getallen ook andere vormen bestaan van data. Wanneer onderzoeken gebruik maken van data op basis van cijfers is dit een kwantitatieve methode. Onderzoeken waarbij taal wordt gebruikt als basis voor onderzoek, wordt een kwalitatieve methode genoemd. De kwalitatieve en kwantitatieve methoden zijn complementair aan elkaar. Dit wil zeggen dat de ene methode niet beter of slechter is dan de andere methode.

Hoe ziet het onderzoeksproces eruit?

Het onderzoeksproces bestaat uit een aantal stappen. De eerste stap is observatie. Hierbij wordt iets waargenomen wat iemand nieuwsgierig maakt. Een onderzoeker heeft een vraag die hij of zij graag beantwoord wil hebben. Om te kijken of de observatie klopt moeten gegevens verzameld worden. Voor het verzamelen van deze gegevens heeft een onderzoeker variabelen nodig. Een variabele is hetgeen dat gemeten wordt om tot een antwoord op de vraag te komen.

In het kort bestaat het onderzoeksproces uit de volgende stappen:

  1. Het formuleren van een onderzoeksvraag.
  2. Het zoeken en lezen van relevante theorie.
  3. Het opstellen van hypothesen.
  4. Het maken van voorspellingen.
  5. Het verzamelen van data om de voorspellingen te testen.
  6. Het analyseren van data.

Hoe vindt men iets om te verklaren?

Op veel verschillende manieren kan men iets vinden om te verklaren. Door bijvoorbeeld het nieuws te kijken op de televisie kan een onderzoeksvraag ontstaan. Door het kijken naar een bepaald programma, kan men een observatie hebben over iets wat gaande is in de wereld. Vervolgens moet er data verzameld worden en is het belangrijk variabelen op te stellen en te definiëren om hetgeen te meten wat men wil onderzoeken.

Op welke manier worden hypothesen getoetst?

De volgende stap in het onderzoeksproces is het toetsen van een theorie en het opstellen van hypothesen. Dit wordt gedaan door data te verklaren. Data kan worden verklaard met behulp van een theorie. Op basis van een theorie kan een voorspelling gedaan worden. Deze voorspelling op basis van een theorie wordt een hypothese genoemd. Om te spreken van een hypothese moet het gaan om een uitspraak die met behulp van wetenschappelijke methodes bewezen of verworpen kan worden. Een hypothese is een verklaring voor een bepaald fenomeen of een set observaties. Wanneer de verzamelde gegevens de theorie of hypothese tegenspreken, is er sprake van falsificatie.

Wat is het verschil tussen een afhankelijke en een onafhankelijke variabele?

Als men gegevens wil verzamelen is het belangrijk dat we ons twee dingen afvragen: (1) wat wordt er gemeten en (2) hoe wordt het gemeten? Om de hypothesen te kunnen testen moeten de variabelen gemeten worden. Variabelen zijn waarden die kunnen variëren tussen mensen, tussen situaties of tussen verschillende momenten in de tijd. Bij de meeste hypothesen zijn er twee variabelen, namelijk de oorzaak en de uitkomst.

De variabele die gezien wordt als de oorzaak van een bepaald effect wordt de onafhankelijke variabele of ook wel de predictor genoemd. Bij een experimentele opzet wordt deze term gebruikt om te benadrukken dat de onderzoeker deze variabele gemanipuleerd heeft. De variabele die verandert door veranderingen in de onafhankelijke variabele wordt de afhankelijke variabele of uitkomstvariabele genoemd.

Wat wordt bedoeld met een meetniveau?

Variabelen kunnen op verschillende manieren gemeten worden. Het verband tussen wat gemeten wordt en de cijfers die uitdrukken wat je meet, wordt het meetniveau (level of measurement) genoemd. Variabelen kunnen categorisch of continu zijn en kunnen verschillende meetniveaus hebben. Een categorische variabele bestaat uit verschillende categorieën. Je kan maar in één categorie per keer ingedeeld worden, je hoort niet een beetje bij de ene categorie en een beetje bij de andere categorie. Een voorbeeld van een categorische variabele is de indeling tussen mannen en vrouwen. In dit geval heeft de variabele slechts twee categorieën; een man of een vrouw. Je kunt niet allebei zijn. Een variabele met twee categorieën wordt een binaire variabele genoemd.

Als een variabele bestaat uit meer dan twee categorieën die aan elkaar gelijk zijn, wordt dit een nominale variabele genoemd. Een voorbeeld van een nominale variabele is religie (Jodendom, Christendom, Islam, et cetera). Hoewel deze categorieën ook kunnen worden weergegeven met cijfers (bijvoorbeeld 1 = Jodendom; 2 = Christendom; 3 = Islam), is het niet mogelijk om wiskundige berekeningen uit te voeren met deze cijfers. Deze cijfers geven namelijk niet een rangorde aan bij een nominale variabele. Een voorbeeld van een nominale variabele die wordt weergegeven met cijfers is het rugnummer van een speler in een teamsport. Een hoger rugnummer betekent niet dat iemand een betere speler is. Nominale data kan alleen gebruikt worden om te kijken naar frequenties, dus hoe vaak een bepaalde speler scoort, of hoeveel mensen een bepaald geloof hebben.

Bij een ordinale variabele bestaan er ook verschillende categorieën, maar deze categorieën hebben een bepaalde rangorde. Ordinale data geven bijvoorbeeld een bepaalde volgorde aan. Er wordt echter niet aangegeven hoe groot het verschil is tussen de categorieën. De top drie van een wedstrijd geeft aan wie beter is dan de ander. Dit geeft een volgorde, maar zegt niet hoeveel beter de winnaar was dan de nummer twee en drie. Bij het volgende meetniveau heb je geen categorische variabele meer, maar is de variabele continu. Een continue variabele is een score die elke waarde kan aannemen die op de meetschaal wordt gebruikt. De intervalvariabele is een vorm van een continue variabele. Bij de intervalvariabele is het verschil tussen alle getallen gelijk. Een voorbeeld hiervan is een schaal waarbij je aangeeft hoe aardig je iemand vindt op een vijfpuntsschaal. Het verschil tussen 1 en 2 is hierbij even groot als het verschil tussen 4 en 5. Dit meetniveau wordt het meest gebruikt bij statistische testen. Nog een stap verder is de ratio variabele. De ratio variabele heeft dezelfde voorwaarden als de intervalvariabele, alleen heeft de ratio variabele een absoluut en betekenisvol nulpunt. Dit betekent dat je de getallen van een ratio variabele kan vermenigvuldigen. Een voorbeeld hiervan is reactietijd. Een milliseconde duurt altijd even lang, dus de verschillen tussen de milliseconden zijn gelijk, maar daarnaast kun je ook zeggen dat 200 milliseconden twee keer zo lang is als 100 milliseconden. Een continue variabele hoeft niet altijd continu te zijn, het kan ook een discrete variabele zijn. Een echte continue variabele kan alle mogelijke waarden aannemen, maar bij een discrete variabele kunnen alleen bepaalde waarden (meestal alleen hele getallen) gekozen worden. Als je aangeeft hoe aardig je iemand vindt op een vijfpuntsschaal, is dat wel een continuüm, waarbij 2.98 een betekenisvolle waarde is, maar je kunt alleen de cijfers 1, 2, 3, 4 en 5 werkelijk kiezen. Je kunt niet daadwerkelijk 2.98 invullen.

Wat wordt bedoeld met een meetfout?

Onderzoekers willen het liefst een meting die hetzelfde is over tijd en over situaties. Het liefst wil hij of zij een accurate meting die niet beïnvloed wordt door wie of waar de meting wordt gedaan. Er is vaak een verschil tussen de gemeten waarde en de werkelijke waarde. Dit verschil noem je de meetfout. Als je een goed instrument hebt, is de meetfout klein. Bij vragenlijsten over gevoelige onderwerpen heb je vaak een grotere meetfout, omdat niet alleen de werkelijke situatie de antwoorden van de participanten beïnvloedt. Er zijn namelijk ook andere factoren, zoals sociale wenselijkheid, die meespelen.

Wat wordt bedoeld met de begrippen validiteit en betrouwbaarheid?

Een manier om de meetfout zo klein mogelijk te maken, is door eigenschappen van het meetinstrument vast te stellen die iets zeggen over hoe goed het meetinstrument zijn werk doet. Een manier om dat te bepalen, is met behulp van de validiteit. De validiteit laat zien of het instrument daadwerkelijk meet wat je wilde meten. Criterium validiteit betekent dat je kunt vaststellen of je instrument meet wat je wil meten aan de hand van objectieve criteria. Dit kan op twee manieren gebeuren:

  • Als je tegelijkertijd data verzamelt met het nieuwe instrument en bestaande criteria toetst, meet je de gelijktijdige validiteit.
  • Als je de data van je nieuwe instrument gebruikt om latere observaties te voorspellen, meet je de voorspellende validiteit.

Het probleem met criterium validiteit is dat het niet altijd gebruikt kan worden, omdat er vaak geen objectieve criteria bestaan voor wat je wil meten. Bijvoorbeeld als je wil weten hoe aardig iemand wordt gevonden. Een andere vorm van validiteit is inhoudsvaliditeit. Dit gaat over de mate waarin de items op een vragenlijst overeenkomen met het construct en of de vragen het fenomeen volledig dekken.

Een instrument moet valide zijn, maar dat is nog niet voldoende. Het moet daarnaast ook betrouwbaar zijn. Betrouwbaarheid betekent dat het instrument dezelfde uitkomst geeft bij dezelfde condities. Dus een betrouwbare weegschaal geeft altijd hetzelfde gewicht als het werkelijke gewicht hetzelfde is. Als een instrument niet betrouwbaar is, kan het ook niet valide zijn. Een instrument dat onder dezelfde omstandigheden namelijk verschillende uitkomsten genereert, meet per definitie niet wat het hoort te meten. De makkelijkste manier om de betrouwbaarheid te toetsen, is door de test te herhalen (test-hertest betrouwbaarheid). Een betrouwbaar instrument geeft dan op beide testen een vergelijkbaar resultaat.

Wat wordt bedoeld met een correlationele onderzoeksmethode?

Er zijn grofweg twee manieren om data te verzamelen, namelijk met correlationeel onderzoek (cross-sectioneel onderzoek) en experimenteel onderzoek. Bij correlationeel onderzoek wordt geobserveerd wat er in de wereld gebeurt zonder het te manipuleren. Dit is goed voor de ecologische validiteit, omdat men de natuurlijke situatie observeert. Sommige onderzoeken kunnen alleen op deze correlationele manier worden uitgevoerd, omdat het onmogelijk of onethisch is om bepaalde variabelen te manipuleren. Het nadeel van deze methode is echter dat het niet mogelijk is om een uitspraak te doen over causaliteit.

Wat wordt bedoeld met een experimentele onderzoeksmethode?

Bij experimenteel onderzoek wordt een variabele gemanipuleerd om te kijken of het de andere variabelen beïnvloedt. Bij veel onderzoeken wordt gekeken of de ene variabele (de predictor) de oorzaak is van de andere variabele (de afhankelijke variabele). Men kan volgens Hume pas spreken van een oorzakelijk verband als:

  • Oorzaak en gevolg elkaar nauw in de tijd opvolgen.
  • De oorzaak voorafgaat aan het gevolg.
  • Het gevolg nooit voorkomt zonder dat de oorzaak heeft plaatsgevonden.

Bij veel onderzoeken worden de variabelen tegelijkertijd gemeten. In veel gevallen weet men dan niet welke variabele de oorzaak is en welke variabele het gevolg weergeeft. Het kan zijn dat er een derde variabele in het spel is (tertium quid) die de oorzaak is van beide andere variabelen. Dit wordt ook wel de verwarrende variabele genoemd. Een voorbeeld is het verband tussen borstimplantaten en zelfmoord. Een laag zelfbeeld is hierbij zowel de oorzaak van het nemen van een borstvergroting als de oorzaak van het ondernemen van zelfmoordpogingen.

John Stuart Mill (1865) heeft nog een criterium toegevoegd aan de criteria van Hume, namelijk dat alle andere verklaringen van het oorzaak-gevolg effect uitgesloten moeten zijn. Wanneer de oorzaak afwezig is, mag het gevolg ook niet aanwezig zijn. Bij experimenteel onderzoek is het doel zo goed mogelijk de oorzaakgevolg relatie tussen variabelen te vinden. Experimenten vergelijken situaties (condities of treatments) waarin de vermeende oorzaak afwezig is met de conditie waarbij de oorzaak aanwezig is. De deelnemers kunnen op twee verschillende manieren meedoen aan een experiment. Dit kan met een binnen-groep ontwerp en in een tussen-groep ontwerp.

Welke twee methoden van dataverzameling bestaan er?

Zoals hierboven vermeld kunnen deelnemers op twee verschillende manieren meedoen aan een experiment. Dit kan met een binnen-groep ontwerp en in een tussen-groep ontwerp. Bij een binnen-groep ontwerp doen dezelfde deelnemers het experiment een aantal keer onder verschillende omstandigheden. Bij een tussen-groep ontwerp heb je verschillende deelnemers onder verschillende omstandigheden.

Welke twee typen variatie bestaan er?

Niet-systematische variatie is het kleine verschil in prestatie tussen twee condities dat niet door de bekende factoren verklaard kan worden. Zelfs als alle variabelen gelijk blijven, is er alsnog meestal een klein verschil in scores tussen verschillende condities of verschillende momenten. Dit komt bijvoorbeeld door verschillen in vaardigheid in de taak tussen mensen of verschillende tijdstippen van de dag. Systematische variatie is het verschil tussen de twee condities die ontstaat door de manipulatie van de conditie. Bijvoorbeeld, in het ene geval krijgen chimpansees een beloning voor hun gedrag, en in het andere niet. Het verschil in gedrag wordt nu veroorzaakt door manipulatie. Dit wordt de systematische variatie genoemd. De rol van de statistiek is om te ontdekken hoeveel verschil er is in prestatie en welk deel van de variatie dan systematisch is en welk deel niet systematisch is. Bij het binnen-groep ontwerp is er minder niet-systematische variatie dan bij het tussen-groep ontwerp. Bij het tussen-groep ontwerp kunnen de personen in de verschillende groepen namelijk andere eigenschappen hebben.

Wat wordt bedoeld met het begrip randomisatie?

Om de niet-systematische variatie zo klein mogelijk te houden en de test zo nauwkeurig mogelijk te maken, maken wetenschappers gebruik van randomisatie. Randomisatie is belangrijk omdat andere bronnen van systematische variatie verwijderd worden, waardoor men zeker weet dat veranderingen veroorzaakt worden door de experimentele manipulatie. In het binnen-groep ontwerp (in-group design) zijn er nog twee belangrijke bronnen van systematische variatie. Dit zijn twee soorten effecten:

  1. Oefeneffecten (practice effect). Dit houdt in dat deelnemers zich de tweede keer anders kunnen gedragen bij de test, omdat ze bekend zijn geworden met de test.

  2. Vervelingseffecten (boredom effects). Dit houdt in dat deelnemers zich in de tweede test anders kunnen gedragen, omdat ze door de eerste test verveeld en / of moe zijn geworden.

Om deze effecten zo klein mogelijk te houden worden er bij verschillende deelnemers verschillende volgordes van conditie gegeven (counterbalancing). Dit houdt in dat de ene persoon eerst conditie 1 en dan 2 krijgt. De andere krijgt vervolgens eerst conditie 2 en daarna 1. Wie welke conditie het eerst krijgt wordt gerandomiseerd, dus willekeurig toegewezen.

In het tussen-groep ontwerp wordt er gerandomiseerd door de deelnemers willekeurig toe te wijzen aan de verschillende condities. Mensen verschillen immers in eigenschappen, die mogelijke confounders (verwarrende variabelen) zijn. Als de participanten at random verdeeld zijn over de condities, is deze variatie deel van de niet-systematische variatie. De groepen verschillen dan niet op een systematische manier van elkaar, anders dan in de experimentele manipulatie.

Wat wordt bedoeld met frequentie distributies?

Zodra een onderzoeker alle gegevens verzameld heeft, gaat hij of zij de data analyseren. Hierbij is het handig om een grafische weergave te maken van de gegevens. Dit kan met een frequentieverdeling (ook wel een histogram genoemd). In deze grafiek is te zien hoe vaak een bepaalde score voorkomt in je data. De grafiek is handig bij het uitrekenen van de proporties.

Een onderzoeker krijgt de ideale situatie wanneer er een verticale lijn door het midden van een histogram getrokken wordt. Beide helften zijn symmetrisch. Dit wordt een normale verdeling genoemd. Een normale verdeling is een belvormige curve. Dit betekent dat de meeste scores rond het midden van de verdeling zitten. Veel fenomenen zijn normaal verdeeld. Meestal staat de frequentie op de verticale as en de score op de horizontale as.

Wanneer een histogram niet symmetrisch is loopt het scheef. Als het histogram veel scores aan de linkerzijde heeft is het positief scheef en als het veel scores aan de rechterzijde heeft is het negatief scheef. Kurtosis geeft de mate aan waarin de scores zich in de staarten van de verdeling bevinden. Dit is te zien aan hoe puntig het histogram is. Bij een leptokurtic verdeling is de kurtosis positief en loopt het histogram in een puntige grafiek. Bij een platykurtic verdeling is de kurtosis negatief en is het histogram vlakker dan normaal.

Wat wordt bedoeld met de modus?

Men kan berekenen waar het centrum van de frequentie verdeling ligt (centrale tendens). De simpelste methode hiervoor is via de modus: Dit is de score met de hoogste frequentie, dus de score die het vaakst voorkomt. Er kunnen meerdere scores zijn met een gelijke frequentie. Als er twee scores zijn die het meest voorkomen, is de verdeling bimodaal. Bij meer dan twee modes is de verdeling multimodaal.

Wat wordt bedoeld met de mediaan?

De tweede manier om het midden van de verdeling te berekenen is met de mediaan. De mediaan is middelste score wanneer je alle scores qua frequentie op volgorde van klein naar groot neer zet. De positie van de mediaan kan berekend worden met de formule: (n + 1) / 2. Als een onderzoeker 11 scores heeft, is de mediaan dus het zesde cijfer. Als een onderzoeker even aantal scores hebt, valt de mediaan tussen twee scores. Dan wordt de mediaan berekend door het gemiddelde van die twee scores te nemen. Extreme scores en een scheve verdeling hebben weinig invloed op de mediaan. De mediaan kan gebruikt worden met data op ordinaal, interval en ratio meetniveau. Voor nominale data is het niet te gebruiken, omdat deze data niet op volgorde van klein naar groot gezet kunnen worden.

Wat wordt bedoeld met het gemiddelde?

De derde manier om het midden van de verdeling te berekenen is met het gemiddelde. Het gemiddelde bereken je door alle scores op te tellen en te delen door het aantal participanten. In formulevorm:

x̅ = Σ (x / n)

x̅ = het gemiddelde
Σ = het somteken (sigma). Hiermee wordt het optellen van alle scores x genoemd. De x is de score van een deelnemer.
n = het aantal deelnemers, ook wel de steekproefgrootte genoemd.

Het gemiddelde kan beïnvloed worden door extreme scores en door een scheve verdeling. Ook is het alleen te gebruiken bij interval of ratio gegevens. Het voordeel van het gemiddelde boven de mediaan en modus is dat je bij het berekenen ervan alle scores meeneemt. Bij de mediaan en modus worden de meeste scores in de dataset genegeerd.

Hoe ziet de verspreiding van een distributie eruit?

Naast het midden van de verdeling, kan iemand ook geïnteresseerd zijn in de manier waarop de scores verspreid zijn. De range (reikwijdte) van de scores is de hoogste score min de laagste score. Omdat je alleen de hoogste en laagste score gebruikt om de range te berekenen, hebben extreme scores veel invloed. Om deze invloed te verminderen wordt de bovenste 25% en de onderste 25% weggehaald waardoor je de middelste 50% overhoudt. Dit wordt de interkwartielafstand genoemd. Kwartielen zijn de drie waardes die de verdeling in vier gelijke stukken verdelen. De mediaan van de data is het tweede kwartiel. Het eerste kwartiel is de mediaan van de laagste helft, het derde kwartiel is de mediaan van de bovenste helft.

Het nadeel van de range is dat de helft van de data niet gebruikt wordt. Als een onderzoeker ervoor kiest wel alle gegevens te gebruiken, kan hij of zij kijken hoe ver elke score verwijderd ligt van het midden van de verdeling. Deze afwijking of deviatie wordt berekend met: de score – het gemiddelde. De totale deviatie wordt berekend door alle deviaties op te tellen.

Omdat sommige scores boven het gemiddelde liggen, en andere onder het gemiddelde, komt de totale deviatie altijd uit op 0. Hierdoor worden de deviatiescores niet opgeteld. De waarden worden eerst gekwadrateerd en vervolgens opgeteld. Deze opgetelde kwadraten worden de kwadratensom of sum of squares (SS) genoemd. De negatieve waarden worden in het kwadraat positief. Dit houdt in dat de SS altijd groter is dan nul. SS kan ook precies nul zijn wanneer alle scores exact gelijk zijn.

Het probleem met deze kwadratensom is dat de grootte afhangt van het aantal scores dat opgeteld wordt. Hierdoor kunnen de kwadratensommen van verschillende steekproefgroottes niet met elkaar vergeleken worden. Daarom wordt er een gemiddelde spreidingsmaat gebruikt, die de variantie genoemd wordt. De variantie (s²) is de kwadratensom gedeeld door de steekproefgrootte – 1.

Het nadeel van de variantie is dat het een gekwadrateerde maat is. Meestal wordt daarom de wortel van de variantie gebruikt. Dit wordt de standaardafwijking (s) genoemd.

De kwadratensom, de variantie en de standaardafwijking zijn allemaal maten die aangeven hoe ver de data verspreid is rond het gemiddelde. Een grote standaardafwijking betekent een grote spreiding, waarbij er veel scores ver van het gemiddelde zitten, en bij een kleine standaardafwijking zitten alle scores ongeveer rond het gemiddelde. Bij een grote standaardafwijking wordt de verdeling platter, bij een kleine standaardafwijking is de verdeling puntiger. Dit kan lijken op een platykurtic of leptokurtic verdeling, terwijl dat niet zo is.

Op welke andere manier kan een frequentieverdeling gebruikt worden?

De frequentieverdelingen kunnen niet alleen gebruikt worden om te bekijken hoe vaak bepaalde scores daadwerkelijk voorkwamen, maar ook om een uitspraak te doen over hoe waarschijnlijk het is dat iets voorkomt. Als er 172 zelfmoorden waren, waarvan 36 personen tussen de 30 en 35, betekent dit een proportie van 36 / 172 = 0.21, ofwel 21 %. Met deze proporties kun je inschatten hoe groot de kans is dat een bepaalde score voorkomt. Kansen nemen een waarde aan tussen de 0 (er is geen kans dat het gebeurt) en de 1 (het gaat zeker gebeuren). Om deze kansen te berekenen, maak je gebruik van een kansverdeling. Het gebied onder een deel van de kansverdeling geeft aan hoe groot de kans is dat een bepaalde waarde wordt verkregen. Vaak wordt er bij de normaalverdeling gebruik gemaakt van een standaardverdeling (z-verdeling), waarbij het gemiddelde altijd 0 is en de standaardafwijking altijd 1. Alle data sets kunnen worden omgezet in zo’n standaardverdeling. Dit doe je door de scores te veranderen in z-scores. Dit kan door de score – het gemiddelde te doen, en vervolgens te delen door de standaardafwijking. Deze z-scores kunnen gebruikt worden om in de tabel van de standaard normaalverdeling de bijbehorende proporties op te zoeken. De proportie in de standaard normaalcurve is hetzelfde als de kans op die waarde. Een z-score van 2.6 betekent een score die 2.6 standaardafwijkingen boven het gemiddelde ligt. Een z-score van 2.6 correspondeert bijvoorbeeld met een proportie in de normaalcurve van 0.0044. Dat betekent dat er 0.44% kans is op deze waarde. Het betekent ook dat 99.56% van de curve onder deze waarde ligt, want de hele curve is 1 (100%).

De tabel met de standaard normaalverdeling kan ook gebruikt worden om de vraag te beantwoorden welke range de middelste 95% heeft. Omdat de normaalcurve symmetrisch is, betekent dit dat er 2.5% van de distributie aan beide kanten van het midden zit. Om erachter te komen welke z-score hoort bij de proportie 0.025, zoek je deze waarde in de tabel bij de kolom ‘smaller portion’. De bijbehorende z-score is 1.96. Omdat de verdeling symmetrisch is, is -1.96 de andere grens. De middelste 95% van de curve zit dus tussen de z-scores -1.96 en 1.96.

Op welke manier moet data gerapporteerd worden?

Nadat het onderzoek is afgerond, wordt er een rapport moeten geschreven met hierin de bevindingen en dat insturen naar een wetenschappelijk tijdschrift. Dit wordt ook wel een journal (wetenschappelijk tijdschrift) genoemd. Een wetenschappelijk tijdschrift is een verzameling van artikelen geschreven door onderzoekers gepubliceerd in wetenschappelijke journals. Deze artikelen beschrijven een nieuw onderzoek, publiceren een review van bestaande artikelen of beschrijven een nieuwe theorie.

Het is belangrijk dat een onderzoeker weet op welke manier een onderzoek inclusief gegevens gepresenteerd en gerapporteerd moet worden. Voor het rapporteren worden meestal de regels en richtlijnen van de American Psychological Association (APA) gevolgd. Het is altijd verstandig de specifieke richtlijnen van een bepaald journal te bekijken.

Wanneer data gerapporteerd wordt, is het belangrijk te bepalen of gebruik gemaakt gaat worden van tekst, een grafiek of een tabel. Een onderzoeker moet hierin subsequent zijn. APA biedt de volgende richtlijnen:

  • Kies een manier van presenteren die ervoor zorgt dat de data zo goed mogelijk begrepen wordt.
  • Wanneer je drie of minder getallen presenteert, doe dit dan in de vorm van een zin.
  • Wanneer je tussen de 4 en 20 getallen presenteert, gebruik dan een tabel.
  • Wanneer je meer dan 20 getallen presenteert, gebruik dan een grafiek. Dit is nuttiger dan een tabel.
Voor toegang tot deze pagina kan je inloggen

 

Voor volledige toegang tot deze pagina kan je inloggen

 

Inloggen (als je al bij JoHo bent aangesloten)

   Aansluiten   (voor online toegang tot alle webpagina's)

 

Hoe het werkt

 

Aanmelden bij JoHo

 

 

JoHo: crossroads via de bundel

  Chapters 

Teksten & Informatie

JoHo: paginawijzer

JoHo 'chapter 'pagina

 

Wat vind je op een JoHo 'chapter' pagina?

  •   JoHo chapters zijn tekstblokken en hoofdstukken rond een specifieke vraag of een deelonderwerp

Crossroad: volgen

  • Via een beperkt aantal geselecteerde webpagina's kan je verder reizen op de JoHo website

Crossroad: kiezen

  • Via alle aan het chapter verbonden webpagina's kan je verder lezen in een volgend hoofdstuk of tekstonderdeel.

Footprints: bewaren

  • Je kunt deze pagina bewaren in je persoonlijke lijsten zoals: je eigen paginabundel, je to-do-list, je checklist of bijvoorbeeld je meeneem(pack)lijst. Je vindt jouw persoonlijke  lijsten onderaan vrijwel elke webpagina of op je userpage
  • Dit is een service voor JoHo donateurs en abonnees.

Abonnement: nemen

  • Hier kun je naar de pagina om je aan te sluiten bij JoHo, JoHo te steunen en zelf en volledig gebruik te kunnen maken van alle teksten en tools.

Abonnement: checken

  • Hier vind je wat jouw status is als JoHo donateur of abonnee

Prints: maken

  • Dit is een service voor wie bij JoHo is aangesloten. Wil je een tekst overzichtelijk printen, gebruik dan deze knop.
JoHo: footprint achterlaten