Toetstechnische Begrippenlijst

Deze pagina is gebaseerd op de Toetstechnische Begrippenlijst (Thio, 1988) van Cito. Het boek Psychometrie in de praktijk bevat meer details en achtergronden.

 


A-parameter  (Eng. A-parameter)

De A-parameter is de parameter uit de item-responsetheorie die betrekking heeft op het discriminerend of onderscheidend vermogen van een item. Zie verder itemresponstheorie.

Terug naar het begin


A-waarde  (Eng. (Difficulty) index of distractor)

De A-waarde is de proportie kandidaten die, of het percentage kandidaten dat, bij een meerkeuzevraag de desbetreffende afleider als antwoord koos.

Terug naar het begin


AANVULVRAAG  (Eng. Completion item)

Een aanvulvraag is een open vraag waarbij de kandidaat een onvolledige zin, berekening of tekening moet afmaken.

Terug naar het begin


ABITURIENT  (Eng. Graduate, School leaver)

Een abituriŽnt is iemand die een bepaalde opleiding heeft voltooid. Dat wil zeggen iemand die het examen met goed gevolg heeft afgelegd en dus de opleiding verlaten heeft.

Terug naar het begin


ABSOLUTE FREQUENTIE  (Eng. Frequency)  

Zie: Frequentie.

Terug naar het begin


ABSOLUUT NORMEREN    (Eng. Criterion referencing)

Absoluut normeren is het volgens bepaalde regels omzetten van toetsscores in cijfers, waarbij de scores gewaardeerd worden door deze te vergelijken met eisen die aan de examenstof worden ontleend.
Zie verder: normeren.

Terug naar het begin


AFFECTIEVE ONDERWIJSDOELSTELLINGEN   (Eng. Affective educational objectives)

Affectieve onderwijsdoelstellingen zijn de categorie onderwijsdoelstellingen die gericht zijn op de emotionele vorming.
Zie verder: onderwijsdoelstellingen.

Terug naar het begin


AFLEIDER   (Eng. Distractor, Distracter)

Een afleider is een bij een meerkeuzevraag behorend fout antwoord of een antwoord dat niet het beste is.

Terug naar het begin


AFLEIDER-WAARDE   

Zie: a-waarde.

Terug naar het begin


AFRONDEN   (Eng. To round, To round up, To round down)

Afronden is het terugbrengen van het aantal cijfers achter de komma van een getal. De Citogroep hanteert de volgende, vrij algemeen geldende, regels.

Bij positieve getallen wordt het laatste cijfer van het afgeronde getal (te noemen: het relevante cijfer) als volgt bepaald:

Voorbeeld:

Alle getallen willen we afronden tot gehele getallen, dus geen enkel cijfer achter de komma: het getal 6,7 wordt 7; -6,7 wordt -7; 7,5 wordt 8; -7,5 wordt -8; 6,49 wordt 6; -6,49 wordt -6, enz.

Terug naar het begin


AFTREKPUNTEN     (Eng. Deduction points)

Aftrekpunten zijn de punten die volgens het scoringsvoorschrift afgetrokken moeten worden voor een bepaald soort fouten, omissies en/of tekortkomingen.

Terug naar het begin


ALPHA ( )   (Eng. Coefficient Alpha, Cronbach's Alpha)

Alpha is een maat voor de betrouwbaarheid in casu de interne consistentie van een toets. De formule voor het berekenen van de coŽfficiŽnt alpha is:

           

waarin:

= (coŽfficiŽnt) alpha

k = aantal opgaven van de toets

= variantie van de scores per opgave (i   = 1, 2, 3, ..., k)

= variantie van de toetsscores

De bij dichotoom gescoorde toetsen veel gebruikte KR-20 is wiskundig identiek met .
Zie verder: betrouwbaarheid.

Terug naar het begin


ALPHA-REST

Alpha-rest is de betrouwbaarheid van een toets waarbij ťťn item buiten beschouwing wordt gelaten.

Terug naar het begin


ALTERNATIEF  (Eng. Alternative answer, Alternative choice, Option)

Een alternatief is elk van de antwoordmogelijkheden bij een meerkeuzevraag.

Terug naar het begin


ANKER  (Eng. Anchor)

Een anker is een item dat in twee of meer toetsen wordt opgenomen om verschillen in met name de moeilijkheidsgraad te kunnen constateren tussen de betreffende toetsen, c.q. tussen de prestaties van degenen die de desbetreffende toetsen hebben gemaakt.
Zie verder: equivaleren en normhandhaving.

Terug naar het begin


ANTWOORDBLAD  (Eng. Answer sheet)

Een antwoordblad is een formulier waarop de kandidaten hun antwoorden op de hun voorgelegde opgaven geven.

Terug naar het begin


ANTWOORDFORMULIER      

Zie: antwoordblad.

Terug naar het begin


ANTWOORDMODEL  (Eng. (Set of) Model answers, Scoring system)

Een antwoordmodel is een opsomming van goede, soms van minder goede en foute antwoorden bij open vragen, bedoeld als richtlijn voor de beoordelaar.
Het antwoordmodel is een onderdeel van het correctievoorschrift. Zie verder: beoordelingsschema.

Terug naar het begin


ANTWOORDRESTRICTIES     (Eng. Response restrictions)

Antwoordrestricties zijn richtlijnen die toegevoegd kunnen worden aan de vraagstelling met betrekking tot:
- de structuur (lengte, indeling, enz.) en inhoud van het antwoord, en
- de criteria  waarop het antwoord beoordeeld kan worden.

Terug naar het begin


B-PARAMETER     (Eng. B-parameter)

De b-parameter is de parameter uit de itemresponstheorie die betrekking heeft op de moeilijkheidsgraad van een item. Zie verder: itemresponstheorie.

Terug naar het begin


BEGRIPSVALIDITEIT     (Eng. Construct validity)

Begripsvaliditeit is de eigenschap die een toets heeft als kan worden aangetoond dat de toets het door de constructeur beoogde kenmerk van de leerling (onderliggende trek, vaardigheid) meet.

Terug naar het begin


BEOORDELAARSBETROUWBAARHEID   (Eng. Rater reliability)

De beoordelaarsbetrouwbaarheid is een maat die aangeeft in hoeverre de beoordelingen van de beoordelaars identiek zijn na correctie voor mildheid of strengheid van de beoordelaars.

De betrouwbaarheid van een meting wordt bepaald door de mate waarin de meting ongevoelig is voor verstorende factoren (zie onder: betrouwbaarheid). Bij het beoordelen van bijvoorbeeld werkstukken, praktijkopdrachten en open vragen is het standaardiseren van de antwoordmogelijkheden meestal in maar beperkte mate mogelijk. Wanneer dan een of meer beoordelaars bij de waardering van de geleverde prestaties worden ingeschakeld, wordt daarmee ook onbedoelde variantie bij de meting geÔntroduceerd. Deze onbedoelde variantie kan bijvoorbeeld voortkomen uit: inconsistentie binnen een beoordelaar zelf; gebrek aan overeenstemming tussen beoordelaars op grond van systematische verschillen tussen de beoordelaars (mildheid of strengheid); gebrek aan overeenstemming tussen de beoordelaars, afgezien van systematische verschillen.

De mate waarin deze variantiebronnen de meting niet verstoren, wordt weergegeven door respectievelijk de:

De formule voor het berekenen van de beoordelaarsbetrouwbaarheid luidt als volgt:

           

waarin:

= beoordelaarsbetrouwbaarheid

= variantiecomponent kandidaten

=  variantiecomponent kandidaten * beoordelaars (residu)

  b  = aantal beoordelaars

De variantiecomponenten kunnen geschat worden via een variantie-analyse.
Zie verder: beoordelaarsovereenstemming, intrabeoordelaarsovereenstemming en beoordelaarseffecten.

Terug naar het begin


BEOORDELAARSEFFECTEN     (Eng. Rater effects)

Beoordelaarseffecten zijn onbedoelde effecten op de score van de kandidaat, voortkomend uit de activiteit van het beoordelen. De beoordelaar is zich meestal niet bewust van deze effecten.

We onderscheiden de volgende beoordelaarseffecten:

 1. contaminatie-effect
 2. halo-effect
 3. normverschuiving
 4. sequentie-effect
 5. signifisch effect

ad a  (contaminatie-effect)
De beoordelaar kent aan de beoordeling van het werk nog andere dan de bedoelde functie(s) toe.

Voorbeelden:

ad b  (halo-effect)
De storende 'uitstraling' van niet ter beoordeling staande kwaliteiten van een kandidaat op de beoordeling van een geleverde prestatie.

Voorbeelden:

ad c  (normverschuiving)
De neiging van een beoordelaar zich in de strengheid van zijn beoordelingen aan te passen aan het gemiddelde prestatieniveau van een groep kandidaten.
Onder het begrip normverschuiving wordt ook wel verstaan het beperkt gebruik maken van de cijferschaal; sommige leraren geven overwegend hoge cijfers, andere lage en weer andere vijven en zessen.

Voorbeeld:

ad d  (sequentie-effect)
De nawerking van voorafgaande beoordelingen van het werk van andere leerlingen bij het beoordelen van een leerlingprestatie.

Voorbeeld:

ad e  (signifisch effect)
De effecten die optreden indien de beoordelingstaak verschillend wordt opgevat door twee of meer beoordelaars.

Voorbeeld:

Terug naar het begin


BEOORDELAARSINSTRUCTIES    (Eng. General scoring instructions)

Beoordelaarsinstructies zijn algemene richtlijnen, die beoordelaars gegeven worden, over de wijze waarop de prestaties van de leerlingen beoordeeld moeten worden. Beoordelaarsinstructies moeten het optreden van beoordelaarseffecten tegengaan. De beoordelaarsinstructies zijn een onderdeel van het correctievoorschrift.

De beoordelaarsinstructies hebben betrekking op zaken als:

Terug naar het begin


BEOORDELAARSOVEREENSTEMMING  (Eng. Rater agreement)

Beoordelaarsovereenstemming is een maat die aangeeft in hoeverre de beoordelingen van de beoordelaars (werkelijk) identiek zijn.

De formule voor het berekenen van de beoordelaarsovereenstemming luidt als volgt:

           

waarin:

= beoordelaarsovereenstemming

= variantiecomponent kandidaten

= variantiecomponent beoordelaars

=  variantiecomponent kandidaten * beoordelaars (residu)

  b  = aantal beoordelaars

De variantiecomponenten kunnen geschat worden via een variantie-analyse.
Zie verder: beoordelaarsbetrouwbaarheid en intrabeoordelaarsovereenstemming.

Terug naar het begin


BEOORDELEN   (Eng. To rate, To judge)

Beoordelen is het toekennen van een waardering aan een geleverde prestatie. Deze waardering kan uitgedrukt worden in een cijfer of in een verbale kwalificatie. Men kan bij de beoordeling al of niet gebruik maken van een meetinstrument.

Terug naar het begin


BEOORDELINGSCRITERIUM    (Eng. Standard)

Een beoordelingscriterium is een kenmerk waarop de prestaties van een leerling beoordeeld worden. Onder beoordelingscriterium kan men tevens een maatstaf verstaan, dat wil zeggen een indicatie van wat leerlingen gezien hun kenmerken zouden moeten kunnen of kennen, bijvoorbeeld: x typaanslagen per minuut.
Zie verder: antwoordmodel, normen

.
Terug naar het begin


BEOORDELINGSINSTRUMENT

De term beoordelingsinstrument komt voor in twee verschillende betekenissen.

Terug naar het begin


BEOORDELINGSMETHODE

Een beoordelingsmethode is een systematische wijze van waarderen van gedrag. Voorbeelden van beoordelingsmethoden zijn, leerverslag, observatie, het afnemen van een toets.

Terug naar het begin


BEOORDELINGSSCHAAL  (Eng. Rating scale)

Een beoordelingsschaal is een beoordelingsinstrument waarmee op een glijdende schaal kan worden aangegeven in welke mate kennis, vaardigheden of houdingen bij een leerling aanwezig zijn. De glijdende schaal bestaat uit meerdere punten die een bepaalde positie of rangorde aangeven, bijvoorbeeld lopend van 'uitstekend' naar 'zwak', of van 'vrijwel altijd' naar 'zelden of nooit'.

Terug naar het begin


BEOORDELINGSSCHEMA    (Eng. Global rating instructions, Scoring system)

Een beoordelingsschema is een schema dat dient als richtlijn bij de beoordeling van antwoorden op opgaven waarbij geen eenduidig antwoordmodel op te stellen is. In het beoordelingsschema worden criteria vermeld aan de hand waarvan het antwoord/de antwoorden beoordeeld dient/dienen te worden. Deze criteria kunnen zowel op de inhoud als op de structuur van het antwoord betrekking hebben.

Terug naar het begin


BEOORDELINGSSYSTEEM

Een beoordelingssysteem is een samenhangend geheel van beoordelingsmethoden en/of beoordelingsprocedures, dat tot een of meer beslissingen over voortgang en diplomering leidt.

Terug naar het begin


BESLISSINGSREGELS    (Eng. Decsion rules)

Beslissingsregels zijn afspraken over de wijze waarop beslissingen genomen moeten worden.

Bij examens waarin elk vak afzonderlijk beoordeeld wordt, kunnen de volgende beslissingsregels gehanteerd worden:

Terug naar het begin


BETROUWBAARHEID    (Eng. Reliability)

De betrouwbaarheid is de mate waarin men staat kan maken op meetresultaten, dat wil zeggen de mate waarin de scores consistent, nauwkeurig en reproduceerbaar zijn, kortom vrij van meetfouten.

Bij een betrouwbare meting zal het resultaat dus niet beÔnvloed mogen zijn door storende factoren met betrekking tot de toets, kandidaat en beoordelaar zoals het tijdstip van de toetsafname, de specifieke vormgeving van de toets, pech of geluk met de opgaven. De mate waarin een meting ongevoelig is voor bepaalde, verstorende factoren, kan worden geschat door berekening van een betrouwbaarheidscoŽfficiŽnt. De waarde van een betrouwbaarheidscoŽfficiŽnt ligt tussen 0 en 1.

De coŽfficiŽnt kan op verschillende manieren worden vastgesteld; elke manier richt zich op bepaalde storende factoren:

 1. via de test-hertestmethode;
 2. via de parallelle-vormen-methode;
 3. via een generaliseerbaarheidscoŽfficiŽnt;
 4. via een berekening van de interne consistentie (KR-20-formule voor dichotome scoring of berekening van alpha ( ) wanneer de scoring polytoom is).

De berekening van de interne consistentie wordt in de praktijk het meest gebruikt omdat deze uitgevoerd kan worden op basis van ťťn toetsafname. De interne consistentie geeft vooral aan in hoeverre van item tot item hetzelfde wordt gemeten. Zij wordt gebruikt om te schatten in hoeverre iemand dezelfde score zou behalen bij het maken van een denkbeeldige, andere vergelijkbare toets over dezelfde leerstof.
Zie verder: generaliseerbaarheidscoŽfficiŽnt.

Terug naar het begin


BETROUWBAARHEIDSCOEFFICIENT   Zie onder: betrouwbaarheid.

Terug naar het begin


BETROUWBAARHEIDSINTERVAL    (Eng. Confidence interval)

Een betrouwbaarheidsinterval is een interval, bepaald met behulp van steekproefgegevens, dat met een zekere kans de populatieparameter omvat.

Indien bijvoorbeeld bij een representatieve steekproef van 100 kandidaten de p-waarde van een item 0.60 is, dan ligt de werkelijke p-waarde met een kans van 95% tussen de waarden 0.50 en 0.70. Ook bij een score kan men zich een betrouwbaarheidsinterval indenken. Dat interval is dan het scorebereik om de behaalde score heen waarbinnen zich met een kans van 95% de ware score bevindt. De grootte van het betrouwbaarheidsinterval hangt af van de betrouwbaarheid van de toets.
Zie ook: ware score en standaardmeetfout.

Terug naar het begin


BETWEEN EXAMINER AGREEMENT   

Zie: interbeoordelaarsovereenstemming.

Terug naar het begin


BIRNBAUM MODEL   

Zie onder: itemresponstheorie.

Terug naar het begin


BONUSPUNTEN   (Eng. Additional points)

Bonuspunten zijn extra punten die aan kandidaten kunnen of moeten worden toegekend.

Bij openvraag-toetsen worden vaak op voorhand 10 scorepunten in de vorm van bonuspunten gegeven die de kandidaat ťťn cijferpunt opleveren zonder dat hier een prestatie tegenover staat.
Zie verder: scoringsvoorschrift.

Terug naar het begin


C-PARAMETER  (Eng. C-parameter)

De C-parameter is de parameter uit de itemresponstheorie die betrekking heeft op het raden of gissen en daarom wel gisparameter genoemd wordt. Zie verder: itemresponstheorie.

Terug naar het begin


C-SCHAAL (Eng. C-scale)

Een C-schaal is een 11-puntsschaal met getalwaarden (C-waarden), lopende van 0 t/m 10, om de scores behaald door een bepaalde populatie in 11 groepen te verdelen en wel zodanig, dat de 1% laagst scorenden de C-waarde 0 krijgen en de 1% hoogst scorenden de waarde 10. De tussenliggende C-waarden corresponderen oplopend met de percentages:

            Slechtste         Gemiddelde            Beste
            Prestaties        Prestaties       Prestaties

C-waarden    0   1   2    3   4   5   6   7   8    9   10

Percentages  1   3   7   12  17  20  17  12   7    3    1

Cumulatieve  1   4  11   23  40  60  77  89  96   99  100
percentages

De C-schaal kan bij het ijken worden gebruikt.

Terug naar het begin


CASUSTOETS   (Eng. Diagnostic problem solving test)

Een casustoets is een toets waaraan ťťn of meer casussen ten grondslag liggen waarover vragen worden gesteld. Een casus, ook wel case of geval genoemd, is een op de praktijk gebaseerd probleem waaraan de vragen gekoppeld zijn, al dan niet uitgebouwd met nieuwe informatie per vraag.
Zie verder: praktijktoets.

Terug naar het begin


CENTIEL  (Eng. Centile)  

Zie: percentiel.

Terug naar het begin


CENTRAAL EXAMEN  (Eng. National examination, Nationwide examination)

Het centraal examen is dat gedeelte van het examen dat als zodanig in het examenprogramma is aangeduid. Het wordt gekenmerkt door landelijke standaardisering van opgaven (gelijke of gelijkwaardige), afnamecondities en beoordeling.

Terug naar het begin


CERTIFICAAT   (Eng. Part certificate)

Een certificaat is een document waarin is vermeld dat een leerling het examen in een exameneenheid (vak, leerstofgebied, onderdeel) met voldoende resultaat heeft afgelegd. Een certificaat is een deeldiploma.

Terug naar het begin


CERTIFICAATEENHEID  (Eng. Credit unit)

Een certificaateenheid is een samenhangend en afgerond geheel van onderwijsdoelstellingen waarvoor een certificaat wordt uitgereikt, en dat als zodanig in het examenprogramma voorkomt. De betreffende onderwijsdoelstellingen kunnen ontleend zijn aan een of meer vakgebieden.

Terug naar het begin


CESUUR   (Eng. Cut-off score)

De cesuur is de grens tussen de hoogste toetsscore waaraan een onvoldoende, en de laagste toetsscore waaraan een voldoende wordt toegekend.
Zie verder: normeren.

Terug naar het begin


CHECKLIST

Observatie-instrument waarmee wordt aangegeven of een leerling bepaalde kennis, vaardigheden of houdingen bezit, door middel van bijvoorbeeld een ja/nee-scoring.

Terug naar het begin


CIJFERS   (Eng. Marks, Grades)

Cijfers zijn getallen --al dan niet verkregen door middel van normeren (1)-- die een bepaalde waardering uitdrukken voor een geleverde prestatie.
Volgens de in het Nederlandse onderwijs gangbare cijferschaal is het hoogste cijfer dat behaald kan worden 10,0 en het laagste 1,0.

Terug naar het begin


CIVIEL EFFECT

Het civiel effect is het recht verbonden aan het bezit van een diploma of getuigschrift.

Terug naar het begin


CLASSIFICATIESCHEMA    (Eng. Taxonomy)

Een classificatieschema is een ordening van onderwijsdoelstellingen volgens een bepaald indelingsprincipe.

Het classificatieschema kan bijvoorbeeld een ordening zijn volgens vaardigheidsniveaus of denkoperaties. Als er sprake is van een hiŽrarchische ordening spreekt men van taxonomie.

Terug naar het begin


CLASSIFICATIEVRAAG    (Eng. Classification item)

De classificatievraag is een vorm van een combinatievraag. Een van de reeksen te combineren elementen bestaat hier uit algemene kenmerken of klassen.

Een voorbeeld:

Der Text nennt in Zeile 76-78 drei Funktionen des Waldes:
    a    wirtschaftliche Nutzfunktion
    b    Ųkologische Schutzfunktion
    c    individuelle Erholungsfunktion

Zu welcher Funktion gehŲren folgende Zitate .... (volgt een rij van 11 citaten).

Terug naar het begin


CLUSTERVRAAG   (Eng. Multiple True-False item)

Een clustervraag bestaat uit een aantal waar/onwaarvragen die op hetzelfde probleem of op dezelfde gegevens betrekking hebben.

Door een gewone meerkeuzevraag per alternatief te laten beantwoorden en scoren verandert men deze in een clustervraag.

Een voorbeeld:

Als je een magneet wilt hebben, dan kun je die vaak uit een toestel halen. Kun je uit de hieronder genoemde toestellen een permanente magneet halen, ja of nee?

    dynamo           ja/nee
    batterij         ja/nee
    huisbel          ja/nee
    luidspreker      ja/nee
    koolmicrofoon    ja/nee
    stroomschakelaar ja/nee
    kompas           ja/nee

Terug naar het begin


COEFFICIENT ALPHA ( ) ) ) ) )   Zie alpha ( ).

Terug naar het begin


COGNITIEVE ONDERWIJSDOELSTELLINGEN    (Eng. Cognitive educational objectives)

Cognitieve onderwijsdoelstellingen zijn de categorie onderwijsdoelstellingen die gericht zijn op de ontwikkeling van het verstandelijk functioneren, bijvoorbeeld via specificatie van de denkoperatie of van de cognitieve structuren.
Zie verder: onderwijsdoelstelling.

Terug naar het begin


COGNITIEVE STRUCTUUR   (Eng. Cognitive structure)

Een cognitieve structuur is de inhoudelijke structuur van iemands kennis, dat wil zeggen van zijn 'mentale modellen van de werkelijkheid'. Kennis wordt hier genomen in de ruime betekenis. Zij omvat het 'weten dat', ook wel declaratieve (soms: conceptuele) kennis genoemd (het statische aspect), en het 'weten hoe', ook wel procedurele kennis genoemd (het procesmatige aspect).

Terug naar het begin


COMBINATIEVRAAG   (Eng. Matching item)

Een combinatievraag is een gesloten vraag waarbij de kandidaat de juiste combinatie(s) moet maken uit twee gegeven groepen elementen.

Terug naar het begin


COMMON SENSE VRAGEN

Common sense vragen zijn vragen die de doelgroep door logisch redeneren of algemeen aanwezige kennis kan beantwoorden en die als zodanig geen specifieke kennis meten.

Terug naar het begin


CONSTRUCT-VALIDITEIT   

Zie: begripsvaliditeit.

Terug naar het begin


CONTAMINATIE-EFFECT   Zie onder: beoordelaarseffecten.

Terug naar het begin


CONTEXT-AFHANKELIJKE VRAAG    (Eng. Context dependent item)

Een context- afhankelijke vraag is een vraag die beantwoord moet worden met behulp van gegevens (een plaatje, grafiek, tabel of tekst) die niet in de vraagformulering zijn opgenomen.

Terug naar het begin


CORRECTIE VOOR ATTENUATIE    (Eng. Correction for attenuation)

De correctie voor attenuatie is een correctie van een correlatiecoŽfficiŽnt voor onbetrouwbaarheid van de gemeten variabelen. Door deze correctie aan te brengen is het mogelijk na te gaan hoe groot de correlatie tussen twee variabelen zou zijn als het mogelijk was beide variabelen perfect betrouwbaar te meten.

De formule voor het berekenen van de correctie voor attenuatie is:

               

waarin:

r'1,2 = gecorrigeerde correlatiecoŽfficiŽnt tussen de scores op toets 1 en de scores op toets 2

r1  = betrouwbaarheidscoŽfficiŽnt toets 1

r2  = betrouwbaarheidscoŽfficiŽnt toets 2

r1,2 = ongecorrigeerde correlatiecoŽfficiŽnt tussen scores toets 1 en scores toets 2.

Terug naar het begin


CORRECTIE VOOR RADEN   (Eng. Correction for chance success, Correction for guessing)

Een correctie voor raden is een correctie van de individuele toetsscores om bij een meerkeuzetoets de invloed van raden zoveel mogelijk uit te schakelen.

Een formule voor het berekenen van de voor raden gecorrigeerde score bij meerkeuzetoetsen is:

      

waarin:

X'  = voor raden gecorrigeerde toetsscore

X  = toetsscore (aantal items goed)

F  = aantal items fout

a  = aantal alternatieven per item

Met behulp van deze formule wordt op grond van het aantal foute antwoorden geschat hoeveel goede antwoorden het gevolg zijn van raden.

In het algemeen wordt in de onderwijskundige literatuur aangeraden geen raadcorrectie toe te passen, maar de kandidaten te instrueren geen vragen over te slaan.
Zie ook: c-parameter.

Terug naar het begin


CORRECTIEMODEL   

Zie: correctievoorschrift.

Terug naar het begin


CORRECTIESLEUTEL  (Eng. Scoring key)

Een correctiesleutel is een lijst van de goed te rekenen antwoorden bij de items van een objectieve toets.

Terug naar het begin


CORRECTIEVOORSCHRIFT     (Eng. Scoring instructions, Scoring system)

Een correctievoorschrift is een bij een open-vraagtoets behorende lijst met richtlijnen voor beoordelaars. Het correctievoorschrift bestaat uit een antwoordmodel, een scoringsvoorschrift en een beoordelaarsinstructie.

Terug naar het begin


CORRELATIE   (Eng. Correlation)

Een correlatie is de samenhang tussen twee variabelen. De mate van samenhang wordt uitgedrukt in een correlatiecoŽfficiŽnt ( r ), een getal tussen -1 en +1.

De meest bekende correlatiecoŽfficiŽnt is de produktmomentcorrelatie (pmc), ook wel de Pearson-correlatie genoemd. De pmc geeft de mate aan waarin twee variabelen, bijvoorbeeld twee (gepaarde) reeksen toetsscores, of twee reeksen itemscores en toetsscores, rechtlijnig met elkaar samenhangen.

De formule voor het berekenen van de pmc is:

      

waarin:

rxy  = pmc-coŽfficiŽnt (of: correlatiecoŽfficiŽnt))

Xi  = score op variabele X van persoon i

Yi  = score op variabele Y van persoon i

=  gemiddelde (toets)score op variabele X

 =  gemiddelde (toets)score op variabele Y

  Sx = standaarddeviatie (toets)scores op variabele X

Sy = standaarddeviatie (toets)scores op variabele Y

  N  = aantal gepaarde waarnemingen

De in toets- en itemanalyses voorkomende rit-, rir- en rar-waarden zijn pmc's.

Terug naar het begin


CORRELATIECOňFFICIňNT     

Zie onder: correlatie.

Terug naar het begin


CREDIT-PUNTEN  (Eng. Credit points)      Zie: studiepunten.

Terug naar het begin


CRITERIUMVARIABELE   (Eng. Criterion variable)

Een criteriumvariabele is een waarneembare gedragsvorm die men met behulp van een meetinstrument wil voorspellen (bijvoorbeeld studiesucces, door middel van een toets voor studievaardigheid).
Zie verder: predictieve validiteit.

Terug naar het begin


CUMULATIEF PERCENTAGE (CP)    (Eng. Cumulative percentage)

Een cumulatief percentage is een bij een toetsscore behorend getal dat aangeeft hoeveel procent van de kandidaten de genoemde toetsscore of een lagere heeft behaald.
Zie verder: frequentietabel.

Terug naar het begin


CUMULATIEVE FREQUENTIE (CF)    (Eng. Cumulative frequency)

De cumulatieve frequentie is een bij een toetsscore behorend getal dat aangeeft hoeveel kandidaten de genoemde toetsscore of een lagere hebben behaald.
Zie verder: frequentietabel.

Terug naar het begin


CURRICULUM   

Zie: leerplan.

Terug naar het begin


CURRICULUMEVALUATIE   (Eng. Curriculum evaluation)

Het verzamelen en interpreteren van gegevens over de uitvoering en effecten van een leerplan, met het oog op het nemen van onderwijskundige beslissingen aangaande het leerplan.

Terug naar het begin


DECIEL-SCHAAL   (Eng. Decile scale)

Een deciel-schaal is een 10-puntsschaal met getalwaarden (deciele rangscores) lopende van 1 t/m 10, om de scores behaald door een bepaalde populatie in 10 even grote groepen te verdelen. Algemener dan de deciel-schaal is de schaal met percentielscores.

                        slechtste                  gemiddelde                           beste
                        prestaties                 prestaties                       prestaties
deciele
rangscore
       1   2   3   4    5   6   7   8   9   10

percentage     10  10  10   10  10  10  10  10  10   10

cumulatief
percentage
     10  20  30  40  50  60   70  80  90  100

De deciel-schaal kan bij het ijken worden gebruikt.

Terug naar het begin


DEELTOETS   

Zie: subtoets.

Terug naar het begin


DEELVRAAG    (Eng. Subquestion)

Een deelvraag is een zelfstandig onderdeel van een meervoudige vraag.

Terug naar het begin


DIAGNOSTISCHE TOETS    (Eng. Diagnostic test)

Een diagnostische toets is een toets die bedoeld is om de oorzaak van specifieke leerproblemen te achterhalen.

Terug naar het begin


DICHOTOME SCORING   (Eng. Dichotomic scoring)

Dichotome scoring is een wijze van scoren waarbij slechts twee waarderingen van het antwoord worden onderscheiden: goed of fout. Het is gebruikelijk meerkeuzevragen dichotoom te scoren.

Terug naar het begin


DIPLOMA    (Eng. Certificate)

Een diploma is een document waarin is vermeld dat iemand in de door het examenprogramma voorgeschreven vakken c.q. onderdelen of exameneenheden examen heeft afgelegd en daarbij voor al die vakken samen een voldoende resultaat heeft behaald.

Terug naar het begin


DISCRIMINATIE-INDEX

De discriminatie-index van een item geeft de mate aan waarin op grond van de score op dat item hoog- en laagscorende leerlingen (op de hele toets) onderscheiden kunnen worden. In het algemeen wordt de discriminatie-index uitgedrukt in de correlatie tussen de scores op het item en de scores op de hele toets.
Zie verder Rar- en Rir-waarde.

Terug naar het begin


DOMEINGERICHTE INTERPRETATIE    (Eng. Domain referenced (test) interpretation)

Domeingerichte interpretatie is het betekenis geven aan een toetsresultaat in termen van kennis en vaardigheden die zijn gedefinieerd bij een bepaald leerstofdomein. Het toetsresultaat wordt gebruikt als schatter van de beheersing van het leerstofdomein i.c. als schatter van het percentage items uit het totale leerstofdomein dat goed zou worden beantwoord.

Terug naar het begin


EFFECTIEF GEWICHT   

Zie onder: gewicht.

Terug naar het begin


EINDEVALUATIE   (Eng. Summative evaluation)

Vertaling van de term summatieve evaluatie, d.i. resultaatbeoordeling van leereffecten over een min of meer afgerond stuk leerstof c.q. een bepaalde onderwijsperiode.

Terug naar het begin


EINDTERMEN   (Eng. Objectives)

Eindtermen beschrijven in globale zin het geheel van kennis, vaardigheden en attituden waarover een afgestudeerde bij de afsluiting van zijn opleiding dient te beschikken.
Zie verder: onderwijsdoelstellingen.

Terug naar het begin


EMPIRISCHE ITEMRESPONSE CURVE

Curve die het verband aangeeft tussen de moeilijkheidsgraad van het item en de behaalde totaalscores op een toets.

Terug naar het begin


ENKELVOUDIGE VRAAG   (Eng. Single response question)

Een enkelvoudige vraag is een vraag die, in tegenstelling tot een meervoudige vraag, niet gesplitst is in deelvragen en die ťťn enkel antwoord vereist.

Terug naar het begin 


EQUATING    Zie: equivaleren.

Terug naar het begin


EQUIVALEREN   (Eng. To equate, Equating)

Equivaleren is een procedure om scores van verschillende toetsen op dezelfde schaal te brengen.

Twee bekende equivaleermethoden zijn de equipercentielmethode en de lineaire methode.
Zie verder: normhandhaving, horizontaal equivaleren, verticaal equivaleren.
 

Terug naar het begin


ESSAY-TYPE QUESTION   

Zie: opstelvraag.

Terug naar het begin


EVALUATIE   (Eng. Evaluation)

Evaluatie is een systematische activiteit voor het verkrijgen van zo objectief mogelijke informatie, op grond waarvan uitspraken over de waarde van het evaluatie-object (een toets, een leerling, een leerplan of gedeelte daarvan, een onderwijsmethode, enz.) worden gedaan en waarover eventueel beslissingen kunnen worden genomen.

Terug naar het begin


EXAMEN   (Eng. Exam, Examination)

Een examen is een door een daartoe bevoegde instantie ingesteld onderzoek naar kennis, inzicht, houding en vaardigheden van een kandidaat, die over een samenhangend geheel van leergebieden, aan de hand van hem verstrekte opdrachten een aantal prestaties moet leveren, op grond waarvan hem met inachtneming van bepaalde prestatie-eisen en beslissingsregels een bewijs kan worden uitgereikt waaraan bepaalde rechten of bevoegdheden kunnen worden ontleend.

In de literatuur komt men uiteenlopende functies tegen die een examen kan vervullen, zoals de selectie- en allocatiefunctie, de prognostische functie, de kwalificatiefunctie, de operationalisatiefunctie en andere bedoelde of onbedoelde effecten die een examen kan hebben.

Bij de selectie- en allocatiefunctie gaat het om het onderscheiden van kandidaten teneinde deze te kunnen toelaten of afwijzen voor onderwijsprogramma's of posities in de maatschappij. Bij de prognostische functie wordt de examenuitslag beschouwd als een voorspelling van de mate waarin de kandidaat succesvol is in een volgende onderwijs- of beroepsfase. Bij een examen met een kwalificatiefunctie wordt bepaald of de kandidaat aan bepaalde minimum-eisen voldoet, op grond waarvan bepaalde rechten worden toegekend, bijvoorbeeld op beroepsuitoefening of doorstroming. Met de operationalisatiefunctie bedoelt men de rol die een examen speelt in het concretiseren van doelstellingen die het onderwijs nastreeft of dient na te streven.

Terug naar het begin


EXAMENBESLUIT   (Eng. Examination statute)

Een examenbesluit is een Koninklijk Besluit waarin de overheid aanwijzingen geeft voor de inrichting en regeling van het examen voor een bepaald onderwijstype. Het kan onder meer bevatten: de indeling van het examen in centraal examen en schoolbeoordeling, aanwijzingen voor de instelling van de noodzakelijke examencommissies, de gang van zaken bij het centraal examen en de taak van gecommitteerden. In het algemeen bevat het examenbesluit aanwijzingen voor de structurele opbouw van het examenprogramma. Het examenprogramma zelf heeft in het algemeen de status van ministeriŽle beschikking. De looptijd van het examenprogramma is in het algemeen korter dan die van het Besluit. Veelal wordt op schoolniveau verdere uitwerking gegeven aan het examenbesluit, soms onder de naam examenreglement.

Terug naar het begin


EXAMENONDERDEEL   

Zie: certificaateenheid.

Terug naar het begin


EXAMENPROGRAMMA   (Eng. Syllabus, Exam requirements)

Een examenprogramma is een zo volledig mogelijke beschrijving van de eisen waaraan examenkandidaten moeten voldoen.
Zie verder: examenbesluit.

Terug naar het begin


EXAMENREGLEMENT   (Eng. Examination rules)

Een examenreglement is een document waarin de school de gang van zaken bij het examen regelt. Het bevat onder meer de organisatie, gedragsregels voor kandidaat en examinator, herkansingsregeling, aanwijzingen voor gedrag bij ziekte en fraude, aanwijzingen voor de regeling van de schoolbeoordeling zoals het examenrooster, wijze van afname en het eventuele wegingssysteem van de cijfers.
Zie verder: examenbesluit.

Terug naar het begin


EXTRA-BEPALING-VRAAG    (Eng. Supplementation item)

De extra-bepaling-vraag bestaat uit een uitspraak en ťťn of meer bepalingen. De leerling moet aangeven of de uitspraak op zichzelf, of alleen in combinatie met ťťn of meer van de bepalingen waar is.

Een voorbeeld:

Uitspraak: Bij de reactie van ijzer met chloor ontstaat alleen FeCl2

Bepalingen:
    1 als ijzer en chloor in massaverhouding 56:35,5 reageren
    2 als er chloor in overmaat is.

A  goed

B  goed+1

C  goed+2

D  fout

Terug naar het begin


FACE-VALIDITY       

Zie: indruksvaliditeit.

Terug naar het begin


FORMATIEVE TOETS    (Eng. Formative test)

Een formatieve toets is een toets die tot doel heeft een leerweg of een leerplan bij te stellen.

Terug naar het begin


FORMELE EVALUATIE   (Eng. Formal evaluation)

Proces van verzamelen en interpreteren van (leerling) gegevens, dat volgens een aantal van te voren vastgestelde regels en met behulp van gestandaardiseerde evaluatie-instrumenten verloopt.

Terug naar het begin


FOUTENANALYSE   (Eng. Error analysis)

Onder een foutenanalyse wordt verstaan het systematisch inventariseren van de door leerlingen gemaakte fouten met het doel leerlingprestaties (individu of groep) en instructiemethoden te verbeteren en opgaven en toetsmatrijzen bij te stellen.

Terug naar het begin


FRACTIE   

Zie: proportie.

Terug naar het begin


FREQUENTIE (F)    (Eng. Frequency)

De (absolute) frequentie is een getal waarmee aangegeven wordt hoe vaak iets voorkomt. Bij een toetsscore geeft dit getal aan hoeveel kandidaten die toetsscore hebben behaald.

De (absolute) frequentie gedeeld door het totale aantal kandidaten levert de relatieve frequentie op. De relatieve frequentie wordt weergegeven als een proportie of een percentage.
Zie verder: frequentietabel.

Terug naar het begin


FREQUENTIEPOLYGOON (Eng. FREQUENCY POLYGON)

Een frequentiepolygoon is een grafische voorstelling van een frequentietabel, waarbij frequenties door stippen worden aangegeven die door rechte lijnen worden verbonden.

Terug naar het begin


FREQUENTIETABEL   (Eng. Frequency distribution table)

Een frequentietabel is een lijst met een rangschikking van scores (in een kolom) van laag naar hoog (of van hoog naar laag), met per score het aantal kandidaten dat die score heeft behaald.

Een frequentietabel kan worden uitgebreid met een kolom met relatieve frequenties, een kolom met cumulatieve frequenties en met een kolom met cumulatieve percentages.

Terug naar het begin


FREQUENTIEVERDELING   (Eng. Frequency distribution)

Een frequentieverdeling geeft aan hoe de verschillende scores zijn verdeeld, met andere woorden hoe vaak de uitkomsten voorkomen. Een frequentieverdeling kan gepresenteerd worden in de vorm van een frequentietabel of in de vorm van een histogram of frequentiepolygoon.

Terug naar het begin


GAUSSVERDELING    

Zie: normale verdeling.

Terug naar het begin


GEMIDDELDE P-WAARDE    ( wpe2.jpg (767 bytes) )  (Eng. Mean item difficulty index)

De gemiddelde p-waarde  ( wpe2.jpg (767 bytes) )  is het gemiddelde van een reeks p-waarden, verkregen door alle p-waarden op te tellen en de som te delen door het aantal p-waarden of, wat nauwkeuriger is, de gemiddelde score  te delen door het aantal items van een toets.

Bij gewogen scores, die bij open vragen kunnen voorkomen, wordt de p-waarde van de gehele toets berekend door de gemiddelde toetsscore te delen door het maximaal haalbare aantal punten.

N.B. In de maximaal haalbare punten zitten niet de eventueel toe te kennen bonuspunten.

Terug naar het begin


GEMIDDELDE SCORE ()   (Eng. Mean score)

De gemiddelde score is het gemiddelde van een reeks scores, verkregen door alle scores op te tellen en de som te delen door het aantal scores.

Terug naar het begin


GENERALISEERBAARHEIDSCOňFFICIňNT     (Eng. Generalizability coefficient)

Een generaliseerbaarheidscoŽfficiŽnt is een maat voor de betrouwbaarheid van een toets waarin verschillende variantiebronnen verwerkt kunnen zijn. Een variantiebron die vrijwel altijd in de coŽfficiŽnt verwerkt is, is de mate van overeenstemming tussen beoordelaars, zowel de inter- als de intrabeoordelaarsovereenstemming.

Terug naar het begin


GEPRECODEERDE TOETS  

Zie: objectieve toets.

Terug naar het begin


GEPRECODEERDE VRAAG     Zie: gesloten vraag.

Terug naar het begin


GESLOTEN VRAAG    (Eng. (Objective test) item)

Een gesloten vraag is een vraagtype waarbij de kandidaat moet kiezen uit een beperkt aantal antwoordmogelijkheden die vooraf gegeven zijn. Zie verder: vraagvorm (2).

Terug naar het begin


GETUIGSCHRIFT    (Eng. Certificate, Testimonial)

Een getuigschrift is een bepaald document waarin is vermeld welke resultaten een leerling bij een examen heeft bereikt in welke vakken, volgens welke programma's en op welke niveaus. Een getuigschrift wordt uitgereikt aan iedere leerling die examen heeft afgelegd, ongeacht de resultaten van dat examen.
Zie verder: diploma, certificaat.

Terug naar het begin


GEVALSBESCHRIJVING   (Eng. Anecdotal record)

Beschrijving van spontaan of uitgelokt gedrag, meestal van een leerling in een groepssituatie.

Terug naar het begin


GEWICHT   (Eng. Weight, Value)

Het gewicht van een opgave geeft de bijdrage aan van die opgave/dat item tot de totaalscore.

We kennen de begrippen     a. nominaal gewicht,       b. effectief gewicht.

ad a: Onder het nominaal gewicht van een opgave/item verstaan we de bijdrage van de maximaal te behalen itemscore aan de maximaal te behalen toetsscore. Indien een item 5 van de in totaal 100 punten kan opleveren, is zijn nominaal gewicht gelijk aan 0,05.

ad b: Onder effectief gewicht van een opgave/item verstaan we de bijdrage van een item aan de totale variantie van een toets.

De formule voor het berekenen van het effectief gewicht Eff van een opgave i is:

        wpe3.jpg (1428 bytes)

waarin:

ri t  = correlatie tussen scores opgave i en toetsscores t

Si   = standaarddeviatie scores opgave i

Sx   = standaarddeviatie toetsscores t

Terug naar het begin


GEWOGEN TOETSSCORE    (Eng. Weighted test score)

Een gewogen toetsscore is de score die een kandidaat heeft behaald op een toets, waarbij per opgave niet evenveel scorepunten te behalen waren.
Zie verder: wegen en gewicht.

Terug naar het begin


GISSEN    

Zie onder: correctie voor raden.

Terug naar het begin


GOEDE ANTWOORD   (Eng. Right answer)

Het goede antwoord is het antwoord dat bij de scoring goed gerekend wordt.

Bij meerkeuzevragen is dit: ofwel het goede antwoord naast een of meer foute antwoorden, ofwel: het beste antwoord naast een of meer minder goede antwoorden.

Voor wat betreft open vragen zie onder: antwoordmodel.

Terug naar het begin


HALO-EFFECT   

Zie onder: beoordelaarseffecten.

Terug naar het begin


HERORDENINGSVRAAG   (Eng. Rearrangement item)

Een herordeningsvraag is een vraag waarin een aantal gegevens in een bepaalde volgorde moet worden gezet.

Een voorbeeld:

Situatie: We laten een bal vallen van een hoogte h met een beginsnelheid = 10 m/s.
De snelheid bij het neerkomen = 60 m/s.
De valversnelling = 10 m/s2.
Bepaal: h.
In welke volgorde moet je de onderstaande formules gebruiken om h te bepalen?
formules:

A D V = v(grond) - v(h)

B s = v(h) * D t + Ĺ a*D t2

C D V = aD t

D a = g

E s = h

De volgorde in het gebruik van de formules is: ... .

Terug naar het begin


HISTOGRAM   (Eng. Histogram)

Een histogram is een grafische voorstelling van een frequentietabel, waarbij frequenties door kolommen zijn weergegeven.

Terug naar het begin


HOMOGENITEIT   (Eng. Homogeneity)

Het theoretische begrip homogeniteit geeft de mate aan waarin de opgaven van een toets een zelfde vaardigheid meten.

Terug naar het begin


HORIZONTAAL EQUIVALEREN   (Eng. Horizontal equating)

Horizontaal equivaleren is het op ťťn schaal brengen van de scores van twee ongeveer even moeilijke toetsen met de bedoeling bij beide toetsen gelijkwaardige normen te hanteren. Bijvoorbeeld: het equivaleren van de examens in een bepaald vak in opeenvolgende jaren.

Terug naar het begin


IDENTIFICATIEVRAAG

Een indentificatievraag is een vraag waarbij van de kandidaat wordt gevraagd de in de stimulus gegeven informatie te vergelijken met vroeger verworven of elders in de opgave (bijvoorbeeld in een tekst of tekening) aangeboden informatie. Vervolgens moet hij nagaan of en in hoeverre deze aan elkaar gelijk zijn.

Terug naar het begin


IJKEN    (Eng. To standardize, To norm, To calibrate)

IJken is het bepalen van de schaalwaarden, bijvoorbeeld waarden op een decielschaal, voor scores die door een normgroep op een toets behaald zijn.

Terug naar het begin


INDRUKSVALIDITEIT   (Eng. Face validity)

Indruksvaliditeit is de mate waarin een toets volgens een niet door (empirisch) onderzoek ondersteund oordeel van betrokkenen zal meten wat gemeten moet worden.

Terug naar het begin


INFORMELE EVALUATIE   (Eng. Informal evaluation)

Proces van verzamelen en interpreteren van (leerling)gegevens, dat niet of in mindere mate volgens expliciete regels verloopt en waarbij geen gebruik wordt gemaakt van gestandaardiseerde evaluatie-instrumenten.

Terug naar het begin


INHOUDSVALIDITEIT    (Eng. Content validity)

Inhoudsvaliditeit van een toets is de eigenschap dat de opgaven een representatieve steekproef vormen van opgaven voor de te toetsen kennis of vaardigheid. Meestal wordt gedoeld op de representativiteit qua leerstofgebied.

Terug naar het begin


INTERBEOORDELAARSOVEREENSTEMMING     (Eng. Inter-rater agreement)

De interbeoordelaarsovereenstemming geeft de mate van overeenstemming aan tussen beoordelingen van twee of meer beoordelaars, die dezelfde werkstukken beoordeeld hebben.

Zie ook: beoordelaarsbetrouwbaarheid

Terug naar het begin


INTERNE CONSISTENTIE    (Eng. Internal consistency)

De interne consistentie van een toets geeft de mate aan waarin de opgaven van die toets onderling samenhangen in statistische zin. De interne consistentie wordt gebruikt als een maat voor de betrouwbaarheid.

De interne consistentie kan onder andere berekend worden met:

a     split-half methode

b    alpha ( )

c    KR-20

Alpha en KR-20 zijn de meest algemene berekeningswijzen van de interne consistentie. Zij zijn het gemiddelde van alle mogelijke schattingen van de interne consistentie met behulp van de split-half methode.
Zie verder: betrouwbaarheid.

Terug naar het begin 


INTERSUBJECTIVITEIT    (Eng. Intersubjectivity)

Intersubjectiviteit is het verschijnsel dat uitspraken van twee of meer beoordelaars (c.q. experts) over een onderwerp met elkaar overeenstemmen. Zie onder: interbeoordelaarsovereenstemming.

Terug naar het begin


INTRABEOORDELAARSOVEREENSTEMMING     (Eng. Intra-rater agreement)

De intra- beoordelaarsovereenstemming geeft de mate van overeenstemming aan tussen twee of meer beoordelingen van eenzelfde beoordelaar die dezelfde werkstukken op verschillende momenten beoordeelt.
Zie verder: beoordelaarsbetrouwbaarheid.

Terug naar het begin


INVULVRAAG    (Eng. Completion item)

Een invulvraag is een open vraag waarbij de kandidaat een onvolledige zin, berekening of tekening moet completeren.

Terug naar het begin


ITEM    (Eng. Item)

Een item is een vooral bij meerkeuzetoetsen gebruikt synoniem van opgave.

Terug naar het begin


ITEMANALYSE    (Eng. Item analysis)    Zie: toets- en itemanalyse.

Terug naar het begin


ITEMBANK    (Eng. Item bank)

Een itembank is een gestructureerde verzameling items. De structuur kan zowel leerinhoudelijk als psychometrisch van aard zijn.

Terug naar het begin


ITEMKALIBRATIE    (Eng. Item calibration)

Schatten (berekenen) van de psychometrische eigenschappen (parameters) van een verzameling items met het doel om deze items op dezelfde schaal te brengen.

Terug naar het begin


ITEMCONSISTENTIE    

Zie: interne consistentie.

Terug naar het begin


ITEMRESPONSE FUNCTIE   (Eng. Itemresponse function)

Functie waarin het verband uitgedrukt wordt tussen de kans op het goed beantwoorden van een item en de vaardigheid van een kandidaat.

Terug naar het begin


ITEMRESPONSTHEORIE    (ENG. Itemresponse theory)

Theorie binnen de testleer waarbij de kans dat een kandidaat met een bepaalde vaardigheid een bepaald item juist zal beantwoorden door een mathematisch model beschreven is, het latente-trekmodel.

In tegenstelling tot het klassieke testmodel levert de itemresponstheorie toetsonafhankelijke persoonsparameters en steekproefonafhankelijke itemparameters. De persoons- en itemparameters bij het latente-trekmodel zijn vergelijkbaar met toetsscores en p-waarden bij het klassieke testmodel, maar deze waarden zijn in het klassieke testmodel niet onafhankelijk van de desbetreffende toets en toetspopulatie.

Het latente-trekmodel is - in tegenstelling tot het klassieke trekmodel - een model dat relatief veel assumpties bevat en restricties oplegt aan de toetsscores. Bij het latente-trekmodel wordt uitgegaan van een niet observeerbare trek (of vermogen) die het observeerbare gedrag (vaardigheid) bepaalt. Het verband tussen de latente trek en de toets wordt gelegd door voor ieder item een zogenaamde itemrespons-functie te bepalen.

Men zou kunnen stellen dat de theoretische eenheid bij de latente- trekmodellen het item is, terwijl de theoretische eenheid in de klassieke testtheorie de toets is.

Afhankelijk van het aantal itemparameters worden wel de volgende drie modellen onderscheiden:

Terug naar het begin


ITEMSCORE (X)    (Eng. Item score)

Een itemscore (X) is het aantal punten dat een kandidaat op een item gescoord heeft.

Terug naar het begin


K    (Eng. Number of items)

K is een gangbaar symbool voor het aantal items van een toets, ook wel toetslengte genoemd.

Terug naar het begin


KR-20    (Eng. Kuder-Richardson's Formula 20)

De KR-20 is een maat voor de interne consistentie van een toets. De KR-20 wordt als indicatie van de betrouwbaarheid gebruikt bij dichotoom gescoorde toetsen.

De letters KR komen van de namen Kuder en Richardson, die de formule voor deze maat hebben opgesteld. Het was hun twintigste formule.

De formule voor het berekenen van de KR-20 is:

        wpe4.jpg (3108 bytes)

waarin:

KR-20 = betrouwbaarheidscoefficiŽnt

Sx2 = variantie van de toetsscores

piqi = variantie van de itemscores

k = aantal items van de toets

pi = p-waarde van item i

qi = 1 - pi

Bij polytoom gescoorde toetsen heet deze maat alpha. Zie verder: betrouwbaarheid.

Terug naar het begin


KALIBREREN    

Zie: itemkalibratie.

Terug naar het begin


KENNIS   (Eng. Knowledge)

De term wordt in verschillende betekenissen gebruikt.

 1. Kennis is datgene wat een persoon weet, wat als het ware als 'data' aanwezig is in zijn cognitieve systeem (lange termijn geheugen). Ook wel: kennis is wat kan worden gereproduceerd van de informatie die op een eerder tijdstip is opgenomen. Ongeveer deze betekenis heeft de term in de trits 'kennis, inzicht en toepassing'.
 2. Kennis is niet alleen wat een persoon weet in de zin van (1) maar ook het doorzien van de implicaties van het gewetene, op algemeen niveau en in specifieke situaties. Deze ruimere betekenis heeft de term als men spreekt over 'kennis en vaardigheden' of 'kennen en kunnen'.
 3. Kennis in de ruime betekenis omvat het hele scala van cognitieve activiteiten, zowel de statische aspecten als de procesmatige aspecten. Kennis is alles wat men kan bestempelen als 'cognitief'. Deze ruime betekenis heeft de term in de cognitiewetenschap en als men onderscheid maakt tussen declaratieve (soms: conceptuele) kennis en procedurele kennis.

De drie betekenissen verhouden zich ongeveer als in het volgende schema:

    (1)  kennis, inzicht en toepassing
    (2)      kennis en vaardigheden
    (3)                   kennis
                         /          \
                        /             \
                       /                \
    declaratieve                    procedurele
    (conceptuele)                  kennis  
    kennis

Terug naar het begin


KENNISSTRUCTUUR    

Zie: cognitieve structuur.

Terug naar het begin


KLASSIEKE TESTMODEL   (Eng. Classical test theory, Classical test model)

Het klassieke testmodel is een model waarbij men de waargenomen score (O) beschouwt als een samenstelling van een component ware score (T) en een component meetfout (E): O = T + E.

Terug naar het begin


KORT-ANTWOORDVRAAG    (Eng. Short-answer question)

Een kort-antwoordvraag is een open vraag waarbij de kandidaat het antwoord zelf moet formuleren door middel van een citaat (vermelding van eerste en laatste woord van een tekstfragment), een of enkele woorden, getallen of eenvoudige tekeningen.

Terug naar het begin 


LANG-ANTWOORDVRAAG    (Eng. Essay(-type) question)

Een lang-antwoordvraag is een open vraag waarbij de kandidaat het antwoord moet formuleren door middel van enkele zinnen, een gecompliceerde berekening of tekening.

Terug naar het begin


LATENTE-TREKMODEL  

Zie: Itemresponstheorie.

Terug naar het begin


LEERDOEL    (Eng. Learning objective)

Een leerdoel is het beoogde resultaat van onderwijsleeractiviteiten.
Als het beoogde leerresultaat wordt geformuleerd in termen van uiterlijke condities en waarneembaar leerlinggedrag spreekt men van 'concrete leerdoelen' of 'gedragsdoelen' (Eng. BEHAVIORAL OBJECTIVES).
Als het beoogde leerresultaat wordt geformuleerd in termen van cognitief gedrag of van cognitieve structuren, spreekt men van cognitieve leerdoelen.
Zie verder: onderwijsdoelstellingen.

Terug naar het begin


LEERDOELGERICHTE TOETS    (Eng. Criterion-referenced test)

Een leerdoelgerichte toets is een toets meestal bestaande uit een gering aantal opgaven (5 tot 10) die te beschouwen zijn als een representatieve steekproef uit alle opgaven die bij een bepaald leerdoel gemaakt zouden kunnen worden.

Leerdoelgerichte toetsen worden tijdens het onderwijsleerproces gebruikt om kennis-hiaten bij de leerlingen te kunnen opsporen en het onderwijs dienovereenkomstig bij te sturen.

Terug naar het begin


LEERLINGDOSSIER    (Eng. Learner's record)

Verzameling van evaluatiegegevens van een leerling die expliciet zijn verzameld om de leergeschiedenis van die leerling te documenteren.

Terug naar het begin


LEERLINGPROFIEL

(Grafische) weergave van scores van een leerling, behaald op met elkaar samenhangende evaluatie-instrumenten die onderling met elkaar worden vergeleken.

Terug naar het begin


LEERLINGVOLGSYSTEEM

Batterij van evaluatie-instrumenten waarmee de vorderingen van individuele leerlingen op verschillende leer- en vormingsgebieden in opvolgende leerjaren kunnen worden beoordeeld.

Terug naar het begin


LEERPLAN    (Eng. Curriculum)

Een leerplan is een document waarin voor het onderwijs worden beschreven: doelen, inhouden, organisatie en werkwijzen. Onder leerplan kan men verstaan: onderwijsleerpakketten (micro- of klasseniveau), schoolwerkplannen (meso- of schoolniveau), onderwijsleerplannen (macro- of landelijk niveau).

Terug naar het begin


LEERRAPPORT    

Zie: leerverslag.

Terug naar het begin


LEERSTOFDOMEIN

Verzameling van onderling samenhangende kennis en vaardigheden.

Terug naar het begin


LEERVERSLAG    (Eng. Learning report)

Zelfrapportage van een leerling over opgedane leereffecten die sterk persoonlijk zijn en die uitsluitend door de betrokkene gerapporteerd kunnen worden. De rapportage geschiedt aan de hand van zogenaamde leereffectzinnen als 'Ik heb geleerd dat (hoe, etc.) ... .'

Terug naar het begin


LIKERT-SCHAAL

Een Likert-schaal wordt meestal gebruikt om houdingen of opinies te meten. Ze bestaat uit meerdere verwante items/uitspraken/ stellingen waarop personen verzocht worden te reageren door het kiezen van een der voorgegeven antwoordmogelijkheden (bijvoorbeeld: zeer mee eens ... zeer mee oneens). Die elementen heten Likert-items

Het is een bepaalde vorm van stimulus-aanbieding die het mogelijk maakt met een en dezelfde steekproef van respondenten een schaal te construeren (bijvoorbeeld: aversie tegen kruisraketten) en de respondenten op deze schaal te plaatsen.

Terug naar het begin


LINEAIRE TRANSFORMATIE     (Eng. Linear conversion)

Een lineaire transformatie is een wijze van omzetting van scores in cijfers of in andere scores, waarbij het nieuwe resultaat een rechtlijnig verband heeft met de oude scores.
Zie verder: standaardscore.

Terug naar het begin


MATCHING    

Zie: combinatievraag.

Terug naar het begin


MATRIX SAMPLING

Matrix sampling is een procedure voor toetsafname waarbij niet alle kandidaten alle items voorgelegd krijgen. De items worden hierbij over verschillende tekstboekjes verdeeld, die weer over verschillende deelgroepen van kandidaten worden verdeeld. Matrix sampling is tijd- en kostenbesparend als het er om gaat psychometrische gegevens over items en toetsen te verkrijgen. Men krijgt uiteraard geen scores van alle kandidaten op alle items.

Terug naar het begin


MEDIAAN    (Eng. Median)

De mediaan is de middelste waarde wanneer de waarnemingen naar grootte gerangschikt zijn.
Zie verder: percentiel.

Terug naar het begin


MEERKEUZETOETS    (Eng. Multiple-choice test, MC test)

Een meerkeuzetoets is een toets bestaande uit meerkeuzevragen.

Terug naar het begin


MEERKEUZEVRAAG    (Eng. Multiple-choice item)

Een meerkeuzevraag is een vraag waarbij de kandidaat het goede antwoord moet bepalen uit verschillende alternatieven. Bij uitzondering worden wel meerkeuzevragen geconstrueerd waarbij meer dan ťťn antwoord goed is.

Terug naar het begin


MEERVOUDIGE VRAAG    (Eng. Multiple response question)

Een meervoudige vraag is een vraag die opgesplitst is in verschillende onderdelen. We onderscheiden twee soorten meervoudige vragen, namelijk vragen die antwoorden opleveren die onafhankelijk van elkaar zijn (serievragen) en vragen waarin antwoorden gevraagd worden die afhankelijk zijn (samengestelde vragen).

Terug naar het begin


MEETFOUT    (Eng. Error of measurement)

De meetfout is de mate waarin de geschatte vaardigheid afwijkt van de werkelijke vaardigheid. De meetfout wordt verondersteld te ontstaan door vertekeningen van uiteenlopende aard bij de meting.
Zie verder: betrouwbaarheid en standaardmeetfout.

Terug naar het begin


METEN    (Eng. TO Measure)

Meten is het toekennen van getallen aan waargenomen prestaties binnen een zodanig theoretisch concept dat op grond van de waarnemingen uitspraken gedaan kunnen worden over de kwaliteit van de prestaties.
Zie verder: beoordelen.

Terug naar het begin


METHODEGEBONDEN TOETS     (Eng. Curriculum-embedded test, Textbook-related test)

Een methodegebonden toets is een toets die aan een methode of leergang gebonden is.

Terug naar het begin


MODUS    (Eng. Mode)

De modus van een reeks waarnemingen is de waarde die het meest frequent voorkomt.

Terug naar het begin


MOEILIJKHEIDSGRAAD     

Zie onder: p-waarde, respectievelijk: p'-waarde.

Terug naar het begin


MULTIPLE-CHOICEVRAAG     

Zie: meerkeuzevraag.

Terug naar het begin


MULTIPLE COMPLETION

Multiple completion is een vraagvorm waarin de leerling moet aangeven welk antwoord of welke combinatie van antwoorden juist is. Karakteristiek voor deze vraagvorm is dat de alternatieven slechts een selectie van alle denkbare combinaties geven.

Een voorbeeld:

Niet iedereen die zonder werk is, behoort tot de officiŽle werklozen. Aan welke van de onderstaande voorwaarden moet verder zijn voldaan wil men officieel als werkloze worden aangemerkt?

1 Men moet beschikbaar zijn voor een werkweek van tenminste 40 uur
2 Men moet de Nederlandse nationaliteit hebben
3 Men moet zich laten inschrijven bij een arbeidsbureau


A alleen 1 en 2
B alleen 1 en 3
C alleen 2 en 3
D aan alle voorwaarden

Terug naar het begin


N    (Eng. Total number of testees)

In het algemeen wordt de hoofdletter N gebruikt als het symbool van de totale omvang van een groep (populatie), bijvoorbeeld het totaal aantal kandidaten dat aan een eindexamentoets heeft deelgenomen.

Terug naar het begin


n    (Eng. Number of testees in a sample)

In het algemeen wordt de kleine letter n gebruikt als het symbool voor het aantal personen in een steekproef.

Terug naar het begin


NIVEAU    (Eng. Level)

Niveau is een klasse in een veronderstelde classificatie van onderwijs of leerstof naar de graad van moeilijkheid ervan.

Het niveau wordt bepaald door de mate van abstractie waarin de leerstof aan de orde wordt gesteld, de cognitieve complexiteit van de leerstof en de hoeveelheid leerstof die per tijdseenheid moet worden verwerkt.

In het kader van de invoering van examens op verschillend niveau (LBO/MAVO-C en -D) wordt een onderscheid gemaakt tussen beheersingsniveaus en vakinhoudelijke niveaus. Beheersingsniveaus doen zich voor waar het ene programma een grotere beheersing vraagt ten aanzien van dezelfde leerstof en dezelfde gedragingen als een ander programma. Vakinhoudelijke niveaus doen zich voor wanneer het ene examenprogramma meer leerstof of een uitgebreider gedrag bevat dan het andere niveau.

Terug naar het begin


NOMINAAL GEWICHT    

Zie onder: gewicht.

Terug naar het begin


NORMALE VERDELING    (Eng. Normal distribution)

De normale verdeling is een bepaalde frequentieverdeling (symmetrische klokvorm) waarbij het gemiddelde, de mediaan en de modus samenvallen.

Terug naar het begin


NORMALISEREN    (Eng. To normalize)

Normaliseren is het veranderen van schaalwaarden zodanig dat de verdeling een normale verdeling wordt. Zie verder: standaardscore.

Terug naar het begin


NORMEN

De term normen kunnen we in drie betekenissen tegenkomen:

 1. Normen (Eng. TRANSFORMATION RULES) zijn de regels volgens welke toetsscores worden omgezet in cijfers. Zie ook: lineaire transformatie.
 2. Normen (Eng. NORMS) zijn scores van een nauwkeurig gedefinieerde populatie, de normgroep. Aan individuele (ruwe) scores kan betekenis toegekend worden door ze te vergelijken met de normen.
 3. Normen (Eng. SCORING INSTRUCTIONS) als synoniem voor correctievoorschriften.

Terug naar het begin


NORMEREN

De term normeren kunnen we in twee betekenissen tegenkomen:

 1. Normeren (Eng. TO CONVERT TEST SCORES TO MARKS) is het bepalen van regels volgens welke toetsscores in cijfers worden omgezet.
  Een belangrijk onderdeel van de normering is het vaststellen van de cesuur. Bij absoluut normeren wordt de cesuur aan de examenstof ontleend ('criterion - referenced measurement'). Enkele methodes om absoluut te normeren zijn: Methode Ebel; Methode Nedelsky en de Kernitemethode - De Groot. Zie verder beoordelingscriterium.
  Bij relatief normeren wordt de omzetting van scores in cijfers gebaseerd op een onderlinge vergelijking van de scores van de kandidaten ('norm - referenced measurement' of 'grading on de curve'). Enkele methodes om relatief te normeren zijn: Grading on the curve en de Methode Wijnen.
 2. Normeren (Eng. TO STANDARDIZE, TO NORM, TO CALIBRATE) als synoniem voor ijken.

Terug naar het begin


NORMGERICHTE INTERPRETATIE   (Eng. Norm-referenced (test) interpretation)

Betekenis geven aan toetsresultaten door deze te vergelijken met de toetsresultaten van een relevante vergelijkingsgroep, bijvoorbeeld leerjaar- of leeftijdgenoten, ook wel normgroep of populatie genoemd.

Terug naar het begin


NORMGROEP    (Eng. Reference group, Norm group)

Een normgroep is een steekproef uit een welomschreven populatie van kandidaten waarop een toets geijkt is.

Terug naar het begin


NORMHANDHAVING    (Eng. Maintaining standards)

Normhandhaving is een procedure die tot doel heeft de scores, behaald bij verschillende examens, op dezelfde wijze te waarderen. Veelal wordt daartoe gebruik gemaakt van ankeritems of standaardtoetsen. Zie verder: equivaleren. Zie evt. ook de Cito toetswijzer

Terug naar het begin


NORMVERSCHUIVING   (Eng. Norm shift)      

Zie onder: beoordelaarseffecten.

Terug naar het begin


OBJECTIEVE TOETS    (Eng. Test)

Een objectieve toets is een toets waar de goed te rekenen antwoorden (correctiesleutel) op alle vragen tevoren vastgelegd zijn. Elk subjectief oordeel van een corrector wordt daardoor bij het scoren uitgeschakeld.

Terug naar het begin


OBJECTIVITEIT    (Eng. Objectivity)

Objectiviteit is de eigenschap die we aan een toets toekennen, als de persoon die de score vaststelt geen invloed op de scoring kan hebben.
Zie verder: objectieve toets.

Terug naar het begin


OMZETTINGSTABEL   (Eng. Conversion table)

Een omzettingstabel is een tabel die aangeeft welke afgeleide score (cijfer, percentiel, enz.) bij welke toetsscore behoort.

Terug naar het begin


ONDERWIJSDOELSTELLING     (Eng. Educational objective)

Een onderwijsdoelstelling is het na te streven resultaat van onderwijsleeractiviteiten. Veelal zijn onderwijsdoelstellingen concretiseringen van eindtermen die ontleend zijn aan situaties waarin abituriŽnten terecht zullen komen. Leerdoelen op hun beurt zijn specifiekere uitwerkingen van algemene keuzen die zijn gemaakt in onderwijsdoelstellingen. Men formuleert wel dat onderwijsdoelstellingen richtinggevend zijn voor het onderwijs van een bepaalde schoolsoort, terwijl leerdoelen op het niveau van de dagelijkse onderwijspraktijk spelen; leerdoelen worden aldaar geformuleerd terwijl eindtermen en onderwijsdoelstellingen niet uitsluitend door het onderwijs zelf worden geformuleerd.

Terug naar het begin


OPDRACHT   Zie: opgave.

Terug naar het begin


OPEN VRAAG    (Eng. Open-ended question)

Een open vraag is een vraagtype waarbij een kandidaat het antwoord zelf moet formuleren.

Ten behoeve van de beoordeling moet er een correctievoorschrift of een beoordelingsschema zijn.

Open vragen kunnen, gekarakteriseerd naar de lengte van het antwoord, onderverdeeld worden in bepaalde vraagvormen, namelijk: invulvraag, aanvulvraag, kort-antwoordvraag, lang-antwoordvraag, opstelvraag.

Terug naar het begin


OPERATIONALISEREN

Operationaliseren bij toetsen is het proces van het uitwerken van de onderwijsdoelstellingen tot opgaven.

Terug naar het begin


OPGAVE    (Eng. Assignment, Item)

Een opgave is een onderdeel van een toets en bevat altijd een stimulus (een middel of prikkel om een bepaald gedrag van een kandidaat uit te lokken) waarop een respons (het uitgelokte gedrag) mogelijk moet zijn.
Zie verder: item.

Terug naar het begin


OPSTELVRAAG    (Eng. Essay(-type) question)

Een opstelvraag is een open vraag waarbij de kandidaat het antwoord moet formuleren door middel van een samenhangend stuk tekst of een berekening of tekening, die een afgerond geheel moeten vormen.

Terug naar het begin


P-WAARDE    (Eng. Item difficulty index)

De p-waarde van een meerkeuzevraag is de proportie kandidaten die het goede antwoord heeft gekozen. Met dit getal wordt de moeilijkheidsgraad van een item weergegeven.
Zie ook: b-parameter.

Terug naar het begin


P'-WAARDE

De p'-waarde is een getal tussen 0 en 1 dat de moeilijkheidsgraad van een opgave weergeeft.

De p'-waarde wordt berekend door de gemiddelde score op een opgave te delen door de maximaal haalbare score op die opgave.

Een opgave met een p'-waarde van .10 is erg moeilijk; een opgave met een p'-waarde van .90 is erg gemakkelijk.

Terug naar het begin


PARALLELLE TOETSEN   (Eng. Alternate tests, Parallel tests, Equivalent tests)

Parallelle toetsen zijn toetsen die dezelfde vaardigheid meten en verder nog voldoen aan een aantal psychometrische eisen, als: gelijke betrouwbaarheid, gelijke gemiddelde score en gelijke variantie.

Terug naar het begin


PARALLELLE-VORMENMETHODE     (Eng. Equivalent-forms method)

De parallelle-vormenmethode is een methode om de betrouwbaarheid te schatten. Behalve de toets in kwestie wordt bij dezelfde groep kandidaten een parallelle toets afgenomen. De uitkomsten van beide toetsafnames worden met elkaar gecorreleerd. De correlatiecoŽfficiŽnt kan worden geÔnterpreteerd als een maat voor de betrouwbaarheid.
Zie verder: betrouwbaarheid.

Terug naar het begin


PARAMETER

De term parameter kunnen we in twee betekenissen tegenkomen:

 1. Een parameter is een grootheid waarmee een eigenschap van een populatie wordt beschreven, zoals de p-waarde en standaarddeviatie etc.
 2. In een mathematische vergelijking zoals y = ax + b  worden a en b de parameters genoemd, of ook wel de constantes van de vergelijking.

 Terug naar het begin


PEILINGSONDERZOEK    (Eng. Assessment of educational progress)

Grootschalig evaluatie-onderzoek met als doel het vaststellen van de inhoud en het rendement van (het onderwijs van) een bepaald schooltype.

Terug naar het begin


PERCENTAGE     

Zie onder: proportie.

Terug naar het begin


PERCENTIEL    (Eng. Percentile)

Percentielen zijn de 99 schaalwaarden die een frequentieverdeling verdelen in 100 groepen van gelijke grootte. Het 50-ste percentiel (P50) wordt de mediaan genoemd. Kwartielen splitsen de verdeling in vier gelijke groepen.

Terug naar het begin


PERCENTIELSCORE    (Eng. Percentile rank)

Een percentielscore is een bij een toetsscore behorend getal dat aangeeft hoeveel procent van de kandidaten de genoemde toetsscore of een lagere heeft behaald.

Voorbeeld:

Iemand haalt op een toets een percentielscore van 56. Dit betekent dat 56% van alle deelnemers bij die toets dezelfde of een lagere score had.

Terug naar het begin


POLY(CHO)TOME SCORING

Polychotome (polytome) scoring is het scoren van een antwoord waarbij er meer dan twee onderscheidingen zijn in de waardering van het antwoord.

Aan het antwoord op een vraag kunnen we bijvoorbeeld 0, 2 of 4 punten toekennen (drie onderscheidingen). Bij open vragen scoort men vaak poly(cho)toom.

Terug naar het begin


POPULATIE    (Eng. Population)

Een populatie is een verzameling van operationeel gedefinieerde eenheden, bijvoorbeeld alle aan een examen deelnemende kandidaten, waarop de conclusies van een statistisch onderzoek betrekking hebben.

Terug naar het begin


PRAKTIJKTOETS    (Eng. (Applied) Performance test)

Een praktijktoets is een toets waarin de opgaven een min of meer natuurgetrouwe weerspiegeling van de (beroeps)praktijk vormen. In het algemeen vereist een praktijktoets praktisch handelen.

Terug naar het begin


PREDICTIEVE VALIDITEIT     (Eng. Predictive validity)

Predictieve validiteit is de eigenschap die een toets heeft als de toetsscore een criteriumvariabele kan voorspellen (prediceren).

Als met een toets studiesucces voorspeld kan worden, dan heeft die toets een bepaalde predictieve validiteit. De hoogte van de predictieve validiteit van die toets wordt uitgedrukt in de hoogte van de correlatie tussen toetsscores van de personen waarbij de toets is afgenomen en hun succes bij verdere studie.
Zie verder: validiteit.

Terug naar het begin


PRETESTEN    (Eng. PRETEST)

Pretesten is het afnemen van een aantal opgaven (toets, proefwerk, e.d.) bij een groep personen, meestal met het doel de eigenschappen van een toets door itemrevisie te verbeteren.
Zie verder: try-out.

Terug naar het begin


PROCESEVALUATIE

Verzamelen en interpreteren van gegevens over het verloop van de componenten van een onderwijsproces om daarover onderwijskundige beslissingen te kunnen nemen.

Terug naar het begin


PRODUKTEVALUATIE

Verzamelen en interpreteren van gegevens over de uitkomsten van een onderwijsleerproces om daarover onderwijkskundige beslissingen te kunnen nemen.

Terug naar het begin


PRODUKTIEVRAAG    (Eng. Convergent production type question)

Een produktievraag is een vraag waarbij van de kandidaat wordt gevraagd een uitwerking, bewerking, verklaring, samenvatting, uitleg of beoordeling te geven van in de stimulus gepresenteerde informatie.

De vraagstelling is naar vorm of inhoud min of meer nieuw voor de kandidaat, maar het antwoord of de oplossing kan gegeven worden op grond van een aangeleerde werkwijze of methode.

Terug naar het begin


PROPORTIE    (Eng. Proportion)

Een proportie is een getal dat de verhouding aangeeft tussen het aantal elementen uit een verzameling met een bepaalde eigenschap en het totale aantal elementen uit deze verzameling.

Voorbeeld:

Het aantal kandidaten dat een item goed beantwoord heeft, gedeeld door het totale aantal kandidaten. Als een proportie met 100 wordt vermenigvuldigd krijgen we het percentage.

Terug naar het begin


PSYCHOMETRISCHE ANALYSE      

Zie: toets- en itemanalyse.

Terug naar het begin 


PSYCHOMOTORISCHE ONDERWIJSDOELSTELLINGEN   (Eng. Psychomotor educational objectives)

Psychomotorische onderwijsdoelstellingen zijn de categorie onderwijsdoelstellingen die betrekking hebben op de vorming van praktische handelingsvaardigheden, waarin de lichaamsmotoriek een belangrijke rol speelt.
Zie verder: onderwijsdoelstellingen.

Terug naar het begin


RAR- en RIR-WAARDEN

RAR- en RIR-WAARDEN zijn discriminatie-indices behorende bij een item. Zij geven aan in welke mate het item hoog- en laagscorende leerlingen onderscheidt. Men noemt de Rir de item-rest correlatie; het is namelijk de correlatie tussen de itemscore en de score op de resterende items van dezelfde toets. De Rar is de correlatie tussen de score op de betreffende afleider en de resterende items. Een goed discriminerend item geeft een hoge positieve Rir-waarde en sterk negatieve Rar-waarden.

Soms worden in plaats van Rir- en Rar-waarden ook wel Rit en Rat-waarden berekend. Dit zijn respectievelijk de correlaties tussen het item en de hele toets, en tussen het alternatief en de hele toets. Deze indices vallen hoger uit dan de Rir- en Rar-waarden omdat hier de itemscore in de totaalscore van de toets wordt meegeteld, waardoor de correlatie geflatteerd wordt.

Terug naar het begin


RIT-WAARDE   

Zie onder: rar- en rir-waarde.

Terug naar het begin


RSK

De RSK, afkorting van 'relatieve standaarddeviatie van Knops' (ontworpen door W. Knops), is de standaarddeviatie van een item gedeeld door het maximale aantal op dat item te behalen scorepunten.

De RSK maakt het mogelijk de standaarddeviaties van items met verschillende maxima te vergelijken.

Terug naar het begin


RAADKANS    (Eng. Chance (success), guessing)

De raadkans is de kans op het juist beantwoorden van een meerkeuzevraag, wanneer de kandidaat het goede antwoord niet weet.
Zie verder: correctie voor raden.

Terug naar het begin


RANGE    (Eng. Range)

De range is een maat voor de spreiding van waarnemingen. De range is de afstand tussen de hoogste en laagste score.

Terug naar het begin


RASCH-MODEL     (Eng. Rach model)      

Zie onder: itemresponstheorie.

Terug naar het begin


REFERENTIEGEGEVENS    (Eng. Reference data)    

Zie: normen.

Terug naar het begin


REFERENTIEGROEP    (Eng. Reference group, reference population)    

Zie: normgroep.

Terug naar het begin


REGELGEVING

Onder regelgeving met betrekking tot examens wordt in het algemeen verstaan de door de overheid vastgestelde verbindende voorschriften met betrekking tot het examen, die zijn vastgelegd in wetten, ministeriŽle beschikkingen en circulaires.
Zie ook: examenbesluit.

Terug naar het begin


RELATIEF NORMEREN    

Zie: Normeren.

Terug naar het begin


RELATIEVE FREQUENTIE   

Zie onder: Frequentie.

Terug naar het begin


RELATIEVE STANDAARDDEVIATIE   

Zie onder: RSK.

Terug naar het begin


REPRODUKTIEVRAAG    (Eng. Recall question)

Een reproduktievraag is een open vraag, waarbij van de kandidaat wordt gevraagd een min of meer letterlijke weergave van vroeger verworven informatie (zoals jaartallen, definities, regels, e.d.) te leveren.

Terug naar het begin


RESPONS    (Eng. Response)

 1. Een respons is het door een stimulus teweeggebrachte gedrag van een kandidaat. Bij een opgave kan dit zijn: het door de kandidaat gegeven antwoord of het door hem gemaakte werkstuk.
 2. Bij enquÍtes verstaat men onder respons het percentage personen dat reageerde op het verzoek om aan de enquÍte deel te nemen. De effectieve respons is het aantal verwerkbare reacties.

Terug naar het begin


RESULTAATBEOORDELING    (Eng. Assessment of learning outcomes)

Resultaatbeoordeling is het vaststellen van de uitkomst van een of meer onderwijsleerprocessen.

Terug naar het begin


RUWE SCORE (X)   

Zie: toetsscore.

Terug naar het begin


SAMENGESTELDE VRAAG    (Eng. Complex question)

Een samengestelde vraag is een meervoudige vraag waarin antwoorden gevraagd worden die afhankelijk van elkaar zijn, dat wil zeggen: het antwoord op deelvraag a is een onmisbaar element voor het oplossen van deelvraag b.
Zie verder: serievraag.

Terug naar het begin


SCHAAL    (Eng. Scale)

Een schaal is een reeks getallen die volgens een bepaald voorschrift gekoppeld worden aan waarnemingen. Toetsscores kunnen bijvoorbeeld door middel van een lineaire transformatie omgezet worden in cijfers van 1 t/m 10, of ze kunnen omgezet worden in percentielscores. Schalen worden veel gebruikt bij het ijken.

Voorbeelden van schalen zijn: percentielschaal, decielschaal, C-schaal.

Terug naar het begin


SCHATTER    (Eng. Estimator)

Een schatter is een statistische grootheid die gebruikt wordt om de waarde van een onbekende parameter te schatten.
Zie verder: steekproef, parameter.

Terug naar het begin


SCHATTING    (Eng. Estimate)

Een schatting is de waarde van een schatter voor een gegeven steekproef.

Terug naar het begin


SCHOOLBEOORDELING    (Eng. School exam)

De schoolbeoordeling is het deel van het examen dat als zodanig in het examenprogramma is opgenomen. Het operationaliseren van de onderwijsdoelstellingen tot examentoetsen in de schoolbeoordeling behoort tot de verantwoordelijkheid van de scholen.
Zie verder: centraal examen.

Terug naar het begin


SCHOOLEXAMEN (SCHOOLONDERZOEK)   

Zie: schoolbeoordeling.

Terug naar het begin


SCHOOLTOETSSERVICESYSTEEM

Een toetsservicesysteem dat bedoeld is voor gebruik in de scholen.

Terug naar het begin


SCORE (X) 

In het algemeen is de score het totaal aantal scorepunten dat iemand op een toets haalt. De score wordt in het algemeen met de letter X aangeduid. De term wordt ook gehanteerd voor itemscore.

Terug naar het begin


SCOREN   (Eng. To Score)

Scoren is het toekennen van getallen aan waargenomen prestaties. In het algemeen door middel van tellen van de punten volgens de scoringsvoorschriften. Zie verder: meten.

Terug naar het begin


SCOREPUNT   (Eng. Scoring point)

Een scorepunt is de eenheid waarin de prestatie bij een opgave gewaardeerd wordt. Het aantal te behalen scorepunten per opgave is gespecificeerd in het scoringsvoorschrift of correctievoorschrift.

Terug naar het begin


SCOREVERDELING   

Zie: frequentieverdeling.

Terug naar het begin


SCORINGSVOORSCHRIFT     (Eng. Scoring rules)

Een scoringsvoorschrift is een onderdeel van het correctiemodel. In het voorschrift worden vermeld: de maximaal haalbare toetsscore en de scorepunten, en eventueel nog: de aftrekpunten en de bonuspunten, een en ander afhankelijk van onder andere goede of gedeeltelijk goede antwoorden.

Het scoringsvoorschrift beschrijft welke antwoorden goed, welke gedeeltelijk goed en welke als fout moeten worden beschouwd.

Indien mogelijk en nodig wordt omschreven wanneer bonuspunten worden toegekend c.q. aftrekpunten in mindering worden gebracht.

Terug naar het begin


SCREENING   (Eng. Screening)

Onder screening van opgaven wordt verstaan de controle vooraf van de opgaven ten aanzien van relevantie, wetenschappelijke inhoud en formulering.

De screening dient bij voorkeur te worden uitgevoerd door deskundigen die niet betrokken zijn geweest bij de samenstelling van de opgaven.

Terug naar het begin


SELECTIE   (Eng. Selection)

Selectie is het door de opnemende instantie uitkiezen van personen voor een bepaalde vacature of een bepaalde opleiding, op grond van relevant geachte indicatoren, bijvoorbeeld eerder behaalde diploma's, afgelegde toets, werkervaring en dergelijke.

Terug naar het begin


SEQUENTIE-EFFECT      

Zie onder: beoordelaarseffecten.

Terug naar het begin


SERIEVRAAG    (Eng. String question)

Een serievraag is een meervoudige vraag waarin antwoorden gevraagd worden die onafhankelijk van elkaar zijn, dat wil zeggen: het antwoord op deelvraag a is niet nodig voor het oplossen van deelvraag b. Zie verder: samengestelde vraag.


Terug naar het begin


SIGNIFISCH EFFECT      

Zie onder: beoordelaarseffecten.

Terug naar het begin


SLAAG-ZAKGRENS      

Zie: cesuur.

Terug naar het begin


SLEUTEL   

Zie: correctiesleutel.

Terug naar het begin


SPEARMAN-BROWN FORMULE     (Eng. Spearman-Brown prophecy formula)

De Spearman-Brown formule is een formule waarmee de betrouwbaarheid van een toets kan worden geschat indien deze zou worden verlengd of verkort, dat wil zeggen: met een aantal (soortgelijke) items uitgebreid of met een aantal items ingekrompen.

De formule voor het berekenen van de betrouwbaarheidscoŽfficiŽnt bij verlenging of verkorting is:

[formule 9]

            wpe5.jpg (2510 bytes)

waarin:

rv = betrouwbaarheidscoŽfficiŽnt toets bij verlenging of verkorting

ro = betrouwbaarheidscoŽfficiŽnt bij oorspronkelijke lengte

kv = lengte toets bij verlenging of verkorting

ko = oorspronkelijke toetslengte

Terug naar het begin


SPLIT-HALF-METHODE    (Eng. Split-half method)

De split-half-methode is een methode om de interne consistentie van een toets te berekenen, waarbij de uitkomst als een maat voor de betrouwbaarheid wordt beschouwd.

Van twee toetshelften (opgevat als twee parallelle toetsen) worden de scores van alle leerlingen met elkaar gecorreleerd.
De splitsing in twee helften kan bijvoorbeeld plaatsvinden door de even genummerde items in de ene helft te plaatsen en de oneven genummerde items in de andere helft.

Omdat we nu de betrouwbaarheid van de halve toets berekend hebben, moeten we vervolgens de betrouwbaarheid van de gehele toets schatten met de Spearman-Brown formule.

Terug naar het begin


SPREIDING    (Eng. Dispersion)

Met de spreiding wordt aangegeven in welke mate bepaalde waarnemingen, zoals toetsscores, van elkaar verschillen. Maten voor de spreiding zijn bijvoorbeeld de standaarddeviatie, de variantie (1) en de range.

Terug naar het begin


STAM   (Eng. Stem)

De stam is het onderdeel van een meerkeuzevraag dat de vraagstelling/het probleem bevat.

Terug naar het begin


STANDAARDAFWIJKING   (Eng. Standard deviation)     

Zie: standaarddeviatie.

Terug naar het begin


STANDAARDDEVIATIE (Sx)    (Eng. Standard deviation)

De standaarddeviatie (Sx) is een maat voor de spreiding van getallen rondom hun gemiddelde. In het geval van een toets gaat het om de spreiding van toetsscores rondom de gemiddelde score

De formule voor het berekenen van de standaarddeviatie van een toets is:

            wpe6.jpg (2551 bytes)

waarin:

Sx = standaarddeviatie

Xi = toetsscore van kandidaat i

= gemiddelde toetsscore

N = aantal kandidaten

Zie verder: RSK.

Terug naar het begin


STANDAARDISEREN     (Eng. To convert to standard scores, to standardize scores)

Standaardiseren is het omzetten van een verdeling van verschillende waarnemingen, zoals toetsscores, op zodanige wijze, dat de verdeling een gewenst gemiddelde en een gewenste standaarddeviatie oplevert. Dit wordt gedaan om toetsscoreverdelingen van verschillende toetsen gemakkelijker met elkaar te kunnen vergelijken en om zodoende ook de toetsprestaties van een individu op verschillende toetsen gemakkelijker te kunnen vergelijken en interpreteren. Bij standaardiseren wordt in tegenstelling tot normaliseren de oorspronkelijke vorm van de verdeling niet aangetast.
Zie verder: standaardscore.

Terug naar het begin


STANDAARDMEETFOUT (Se)     (Eng. Standard error of measurement)

De standaardmeetfout (Se) is een indicatie voor de onnauwkeurigheid van een meting. De grootte van de standaardmeetfout hangt af van de betrouwbaarheid en de standaarddeviatie van de toetsscores.

De formule voor het berekenen van de standaardmeetfout in het klassieke testmodel is:

                   

waarin:

Se = standaardmeetfout

Sx = standaarddeviatie toetsscores

r = toetsbetrouwbaarheid

Zie verder: ware score.

Terug naar het begin


STANDAARD-NORMALE VERDELING     (Eng. Standard normal distribution)

De standaard- normale verdeling is een normale verdeling met een gemiddelde van nul en een standaarddeviatie van ťťn.
Zie verder: standaardiseren.

Terug naar het begin


STANDAARDSCORE     (Eng. Standard score)

Een standaardscore is een uit een toetsscore afgeleide score door omzetting van de oorspronkelijke verdeling van toetsscores in een verdeling met een gewenst gemiddelde en een gewenste standaarddeviatie.

Standaardscores worden veel gebruikt om scores van toetsen met verschillende gemiddelden en standaarddeviatie met elkaar te kunnen vergelijken.

Voorbeelden van veel voorkomende standaardscores zijn:

Z-scores,     met een gemiddelde 0 en standaarddeviatie 1;

T-scores,    met een gemiddelde 50 en standaarddeviatie 10;

C-scores,    met een gemiddelde 5 en standaarddeviatie 2;

IQ-scores,   met een gemiddelde 100 en standaarddeviatie 15 (soms 16);

Eindtoets basisonderwijs-scores , met een gemiddelde van 535 en standaarddeviatie 10.


De formule voor het berekenen van de Z-score en IQ-score is:

            wpe8.jpg (2436 bytes)

waarin:

Y = standaardscore

wpeA.jpg (767 bytes) = gemiddelde standaardscore

Sy = standaarddeviatie standaardscores

X = toetsscore

wpe9.jpg (792 bytes) = gemiddelde toetsscore

Sx = standaarddeviatie toetsscore

Omdat de omzetting van toetsscores naar Z-score en IQ-score rechtlijnig is (zie formule) blijft de oorspronkelijke vorm van de verdeling ongewijzigd.

De T-scores en de C-scores worden verkregen door een niet-rechtlijnige transformatie met het doel de oorspronkelijke verdeling te normaliseren.

Terug naar het begin


STEEKPROEF   (Eng. Sample)

Een steekproef is een verzameling elementen die op aselecte wijze uit de te onderzoeken populatie zijn genomen, hetgeen wil zeggen dat ieder element in de populatie in principe een gelijke kans heeft in het onderzoek betrokken te worden.

Naar de wijze waarop een steekproef uit de populatie wordt genomen, onderscheidt men verschillende soorten steekproeven, met name:

1 enkelvoudige steekproef (Eng. RANDOM SAMPLE)

2 gelede of gelaagde of gestratificeerde steekproef (Eng. STRATIFIED SAMPLE)

3 cluster steekproef (Eng. CLUSTER SAMPLE)

4 systematische steekproef (Eng. SYSTEMATIC SAMPLE)

ad 1
Bij een enkelvoudige steekproef worden n elementen aselect uit de te onderzoeken populatie genomen. De enkelvoudige steekproef is de meest gangbare steekproef. Met de term 'steekproef' zonder nadere aanduiding wordt vrijwel uitsluitend een enkelvoudige steekproef bedoeld.

ad 2
Bij een gelede of gelaagde of gestratificeerde steekproef wordt de te onderzoeken populatie eerst onderverdeeld in een aantal deelpopulaties (lagen, geledingen, strata) en uit elk der deelpopulaties wordt dan een steefproef genomen.

ad 3
Bij een cluster-steekproef wordt de te onderzoeken populatie onderverdeeld in deelpopulaties (clusters), bijvoorbeeld schoolklassen, en vervolgens worden de clusters aselect getrokken. Daarbij worden alle elementen in het cluster onderzocht.

ad 4
Bij een systematische steekproef worden de elementen in de populatie genummerd en vervolgens wordt ieder i-de element in de steekproef opgenomen. Bestaat een populatie bijvoorbeeld uit 1000 elementen en men wil een steekproef van 100 elementen dan is i = 10. Er wordt dan aselect een getal uit de getallen 1 t/m 10 gekozen, bijvoorbeeld 7. De steekproef bestaat dan uit de elementen met de nummers 7, 17, 27, ..., 997.

Terug naar het begin


STELLINGVRAAG

Een stellingvraag is een bijzondere vorm van een waar/onwaar-vraag. Bij een stellingvraag worden twee met elkaar samenhangende beweringen gecombineerd tot een vierkeuzevraag.

Terug naar het begin


STIMULUS    (Eng. Stimulus)

Een stimulus is een middel om een bepaald gedrag van een persoon uit te lokken. Dit is alle informatie die een kandidaat aangeboden krijgt om tot een response te komen.

Terug naar het begin


STUDIEPUNTEN     (Eng. Credit-points)

Studiepunten zijn kwalificeringen voor de studievoortgang, ze worden gegeven als een onderdeel van een opleidingsprogramma met voldoende resultaat is afgesloten. In het algemeen is het aantal studiepunten per onderdeel evenredig met de omvang ervan.

Terug naar het begin


SUBTOETS    (Eng. Subtest)

Een subtoets is een aantal opgaven uit een toets die volgens een bepaald criterium bij elkaar horen. Vaak worden over subtoetsen ook afzonderlijke toets- en itemanalyses uitgevoerd, teneinde de kwaliteit van de items ook tegen de subtoetsachtergrond te kunnen beoordelen.

Terug naar het begin


SUMMATIEVE TOETS     (Eng. Summative tests)

Een summatieve toets is een toets met het doel een curriculum op effectiviteit te beoordelen, dan wel met een soortgelijk curriculum te vergelijken (summatieve leerplanevaluatie).

De term wordt ook wel ruimer gesteld voor alle soorten toetsen die aan het eind van een onderwijsleerproces worden gebruikt voor evaluatie van het onderwijs en/of examinering van kandidaten. Zie verder: formatieve toets.

Terug naar het begin


TAXONOMIE    (Eng. Taxonomy)

Een taxonomie van onderwijsdoelstellingen is een classificatieschema waarin de categorieŽn een hiŽrarchische relatie vertonen.

Bekende taxonomieŽn zijn:

1 Voor het cognitieve gebied: die van B.S. Bloom c.s., J.P. Guilford en E. de Corte c.s.

2 Voor het affectieve gebied: die van D.R. Krathwohl c.s.

3 Voor het psychomotorische gebied: die van E.J. Simpson.

A. de Block c.s. hebben een taxonomie ontwikkeld op denk-psychologische grondslag. Vanuit hun opvatting over de harmonische vorming is deze taxonomie zowel voor cognitieve als voor affectieve doelstellingen bestemd.

Terug naar het begin


TEST   (Eng. Test)

In het nederlands is een onderscheid in zwang geraakt tussen het uit het engels overgenomen woord 'test' en het door A.D. de Groot voorgestelde woord '(studie-)toets'.
Onder test verstaan we instrumenten voor het meten van psychologische karakteristieken van mensen, voorzover ze niet direct door opzettelijke inspanningen (bijvoorbeeld onderwijs) zijn beÔnvloed.

Voorbeelden: (algemene) intelligentietests, tests voor reactievermogen, tests voor afzonderlijke cognitieve functies (bijvoorbeeld geheugen), tests voor gedragswijzen (bijvoorbeeld introversie - extraversie en andere persoonskenmerken in de socio-emotionele sfeer). Ze zijn in de regel bestemd voor gebruik door professioneel geschoolden in de testpsychologie.
Zie verder: toets.

Terug naar het begin


TEST-HERTESTMETHODE    (Eng. Test-retest method)

De test-hertestmethode is een methode om de betrouwbaarheid te schatten. Dezelfde toets wordt tweemaal afgenomen bij dezelfde kandidaten onder zoveel mogelijk dezelfde omstandigheden. De scores behaald bij de eerste toetsafname worden gecorreleerd met die behaald bij de tweede afname. De correlatiecoŽfficiŽnt is dan een maat voor de betrouwbaarheid.

Terug naar het begin


TOETS   (Eng. Test)

Een toets is een instrument voor het meten van iemands kennis en vaardigheden (praktische vaardigheden en houdingen) die door middel van studie en/of onderwijs op een of ander vakgebied zijn verworven.
Zie verder: objectieve toets en test.

Terug naar het begin


TOETSANALYSE   

Zie: toets- en itemanalyse.

Terug naar het begin


TOETS- EN ITEMANALYSE     (Eng. Test and item analysis)

Een toets- en itemanalyse is een berekening van indices waarmee de psychometrische kwaliteit van de toets en de items kan worden beoordeeld op basis van de resultaten van een groep personen in een bepaalde gebruikssituatie.

Door het berekenen van gemiddelde score, standaarddeviatie, betrouwbaarheid en standaardmeetfout wordt informatie verkregen over de kwaliteit van de toets en door het berekenen van p- of p'-waarde, a-waarde, rar- en rir-waarde wordt informatie verkregen over de kwaliteit van elk item.

Terug naar het begin


TOETSFUNCTIE   

Zie onder: toets

Terug naar het begin


TOETSMATRIJS     (Eng. Test content specification, Test blueprint)

Een toetsmatrijs is een tabel waarin aangegeven wordt hoe de opgaven behorende bij bepaalde doelstellingen worden verdeeld over tenminste twee dimensies: (vak)inhoudscategorieŽn en gedragscategorieŽn (bijvoorbeeld kennis, toepassing, inzicht).

Terug naar het begin


TOETSSCORE (X)     (Eng. Test score)

Een toetsscore (X), ook wel ruwe score genoemd, is de door middel van scoren verkregen getalsmatige weergave van de prestatie van een kandidaat op een toets. Bij een meerkeuzetoets is de toetsscore in het algemeen het aantal goed beantwoorde items.

Terug naar het begin


TOETSSERVICESYSTEEM     (Eng. Itembanking system)

Een toetsservicesysteem (itembanksysteem) is een geÔntegreerd en ten dele geautomatiseerd stelsel van procedures voor het onderhouden van een of meer itembanken, voor het samenstellen van toetsen uit de itembanken (toetsconstructie) en voor het produceren (bv. drukken) van toetsen.

Terug naar het begin


TOTAALSCORE   

Zie: toetsscore.

Terug naar het begin


TRANSFORMATIE     (Eng. Conversion)

Transformatie is het volgens regels omzetten van waarden op de ene schaal in waarden op een andere schaal. Een voorbeeld van een transformatie is het omzetten van de ruwe scores van een toets in standaardscores.

Terug naar het begin


TRUE/FALSE ITEM      

Zie: Waar/onwaarvraag.

Terug naar het begin


TRY-OUT    (Eng. Try-out)

Een try-out is een situatie waarin toetsen of bepaalde opgaven aan een oppervlakkig vooronderzoek worden onderworpen.
Bij een try-out gelden minder strenge onderzoeksvoorwaarden dan bij pretesten. Vaak wordt een try-out gehouden met een vrij klein aantal proefpersonen (steekproef) en worden aan de representativiteit van de steekproef geen hoge eisen gesteld. De bij een try-out verkregen gegevens bevatten alleen aanwijzingen voor het verbeteren van de opgaven, maar kunnen niet worden gebruikt voor het doen van uitspraken over de groep personen waarvoor de opgaven zijn bedoeld.

Terug naar het begin


VAARDIGHEID     (Eng. Competence)

De term vaardigheid wordt in verschillende betekenissen gebruikt:

 1. (Eng. SKILLS) Bekwaamheid in het uitvoeren van bepaalde handelingen en mentale operaties. Deze betekenis heeft de term als men een onderscheid wil maken met kennis in beperktere zin, bijvoorbeeld in de uitdrukking 'kennis en vaardigheden'. 'Vaardigheden' is hier min of meer synoniem met het tegenwoordig ook gebruikte 'procedure kennis'.
 2. Als synoniem van 'kennis' in de ruime betekenis van het woord. Zie: kennis.
 3. (Eng. ABILITY) Interpretatie van een antwoordpatroon binnen een itemresponsmodel (de toets meet een bepaalde 'vaardigheid').

Terug naar het begin


VALIDITEIT    (Eng. Validity)

De validiteit van een toets is de eigenschap dat de toets meet wat de constructeur bedoeld heeft ermee te meten. Aangezien een toets veel en uiteenlopende bedoelingen kan hebben zijn er evenzoveel validiteiten te onderscheiden, die een toets in verschillende mate kan bezitten. In de literatuur komen veel verschillende benamingen en definities van validiteiten voor. 

De methoden voor het bepalen van validiteiten zijn te verdelen in: methoden die door middel van correlatieberekening de relatie bepalen tussen de scores en een criterium (onder andere predictieve validiteit); methoden die tot een uitspraak leiden over de relatie tussen de toetsvragen en de onderwijsdoelstellingen (inhoudsvaliditeit); methoden die het toetsgedrag verklaren op grond van een onderliggende trek (begripsvaliditeit); methoden die de geldigheid van gevolgtrekkingen op grond van scores vaststellen door middel van experimenten; en overige methoden waaronder het op het oog vaststellen van de relatie tussen de toets en hetgeen de toets pretendeert te meten (indruksvaliditeit).

In onderwijssituaties wordt een belangrijke rol toegedeeld aan de inhoudsvaliditeit van een toets.

Terug naar het begin


VARIABELE    (Eng. Variable)

Een variabele is een grootheid die verschillende waarden kan aannemen, bijvoorbeeld geslacht, leeftijd, toetsscore en klassegrootte.

Terug naar het begin


VARIANTIE (Sx)     (Eng. Variance)

De variantie (Sx) is het kwadraat van de standaarddeviatie en is, evenals de standaarddeviatie, een maat voor de spreiding van getallen.

Terug naar het begin 


VERKLARING    (Eng. Testimonial)

Een verklaring is een geschrift dat aan een leerling wordt uitgereikt, die geen diploma of getuigschrift kan worden gegeven. Op de verklaring staat het tijdstip waarop hij de school verlaten heeft alsmede het leerjaar, waarnaar hij het laatst onvoorwaardelijk is bevorderd.

Terug naar het begin


VERLENGINGS- (EVENTUEEL VERKORTINGS-) FORMULE     

Zie: Spearman-Brown formule.

Terug naar het begin


VERTICAAL EQUIVALEREN      (Eng. Vertical equating)

Verticaal equivaleren is het op ťťn schaal brengen van de scores van twee toetsen van verschillende moeilijkheidsgraad om de omvang van het verschil te kunnen vaststellen en om de normering van beide toetsen op elkaar af te stemmen.   Bijvoorbeeld: het equivaleren van de C- en D-examens voor hetzelfde vak in een bepaald jaar.

Terug naar het begin


VOORSPELLENDE WAARDE     

Zie: predictieve validiteit.

Terug naar het begin


VOORTGANGSEVALUATIE     (Eng. Formative evaluation)

Systematisch verzamelen en interpreteren van gegevens over leerresultaten met het oog op het sturen van leerprocessen.

Terug naar het begin


VRAAGSOORT    (Eng. Item type, Question type)

Vraagsoort is een verzamelnaam voor open vragen, gekarakteriseerd naar geleding van de vraagstelling: enkelvoudige vraag, meervoudige vraag, serievraag, samengestelde vraag.

Terug naar het begin


VRAAG(STUK)      

Zie: opgave.

Terug naar het begin


VRAAGTYPE    (Eng. Item type, Question type)

Vraagtype is een verzamelnaam voor vragen, gekarakteriseerd naar het open of gesloten zijn van de vraagstelling.

Terug naar het begin


VRAAGVORM    (Eng. Item format, Response type)

 1. Verzamelnaam voor open vragen, gekarakteriseerd naar de lengte van het antwoord in: invulvraag, aanvulvraag, kort-antwoordvraag, lang-antwoordvraag, opstelvraag.
 2. Verzamelnaam voor gesloten vragen, gekarakteriseerd naar constructiewijze van stam en alternatieven: meerkeuzevraag, combinatievraag, waar/onwaarvraag, stellingvraag.

Terug naar het begin


VRIJE-VERWERKINGSVRAAG     (Eng. Divergent production type question)

Een vrije-verwerkingsvraag is een open vraag waarbij van de kandidaat wordt gevraagd een opgave op te lossen volgens een zelfstandig gekozen werkwijze of methode. Aangezien het hier gaat om de wijze waarop de kandidaat de opgave in zijn antwoord geÔnterpreteerd heeft, is het goede antwoord niet vooraf te bepalen.

Terug naar het begin


WAAR/ONWAARVRAAG    (Eng. True-False item)

Een waar/onwaarvraag is een gesloten vraag, waarin een uitspraak als waar of onwaar gekenmerkt moet worden. Deze vraagvorm kent verscheidene variaties.

Voorbeeld:

Het kwadraat van 2.5 is 4.25      ja/nee

Zie: clustervraag en extra-bepaling-vraag.

Terug naar het begin


WAARGENOMEN SCORE    (Eng. Observed score)

De waargenomen score is de score zoals die door een kandidaat behaald is. In de klassieke testtheorie denkt men de waargenomen score opgesplitst in een component ware score en een component meetfout.

Terug naar het begin


WARE SCORE    (Eng. True score)

De ware score is de hypothetische score die een kandidaat zou verkrijgen indien het mogelijk zou zijn zonder meetfout zijn score te bepalen. Iemands ware score wordt in de klassieke testtheorie voorgesteld als het gemiddelde van een oneindig aantal metingen door middel van equivalente toetsen, aangenomen dat daarbij geen oefeneffecten, of andere veranderingen in de persoon ontstaan. De standaarddeviatie van de verdeling van dit oneindige aantal metingen staat bekend als de standaardmeetfout.

Terug naar het begin


WEGEN    (Eng. To weigh)

Wegen bij een toets is het toekennen van verschillende aantallen maximaal te behalen punten per opgave.

Bij relatief genormeerde toetsen is het effect van wegen in het algemeen beperkt tot het gemiddelde omdat de bijdrage van de items aan de toetsscore voornamelijk bepaald wordt door de variantiebijdragen van de items, het z.g. effectief gewicht.
Zie verder: gewicht en gewogen toetsscore.

Terug naar het begin


Z-SCORE    (Eng. Z-score)

Een z-score is een veel voorkomende standaardscore met een gemiddelde 0 (nul) en een standaarddeviatie 1.

De formule voor het berekenen van z-scores is:

            wpeB.jpg (1351 bytes)

waarin:

z = z-score

X = toetsscore

wpeC.jpg (792 bytes)= gemiddelde toetsscore

Sx = standaarddeviatie toetsscores.

Zie verder: standaardscore.

Terug naar het begin


ZELFGERICHTE INTERPRETATIE

Betekenis geven aan toetsresultaten door deze te vergelijken met de eerder door een individu of een groep leerlingen behaalde toetsresultaten op een vergelijkbare toets.


Terug naar het begin                                                 Naar Literatuurlijst