Nieuwe IQ test: De KIQT+
Op 10 maart 2021 wordt een nieuwe intelligentietest gelanceerd, de Kinder IQ Test Plus (KIQT+). Dit is een intelligentietest die als enige specifiek ontwikkeld is voor meer- en hoogbegaafde kinderen. Omdat dit best een andere insteek is dan de andere intelligentietesten die momenteel beschikbaar zijn, lijkt het me goed om hier wat verder over uit te leggen. Al langere tijd ben ik betrokken bij de adviesraad van deze intelligentietest, waardoor ik een forse kijk achter de schermen heb kunnen nemen, al veel gewerkt heb met de KIQT+ en de onderbouwing van het materiaal en de normen goed heb kunnen uitvragen. Hierdoor juist ook alle kritische vragen kunnen stellen die van belang zijn, omdat ik op dagelijkse basis de implicaties zie die diagnostiek heeft voor hoogbegaafde kinderen en hierin nog veel haken en ogen zitten.
De aanleiding voor het ontwikkelen van de KIQT+ was – voor zover ik begrepen heb – een grote behoefte om (hoog)begaafde kinderen ook betrouwbaar in beeld te kunnen brengen met een intelligentietest. Je zou denken dat dit bij alle gevalideerde testen het geval is, maar er zitten meerdere haken en ogen aan zowel de opzet (dus de opdrachten, instructies en moeilijkheidsgraad) als de normen (dus de manier waarop scores worden berekend) van de andere beschikbare Nederlandse intelligentietesten. Dit maakt ze niet onbruikbaar of helemaal onbetrouwbaar, maar het geeft uitdagingen om begaafde kinderen recht te doen met dergelijke testen. Vaak zijn de normen van IQ testen aan de bovenkant maar op een klein groepje kinderen onderzocht en voor de rest doorberedeneerd naar boven. Hierdoor zit een veronderstelling ingebakken dat begaafde mensen ook sowieso sneller zijn, meer goede antwoorden geven (zowel bij makkelijke als moeilijke antwoorden) en instructies op dezelfde (eenduidige) manier interpreteren als alle andere mensen. Dat is in de praktijk weerbarstiger, zonder dat dit hoeft te betekenen dat iemand minder intelligent is. Van oudsher worden intelligentietesten meer onderbouwd voor de lagere intelligenties en hoewel hoogbegaafde kinderen inmiddels wel gezien worden als doelgroep waar veel vraag is naar goed intelligentieonderzoek, wordt in de ontwikkeling nog steeds veel meer aandacht besteed aan de bruikbaarheid voor lagere intelligenties. Tijd dus om hierin een stap vooruit te zetten en meer kinderen recht te kunnen doen.
Het technische verhaal
De testtheorie
De KIQT+ hanteert een andere testtheorie dan de huidig beschikbare intelligentietesten. Waar de WISC-V en RAKIT-2 uitgaan van een somscore (dus alle goede antwoorden bij elkaar opgeteld) en afbreeknormen (na een x aantal foute antwoorden stoppen, omdat verondersteld wordt dat een opdracht dan te moeilijk is), wordt binnen de KIQT+ gewerkt met een computergestuurd algoritme. Deze maakt een profiel van de vermogens van een kind, op basis van zowel de goede als de foute antwoorden die een kind geeft. Er zijn namelijk logische goede antwoorden (dus je snapt de opdracht en kunt alle stukjes informatie plaatsen), maar ook logische fouten antwoorden (je snapt misschien wel de opdracht, maar vergeet stukjes informatie mee te nemen in je antwoord omdat je die niet meer doorziet). Er zijn ook onlogische foute antwoorden (o.a. wilde gokken), wat door het algoritme wordt herkend. Deze tellen mogelijk minder mee in de beoordeling van je intelligentiescore, als ze worden aangemerkt als onbetrouwbare antwoorden. Handig, als een kind vanuit onderpresteren dit soort gedrag laat zien. Dit betekent trouwens niet dat kinderen gematst worden, omdat het profiel als geheel vanuit alle antwoorden wel consistent moet zijn.
Bovenstaand plaatje (met dank aan Scaliq voor het verstrekken van deze achtergrondinformatie) geeft hier een voorbeeld van. Bij deze grafiek is de x-as de vaardigheidsscore van een kind, dus hoe capabel een kind is in deze subtest (alle soortgelijke opdrachten). De y-as is het percentage kinderen dat voor een bepaald multiple choice antwoord (A tm H) kiest. Je ziet hierbij dat kinderen met een hoge vaardigheidsscore vaak kiezen voor G, het goede antwoord. Kinderen waarvoor deze opdracht veel te moeilijk is, kiezen vaak voor E. E is dan waarschijnlijk een logisch fout antwoord, wat écht goed lijkt als je wat stukjes informatie niet doorziet. Zo heb je ook F en H, wat minder logische foute antwoorden zijn voor kinderen die qua vaardigheidsscore er tussenin zitten. De overige antwoorden lijken onlogische foute antwoorden te zijn. Zo wordt per opgave gekeken naar de logica van de antwoorden van een kind, wat steeds invloed heeft op de inschatting van de vaardigheidsscore van een kind. Dit kan niet door een mens worden gedaan, omdat het niet simpelweg gaat om het aantal goede antwoorden, maar om het patroon van de antwoorden. Dus wordt dit gedaan door een algoritme vanuit software.
De testopzet
In de ontwikkeling van de KIQT+ is gekeken naar de onderbouwing en toegevoegde waarde van verschillende soorten taken die in intelligentietesten gebruikt worden. Meestal zit in een intelligentieonderzoek een verbaal deel (o.a. vragen waar in zinnen antwoord gegeven moet worden), geheugentaken, een non-verbaal deel (o.a. plaatjes waar logische reeksen van moeten worden gemaakt) en onderdelen met tijdsdruk. Hier krijgen kinderen een score voor en zo ontstaat een intelligentieprofiel met verschillende waarden, waar wel/niet verschil tussen kan zitten. Bij de ontwikkeling van de KIQT+ is gekeken naar de taken die wetenschappelijk gezien het meest betrouwbaar zijn om algemene intelligentie (zogenaamde g-factor) in kaart te brengen. Uit het doornemen van honderden wetenschappelijke bronnen kwamen non-verbale, visueel-ruimtelijke taken die fluïde intelligentie meten (o.a. patroonherkenning en logisch beredeneren) als meest betrouwbare metingen naar voren (zie de whitepaper van de KIQT+ voor de wetenschappelijke bronnen). Andere metingen laten hierin meer ruis of onbetrouwbaarheid zien, wat betekent dat mensen verschillend kunnen reageren ongeacht hun intelligentie. Bij minder betrouwbare taken ga je dus niet vanzelfsprekend hoger presteren als je ook intelligenter bent (of andersom). Binnen de KIQT+ zijn alle taken achterwege gelaten die onvoldoende voorspellende waarde hebben voor de g-factor. Toen bleven enkel de taken over waarbij écht betrouwbaar gesteld kan worden dat intelligentere mensen er ook echt beter in zijn dan minder intelligente mensen.
Hierdoor krijg je na onderzoek met een KIQT+ een totaal IQ score en een profiel op basis van non-verbale taken. Dit kan voor gebruik in de praktijk een gemis zijn, omdat veel onderzoekers, ouders en scholen toch waarde hechten aan inzicht in het verschil tussen verschillende vaardigheden bij een kind. Wat deze profielen (en eventuele verschillen) echter betekenen voor een individu, verschilt per situatie en is dus niet één-op-één vanuit een intelligentieprofiel zoals we het normaal meten te stellen. Hierdoor ontstaat een vorm van schijnveiligheid, waarbij het lijkt alsof een profiel wel gedrag van een kind kan verklaren (vanuit sterkte en zwakte in vermogens), maar dit zeker niet waterdicht is. Bijvoorbeeld: Het ene kind scoort lager op een verbale taak doordat hij de opdracht minder goed snapte en het andere kind scoort lager op dezelfde verbale taak omdat hij terughoudend is om volledig antwoord te geven. Als allebei deze kinderen dezelfde score halen, wil dat niet vanzelfsprekend zeggen dat ze ook even intelligent zijn (op verbaal gebied). Nu ligt de interpretatie hiervan bij de onderzoeker om het in context te plaatsen, maar dit gebeurt niet altijd op een manier die écht aansluit bij een kind en is vatbaar voor subjectiviteit. Om de meting van de IQ score zo objectief en betrouwbaar mogelijk te maken, met zo min mogelijk ruis en individuele haken en ogen, zijn binnen de KIQT+ dus enkel die subtesten gebruikt die zich hiervoor lenen.
Gebruik in de praktijk
Ik ben ontzettend blij met deze gedegen onderbouwde IQ test voor onze doelgroep, laat dat duidelijk zijn! Wij werken binnen de praktijk zo hard om alle kinderen recht te doen met de onderzoeksmiddelen die we hebben, waarbij we vaak er tegenaan lopen dat diagnostische instrumenten niet gemaakt zijn voor kinderen die wel heel veel vermogens hebben, maar om andere redenen dit niet laten zien dan simpelweg te stellen dat ze minder intelligent zijn. Zowel binnen vragenlijsten als testen komen we dit tegen. Hiermee omgaan vergt veel van de expertise van een onderzoeker, waarbij alsnog de kans bestaat dat je een kind niet in kaart kunt brengen zoals je denkt dat een kind recht doet. Tegelijkertijd snap ik dat deze nieuwe IQ test meerdere vragen oproept en ook voor ons is het een zoektocht geweest om te kijken hoe we met deze nieuwe ontwikkeling omgaan.
Onderpresteren?
Een van de grootste kritiekpunten die ik heb op intelligentietesten voor hoogbegaafde kinderen (zowel de WISC-V als bij de RAKIT-2), is dat de opzet van taken aanleiding kan geven tot onderpresteren of moeilijk testbaar gedrag. Hieronder valt o.a. gokken, verbaal dichtklappen, gestrest raken van tijdsdruk, instructies verkeerd begrijpen, onduidelijke voorbeelden, meerdere goede antwoorden of verkeerde/onvoldoende strategieën inzetten. Dit kan ruis geven in de meting, wat betekent dat je niet meer zeker weet of een kind zijn volledige vermogens heeft ingezet. Dit wil dus niet zeggen dat een score altijd hoger zou moeten zijn, maar dat er onduidelijkheid ontstaat over de betrouwbaarheid van de vermogens van een kind. Binnen de afnameprotocollen van intelligentietesten zijn strenge regels gesteld over het gedrag van een onderzoeker, omdat je niet onrealistisch veel mag helpen, aansturen op bepaalde antwoorden of het ene kind voordeel mag geven op het andere kind. En terecht! Maar soms merk je dat je een kind ‘laat wegkomen’ met bijvoorbeeld een half uitgelegd antwoord en dat hij hiervoor minder punten krijgt. Dan mag je als onderzoeker weinig om dit te doorbreken.
Dit is bij de KIQT+ niet volledig te voorkomen, net als bij andere intelligentietesten. Wel is de opzet dusdanig dat verschillende interpretaties van opdrachten of instructies zoveel mogelijk vermeden zijn. Ook het weglaten van bijvoorbeeld geheugentaken, tijdsdruk of verbale taken helpt hierbij, omdat dit hoofdzakelijk de subtesten zijn met de meeste kans op ruis (zo merk ik in de praktijk). Het algoritme houdt tevens rekening met onlogische foute antwoorden, wat een indicatie is van gokken en verminderde inzet. Wanneer een kind dit dus vaker doet, wordt door het algoritme de meting ook aangemerkt als onbetrouwbaar. Een fijne en belangrijke check, zodat mensen niet denken dat de meting daadwerkelijk de vermogens van een kind representeert. Wanneer een kind logische foute antwoorden geeft, kan hiermee dus ook betrouwbaar gesteld worden dat een kind daadwerkelijk minder vermogens heeft en gokken bijvoorbeeld een signaal is van het écht niet meer snappen. Dit is vanuit een menselijke inschatting niet zo makkelijk te doen, dus fijn dat deze check erin zit om ook onderpresteerders (waar je niet doorheen hebt kunnen prikken, wat natuurlijk wel altijd het doel is) eruit te pikken.
Alleen een non-verbale IQ score?
Intelligentieonderzoek gaat niet alleen om een IQ score. Dan kun je net zo goed een cijfer op een post-it schrijven en op het voorhoofd van een kind plakken. Je wilt juist dat diagnostiek als geheel recht doet aan een kind als geheel. Dat er nu ‘alleen’ een IQ score en profiel zonder verbale onderdelen genoemd wordt, kan dus een nadeel zijn en soms de focus op ‘erop of eronder’ scores vergroten (de magische 130, zonder menselijkheid of context). Ik snap ook dat mensen wel behoefte hebben aan meer metingen en observaties die een breder beeld geven van een kind. Wij hebben ook lang gezocht naar een manier om alle observatiegegevens die je bij andere intelligentietesten wel hebt (bijvoorbeeld omgaan met tijdsdruk, geheugenstrategieën en creativiteit) op te kunnen vangen. Inmiddels hebben we hier een mooie vorm in gevonden in ons begaafdheidsonderzoek! De KIQT+ als enige instrument afnemen om een kind in kaart te brengen zou ik dus zelf niet doen, omdat ik dan veel informatie zou missen. Maar door de KIQT+ aan te vullen met andere metingen en observaties heb ik juist het idee dat we meer ruimte hebben voor uitgebreidere diagnostiek dan je normaal in een intelligentieonderzoek zou doen.
Dit betekent m.i. niet dat je ook allemaal subtesten van de WISC-V of RAKIT-2 moet afnemen naast de KIQT+. Je gaat dan namelijk informatie aanvullen vanuit minder betrouwbare bronnen (dus weer risico op subjectiviteit en scores die voor verschillende mensen verschillende dingen betekenen). Ook sluit je de mogelijkheid voor een second opinion onderzoek uit, omdat je na het maken van subtesten deze twee jaar niet meer opnieuw mag gebruiken als meting voor de intelligentie van iemand. Wij hebben dus ervoor gekozen om de KIQT+ aan te vullen met vragenlijsten die relevant zijn voor adviezen omtrent meer- en hoogbegaafdheid (zoals persoonlijkheid, schoolbeleving en sociaal-emotioneel functioneren) en een gestructureerde observatie om te kijken naar taakaanpak en omgang met uitdagingen. Daarmee heb ik er zeker een goed gevoel bij! Het is echter per onderzoeksbureau een eigen keuze hoe en of ze de KIQT+ aanvullen met andere instrumenten. De kans is dus groot dat we als werkveld nog moeten zoeken en hier verschillen tussen de bureaus bestaan.
Alleen voor slimme kinderen?
Ik heb al een aantal keer gehoord dat mensen denken dat kinderen met de KIQT+ vaker als hoogbegaafd bestempeld zullen worden, omdat het een test is die voor slimme kinderen gemaakt is. Dat vind ik nogal kort door de bocht en doet geen recht aan de wetenschappelijke onderbouwing van de normen. Niemand heeft er iets aan als alle kinderen hoogbegaafd ‘blijken’ uit een test. Daar doe je zowel de hoogbegaafde als niet-hoogbegaafde kinderen mee tekort. Het verminderen van ruis en onbetrouwbaarheid in de metingen van intelligenties bij zowel hoogbegaafde als niet-hoogbegaafde kinderen lijkt me een goed streven. Omdat de KIQT+ IQ scores vanaf 105 kan meten, is er dus een hele groep kinderen die ook goed getest kan worden en niet hoogbegaafd is. Ook dan ben ik er voorstander van om breder te kijken dan alleen een IQ score. Feit blijft wel dat de KIQT+ vooral een meerwaarde heeft voor kinderen met (vermoedelijk) hogere intelligentiescores. Gezien de grote vraag binnen deze doelgroep naar gedegen onderzoek, lijkt me dat ook helemaal niet zo erg.
Zo, ben je inmiddels helemaal aan het eind gekomen van dit lange verhaal? Voor nu heb ik redelijk kunnen uitleggen wat ik belangrijk vind om te snappen van de KIQT+. De komende tijd zal deze test zich moeten bewijzen in de praktijk, qua bruikbaarheid op verschillende gebieden. Ook moet de test nog beoordeeld worden door de Commissie Testaangelegenheden Nederland (COTAN), een centraal orgaan om de onderbouwing, betrouwbaarheid en validiteit te beoordelen. Zoals ik eerder aangaf, is dit voor ons ook een zoektocht en eentje die we graag doen. Als diagnostiek nerd en idealist hoop ik wel dat mensen zich informeren voordat ze een mening hebben over deze nieuwe test en dat er een goed bruikbare manier bij komt om begaafde kinderen te onderzoeken op een manier die hen recht doet.
Geen reactie's