Data med fejl i er blevet udleveret til brug i mere end 200 forskningsprojekter. Styrelsen for It og Læring gør dog forskerne opmærksom på, at data ikke er uden problemer. "STIL gør tydeligt opmærksom på, at testresultater fra 2010-2014 ikke direkte kan sammenlignes med testresultater fra 2015-2022", skriver styrelsen i et svar til Folkeskolen.
Illustration: Øivind Hovland
Eksperter: Ministeriet bør standse udlevering af fejlbehæftede data til forskning
Resultaterne bliver tvivlsomme, når forskere bruger data fra nationale test fra før 2015, advarer eksperter, som mener, at ministeriet bør sætte en stopper for udleveringen af dét, de kalder for fejlbehæftede data.
Man kan ikke nødvendigvis stole på forskningsresultater, der
bygger på data fra nationale test.
Sådan lød advarslen forleden i fagbladet Folkeskolen fra professor emeritus Svend
Kreiner, der har gennemgået fire forskningsrapporter, som ifølge ham og en
række eksperter i psykometri drager nogle “usikre konklusioner” på baggrund af
netop data fra nationale test.
Én af grundene til, at mange forskere kommer på glatis, når de
kaster sig ud i at analysere testdata, er, at elevers testresultater fra
perioden 2010-2014, som forskerne kan få adgang til hos Styrelsen for It og
Læring (Stil), er meget usikre og er beregnet på en anden måde end senere data.
Det gør det blandt andet umuligt at sammenligne med senere testresultater,
forklarer Svend Kreiner i sin skriftlige gennemgang af rapporterne.
Spørger man
Svend Kreiner, mener han, at Stil enten burde rette fejlene i elevernes
testdata ved at lave en genberegning, eller simpelthen lukke for adgangen til
de data, der volder forskerne ekstra store problemer.
“Hvis ministeriet samtidig havde besluttet også at rette
testresultaterne fra 2010 til 2014 eller helt havde slettet resultaterne fra
før 2014, ville vi have været fri for den sidste tids diskussion af
resultaterne fra Holm et.al. (2023). Det er desværre ikke tilfældet”, skriver
Svend Kreiner i det notat, hvor han gennemgår en række forskningsrapporters
“problematiske” brug af data fra de nationale test.
Anklagede forskere afviser kritik
Med “den sidste tids diskussion” henviser han til en artikel på folkeskolen.dk fra januar, hvor Svend Kreiner og hans forskerkollega Jeppe
Bundsgaard kritiserer forskerne bag en rapport fra Rockwool Fondens
forskningsenhed for at bruge de fejlbehæftede data. Rockwool Fondens chef for forskning
i uddannelse og familie, Rasmus Landersø, afviste for nylig kritikken.
”De ting, som Svend Kreiner påpeger, er lige præcis de ting,
som vi er meget opmærksomme på i vores brug af data. Ikke kun i forbindelse med
nationale test, men helt generelt”, siger Rasmus Landersø, der ikke er bange
for at stå inde for troværdigheden af forskningsenhedens resultater de seneste
ti år, hvor han har været ansat.
Professor i statskundskab på Aarhus Universitet Simon Calmar Andersen har også brugt den omdiskuterede data og bliver kritiseret for det i Svend Kreiners notat. Han afviste forleden overfor Folkeskolen, at fejlene i data har nogen praktisk betydning for hans forskningsresultater.
“Svend Kreiner skriver selv, at han ikke kan sige, hvor meget det betyder for resultaterne om data er genberegnede eller ikke er. Jeg vil sige, at den der genberegning ikke har nogen praktisk betydning”, siger Simon Calmar Andersen.
Testekspert: Data burde kunne korrigeres
Svend Kreiner bekymring omkring den fejlbehæftede data bliver delt af Daniel
Bergh, der er lektor på Gøteborg Universitet og har mange års erfaring med
psykometri.
Han har læst Svend Kreiners notat og siger:
”Jeg forstår godt, at
det er problematisk at tage data væk, fordi man efterlader et hul i
registreringen. Men det er ikke godt, hvis der findes data, som er fejlbehæftet.
Jeg tænker stadig, at data burde kunne korrigeres”.
Folkeskolen har spurgt
Stil, hvorfor styrelsen ikke genberegner de gamle data.
Den korte version af
styrelsens svar er, at det ikke kan lade sig gøre at lave genberegninger, der
ville kunne gøre de gamle data sammenlignelige med senere data. Blandt
andet fordi, at flere af de 45 spørgsmål, som en test i dansk læsning eller
matematik består af, blev udskiftet i 2015.
Sagens notater og replikker
- Professor emeritus Svend Kreiner har skrevet et kritisk notat om forskeres brug af data fra nationale test i forskning.
- Lektor Tine Nielsen har skrevet en vurdering af Svend Kreiners notat.
- Otte kritiserede forskere har skrevet et fælles svar på Svend Kreiners kritik.
Det betyder, at elevens
samlede pointscore i testen skal beregnes på færre opgaver end de 45, og det
giver et alt for usikkert resultat, forklarer styrelsen i et svar til Folkeskolen.
Stil: Data kan hverken fjernes eller rettes
Psykolog, ph.d. Tine Nielsen, der forsker i bl.a. test ved professionshøjskolen UCL, har ligesom Daniel Bergh læst Svend Kreiners notat, og hun mener, at Stil burde
undlade at give forskerne adgang til den problematiske data.
“At der ikke er sket en
genberegning af testresultaterne fra før 2015, er naturligvis uheldigt. Der er,
for mig at se, dog ikke noget der forhindrer ministeriet i at råde bod på dette
ved at undlade at udlevere data fra før 2015”, skriver Tine Nielsen i sin
vurdering af Svend Kreiners notat.
Det forslag ser det dog
heller ikke ud til, at Stil har planer om at følge.
Til Folkeskolen skriver styrelsen:
“STIL vurderer dog
samlet set, at data fra nationale test 2010-2014 kan have selvstændig værdi og
interesse i analyse- og forskningssammenhæng, og har derfor ikke fundet
anledning til at slette disse data. Dette også i lyset af, at STIL ved evt.
udlevering af disse data gør opmærksom på, at testresultater fra 2010-2014 ikke
direkte kan sammenlignes med testresultater fra 2015-2022".
Styrelsen gør dog ikke
bare forskerne opmærksom på, at testresultaterne ikke er sammenlignelige.
De forsøger også at anspore forskerne til ikke at sammenblande de to datasæt, lyder forklaringen fra Stil.
“Når forskere ansøger
om udlevering af data fra de nationale test, udleveres som udgangspunkt
udelukkende de genberegnede elevdygtigheder fra 2015 og frem. STIL gør tydeligt
opmærksom på, at testresultater fra 2010-2014 ikke direkte kan sammenlignes med
testresultater fra 2015-2022. Dette fremgår også af den datadokumentation, der
medfølger ved udlevering”, skriver styrelsen i mailen.