Danske unge i en international sammenligning Bind 2 – Teknisk ...
Danske unge i en international sammenligning Bind 2 – Teknisk ...
Danske unge i en international sammenligning Bind 2 – Teknisk ...
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Enhver g<strong>en</strong>eralisering, der laves på basis af <strong>en</strong> stikprøve, har derfor <strong>en</strong> usikkerhed. Stikprøvevarians<strong>en</strong><br />
er et mål for d<strong>en</strong>ne usikkerhed.<br />
PISA anv<strong>en</strong>der <strong>en</strong> totrins udtræksprocedure for stikprøv<strong>en</strong> i stedet for at trække <strong>en</strong> <strong>en</strong>kel<br />
tilfældig stikprøve. En af forskell<strong>en</strong>e mellem de to måder at udtrække stikprøve på er, at<br />
udtrukne elever fra d<strong>en</strong> samme skole ikke kan betragtes som uafhængige observationer i<br />
totrins procedur<strong>en</strong>. Det skyldes, at elever, som går på d<strong>en</strong> samme skole, typisk har flere<br />
fællestræk <strong>en</strong>d elever, der går på forskellige skoler. For eksempel vil elever på d<strong>en</strong> samme<br />
skole (og klasse) have de samme lærere og d<strong>en</strong> samme undervisningsplan. Desud<strong>en</strong> er der<br />
t<strong>en</strong>d<strong>en</strong>s til, at elever, som går på <strong>en</strong> skole, ligner hinand<strong>en</strong> mht. socioøkonomisk baggrund,<br />
både pga. boligmæssig polarisering, m<strong>en</strong> også pga. forældr<strong>en</strong>es muligheder for<br />
skolevalg. En tilfældigt udtrukket stikprøve af 4000 elever blandt alle skoler vil derfor<br />
repræs<strong>en</strong>tere forskellighed<strong>en</strong> i elevbefolkning<strong>en</strong> bedre <strong>en</strong>d <strong>en</strong> stikprøve af 100 skoler<br />
med 40 elever i hver skole. D<strong>en</strong> statistiske usikkerhed (dvs. standardfejl<strong>en</strong>) for fx g<strong>en</strong>nemsnittet<br />
af læsetestscorer for hele elevpopulation<strong>en</strong> vil derfor være større for <strong>en</strong> totrins<br />
stikprøve <strong>en</strong>d for <strong>en</strong> helt tilfældigt udtrukket stikprøve.<br />
På grund af det komplekse stikprøvedesign i PISA-undersøgels<strong>en</strong>, estimeres stikprøvevarians<strong>en</strong><br />
for befolkningsparametre (og d<strong>en</strong>s kvadratrod, standardfejl<strong>en</strong>) ved brug af<br />
såkaldte replication (=g<strong>en</strong>tagelses) metoder. Ved disse metoder udtrækkes <strong>en</strong> række mindre<br />
stikprøver, eller replicate samples, fra hele stikprøv<strong>en</strong>. D<strong>en</strong> relevante parameter, fx g<strong>en</strong>nemsnit<br />
af scorer, estimeres for hver af disse g<strong>en</strong>tagne mindre stikprøver og samm<strong>en</strong>lignes<br />
så med det tilsvar<strong>en</strong>de estimat for hele stikprøv<strong>en</strong> for at give et skøn over stikprøvevarians<strong>en</strong>.<br />
Det er vigtigt at afrapportere præcise og middelrette estimater af standardfejl<strong>en</strong>e, fordi de<br />
bruges i samm<strong>en</strong>ligninger af forskellige politikparametre. Hvis det for eksempel overvejes<br />
at indføre reformer, der skal mindske forskell<strong>en</strong> mellem dr<strong>en</strong>ges og pigers læsefærdigheder,<br />
er det vigtigt pålideligt at kunne teste, om d<strong>en</strong>ne forskel er statistisk sikker (dvs.<br />
signifikant), eller om d<strong>en</strong> snarere beror på tilfældigheder. Ethvert resultat, der videreformidles<br />
til andre forskere eller til politikere, bør derfor beregnes med replicates.<br />
Plausible values<br />
PISA anv<strong>en</strong>der imputationsmetoder (plausible values) for at afrapportere elevernes test -<br />
resultater, hvilke er h<strong>en</strong>sigtsmæssigt, når skøn over hele elevbefolkning<strong>en</strong>s færdigheder er<br />
i fokus. Plausible values (plausible værdier) er <strong>en</strong> repræs<strong>en</strong>tation af hele vift<strong>en</strong> af færdigheder,<br />
som <strong>en</strong> elev kan have, baseret på d<strong>en</strong>nes testresultater. I stedet for direkte at estimere<br />
<strong>en</strong> elevs færdigheder (fx evner i matematik) estimeres <strong>en</strong> fordeling af elev<strong>en</strong>s færdigheder.<br />
Plausible values er tilfældige træk fra d<strong>en</strong>ne estimerede fordeling af elev<strong>en</strong>s færdigheder.<br />
Der bruges fem plausible values for hver elev og for hvert testet domæne. De statistiske<br />
analyser g<strong>en</strong>nemføres <strong>en</strong>keltvis for hver af de fem plausible values. Først til sidst<br />
beregnes g<strong>en</strong>nemsnittet for fx regressionskoeffici<strong>en</strong>terne samt tilhør<strong>en</strong>de standardfejl,<br />
som blev beregnet i fem særskilte kørsler for de fem plausible values. D<strong>en</strong>ne metode, samm<strong>en</strong><br />
med replicates metod<strong>en</strong>, kræver, at parametre som g<strong>en</strong>nemsnit, standardafvigelse,<br />
proc<strong>en</strong>ter og regressionskoeffici<strong>en</strong>ter skal beregnes 405 gange: fem særskilte analyser for<br />
hver plausible value med hver gang 80 replicates plus <strong>en</strong> gang for hele stikprøv<strong>en</strong>.<br />
Kapitel 5 <strong>–</strong> Baggrundsoplysninger og fortolkning af testresultaterne i PISA<br />
161