29.07.2013 Views

Danske unge i en international sammenligning Bind 2 – Teknisk ...

Danske unge i en international sammenligning Bind 2 – Teknisk ...

Danske unge i en international sammenligning Bind 2 – Teknisk ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Enhver g<strong>en</strong>eralisering, der laves på basis af <strong>en</strong> stikprøve, har derfor <strong>en</strong> usikkerhed. Stikprøvevarians<strong>en</strong><br />

er et mål for d<strong>en</strong>ne usikkerhed.<br />

PISA anv<strong>en</strong>der <strong>en</strong> totrins udtræksprocedure for stikprøv<strong>en</strong> i stedet for at trække <strong>en</strong> <strong>en</strong>kel<br />

tilfældig stikprøve. En af forskell<strong>en</strong>e mellem de to måder at udtrække stikprøve på er, at<br />

udtrukne elever fra d<strong>en</strong> samme skole ikke kan betragtes som uafhængige observationer i<br />

totrins procedur<strong>en</strong>. Det skyldes, at elever, som går på d<strong>en</strong> samme skole, typisk har flere<br />

fællestræk <strong>en</strong>d elever, der går på forskellige skoler. For eksempel vil elever på d<strong>en</strong> samme<br />

skole (og klasse) have de samme lærere og d<strong>en</strong> samme undervisningsplan. Desud<strong>en</strong> er der<br />

t<strong>en</strong>d<strong>en</strong>s til, at elever, som går på <strong>en</strong> skole, ligner hinand<strong>en</strong> mht. socioøkonomisk baggrund,<br />

både pga. boligmæssig polarisering, m<strong>en</strong> også pga. forældr<strong>en</strong>es muligheder for<br />

skolevalg. En tilfældigt udtrukket stikprøve af 4000 elever blandt alle skoler vil derfor<br />

repræs<strong>en</strong>tere forskellighed<strong>en</strong> i elevbefolkning<strong>en</strong> bedre <strong>en</strong>d <strong>en</strong> stikprøve af 100 skoler<br />

med 40 elever i hver skole. D<strong>en</strong> statistiske usikkerhed (dvs. standardfejl<strong>en</strong>) for fx g<strong>en</strong>nemsnittet<br />

af læsetestscorer for hele elevpopulation<strong>en</strong> vil derfor være større for <strong>en</strong> totrins<br />

stikprøve <strong>en</strong>d for <strong>en</strong> helt tilfældigt udtrukket stikprøve.<br />

På grund af det komplekse stikprøvedesign i PISA-undersøgels<strong>en</strong>, estimeres stikprøvevarians<strong>en</strong><br />

for befolkningsparametre (og d<strong>en</strong>s kvadratrod, standardfejl<strong>en</strong>) ved brug af<br />

såkaldte replication (=g<strong>en</strong>tagelses) metoder. Ved disse metoder udtrækkes <strong>en</strong> række mindre<br />

stikprøver, eller replicate samples, fra hele stikprøv<strong>en</strong>. D<strong>en</strong> relevante parameter, fx g<strong>en</strong>nemsnit<br />

af scorer, estimeres for hver af disse g<strong>en</strong>tagne mindre stikprøver og samm<strong>en</strong>lignes<br />

så med det tilsvar<strong>en</strong>de estimat for hele stikprøv<strong>en</strong> for at give et skøn over stikprøvevarians<strong>en</strong>.<br />

Det er vigtigt at afrapportere præcise og middelrette estimater af standardfejl<strong>en</strong>e, fordi de<br />

bruges i samm<strong>en</strong>ligninger af forskellige politikparametre. Hvis det for eksempel overvejes<br />

at indføre reformer, der skal mindske forskell<strong>en</strong> mellem dr<strong>en</strong>ges og pigers læsefærdigheder,<br />

er det vigtigt pålideligt at kunne teste, om d<strong>en</strong>ne forskel er statistisk sikker (dvs.<br />

signifikant), eller om d<strong>en</strong> snarere beror på tilfældigheder. Ethvert resultat, der videreformidles<br />

til andre forskere eller til politikere, bør derfor beregnes med replicates.<br />

Plausible values<br />

PISA anv<strong>en</strong>der imputationsmetoder (plausible values) for at afrapportere elevernes test -<br />

resultater, hvilke er h<strong>en</strong>sigtsmæssigt, når skøn over hele elevbefolkning<strong>en</strong>s færdigheder er<br />

i fokus. Plausible values (plausible værdier) er <strong>en</strong> repræs<strong>en</strong>tation af hele vift<strong>en</strong> af færdigheder,<br />

som <strong>en</strong> elev kan have, baseret på d<strong>en</strong>nes testresultater. I stedet for direkte at estimere<br />

<strong>en</strong> elevs færdigheder (fx evner i matematik) estimeres <strong>en</strong> fordeling af elev<strong>en</strong>s færdigheder.<br />

Plausible values er tilfældige træk fra d<strong>en</strong>ne estimerede fordeling af elev<strong>en</strong>s færdigheder.<br />

Der bruges fem plausible values for hver elev og for hvert testet domæne. De statistiske<br />

analyser g<strong>en</strong>nemføres <strong>en</strong>keltvis for hver af de fem plausible values. Først til sidst<br />

beregnes g<strong>en</strong>nemsnittet for fx regressionskoeffici<strong>en</strong>terne samt tilhør<strong>en</strong>de standardfejl,<br />

som blev beregnet i fem særskilte kørsler for de fem plausible values. D<strong>en</strong>ne metode, samm<strong>en</strong><br />

med replicates metod<strong>en</strong>, kræver, at parametre som g<strong>en</strong>nemsnit, standardafvigelse,<br />

proc<strong>en</strong>ter og regressionskoeffici<strong>en</strong>ter skal beregnes 405 gange: fem særskilte analyser for<br />

hver plausible value med hver gang 80 replicates plus <strong>en</strong> gang for hele stikprøv<strong>en</strong>.<br />

Kapitel 5 <strong>–</strong> Baggrundsoplysninger og fortolkning af testresultaterne i PISA<br />

161

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!