18.09.2013 Views

Litet statistiskt lexikon - Ncm

Litet statistiskt lexikon - Ncm

Litet statistiskt lexikon - Ncm

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Litet</strong> <strong>statistiskt</strong> <strong>lexikon</strong><br />

GÖRAN ANDERSSON<br />

Vi har bett Göran Andersson att som en avrundning av den uppmärksammade<br />

artikelserien om Statistisk kommunikationsfärdighet ställa samman ett litet <strong>statistiskt</strong><br />

<strong>lexikon</strong>, som skulle täcka de mest elementära begreppen inom de samhällsvetenskapliga<br />

tillämpningar som berör matematiken (bl a som en följd av den nya<br />

kursplanen i matematik för gymnasiets HSE-linjer).<br />

Efter viss tvekan har han (till vår glädje) ställt upp på att göra det önskade lilla<br />

<strong>lexikon</strong>et. Han vill dock ha betonat att sammanställningen av statistiska fackuttryck<br />

verkligen är mycket liten. Ett flertal uppslagsord har Göran exemplifierat i<br />

artikelserien (se hänvisningar efter respektive uppslagsord).<br />

Bortfall Se Svarsbortfall.<br />

Cluster Engelskt ord som betyder grupp, hop.<br />

Clusterurval Kallas även gruppurval. Vissa populationer<br />

är svåra att undersöka genom t ex<br />

obundet slumpmässigt urval helt enkelt därför att<br />

det är svårt/dyrt att konstruera en förteckning<br />

(urvalsram) över individerna i populationen (t ex<br />

landets gymnasieelever). Däremot kan det vara<br />

lättare att finna en förteckning över grupper av<br />

individer (t ex en förteckning över landets gymnasieskolor).<br />

Clusterurval innebär att man slumpmässigt<br />

väljer ut ett antal grupper från urvalsramen av<br />

grupper, i exemplet ett antal gymnasieskolor.<br />

Undersöks samtliga elever i de utvalda skolorna<br />

Statistisk kommunikationsfärdighet<br />

— artikelserie i Nämnaren<br />

Årgång 9<br />

Nr 1: Att luras med statistik — mycket<br />

mer än vilseledande diagram<br />

Nr 2: Genomskåda och belysa<br />

Nr 3: Problem med väljarbarometrar<br />

Nr 4: Lite mer om den statistiska felmarginalen<br />

Årgång 10<br />

Nr 1: Argumentation med index<br />

Nr 3: Försöksverksamhet med tillämpad<br />

statistik (I detta nummer ges också<br />

omfattande lästips med förslag på<br />

litteratur om "statistisk klokskap".)<br />

har man gjort ett enstegsurval. Undersöker man i<br />

stället ett stickprov av elever från var och en av de<br />

utvalda skolorna är det fråga om ett tvåstegsurval<br />

(som är det enklaste fallet av flerstegsurval). Även<br />

tre- och fyrstegsurval förekommer ganska ofta.<br />

Om populationen t ex är landets grundskoleelever<br />

kanske man först väljer ut ett antal kommuner,<br />

sedan ett antal grundskoleenheter ur var och en<br />

av de utvalda kommunerna medan det tredje<br />

steget, slutligen, är ett urval av elever från var och<br />

en av dessa skolenheter.<br />

Vid riksomfattande intervjuundersökningar<br />

används ofta clusterurval även om det finns en<br />

förteckning över populationens individer. För att<br />

minska reskostnaderna är det oftast lämpligt att<br />

koncentrera intervjuerna till ett antal utvalda


duster (t ex kommuner eller församlingar). IMUoch<br />

Sifo-undersökningarna baseras på clusterurval.<br />

(Se nr 3, 82/83.)<br />

Definitionsproblem I massmediadebatten om<br />

t ex olika gruppers inkomstutveckling, förekommer<br />

ofta att debattörerna pratar förbi varandra<br />

genom att använda olika definitioner (före eller<br />

efter skatt, löpande eller fasta priser, med eller<br />

utan tillägg av olika slag etc). (Se nr 1, 82/83.)<br />

Deflatering Bortrensning av inflationens inverkan<br />

(i t ex en tidsserie). (Se övningsexempel i nr 1,<br />

83/84.)<br />

Enstegsurval Se clusterurval.<br />

Felmarginal Se statistisk felmarginal<br />

Flerstegsurval Se clusterurval.<br />

Gruppurval Synonym till clusterurval (se detta<br />

ord).<br />

Index Ordet index kommer från latinet och<br />

betyder pekfinger eller visare. Den senare betydelsen<br />

går igen i de statistiska indexbegreppen. Syftet<br />

är där nämligen att visa hur ett mätvärde —<br />

eller en serie av mätvärden — förhåller sig till ett<br />

visst utgångsläge.<br />

Konfidens I den statistiska litteraturen betyder<br />

konfidens ungefär tillförlitlighet, säkerhet.<br />

Konfidensintervall Ett intervall som baseras på<br />

stickprovsvärden och som med viss tillförlitlighet/säkerhet/konfidens<br />

(t ex 95 %) täcker det<br />

populationsvärde som avses. (Se nr 3 och 4, 82/<br />

83.)<br />

Konfidensnivå Den tillförlitlighet/konfidens<br />

med vilken ett konfidensintervall täcker det åsyftade<br />

populationsvärdet. Vanliga konfidensnivåer<br />

är 90, 95, 99 och 99,9 %. Om konfidensnivån<br />

inte är angiven avses oftast 95 %.<br />

Korrelationskoefficienten Vanligen åsyftas den<br />

s k produktmomentkorrelationskoefficienten r<br />

som mäter graden av det linjära sambandet mellan<br />

två variabler. Koefficienten varierar mellan<br />

- 1 och + 1, där r = - 1 anger att ett fullständigt<br />

linjärt, negativt samband föreligger. På motsvarande<br />

sätt innebär r = 1 ett fullständigt linjärt,<br />

positivt samband. Om r = 0,815 säger det oss två<br />

saker:<br />

tecknet (+) innebär att sambandet är positivt<br />

det numeriska värdet 0,815 innebär att sambandet<br />

är relativt höggradigt linjärt (eftersom<br />

0,815 är ganska nära 1).<br />

Mätfel Skillnaden mellan uppmätt och "sant"<br />

värde i en observation. Naturvetaren kanske i<br />

första hand förknippar mätfel med ett tekniskt<br />

mätinstrument som inte fungerar tillfredsställande.<br />

Sådana mätfel inryms naturligtvis också under<br />

rubriken. I statistisk litteratur har dock begreppet<br />

mätinstrument en betydligt vidare innebörd. Så är<br />

t ex ett vanligt mätinstrument den postenkät som<br />

utsänds till ett antal utvalda. Mätfel kan uppkomma<br />

t ex om en fråga är olämpligt formulerad.<br />

(Se nr 2, 82/83.)<br />

Obundet slumpmässigt urval (OSU) OSU tillgår<br />

i princip på samma sätt som dragning av ett<br />

antal lotter ur en tombola, där man tar en lott i<br />

Göran Andersson är säkert känd bland många som undervisar i matematik för sin artikelserie i<br />

Nämnaren och för boken Lögn och sanning med statistik. Den senare har gett honom ett av<br />

Forskningsrådsnämndens stipendier för "angelägna populärvetenskapliga bokprojekt". Av<br />

recensionerna tror vi han gläder sig särskilt åt pedagogikprofessorn Erik Wallins anmälan i<br />

Upsala Nya Tidning, som avslutades med ". . . en kunnig och stringent framställning som på<br />

samma gång sprudlar av gott humör". I detta instämmer Nämnarens redaktion gärna och länge.<br />

Göran är till vardags universitetslektor i Uppsala, där han lett flera utvecklingsprojekt<br />

rörande bl a statistikundervisningens metodik. Författat ett antal läromedel för högskolebruk<br />

som led i utvecklingsarbetet. Ordförande i Svenska statistikersamfundets utbildningskommitté.<br />

Genom olika vikariat under studietiden har han skaffat sig ca två års erfarenhet av att undervisa<br />

11—18-åriga elever i matematik. Två korttidsförordnanden som gymnasieinspektör.<br />

Under senare år har Göran varit en flitigt anlitad föreläsare vid fortbildningsdagar för lärare i<br />

matematik och samhällskunskap. I dessa sammanhang, och andra, propagerar han för ökat<br />

utrymme inom gymnasieundervisningen för tillämpad statistik och systematiserad kritisk<br />

granskning av statistik i massmedia. Den här terminen ägnar han bl a åt att stödja och bevaka<br />

att de nya statistikmomenten i läroplanen för HSE-matematiken följs upp med fortbildningsinsatser.


taget och rullar och skakar om tombolan mellan<br />

varje dragning, så att varje enskild lott tas ut<br />

fullständigt slumpmässigt. OSU innebär att varje<br />

individ i populationen har samma sannolikhet att<br />

bli utvald till stickprovet. Vidare gäller att varje<br />

tänkbar kombination av n individer från de N i<br />

populationen har samma sannolikhet att bli det<br />

utvalda stickprovet.<br />

Orsak—verkan Ett ej ovanligt <strong>statistiskt</strong> felslut<br />

är förväxling av orsak och verkan. Det är viktigt<br />

att komma ihåg att det faktum att ett samband<br />

existerar mellan två variabler (x och y) inte behöver<br />

betyda att man fastställt vilket av följande<br />

orsakssammanhang som gäller.<br />

Variabeln x påverkar variabeln y.<br />

Variabeln y påverkar variabeln x.<br />

Ömsesidig påverkan mellan variablerna.<br />

En eller flera variabler z påverkar<br />

samtidigt variablerna utan att dessa<br />

(x och y) behöver ha något saklogiskt<br />

samband.<br />

(Se nr 1, 82/83.)<br />

Population En statistisk undersökning syftar i<br />

princip alltid till att ge information om en mängd<br />

individer/enheter. Denna mängd kallas för population.<br />

Om samtliga individer i populationen<br />

undersöks talar man om totalundersökning. Mycket<br />

vanligt är dock att man blott undersöker ett<br />

stickprov ur populationen i hopp om att till lägre<br />

kostnad kunna dra något så när tillförlitliga slutsatser<br />

om hela den bakomliggande populationen.<br />

Randomiserade intervjuer Termen kommer av<br />

engelska "random" = slumpmässig. Randomiserade<br />

intervjuer är en teknik som möjliggör meningsfulla<br />

skattningar även för ytterst känsliga<br />

frågor som kriminalitet, prostitution och missbruk.<br />

Intervjun tillgår så att den svarande drar ett<br />

kort ur en välblandad kortlek som i det enklaste<br />

fallet består av två typer av påståendekort (t ex<br />

"Jag skattefuskar" och "Jag skattefuskar inte").<br />

Den svarande avger ett av svaren "Sant" eller<br />

"Osant" varefter han blandar in påståendekortet<br />

i kortleken igen utan att intervjuaren har sett<br />

kortet. Det är sedan möjligt att skatta andelen<br />

skattefuskare i populationen genom vissa jämförande<br />

beräkningar baserade på proportionen kort<br />

"Jag skattefuskar inte" och proportionen<br />

"Sant"-svar. (Se övningsuppgift i nr 2, 82/83.)<br />

Sampel Synonym till stickprov.<br />

Signifikant skillnad Se <strong>statistiskt</strong> säkerställd<br />

skillnad.<br />

Slumpfel Man skiljer på slumpmässiga fel<br />

(slumpfel) och systematiska fel. Slumpfel i urvalssammanhang<br />

beror på att urvalsmekanismen (utlottningsförfarandet)<br />

nästan aldrig ger exakt re-<br />

presentativitet. Ibland tilldelar slumpen stickprovet<br />

t ex fler borgerliga än det "borde" innehålla,<br />

ibland färre. Men i det långa loppet tar slumpfelen<br />

ut varandra. Systematiska fel ger däremot en<br />

konsekvent snedvridning. Om värnpliktiga mäts<br />

med marschkängorna på erhålls en systematisk<br />

överskattning av kroppslängden.<br />

Slumpmässigt urval Oftast avses sannolikhetsurval,<br />

dvs de typer av urval som möjliggör sannolikhetsberäkningar<br />

av slumpfelets storlek (t ex i<br />

form av konfidensintervall eller statistiska felmarginaler).<br />

OSU, stratifierat urval och clusterurval<br />

är exempel på sannolikhetsurval.<br />

Slumptalstabell Kan sägas vara en i förväg<br />

upprättad "dragningslista". Varje enskild siffra<br />

har bildats på sådant sätt att var och en av de tio<br />

olika, möjliga siffrorna har haft samma sannolikhet<br />

att bli utvald.<br />

Snedvridande faktorer På en arbetsplats är ofta<br />

män och kvinnor olika fördelade över ålder och<br />

typ av arbete. Därför kan medelfrånvaron bland<br />

män och kvinnor ge ett missvisande mått på<br />

könsfaktorns betydelse för sjukfrånvaron. Ålder<br />

och typ av arbete är här exempel på snedvridande<br />

faktorer som gör en jämförelse av totalmedelvärdena<br />

tämligen meningslös. (Se övningsuppgift i nr<br />

1, 80/81, med lösning i nr 3, 80/81.)<br />

Standardvägning En metod att eliminera inverkan<br />

av snedvridande faktorer.<br />

Statistisk felmarginal Ett mått på det slumpmässiga<br />

felet i resultatet av en stickprovsundersökning.<br />

Om inget annat sägs brukar felmarginalen<br />

anges med 95 % säkerhet. Felmarginaler beräknas<br />

även för bl a differensen mellan resultaten<br />

i två stickprovsundersökningar. (Se nr 3, 82/83.)<br />

Statistiskt säkerställd skillnad Om den uppmätta<br />

skillnaden mellan resultaten i två stickprovsundersökningar<br />

är större än den statistiska felmarginalen<br />

för denna skillnad, sägs den uppmätta<br />

skillnaden vara "<strong>statistiskt</strong> säkerställd". Om inget<br />

annat anges är vanligen innebörden av "säkerställdheten"<br />

att sannolikheten är mindre än 5 %<br />

att den uppmätta skillnaden enbart beror på<br />

slumpen. Man talar också om statistisk säker-


ställd skillnad mellan ett stickprovsvärde och ett<br />

sant eller hypotetiskt värde på motsvarande storhet<br />

i populationen (t ex om skillnaden mellan<br />

andelen centerpartister i en IMU-mätning och i<br />

valresultatet). (Se nr 3 och 4, 82/83.)<br />

Stratifierat urval Populationen indelas i ett<br />

antal undergrupper, strata (singularis stratum).<br />

Ur varje stratum tas ett slumpmässigt urval ut för<br />

undersökning. De erhållna värdena i de olika<br />

strata vägs sedan ihop till en skattning för hela<br />

populationen.<br />

Svarsbortfall Vid enkät- och intervjuundersökningar<br />

är det vanligt att en del av de tilltänkta<br />

intervjupersonerna inte är anträffbara. Och av<br />

dem som är anträffbara brukar ett antal vägra att<br />

medverka i undersökningen. Svarsbortfall innebär<br />

problem därför att man nästan alltid måste<br />

utgå från att dessa personer beträffande väsentli-<br />

UPPROP<br />

Vid biennalens Tema 22 föreslogs detta<br />

upprop:<br />

Fler och fler lärare önskar arbeta mera oberoende<br />

av en fastställd lärobok i matematik,<br />

men många känner sig osäkra och skulle<br />

önska få tillfälle att utbyta erfarenheter<br />

med kolleger med samma inriktning. För<br />

att underlätta detta, vore det bra om det<br />

kunde upprättas en adressförteckning över<br />

intresserade lärare. Kanske kunde vi också<br />

samlas till någon egen konferens.<br />

Är DU intresserad, skriv då till Gudrun Malmer,<br />

Soldatgatan 5, 212 33 Malmö, tel 040 - 49 35 75.<br />

Uppge namn, adress och telefonnummer och det<br />

stadium DU undervisar på. Delge också gärna dina<br />

idéer om hur vi bäst ska kunna utbyta erfarenheter.<br />

ga undersökningsvariabler skiljer sig från svarandegruppen.<br />

I nr 1, 82/83, visas i några exempel<br />

hur man under olika antaganden beräknar svarsbortfallets<br />

möjliga inverkan på slutresultatet.<br />

Systematiska fel Kan ses som en motsats till<br />

slumpfel och exemplifieras under detta uppslagsord.<br />

Totalundersökning Samtliga individer i populationen<br />

undersöks.<br />

Trend Inom tidserieanalysen försöker man ofta<br />

särskilja fyra olika variationsorsaker: trend, konjunktur,<br />

säsong, tillfälliga variationer. Med trend<br />

menar man den långsiktiga utveckling som äger<br />

rum på grund av t ex ökad levnadsstandard,<br />

befolkningstillväxt, produktivitetsförbättringar<br />

etc.<br />

Tvåstegsurval Se clusterurval.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!