Litet statistiskt lexikon - Ncm
Litet statistiskt lexikon - Ncm
Litet statistiskt lexikon - Ncm
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
<strong>Litet</strong> <strong>statistiskt</strong> <strong>lexikon</strong><br />
GÖRAN ANDERSSON<br />
Vi har bett Göran Andersson att som en avrundning av den uppmärksammade<br />
artikelserien om Statistisk kommunikationsfärdighet ställa samman ett litet <strong>statistiskt</strong><br />
<strong>lexikon</strong>, som skulle täcka de mest elementära begreppen inom de samhällsvetenskapliga<br />
tillämpningar som berör matematiken (bl a som en följd av den nya<br />
kursplanen i matematik för gymnasiets HSE-linjer).<br />
Efter viss tvekan har han (till vår glädje) ställt upp på att göra det önskade lilla<br />
<strong>lexikon</strong>et. Han vill dock ha betonat att sammanställningen av statistiska fackuttryck<br />
verkligen är mycket liten. Ett flertal uppslagsord har Göran exemplifierat i<br />
artikelserien (se hänvisningar efter respektive uppslagsord).<br />
Bortfall Se Svarsbortfall.<br />
Cluster Engelskt ord som betyder grupp, hop.<br />
Clusterurval Kallas även gruppurval. Vissa populationer<br />
är svåra att undersöka genom t ex<br />
obundet slumpmässigt urval helt enkelt därför att<br />
det är svårt/dyrt att konstruera en förteckning<br />
(urvalsram) över individerna i populationen (t ex<br />
landets gymnasieelever). Däremot kan det vara<br />
lättare att finna en förteckning över grupper av<br />
individer (t ex en förteckning över landets gymnasieskolor).<br />
Clusterurval innebär att man slumpmässigt<br />
väljer ut ett antal grupper från urvalsramen av<br />
grupper, i exemplet ett antal gymnasieskolor.<br />
Undersöks samtliga elever i de utvalda skolorna<br />
Statistisk kommunikationsfärdighet<br />
— artikelserie i Nämnaren<br />
Årgång 9<br />
Nr 1: Att luras med statistik — mycket<br />
mer än vilseledande diagram<br />
Nr 2: Genomskåda och belysa<br />
Nr 3: Problem med väljarbarometrar<br />
Nr 4: Lite mer om den statistiska felmarginalen<br />
Årgång 10<br />
Nr 1: Argumentation med index<br />
Nr 3: Försöksverksamhet med tillämpad<br />
statistik (I detta nummer ges också<br />
omfattande lästips med förslag på<br />
litteratur om "statistisk klokskap".)<br />
har man gjort ett enstegsurval. Undersöker man i<br />
stället ett stickprov av elever från var och en av de<br />
utvalda skolorna är det fråga om ett tvåstegsurval<br />
(som är det enklaste fallet av flerstegsurval). Även<br />
tre- och fyrstegsurval förekommer ganska ofta.<br />
Om populationen t ex är landets grundskoleelever<br />
kanske man först väljer ut ett antal kommuner,<br />
sedan ett antal grundskoleenheter ur var och en<br />
av de utvalda kommunerna medan det tredje<br />
steget, slutligen, är ett urval av elever från var och<br />
en av dessa skolenheter.<br />
Vid riksomfattande intervjuundersökningar<br />
används ofta clusterurval även om det finns en<br />
förteckning över populationens individer. För att<br />
minska reskostnaderna är det oftast lämpligt att<br />
koncentrera intervjuerna till ett antal utvalda
duster (t ex kommuner eller församlingar). IMUoch<br />
Sifo-undersökningarna baseras på clusterurval.<br />
(Se nr 3, 82/83.)<br />
Definitionsproblem I massmediadebatten om<br />
t ex olika gruppers inkomstutveckling, förekommer<br />
ofta att debattörerna pratar förbi varandra<br />
genom att använda olika definitioner (före eller<br />
efter skatt, löpande eller fasta priser, med eller<br />
utan tillägg av olika slag etc). (Se nr 1, 82/83.)<br />
Deflatering Bortrensning av inflationens inverkan<br />
(i t ex en tidsserie). (Se övningsexempel i nr 1,<br />
83/84.)<br />
Enstegsurval Se clusterurval.<br />
Felmarginal Se statistisk felmarginal<br />
Flerstegsurval Se clusterurval.<br />
Gruppurval Synonym till clusterurval (se detta<br />
ord).<br />
Index Ordet index kommer från latinet och<br />
betyder pekfinger eller visare. Den senare betydelsen<br />
går igen i de statistiska indexbegreppen. Syftet<br />
är där nämligen att visa hur ett mätvärde —<br />
eller en serie av mätvärden — förhåller sig till ett<br />
visst utgångsläge.<br />
Konfidens I den statistiska litteraturen betyder<br />
konfidens ungefär tillförlitlighet, säkerhet.<br />
Konfidensintervall Ett intervall som baseras på<br />
stickprovsvärden och som med viss tillförlitlighet/säkerhet/konfidens<br />
(t ex 95 %) täcker det<br />
populationsvärde som avses. (Se nr 3 och 4, 82/<br />
83.)<br />
Konfidensnivå Den tillförlitlighet/konfidens<br />
med vilken ett konfidensintervall täcker det åsyftade<br />
populationsvärdet. Vanliga konfidensnivåer<br />
är 90, 95, 99 och 99,9 %. Om konfidensnivån<br />
inte är angiven avses oftast 95 %.<br />
Korrelationskoefficienten Vanligen åsyftas den<br />
s k produktmomentkorrelationskoefficienten r<br />
som mäter graden av det linjära sambandet mellan<br />
två variabler. Koefficienten varierar mellan<br />
- 1 och + 1, där r = - 1 anger att ett fullständigt<br />
linjärt, negativt samband föreligger. På motsvarande<br />
sätt innebär r = 1 ett fullständigt linjärt,<br />
positivt samband. Om r = 0,815 säger det oss två<br />
saker:<br />
tecknet (+) innebär att sambandet är positivt<br />
det numeriska värdet 0,815 innebär att sambandet<br />
är relativt höggradigt linjärt (eftersom<br />
0,815 är ganska nära 1).<br />
Mätfel Skillnaden mellan uppmätt och "sant"<br />
värde i en observation. Naturvetaren kanske i<br />
första hand förknippar mätfel med ett tekniskt<br />
mätinstrument som inte fungerar tillfredsställande.<br />
Sådana mätfel inryms naturligtvis också under<br />
rubriken. I statistisk litteratur har dock begreppet<br />
mätinstrument en betydligt vidare innebörd. Så är<br />
t ex ett vanligt mätinstrument den postenkät som<br />
utsänds till ett antal utvalda. Mätfel kan uppkomma<br />
t ex om en fråga är olämpligt formulerad.<br />
(Se nr 2, 82/83.)<br />
Obundet slumpmässigt urval (OSU) OSU tillgår<br />
i princip på samma sätt som dragning av ett<br />
antal lotter ur en tombola, där man tar en lott i<br />
Göran Andersson är säkert känd bland många som undervisar i matematik för sin artikelserie i<br />
Nämnaren och för boken Lögn och sanning med statistik. Den senare har gett honom ett av<br />
Forskningsrådsnämndens stipendier för "angelägna populärvetenskapliga bokprojekt". Av<br />
recensionerna tror vi han gläder sig särskilt åt pedagogikprofessorn Erik Wallins anmälan i<br />
Upsala Nya Tidning, som avslutades med ". . . en kunnig och stringent framställning som på<br />
samma gång sprudlar av gott humör". I detta instämmer Nämnarens redaktion gärna och länge.<br />
Göran är till vardags universitetslektor i Uppsala, där han lett flera utvecklingsprojekt<br />
rörande bl a statistikundervisningens metodik. Författat ett antal läromedel för högskolebruk<br />
som led i utvecklingsarbetet. Ordförande i Svenska statistikersamfundets utbildningskommitté.<br />
Genom olika vikariat under studietiden har han skaffat sig ca två års erfarenhet av att undervisa<br />
11—18-åriga elever i matematik. Två korttidsförordnanden som gymnasieinspektör.<br />
Under senare år har Göran varit en flitigt anlitad föreläsare vid fortbildningsdagar för lärare i<br />
matematik och samhällskunskap. I dessa sammanhang, och andra, propagerar han för ökat<br />
utrymme inom gymnasieundervisningen för tillämpad statistik och systematiserad kritisk<br />
granskning av statistik i massmedia. Den här terminen ägnar han bl a åt att stödja och bevaka<br />
att de nya statistikmomenten i läroplanen för HSE-matematiken följs upp med fortbildningsinsatser.
taget och rullar och skakar om tombolan mellan<br />
varje dragning, så att varje enskild lott tas ut<br />
fullständigt slumpmässigt. OSU innebär att varje<br />
individ i populationen har samma sannolikhet att<br />
bli utvald till stickprovet. Vidare gäller att varje<br />
tänkbar kombination av n individer från de N i<br />
populationen har samma sannolikhet att bli det<br />
utvalda stickprovet.<br />
Orsak—verkan Ett ej ovanligt <strong>statistiskt</strong> felslut<br />
är förväxling av orsak och verkan. Det är viktigt<br />
att komma ihåg att det faktum att ett samband<br />
existerar mellan två variabler (x och y) inte behöver<br />
betyda att man fastställt vilket av följande<br />
orsakssammanhang som gäller.<br />
Variabeln x påverkar variabeln y.<br />
Variabeln y påverkar variabeln x.<br />
Ömsesidig påverkan mellan variablerna.<br />
En eller flera variabler z påverkar<br />
samtidigt variablerna utan att dessa<br />
(x och y) behöver ha något saklogiskt<br />
samband.<br />
(Se nr 1, 82/83.)<br />
Population En statistisk undersökning syftar i<br />
princip alltid till att ge information om en mängd<br />
individer/enheter. Denna mängd kallas för population.<br />
Om samtliga individer i populationen<br />
undersöks talar man om totalundersökning. Mycket<br />
vanligt är dock att man blott undersöker ett<br />
stickprov ur populationen i hopp om att till lägre<br />
kostnad kunna dra något så när tillförlitliga slutsatser<br />
om hela den bakomliggande populationen.<br />
Randomiserade intervjuer Termen kommer av<br />
engelska "random" = slumpmässig. Randomiserade<br />
intervjuer är en teknik som möjliggör meningsfulla<br />
skattningar även för ytterst känsliga<br />
frågor som kriminalitet, prostitution och missbruk.<br />
Intervjun tillgår så att den svarande drar ett<br />
kort ur en välblandad kortlek som i det enklaste<br />
fallet består av två typer av påståendekort (t ex<br />
"Jag skattefuskar" och "Jag skattefuskar inte").<br />
Den svarande avger ett av svaren "Sant" eller<br />
"Osant" varefter han blandar in påståendekortet<br />
i kortleken igen utan att intervjuaren har sett<br />
kortet. Det är sedan möjligt att skatta andelen<br />
skattefuskare i populationen genom vissa jämförande<br />
beräkningar baserade på proportionen kort<br />
"Jag skattefuskar inte" och proportionen<br />
"Sant"-svar. (Se övningsuppgift i nr 2, 82/83.)<br />
Sampel Synonym till stickprov.<br />
Signifikant skillnad Se <strong>statistiskt</strong> säkerställd<br />
skillnad.<br />
Slumpfel Man skiljer på slumpmässiga fel<br />
(slumpfel) och systematiska fel. Slumpfel i urvalssammanhang<br />
beror på att urvalsmekanismen (utlottningsförfarandet)<br />
nästan aldrig ger exakt re-<br />
presentativitet. Ibland tilldelar slumpen stickprovet<br />
t ex fler borgerliga än det "borde" innehålla,<br />
ibland färre. Men i det långa loppet tar slumpfelen<br />
ut varandra. Systematiska fel ger däremot en<br />
konsekvent snedvridning. Om värnpliktiga mäts<br />
med marschkängorna på erhålls en systematisk<br />
överskattning av kroppslängden.<br />
Slumpmässigt urval Oftast avses sannolikhetsurval,<br />
dvs de typer av urval som möjliggör sannolikhetsberäkningar<br />
av slumpfelets storlek (t ex i<br />
form av konfidensintervall eller statistiska felmarginaler).<br />
OSU, stratifierat urval och clusterurval<br />
är exempel på sannolikhetsurval.<br />
Slumptalstabell Kan sägas vara en i förväg<br />
upprättad "dragningslista". Varje enskild siffra<br />
har bildats på sådant sätt att var och en av de tio<br />
olika, möjliga siffrorna har haft samma sannolikhet<br />
att bli utvald.<br />
Snedvridande faktorer På en arbetsplats är ofta<br />
män och kvinnor olika fördelade över ålder och<br />
typ av arbete. Därför kan medelfrånvaron bland<br />
män och kvinnor ge ett missvisande mått på<br />
könsfaktorns betydelse för sjukfrånvaron. Ålder<br />
och typ av arbete är här exempel på snedvridande<br />
faktorer som gör en jämförelse av totalmedelvärdena<br />
tämligen meningslös. (Se övningsuppgift i nr<br />
1, 80/81, med lösning i nr 3, 80/81.)<br />
Standardvägning En metod att eliminera inverkan<br />
av snedvridande faktorer.<br />
Statistisk felmarginal Ett mått på det slumpmässiga<br />
felet i resultatet av en stickprovsundersökning.<br />
Om inget annat sägs brukar felmarginalen<br />
anges med 95 % säkerhet. Felmarginaler beräknas<br />
även för bl a differensen mellan resultaten<br />
i två stickprovsundersökningar. (Se nr 3, 82/83.)<br />
Statistiskt säkerställd skillnad Om den uppmätta<br />
skillnaden mellan resultaten i två stickprovsundersökningar<br />
är större än den statistiska felmarginalen<br />
för denna skillnad, sägs den uppmätta<br />
skillnaden vara "<strong>statistiskt</strong> säkerställd". Om inget<br />
annat anges är vanligen innebörden av "säkerställdheten"<br />
att sannolikheten är mindre än 5 %<br />
att den uppmätta skillnaden enbart beror på<br />
slumpen. Man talar också om statistisk säker-
ställd skillnad mellan ett stickprovsvärde och ett<br />
sant eller hypotetiskt värde på motsvarande storhet<br />
i populationen (t ex om skillnaden mellan<br />
andelen centerpartister i en IMU-mätning och i<br />
valresultatet). (Se nr 3 och 4, 82/83.)<br />
Stratifierat urval Populationen indelas i ett<br />
antal undergrupper, strata (singularis stratum).<br />
Ur varje stratum tas ett slumpmässigt urval ut för<br />
undersökning. De erhållna värdena i de olika<br />
strata vägs sedan ihop till en skattning för hela<br />
populationen.<br />
Svarsbortfall Vid enkät- och intervjuundersökningar<br />
är det vanligt att en del av de tilltänkta<br />
intervjupersonerna inte är anträffbara. Och av<br />
dem som är anträffbara brukar ett antal vägra att<br />
medverka i undersökningen. Svarsbortfall innebär<br />
problem därför att man nästan alltid måste<br />
utgå från att dessa personer beträffande väsentli-<br />
UPPROP<br />
Vid biennalens Tema 22 föreslogs detta<br />
upprop:<br />
Fler och fler lärare önskar arbeta mera oberoende<br />
av en fastställd lärobok i matematik,<br />
men många känner sig osäkra och skulle<br />
önska få tillfälle att utbyta erfarenheter<br />
med kolleger med samma inriktning. För<br />
att underlätta detta, vore det bra om det<br />
kunde upprättas en adressförteckning över<br />
intresserade lärare. Kanske kunde vi också<br />
samlas till någon egen konferens.<br />
Är DU intresserad, skriv då till Gudrun Malmer,<br />
Soldatgatan 5, 212 33 Malmö, tel 040 - 49 35 75.<br />
Uppge namn, adress och telefonnummer och det<br />
stadium DU undervisar på. Delge också gärna dina<br />
idéer om hur vi bäst ska kunna utbyta erfarenheter.<br />
ga undersökningsvariabler skiljer sig från svarandegruppen.<br />
I nr 1, 82/83, visas i några exempel<br />
hur man under olika antaganden beräknar svarsbortfallets<br />
möjliga inverkan på slutresultatet.<br />
Systematiska fel Kan ses som en motsats till<br />
slumpfel och exemplifieras under detta uppslagsord.<br />
Totalundersökning Samtliga individer i populationen<br />
undersöks.<br />
Trend Inom tidserieanalysen försöker man ofta<br />
särskilja fyra olika variationsorsaker: trend, konjunktur,<br />
säsong, tillfälliga variationer. Med trend<br />
menar man den långsiktiga utveckling som äger<br />
rum på grund av t ex ökad levnadsstandard,<br />
befolkningstillväxt, produktivitetsförbättringar<br />
etc.<br />
Tvåstegsurval Se clusterurval.