Kvalitetsbegrepp och riktlinjer för kvalitets - Statistiska centralbyrån
Kvalitetsbegrepp och riktlinjer för kvalitets - Statistiska centralbyrån
Kvalitetsbegrepp och riktlinjer för kvalitets - Statistiska centralbyrån
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
(Huvud)<br />
<strong>Kvalitetsbegrepp</strong> <strong>och</strong> <strong>riktlinjer</strong> <strong>för</strong> <strong>kvalitets</strong>-<br />
deklaration av officiell statistik<br />
Quality definition and recommendations for<br />
quality declarations of official statistics<br />
(fot)
Producent: <strong>Statistiska</strong> <strong>centralbyrån</strong>, Utvecklingsavdelningen, Metodenheten<br />
Förfrågningar: Eva Elvers, tfn 08 - 506 947 14 e-post: eva.elvers@scb.se
Förord<br />
Frågor som har att göra med statistikens kvalitet <strong>och</strong> hur den kan <strong>för</strong>bättras har alltid<br />
varit centrala <strong>för</strong> <strong>Statistiska</strong> <strong>centralbyrån</strong> (SCB). I det arbetet ingår att definiera<br />
vad man vill mena med kvalitet i samband med statistik <strong>och</strong> att utforma verktyg <strong>för</strong><br />
att följa <strong>och</strong> <strong>för</strong>bättra kvaliteten hos olika statistikprodukter.<br />
Som ett led i <strong>kvalitets</strong>arbetet presenterar SCB i detta Meddelande i samordningsfrågor<br />
(MIS) dels ett <strong>kvalitets</strong>begrepp <strong>för</strong> officiell statistik, dels anvisningar <strong>för</strong><br />
utformning av <strong>kvalitets</strong>deklarationer. MIS:et är främst avsett att vara ett hjälpmedel<br />
<strong>för</strong> producenter av officiell statistik, både i arbetet med att utveckla statistiken <strong>och</strong><br />
vid utformningen av den <strong>kvalitets</strong>deklaration som skall åtfölja all officiell statistik.<br />
Förhoppningsvis kan MIS:et också vara till hjälp <strong>för</strong> beställare <strong>och</strong> användare av<br />
statistik.<br />
Detta MIS ersätter MIS 1994:3 "<strong>Kvalitetsbegrepp</strong> <strong>och</strong> <strong>riktlinjer</strong> <strong>för</strong> <strong>kvalitets</strong>redovisning<br />
av statistik". Det överensstämmer i det väsentliga med sin <strong>för</strong>egångare, men<br />
vissa revisioner har gjorts. Huvudskälen <strong>för</strong> dessa har varit dels att komma nära det<br />
<strong>kvalitets</strong>begrepp som är under framväxt hos EU:s statistikbyrå Eurostat, dels<br />
önskemål om att undanröja vissa konstaterade olägenheter med <strong>för</strong>egående<br />
<strong>kvalitets</strong>begrepp.<br />
Kvalitetsarbete är en kontinuerlig process som hämtar impulser från såväl användning<br />
<strong>och</strong> produktion av statistik som forskning. För det fortsatta arbetet välkomnar<br />
SCB synpunkter på innehållet i detta MIS från intressenter såväl inom som utom<br />
det officiella statistiksystemet.<br />
MIS:et har utarbetats av Eva Elvers <strong>och</strong> Bengt Rosén, SCB.<br />
<strong>Statistiska</strong> <strong>centralbyrån</strong> i april 2001<br />
Svante Öberg
Innehålls<strong>för</strong>teckning Sida<br />
Förord<br />
Bakgrund <strong>för</strong> <strong>och</strong> syfte med detta MIS<br />
<strong>Kvalitetsbegrepp</strong> <strong>för</strong> officiell statistik 1<br />
Allmänt om kvalitet 1<br />
Kvalitet <strong>och</strong> statistik 2<br />
<strong>Kvalitetsbegrepp</strong> <strong>för</strong> officiell statistik 3<br />
Kvalitetskomponenternas innebörd 5<br />
Statistikens innehåll 5<br />
Statistikens till<strong>för</strong>litlighet 7<br />
Statistikens aktualitet 9<br />
Statistikens jäm<strong>för</strong>barhet <strong>och</strong> samanvändbarhet 10<br />
Statistikens tillgänglighet <strong>och</strong> <strong>för</strong>ståelighet 12<br />
Riktlinjer <strong>för</strong> <strong>kvalitets</strong>deklaration av statistik 13<br />
Underlag <strong>för</strong> <strong>kvalitets</strong>bedömning <strong>och</strong> statistikanvändning 13<br />
Mall <strong>för</strong> <strong>kvalitets</strong>deklaration av statistik 14<br />
Bilaga 1 Begrepp <strong>och</strong> termer i anslutning till statistiska undersökningar 19<br />
Bilaga 2 Summarisk redovisning av osäkerhet 29<br />
Bilaga 3 <strong>Kvalitetsbegrepp</strong>et – översättning till engelska 31<br />
Bilaga 4 Exempel 43
Bakgrund <strong>för</strong> <strong>och</strong> syfte med detta MIS<br />
Beslutsfattare, planerare, media, allmänhet, m.fl. efterfrågar statistik som belyser<br />
olika samhällsaspekter <strong>och</strong> deras <strong>för</strong>ändringar. Information önskas om befolkningen,<br />
näringslivet, fastighetsbeståndet, miljön, osv. Sveriges officiella statistik<br />
syftar till att möta sådana informationsönskemål.<br />
I <strong>och</strong> med att samhället <strong>för</strong>ändras, ändras också behov <strong>och</strong> önskemål om den officiella<br />
statistikens innehåll. Nya önskemål tillkommer <strong>och</strong> gamla blir överspelade.<br />
Likaså ändras de tekniska, juridiska <strong>och</strong> opinionsmässiga <strong>för</strong>utsättningarna <strong>för</strong><br />
insamling av grunduppgifter till statistik <strong>och</strong> <strong>för</strong> spridning av statistiken. För att<br />
möta behoven väl behöver statistiken där<strong>för</strong> ständigt utvecklas <strong>och</strong> anpassas, i samarbete<br />
mellan beställare, användare <strong>och</strong> producenter.<br />
Informationsönskemålen om samhällets olika sektorer är så mångskiftande att de<br />
inte kan mötas av officiell statistik med precis det innehåll <strong>och</strong> den till<strong>för</strong>litlighet<br />
som varje enskild användare helst skulle vilja. Åtskillig statistik används där<strong>för</strong><br />
även <strong>för</strong> andra ändamål <strong>och</strong> på andra sätt än vad den främst är framtagen <strong>för</strong>. För att<br />
undvika felanvändningar är det viktigt att producenterna tillhandahåller klar<br />
information om statistikens egenskaper, d.v.s. en <strong>kvalitets</strong>/varudeklaration.<br />
Detta Meddelande i samordningsfrågor (MIS) presenterar dels ett <strong>kvalitets</strong>begrepp<br />
<strong>för</strong> officiell statistik, dels <strong>riktlinjer</strong> <strong>för</strong> utformning av <strong>kvalitets</strong>deklarationer av<br />
officiell statistik. Sådana angavs senast i MIS 1994:3 "<strong>Kvalitetsbegrepp</strong> <strong>och</strong> <strong>riktlinjer</strong><br />
<strong>för</strong> <strong>kvalitets</strong>deklaration av officiell statistik". Huvudanledningar till att MIS:et<br />
nu revideras är dels att undanröja vissa konstaterade olägenheter med <strong>för</strong>egående<br />
<strong>kvalitets</strong>begrepp dels att komma nära det <strong>kvalitets</strong>begrepp som är under framväxt<br />
hos EU:s statistikbyrå Eurostat.<br />
Viktig bakgrund <strong>för</strong> arbete med <strong>riktlinjer</strong> <strong>för</strong> <strong>kvalitets</strong>deklarationer ges av <strong>för</strong>ordningen<br />
om den officiella statistiken (SFS 1992:1668, senast ändrad i SFS 1999:3).<br />
Där anges att officiell statistik skall <strong>kvalitets</strong>deklareras, <strong>och</strong> att SCB skall meddela<br />
<strong>för</strong>eskrifter <strong>för</strong> <strong>kvalitets</strong>deklarationer. SCB har <strong>för</strong>eskrivit att officiell statistik skall<br />
åtföljas av en <strong>kvalitets</strong>deklaration vilken skall offentliggöras <strong>och</strong> finnas tillgänglig<br />
på samma sätt som den officiella statistiken. För att kunna ge allmänna råd i<br />
anlutning till <strong>för</strong>eskrifterna behöver SCB ett MIS av här <strong>för</strong>eliggande slag. Det är i<br />
<strong>för</strong>sta hand avsett att vara ett hjälpmedel <strong>för</strong> statistikproducenter vid deras utarbetande<br />
av <strong>kvalitets</strong>deklarationer, men det kan <strong>för</strong>hoppningsvis också vara till<br />
hjälp <strong>för</strong> beställare <strong>och</strong> användare av statistik.<br />
Kvalitetssynen i detta MIS överensstämmer med den i MIS 1994:3. Huvudramen<br />
ges av begreppet totalkvalitet, en ram som successivt anammats inom såväl offentlig<br />
som privat verksamhet. Utvecklingslinjen ifråga återfinns också hos statistiska<br />
centralbyråer i andra länder.<br />
Första kapitlet behandlar statistikkvalitet. Det börjar med en allmän diskussion av<br />
kvalitet, <strong>och</strong> mynnar ut i en strukturering av <strong>kvalitets</strong>begreppet <strong>för</strong> statistik. Kapitlet<br />
därefter beskriver innebörden i de olika komponenter som tillsammans bildar<br />
<strong>kvalitets</strong>begreppet. I tredje kapitlet formuleras <strong>riktlinjer</strong> <strong>för</strong> hur en <strong>kvalitets</strong>deklaration<br />
skall disponeras <strong>och</strong> vilken information som statistikproducenterna bör<br />
tillhandahålla <strong>för</strong> de olika <strong>kvalitets</strong>komponenterna. Begrepp <strong>och</strong> termer i anslutning<br />
till statistiska undersökningar <strong>för</strong>klaras i Bilaga 1. En möjlighet <strong>för</strong> summariskt<br />
angivande av osäkerhetsmarginaler anges i Bilaga 2. I Bilaga 3 är <strong>kvalitets</strong>begreppet<br />
översatt till engelska.
MIS:et saknar medvetet en genomgående numrering, <strong>för</strong> att undvika sammanblandning<br />
med den numrering som är avsedd att användas i <strong>kvalitets</strong>deklarationer.<br />
Den numreringen in<strong>för</strong>s i kapitlet om Kvalitetskomponenternas innebörd <strong>och</strong><br />
används sedan också i kapitlet om Riktlinjer <strong>för</strong> <strong>kvalitets</strong>deklarationer.
<strong>Kvalitetsbegrepp</strong> <strong>för</strong> officiell statistik<br />
Allmänt om kvalitet<br />
I vardagsspråket handlar "kvalitet" om var på skalan dålig - ganska bra - utmärkt en<br />
användare anser att en viss produkt (vara eller tjänst) ligger i jäm<strong>för</strong>else med andra<br />
liknande produkter. Ofta används emellertid ordet "kvalitet" också med en positiv<br />
värdeladdning, som synonym till "god kvalitet". Denna möjliga värdeladdning med<strong>för</strong><br />
att termen är litet svår att hantera, <strong>och</strong> att den kan definieras på olika sätt.<br />
Synen på kvalitet <strong>och</strong> idéer om hur man skall utveckla produkter med god kvalitet<br />
har varierat under tidernas lopp. Under senare decennier har <strong>kvalitets</strong>tänkandet hos<br />
producenter av varor <strong>och</strong> tjänster kommit att allt mer bli baserat på synsättet totalkvalitet,<br />
<strong>för</strong> vilket huvudpunkter ges av (i) <strong>och</strong> (ii) nedan.<br />
(i) Användaren skall stå i centrum. En produkts <strong>kvalitets</strong>status avgörs av<br />
(faktiska <strong>och</strong> potentiella) användares uppfattningar om produkten <strong>och</strong><br />
dess användbarhet.<br />
För att ovanstående slagordsmässiga formulering skall leda till praktiska effekter<br />
måste den operationaliseras. Ett <strong>för</strong>sta steg är att formulera ett konkret <strong>kvalitets</strong>begrepp<br />
<strong>för</strong> den aktuella produkten. Utgående från punkt (i) ovan kan producentens<br />
<strong>kvalitets</strong>begrepp definieras på följande sätt.<br />
(ii) Kvalitet åsyftar alla egenskaper hos en produkt som har betydelse <strong>för</strong><br />
hur väl denna tillfredsställer användares behov <strong>och</strong> <strong>för</strong>väntningar.<br />
Denna definition innebär ett användarorienterat <strong>kvalitets</strong>begrepp som <strong>för</strong> producenten<br />
i <strong>för</strong>sta hand får en deskriptiv innebörd. För honom/henne är <strong>kvalitets</strong>begreppet<br />
fram<strong>för</strong> allt en <strong>för</strong>teckning av de aspekter på en produkt som användare<br />
fäster avseende vid när de bedömer hur bra den tillgodoser deras behov <strong>och</strong> <strong>för</strong>väntningar.<br />
Därvid beaktas aspekter såväl på hur produkten fungerar som på service<br />
i samband med in<strong>för</strong>skaffande <strong>och</strong> användning. Begreppet tar däremot inte ställning<br />
till om produkten i någon absolut mening skall anses vara bra eller dålig.<br />
För användaren har kvalitet en mer värderande innebörd. Dennes <strong>kvalitets</strong>omdöme<br />
beror dock inte enbart på produkten i sig, utan också på hur den är avsedd att<br />
användas. En <strong>och</strong> samma produkt kan mycket väl anses ha god kvalitet <strong>för</strong> en viss<br />
användning, men dålig <strong>för</strong> en annan. Användaren är den som vet vilka behov <strong>och</strong><br />
<strong>för</strong>väntningar han/hon har, <strong>och</strong> är där<strong>för</strong> den som står <strong>för</strong> <strong>kvalitets</strong>bedömningen. För<br />
producenten är det naturligtvis högst angeläget att ta reda på användares <strong>kvalitets</strong>bedömningar,<br />
eftersom de ger underlag <strong>för</strong> utvecklingsarbete mot bättre kvalitet<br />
(större användartillfredsställelse).<br />
Det <strong>för</strong> en produkt konkret formulerade <strong>kvalitets</strong>begreppet har betydelse i bl.a.<br />
nedanstående sammanhang:<br />
Utformning av <strong>kvalitets</strong>deklarationer : Genom en <strong>kvalitets</strong>deklaration kan producenten<br />
beskriva en produkts egenskaper så att den kan användas på rätt sätt, <strong>och</strong><br />
informera användare om den kvalitet de i olika avseenden kan räkna med.<br />
I <strong>kvalitets</strong><strong>för</strong>bättringsarbete : Eftersom användarnas värderingar <strong>och</strong> preferenser<br />
ändras över tiden måste producenten ständigt sträva efter att anpassa sin produkt till<br />
nya önskemål. Ett användarorienterat <strong>kvalitets</strong>begrepp underlättar kommunikationen<br />
mellan användare <strong>och</strong> producent.<br />
Vid produktivitetsutvärdering: Det är alltid angeläget att produktionsresurser utnyttjas<br />
så bra som möjligt. En producent vill där<strong>för</strong> kunna utvärdera relativ nytta<br />
<strong>och</strong> kostnader <strong>för</strong> olika resurser i produktionsprocessen. <strong>Kvalitetsbegrepp</strong>et ger ett<br />
av instrumenten <strong>för</strong> utvärdering <strong>och</strong> resursallokering.<br />
1
2<br />
Kvalitet <strong>och</strong> statistik<br />
Termen statistik används med litet olika betydelser. Här har det huvudinnebörden<br />
"sammanfattande numerisk beskrivning av <strong>för</strong>hållanden i en grupp". Statistik tas<br />
fram <strong>för</strong> att ge information som kan belysa konkreta sakproblem. Den utgör ofta en<br />
viktig del av besluts- <strong>och</strong> planeringsunderlag, men ger också information till allmänhet,<br />
utredare, forskare m.fl. om "sakernas tillstånd <strong>och</strong> utveckling".<br />
Det i statistiksammanhang centrala begreppet är statistisk storhet. En sådan är ett<br />
värde, som definieras av att ett statistiskt mått (antal, medelvärde, median, m.fl.)<br />
används <strong>för</strong> att sammanfatta värdena på en variabel (= egenskap) hos objekten i en<br />
grupp. Det "totala" objektkollektivet kallas populationen.<br />
Exempel på statistiska storheter : (i) Förädlingsvärdet i svensk varvsindustri under<br />
1998. Här är objektgruppen = <strong>för</strong>etagen i svensk varvsindustri under 1998, variabeln<br />
= <strong>för</strong>ädlingsvärde <strong>och</strong> det statistiska måttet = summa. (ii) Genomsnittlig disponibel<br />
inkomst under 1998 <strong>för</strong> i Stockholm bosatta tvåbarnsfamiljer. Här är objektgruppen<br />
= tvåbarnsfamiljer som bodde i Stockholm 1998, variabeln = disponibel inkomst <strong>och</strong><br />
det statistiska måttet = medelvärde.<br />
En statistisk undersökning går ut på att skaffa kunskap om värdena på en eller flera<br />
statistiska storheter <strong>för</strong> en population, <strong>och</strong> oftast också <strong>för</strong> delgrupper i denna. De<br />
statistiska storheter som en undersökning gäller kallas dess målstorheter. De har<br />
"sanna" men okända värden. En statistisk undersökning omfattar normalt två<br />
huvudmoment, insamling av grunduppgifter (primäruppgifter), respektive bearbetning<br />
av dessa till statistikvärden, som skattar målstorheterna.<br />
Ordet "skattning" indikerar fram<strong>för</strong> allt att ett statistikvärde normalt inte anger ett<br />
helt korrekt värde på motsvarande målstorhet, utan är <strong>för</strong>enat med viss osäkerhet.<br />
Det "kategoriska" kravet vid skattning är att sträva efter väntevärdesriktiga ("i<br />
genomsnitt riktiga") skattningar. Det finns flera möjliga källor till osäkerhet. Vid en<br />
urvalsundersökning <strong>för</strong>eligger den uppenbara osäkerhetskällan att inte alla objekt i<br />
populationen undersöks. I såväl total- som urvalsundersökningar kommer också<br />
andra slag av störningar in i undersökningsprocessen <strong>och</strong> bidrar till osäkerhet i<br />
statistiken. Osäkerhetskällor utöver urval, vilka diskuteras mer ingående längre<br />
fram, är : brister i täckningen av målpopulationen, mätfel, svarsbortfall, bearbetningsfel<br />
samt inte helt uppfyllda modellantaganden.<br />
När det allmänna total<strong>kvalitets</strong>begrepp som formulerades i <strong>för</strong>egående avsnitt tilllämpas<br />
på statistik ger det följande definition<br />
(iii) Statistiks kvalitet avser alla egenskaper hos statistik som har betydelse<br />
<strong>för</strong> hur väl denna tillgodoser användares informationsbehov.<br />
För att ge bakgrund åt det <strong>kvalitets</strong>begrepp som formuleras litet längre fram anges<br />
härnäst några aspekter på statistik, som flertalet användare fäster avseende vid. En<br />
mer fullständig diskussion ges i kapitlet om Kvalitetskomponenternas innebörd.<br />
Vanligtvis efterfrågas aktuell statistik, varmed avses (åtminstone idealt) statistik<br />
som beskriver nuläget. Faktorer som påverkar aktualiteten är snabbheten i uppgiftsinsamling<br />
<strong>och</strong> bearbetning, <strong>och</strong> <strong>för</strong> återkommande undersökningar hur frekvent de<br />
genom<strong>för</strong>s.<br />
En vanlig <strong>och</strong> viktig användning av statistik är att göra jäm<strong>för</strong>elser, dels jäm<strong>för</strong>elser<br />
över tiden (med hjälp av tidsserier) dels jäm<strong>för</strong>elser mellan olika grupper. Rättvisande<br />
jäm<strong>för</strong>elser ställer konsistenskrav på statistikvärdenas målstorheter, krav<br />
som också aktualiseras när statistikvärden från olika statistikkällor skall användas<br />
tillsammans.<br />
Framtagen statistik görs tillgänglig <strong>för</strong> användarna med olika spridningsformer, via<br />
olika media (papper, elektroniskt medium, m.m.) <strong>och</strong> via olika kanaler (<strong>Statistiska</strong>
Meddelanden per post, årsbok, på diskett, uttag från databas, m.m.). Informationen<br />
kan också presenteras på olika sätt, i text, diagram, tabeller, m.m.<br />
Vissa användare efterfrågar annan statistik än den som publiceras reguljärt. En del<br />
sådan statistik finns ofta redan framtagen hos producenten, eller kan tas fram av<br />
denne genom specialbearbetning av primärmaterial. Ett alternativ, som önskas särskilt<br />
av forskare, utredare, m.fl., är att få direkttillgång till (avidentifierat) primärmaterial,<br />
vilket ger möjlighet att själv framställa statistik man är intresserad av.<br />
Användares tilltro till statistik beror av deras uppfattning om såväl oavsiktliga som<br />
avsiktliga fel. Inte ens den mest omsorgsfulle statistikproducent kan undvika viss,<br />
men oavsiktlig, osäkerhet i statistiken. Att medvetet felaktig, icke objektiv, statistik<br />
kan <strong>för</strong>ekomma är känt. Aspekten objektivitet <strong>för</strong>s dock inte in i <strong>kvalitets</strong>begreppet.<br />
Det är nästan ogörligt att bedöma om statistik är framställd på ett objektivt sätt eller<br />
inte. För Sveriges del säger lagen 1992 : 889 om den officiella statistiken: Den<br />
officiella statistiken skall vara objektiv <strong>och</strong> allmänt tillgänglig.<br />
Som redan sagts avser "användare" såväl faktiska som potentiella användare. Det<br />
finns alltid organisationer <strong>och</strong> personer som inte får sina statistikönskemål tillgodosedda,<br />
antingen där<strong>för</strong> att önskad statistik inte framställs eller där<strong>för</strong> att framtagen<br />
statistik inte är tillräckligt bra <strong>för</strong> deras syften. Sådana önskemål bör beaktas<br />
när statistik utvärderas <strong>och</strong>/eller revideras.<br />
<strong>Kvalitetsbegrepp</strong> <strong>för</strong> officiell statistik<br />
Hur en användare avgränsar den statistik som dennes <strong>kvalitets</strong>bedömning avser<br />
beror av sakproblemet <strong>och</strong> användningssituationen. "Statistiken" kan bestå av ett<br />
enskilt statistikvärde, av alla statistikvärden från en enskild undersökning eller från<br />
flera olika undersökningar, som används tillsammans. Den kan också åsyfta ett<br />
flöde (över tiden) av statistikvärden. Naturligtvis gäller att ju mer omfattande statistiken<br />
är, desto fler aspekter har den. Följande <strong>kvalitets</strong>begrepp är avsett att kunna<br />
användas oavsett statistikens omfattning, men <strong>för</strong> små "statistikpaket" är vissa<br />
<strong>kvalitets</strong>komponenter ibland irrelevanta.<br />
Det finns inget självklart sätt att dela in en statistiks totala egenskapsuppsättning i<br />
huvud- <strong>och</strong> underaspekter. Den struktur som presenteras nedan har följande fem<br />
huvudkomponenter. (1) Innehåll, som fram<strong>för</strong> allt gäller statistikens målstorheter.<br />
(2) Till<strong>för</strong>litlighet, som avser osäkerhetskällor <strong>och</strong> dessas effekter på statistiken. (3)<br />
Aktualitet, som omfattar tidsaspekter som spelar roll <strong>för</strong> hur väl statistiken beskriver<br />
nuläget. (4) Jäm<strong>för</strong>barhet <strong>och</strong> samanvändbarhet, som avser möjligheter till<br />
jäm<strong>för</strong>elser, över tiden <strong>och</strong> mellan grupper, samt till att använda statistiken tillsammans<br />
med annan statistik. (5) Tillgänglighet <strong>och</strong> <strong>för</strong>ståelighet, som avser statistikens<br />
fysiska tillgänglighet <strong>och</strong> dess <strong>för</strong>ståelighet.<br />
Det har tidigare understrukits att <strong>kvalitets</strong>begreppet är användarorienterat, <strong>och</strong> det<br />
bör därmed så långt möjligt formuleras i termer av hur användaren ser på statistiken.<br />
Särskilt under komponenten Till<strong>för</strong>litlighet görs dock avsteg från denna princip.<br />
För användaren har den totala till<strong>för</strong>litligheten huvudintresset, medan uppdelningen<br />
på olika osäkerhetskällor är av produktionsteknisk natur. Att olika typer av<br />
osäkerhetskällor ändå specificeras beror på att det ofta är svårt att uttala sig om till<strong>för</strong>litligheten<br />
totalt, medan det kan vara möjligt att ge användare <strong>för</strong>hållandevis god<br />
information om hur, <strong>och</strong> med vilken effekt, åtminstone vissa av osäkerhetskällorna<br />
kan ha påverkat statistiken.<br />
3
4<br />
I tablån nedan struktureras <strong>kvalitets</strong>begreppet i huvud- <strong>och</strong> underkomponenter.<br />
Komponenternas innebörd beskrivs ut<strong>för</strong>ligare i nästa kapitel.<br />
INNEHÅLL<br />
• <strong>Statistiska</strong> målstorheter<br />
- Objekt <strong>och</strong> population<br />
- Variabler<br />
- <strong>Statistiska</strong> mått<br />
- Redovisningsgrupper<br />
- Referenstider<br />
• Fullständighet<br />
<strong>Kvalitetsbegrepp</strong> <strong>för</strong> officiell statistik<br />
TILLFÖRLITLIGHET<br />
• Till<strong>för</strong>litlighet totalt<br />
• Osäkerhetskällor<br />
⋅ Urval<br />
⋅ Ramtäckning<br />
⋅ Mätning<br />
⋅ Svarsbortfall<br />
⋅ Bearbetning<br />
⋅ Modellantaganden<br />
• Redovisning av osäkerhetsmått<br />
AKTUALITET<br />
• Frekvens<br />
• Framställningstid<br />
• Punktlighet<br />
JÄMFÖRBARHET <strong>och</strong> SAMANVÄNDBARHET<br />
• Jäm<strong>för</strong>barhet över tiden<br />
• Jäm<strong>för</strong>barhet mellan grupper<br />
• Samanvändbarhet med annan statistik<br />
TILLGÄNGLIGHET <strong>och</strong> FÖRSTÅELIGHET<br />
• Spridningsformer<br />
• Presentation<br />
• Dokumentation<br />
• Tillgång till primärmaterial<br />
• Upplysningstjänster
Kvalitetskomponenternas innebörd<br />
I detta kapitel görs en genomgång av <strong>kvalitets</strong>begreppets komponenter, med tyngdpunkt<br />
på deras deskriptiva innebörd. I vissa fall ges också kommentarer angående<br />
användares <strong>kvalitets</strong>bedömningsgrunder. Genomgången följer <strong>kvalitets</strong>begreppets<br />
tidigare angivna struktur, vilken också ligger till grund <strong>för</strong> den numrering av komponenter<br />
<strong>och</strong> underkomponenter som in<strong>för</strong>s.<br />
En läsare som upplever delar av framställningen som svår<strong>för</strong>ståeligt teknisk kan få<br />
hjälp från Bilaga 1. Där ges ut<strong>för</strong>ligare beskrivning av begrepp <strong>och</strong> termer i anslutning<br />
till statistiska undersökningar.<br />
1 STATISTIKENS INNEHÅLL<br />
gäller de statistiska målstorheterna<br />
1.1 <strong>Statistiska</strong> målstorheter<br />
En statistisk målstorhet bestäms av att ett statistiskt mått används <strong>för</strong> att sammanfatta<br />
värdena på en variabel <strong>för</strong> objekten i en grupp, varvid det totala objektkollektivet<br />
kallas <strong>för</strong> populationen. En rätt vanlig synonym till målstorhet är parameter.<br />
1.1.1 - 1.1.3 Objekt <strong>och</strong> population, variabler <strong>och</strong> statistiska mått<br />
Dessa <strong>kvalitets</strong>komponenter avser valet av objekt, variabler <strong>och</strong> statistiska mått som<br />
ingår i de statistiska målstorheterna.<br />
Såväl objekt som variabler har associerade referenstider, se 1.1.5.<br />
1.1.4 Redovisningsgrupper<br />
Oftast redovisas statistik inte bara <strong>för</strong> hela populationen utan också <strong>för</strong> delpopulationer,<br />
redovisningsgrupper. Man talar om att statistiken bryts ned på (del)grupper.<br />
En <strong>för</strong>utsättning <strong>för</strong> sådan nedbrytning är naturligtvis att man <strong>för</strong> undersökta objekt<br />
har uppgifter angående variabler som man vill göra indelningar efter. Faktorer som<br />
verkar återhållande <strong>för</strong> hur långt statistik bryts ned är dels att det krävs mer arbete<br />
<strong>och</strong> mer publiceringsutrymme ju fler grupper som tas med i redovisningen, dels att<br />
integritetskränkning kan uppstå. Vidare, särskilt <strong>för</strong> urvalsundersökningar med<strong>för</strong><br />
successiv minskning av redovisningsgruppers storlek att statistiken <strong>för</strong>r eller senare<br />
blir så osäker att den inte är användbar.<br />
Aspekter på denna <strong>kvalitets</strong>komponent är fram<strong>för</strong> allt<br />
- vilka indelningsvariabler som används <strong>för</strong> att skapa redovisningsgrupper,<br />
- hur långtgående indelningar i redovisningsgrupper som görs.<br />
Exempel<br />
SCB ut<strong>för</strong> årligen Inkomst<strong>för</strong>delningsundersökningen (HINK), som belyser befolkningens<br />
inkomst<strong>för</strong>hållanden. Referensperiod är kalenderår.<br />
Ett centralt objekt i undersökningen är "familj". En sådan består av antingen<br />
två vuxna (≥ 18 år) som sammanbor under äktenskapsliknande former <strong>och</strong><br />
de barn (< 18 år) som (eventuellt) bor hos dem, eller<br />
en ensamstående vuxen <strong>och</strong> de barn som (eventuellt) bor hos denne.<br />
Populationen utgörs av alla familjer som var bosatta i riket under mer än halva<br />
kalenderåret.<br />
Exempel på variabler <strong>för</strong> familjer: Årets arbetsinkomst, årets disponibla<br />
inkomst, socioekonomisk grupptillhörighet, antal barn.<br />
Exempel på redovisningsgrupper: Två - vuxen - familjer med tre eller fler barn,<br />
5
6<br />
familjer med ensamstående vuxen med barn, högre - tjänstemanna - familjer.<br />
De i HINK mest använda statistiska måtten är medelvärde <strong>och</strong> antal, men bl.a.<br />
median <strong>för</strong>ekommer också.<br />
Exempel på statistiska målstorheter: Genomsnittlig arbetsinkomst under året <strong>för</strong><br />
arbetarfamiljer, genomsnittlig disponibel inkomst under året <strong>för</strong> två - vuxen-<br />
familjer utan barn, medianinkomst <strong>för</strong> högre-tjänstemanna-familjer, antal lantbrukarfamiljer.<br />
Kommentarer om statistiska målstorheter<br />
En användares önskemål om statistisk information utgår från dennes sakproblem. I <strong>för</strong>sta<br />
hand är användaren intresserad av statistiska målstorheter som nära ansluter till det<br />
<strong>för</strong>eliggande sakproblemet. Ju bättre statistikens objekt, variabler, referenstider, m.m.<br />
överensstämmer med önskemålen, desto bättre är kvaliteten på denna punkt.<br />
En användare som kan delta i planering av ny eller i omläggning av existerande statistik<br />
har möjlighet att påverka valet av objekt, variabler <strong>och</strong> mått. Eftersom det ofta finns flera<br />
användare kan dock motstridiga önskemål <strong>för</strong>eligga, <strong>och</strong> ofta måste kompromisser göras.<br />
Även i fall där enighet råder kan man av kostnads- eller tidsskäl välja statistiska målstorheter<br />
som avviker från de ideala.<br />
Kommentarer om redovisningsgrupper<br />
Om användarens intresse är fokuserat på statistik <strong>för</strong> vissa bestämda grupper, fäster<br />
han/hon naturligtvis stort avseende vid om statistik redovisas <strong>för</strong> just de grupperna.<br />
Är användaren mer allmänt intresserad av en detaljrik bild, fäster han/hon kanske mest<br />
vikt vid hur långtgående indelningar som görs.<br />
1.1.5 Referenstider<br />
Objekt <strong>och</strong> variabler hän<strong>för</strong> sig till någon viss tid. Den kan vara snävt avgränsad,<br />
t.ex. till en bestämd dag, <strong>och</strong> man talar då om referenstidpunkt. När tiden är längre,<br />
t.ex. ett kalenderår, talar man om referensperiod. Referenstiderna <strong>för</strong> objekt <strong>och</strong><br />
variabler i en statistisk målstorhet sammanfaller oftast, men behöver inte göra det.<br />
Flera referenstider kan ingå, särskilt i målstorheter som avser <strong>för</strong>ändringar.<br />
För statistik från återkommande undersökningar (t.ex. avseende medellön <strong>för</strong><br />
arbetare inom industrin) är det ofta naturligt att betrakta population <strong>och</strong> variabler<br />
som desamma i varje undersökningsomgång, medan referenstiden ändras. För statistik<br />
från engångsundersökningar är det ofta naturligare att betrakta referenstid som<br />
del av definitionerna av objekt <strong>och</strong> variabler. (Exempelvis kan objekten definieras<br />
som "kvinnor i ålder 16 – 50 år som var bosatta i Stockholm 1 juli 1998".) Om det är<br />
mest ändamålsenligt att betrakta referenstiden som fristående eller som del av<br />
objekt <strong>och</strong> variabler får avgöras i det speciella fallet.<br />
Exempel<br />
Objekt <strong>och</strong> variabel med samma referenstid: Genomsnittlig arbetsinkomst<br />
under kalenderåret 1998 <strong>för</strong> personer bosatta i riket under hela 1998.<br />
Objekt <strong>och</strong> variabel med olika referenstid: Lön under 1998 <strong>för</strong> personer som<br />
avlade civilingenjörsexamen under 1988.<br />
Variabler med olika referenstider: Att konsumentprisindex <strong>för</strong> juli 1998 var<br />
257 kan (något svepande) tolkas så att en bestämd "varukorg" som under<br />
indexbasåret 1980 kostade 100 kronor, i juli 1998 kostade 257 kronor. Här<br />
figurerar såväl 1998 som juli 1980 som referenstider <strong>för</strong> prisuppgifter.
1.2 Fullständighet<br />
Denna <strong>kvalitets</strong>aspekt gäller hur väl ett statistiksystem <strong>och</strong> dess statistikutflöde<br />
täcker ett ämnesområdes "alla vitala delar". T.ex. hur fullständigt arbetsmarknadsstatistiken<br />
belyser arbetsmarknaden. Inget statistiksystem kommer att leva upp till<br />
vad alla användare anser vara ämnesområdets alla vitala delar, men det kan göra det<br />
bättre eller sämre.<br />
2 STATISTIKENS TILLFÖRLITLIGHET<br />
gäller statistikvärdens <strong>och</strong> målstorheters överensstämmelse<br />
Normalt <strong>för</strong>ekommer så mycket störningar i en statistisk undersökning att statistikvärden<br />
inte anger exakta värden på målstorheterna, utan skattningar av dessa. Härvid<br />
är ledstjärnan att sträva efter väntevärdesriktiga ("riktiga i genomsnitt") skattningar.<br />
Mellan ett statistikvärde <strong>och</strong> dess målstorhet <strong>för</strong>eligger normalt en avvikelse<br />
(ett "fel"). Ju mindre den <strong>för</strong>väntade absoluta avvikelsen är, desto till<strong>för</strong>litligare är<br />
statistiken, <strong>och</strong> ju större desto osäkrare. Hur stora avvikelser blir beror bl.a. på hur<br />
väl planerad <strong>och</strong> genom<strong>för</strong>d undersökningen är. Vid urvalsundersökningar spelar<br />
urvalsstorleken stor roll. Användares önskemål är naturligtvis att avvikelser skall<br />
vara små, helst <strong>för</strong>sumbara.<br />
Ofta är avvikelser dock inte <strong>för</strong>sumbara, vilket är särskilt tydligt <strong>för</strong> statistik från<br />
urvalsundersökningar. Då önskar åtminstone statistiskt välbevandrade användare<br />
numeriska begränsningar på avvikelsernas storlek, osäkerhetsmått. Att ange sådana<br />
begränsningar är dock inte alldeles enkelt, eftersom de definieras i termer av målstorheter<br />
som man inte har säker kunskap om. (Hade man det, behövdes inte undersökningen.)<br />
Uttalanden om statistiks till<strong>för</strong>litlighet faller med nödvändighet under<br />
kategorin "utsagor om rådande osäkerhet", vilket är ett begreppsmässigt intrikat<br />
område. Ett statistikvärdes till<strong>för</strong>litlighet/osäkerhet uttrycks vanligen med hjälp av<br />
ett osäkerhetsintervall med innebörd enligt nedan.<br />
Det är högst troligt att målstorhetens värde ligger i:<br />
osäkerhetsintervall = statistikvärde ± osäkerhetsmarginal.<br />
Ofta kan ett osäkerhetsintervall tolkas som ett konfidensintervall med angiven<br />
konfidensgrad. Om denna är vald till 95% innebär det att osäkerhetsintervallet<br />
omfattar målstorheten med 95% trolighet. Andra osäkerhetsmått som väsentligen är<br />
ekvivalenta med konfidensintervall : medelfel, variationskoefficient, relativ osäkerhetsmarginal.<br />
Ibland kan osäkerhetsintervall vara baserade på särskilda utvärderingar,<br />
erfarenhet, sakkunskap, m.m., varvid man talar om bedömningsintervall.<br />
En klassificering av "fel" är slumpmässiga (tillfälliga) respektive systematiska fel.<br />
De <strong>för</strong>ra fluktuerar kring 0 medan de senare till sin huvuddel har samma tecken.<br />
Systematiska fel leder till skevhet (bias) i statistiken.<br />
2.1 Till<strong>för</strong>litlighet totalt<br />
Användaren är vanligen mest intresserad av att få uppfattning om i vilken mån<br />
han/hon kan <strong>för</strong>lita sig på ett statistikvärde totalt sett, d.v.s. få en begränsning <strong>för</strong><br />
hela avvikelsen från målstorheten. I vissa fall kan producenten ge precis kvantitativ<br />
information om denna, i andra fall endast om hur någon/några, men inte alla, osäkerhetskällor<br />
kan ha påverkat till<strong>för</strong>litligheten.<br />
Kommentarer om till<strong>för</strong>litlighet<br />
Framställning av statistik kan ofta snabbas upp om man gör avkall på dess till<strong>för</strong>litlighet<br />
(genom stort svarsbortfall, ofullständig granskning, m.m.). Framställningstid <strong>och</strong> till<strong>för</strong>litlighet<br />
står i motsättning till varandra. I fall där snabb framtagning anses angelägen,<br />
brukar man lösa dilemmat genom att i en <strong>för</strong>sta omgång ta fram "preliminär" statistik,<br />
<strong>och</strong> senare "definitiv" statistik med bättre till<strong>för</strong>litlighet.<br />
7
8<br />
2.2 Osäkerhetskällor<br />
Åtminstone som en <strong>för</strong>sta approximation, med pedagogiska <strong>för</strong>tjänster, kan en total<br />
avvikelsen ses som en summa av partiella avvikelser, vilka emanerar från olika<br />
felkällor. Härvid skall dock framhållas dels att de partiella avvikelserna kan motverka<br />
varandra (genom att ha olika tecken) dels att uppdelningen på möjliga felkällor<br />
ibland kan vara något skönsmässig.<br />
2.2.1 Urval<br />
Kvalitetskomponenten avser den del av totala avvikelsen som beror på att statistiken<br />
är baserad på observationer på endast ett urval av objekt. Osäkerhetsmarginaler<br />
kan ofta anges i form av konfidensintervall.<br />
2.2.2 Ramtäckning<br />
Kvalitetskomponenten avser den del av totala avvikelsen som beror på skillnad<br />
mellan rampopulation <strong>och</strong> målpopulation.<br />
2.2.3 Mätning<br />
Kvalitetskomponenten avser den del av totala avvikelsen som beror på mätfel.<br />
2.2.4 Svarsbortfall<br />
Svarsbortfall, vanligen <strong>för</strong>kortat till bortfall, uppstår när värden på en eller flera<br />
observationsvariabler inte kan inhämtas. Termen skall uppfattas i den vida mening<br />
som indikeras av engelskans "missing value". Den omfattar t.ex. att uppgifter saknas,<br />
där<strong>för</strong> att de av en eller annan anledning inte kunde över<strong>för</strong>as från ett administrativt<br />
register. Om man <strong>för</strong> ett objekt inte erhåller några användbara uppgifter<br />
<strong>för</strong>eligger objektbortfall. Om användbara uppgifter inhämtats <strong>för</strong> vissa, men inte<br />
alla observationsvariabler <strong>för</strong>eligger partiellt bortfall (<strong>för</strong> variabler utan värden).<br />
Kvalitetskomponenten avser den del av totala avvikelsen som beror på bortfall.<br />
2.2.5 Bearbetning<br />
Kvalitetskomponenten avser den del av totala avvikelsen som beror på ofullkomligheter<br />
i bearbetningen, vilken omfattar databeredning (dataregistrering, kodning<br />
<strong>och</strong> granskning/rättning) <strong>och</strong> numeriska skattningsberäkningar. Själva skattnings<strong>för</strong>farandet<br />
hänger nära samman med urval, <strong>och</strong> det är oftast naturligast att <strong>för</strong>a<br />
samman dessa till en aspekt "urval <strong>och</strong> skattning/estimation".<br />
2.2.6 Modellantaganden<br />
Avser den del av den totala avvikelsen som beror på att statistiken är baserad på<br />
modellantaganden som inte är perfekt uppfyllda.<br />
Val av urvals- <strong>och</strong> skattnings<strong>för</strong>farande baseras ofta på modellantaganden, som<br />
spelar roll <strong>för</strong> skattningarnas precision men inte deras väntevärdesriktighet. För<br />
störningar på grund av täcknings - <strong>och</strong> mätningsbrister samt bortfall görs också ofta<br />
antaganden, som används <strong>för</strong> justeringar i skattningssteget. Nyssnämnda typer av<br />
modellantaganden hän<strong>för</strong>s till den aktuella osäkerhetskällan. Denna <strong>kvalitets</strong>komponent<br />
avser modellantaganden utöver dem som gäller urval, ramtäckning, mätning<br />
<strong>och</strong> bortfall. Exempel är framskrivningsmodeller, modeller <strong>för</strong> att ”<strong>för</strong>dela ned”<br />
statistik från stora till små redovisningsgrupper <strong>och</strong> modeller <strong>för</strong> att skatta ej<br />
undersökta delar av populationen.<br />
2.3 Redovisning av osäkerhetsmått<br />
Avser om konfidensintervall eller annat osäkerhetsmått redovisas.<br />
Kommentarer om osäkerhetsmått<br />
I planerings- <strong>och</strong> beslutssammanhang används statistik ofta så att man i en <strong>för</strong>sta omgång<br />
resonerar under premissen att statistikvärdena anger korrekta värden på målstorheterna.<br />
Många användare är dock medvetna om att de kan komma till mer eller mindre<br />
missvisande slutsatser genom att bortse från osäkerheten. Om de sedan vill bedöma
osäkerhetens konsekvenser, befinner de sig i markant olika situationer om numeriska<br />
osäkerhetsmått presenterats eller ej. Med tillgång till osäkerhetsmått kan en i statistikteori<br />
bevandrad användare göra välgrundade bedömningar av osäkerhetens konsekvenser, <strong>och</strong><br />
kan därmed göra adekvata "slutsatsjusteringar".<br />
Osäkerhetsmått behövs inte minst <strong>för</strong> <strong>för</strong>ändringsskattningar.<br />
3 STATISTIKENS AKTUALITET<br />
gäller statistikens relation till "nuläget"<br />
Användare efterfrågar vanligen statistik som beskriver "nuläget", eller med andra<br />
ord aktuell statistik. För statistiks aktualitet spelar naturligtvis tidsavståndet mellan<br />
"nu" <strong>och</strong> statistikens referenstid den centrala rollen. Den beror av framställningstid,<br />
publiceringsfrekvens <strong>och</strong> punktlighet.<br />
Kommentar om aktualitet<br />
En annan viktig faktor <strong>för</strong> statistiks aktualitet är hur snabbt verkligheten ändras. Vid<br />
bedömning av "tillräckligt aktuell" får användaren sammanväga ovan nämnda produktions<strong>för</strong>hållanden<br />
med sin egen uppfattning om verklighetens <strong>för</strong>ändringstakt.<br />
3.1 Frekvens<br />
Statistik från återkommande undersökningar tas vanligen fram enligt ett regelbundet<br />
schema (månatligen, kvartalsvis, årligen), <strong>och</strong> det är då naturligt att tala om frekvenser<br />
(eller periodiciteter).<br />
- Undersökningsfrekvensen avser periodiciteten i statistikens referenstid.<br />
- Publiceringsfrekvensen avser periodiciteten med vilken statistiken publiceras.<br />
- Uppgiftsinsamlingsfrekvensen avser periodiciteten med vilken grunduppgifter<br />
samlas in.<br />
I normalfallet sammanfaller de tre frekvenserna, men inte alltid. För användaren är<br />
de två sistnämnda frekvenserna normalt de viktigaste.<br />
Exempel<br />
SCB:s Investeringsenkät illustrerar att frekvenser kan skilja sig åt. Undersökningen<br />
samlar in uppgifter <strong>och</strong> publicerar statistik tre gånger per år,<br />
medan statistiken avser kvartal.<br />
3.2 Framställningstid<br />
Tiden mellan statistikens referenstid (referenstidpunkt eller referensperiodens slut)<br />
<strong>och</strong> dess publicering.<br />
3.3 Punktlighet<br />
Överensstämmelsen mellan utlovad <strong>och</strong> faktisk publiceringstid.<br />
Kommentarer om frekvens, framställningstid <strong>och</strong> punktlighet<br />
För en statistikanvändare är det ofta mycket viktigt att statistik <strong>för</strong>eligger i "rätt tid" (t.ex.<br />
till ett utsatt beslutsdatum). Vid engångsundersökningar hänger saken fram<strong>för</strong> allt på<br />
statistikens framställningstid. Vid återkommande undersökningar är publiceringsfrekvens<br />
<strong>och</strong> punktlighet också viktiga.<br />
För ekonomisk statistik som påverkar de finansiella marknaderna kan punktlighets- <strong>och</strong><br />
samtidighetskrav vara så höga som delar av sekund.<br />
Undersökningsfrekvensen spelar roll inte bara <strong>för</strong> statistiks aktualitet. Även en användare<br />
med "historiskt" intresse fäster vikt vid denna. Ju högre den är, desto mer i detalj kan en<br />
utveckling följas.<br />
9
10<br />
4 STATISTIKENS JÄMFÖRBARHET <strong>och</strong> SAMANVÄNDBARHET<br />
gäller främst målstorheters likhet<br />
En vanlig <strong>och</strong> viktig användning av statistik är <strong>för</strong> att göra jäm<strong>för</strong>elser, dels jäm<strong>för</strong>elser<br />
över tiden (tidsserier) dels jäm<strong>för</strong>elser mellan grupper. I det senare fallet<br />
handlar det ofta om geografiska grupper, t.ex. jäm<strong>för</strong>else av <strong>för</strong>hållanden i olika<br />
länder. Jäm<strong>för</strong>elser kan dock mycket väl gälla grupper av annan (än geografisk)<br />
natur, t.ex. jäm<strong>för</strong>else av <strong>för</strong>hållanden <strong>för</strong> två - vuxen - familjer med, 0, 1, 2, 3<br />
respektive 4 eller fler barn, d.v.s. med gruppindelning efter antalet barn.<br />
Vid jäm<strong>för</strong>elser vill man idealt ha tillgång till statistikvärden <strong>för</strong> "samma" målstorhet,<br />
vid olika tidpunkter respektive <strong>för</strong> olika grupper. Hur "lika" målstorheter är,<br />
beror på deras definition. Ytterligare en faktor finns ofta med i bilden. Allmänt uttryckt<br />
gäller att vad man "egentligen" mäter, ofta beror på hur man mäter. För statistikvärdens<br />
jäm<strong>för</strong>barhet spelar den använda undersökningsmetodiken ofta en<br />
betydande roll. Det är till jäm<strong>för</strong>barhetens <strong>för</strong>del om samma frågeformulär, samma<br />
datainsamlingsmetod, samma skattnings<strong>för</strong>farande, o.s.v. använts.<br />
Detta nyss sagda <strong>för</strong>stärks av följande <strong>för</strong>hållande. Även om skev statistik är en<br />
styggelse, mildras skevhetens negativa effekter om statistikvärden som man vill<br />
jäm<strong>för</strong>a är skeva på ett likartat sätt. Lika undersökningsmetod syftar naturligtvis i<br />
<strong>för</strong>sta hand till att leda till jäm<strong>för</strong>bar oskev statistik. Dock, om skevhet trots allt<br />
uppkommer blir den likartad, vilket underlättar jäm<strong>för</strong>else.<br />
Denna <strong>kvalitets</strong>komponent, inklusive delkomponenten "samanvändning med annan<br />
statistik", avser fram<strong>för</strong> allt likhet hos målstorheter <strong>och</strong> undersökningsmetoder.<br />
Kommentar om jäm<strong>för</strong>barhet<br />
Hur pregnanta slutsatser man kan dra från en jäm<strong>för</strong>else beror dock inte bara på hur<br />
"lika" de bakomliggande målstorheterna är. Den beror naturligtvis också på till<strong>för</strong>litligheten<br />
hos de statistikvärden som jäm<strong>för</strong>elsen baseras på. Om deras osäkerheter är<br />
stora kan observerade skillnader vara ett uttryck <strong>för</strong> tillfälligt ”brus” <strong>och</strong> inte <strong>för</strong> faktiska<br />
skillnader.<br />
4.1 Jäm<strong>för</strong>barhet över tiden<br />
Kvalitetsaspekten avser i vilken mån en återkommande undersöknings statistiska<br />
målstorheter <strong>och</strong> undersökningsmetod legat fasta eller ändrats över tiden.<br />
Även <strong>för</strong> statistik framställd med samma innehåll <strong>och</strong> metod kan saklogiskt intressanta<br />
jäm<strong>för</strong>elser vara svåra att göra till följd av bl.a. säsong- <strong>och</strong> kalendervariationer.<br />
(Påsken kan ligga i olika kvartal olika år, antalet arbetsdagar i en månad kan<br />
variera.) Säsongrensnings<strong>för</strong>faranden används <strong>för</strong> att underlätta jäm<strong>för</strong>elser, särskilt<br />
<strong>för</strong> kortperiodisk statistik.<br />
Kommentarer om jäm<strong>för</strong>barhet över tiden<br />
För denna <strong>kvalitets</strong>komponent <strong>för</strong>eligger ofta motstridiga användarintressen. En användare<br />
som är intresserad av utvecklingen i ett specifikt avseende är naturligtvis<br />
angelägen om att statistiken från de olika referenstiderna skall gälla "samma sak", d.v.s.<br />
att statistikens målstorheter <strong>och</strong> även dess eventuella skevhet (undersökningsmetodik)<br />
varit o<strong>för</strong>ändrade.<br />
Användare som fram<strong>för</strong> allt intresserar sig <strong>för</strong> "nuläge <strong>och</strong> framtid" vill ofta att omvärlds<strong>för</strong>ändringar<br />
skall åtföljas av motsvarande <strong>för</strong>ändringar i statistiken, så att den så<br />
väl som möjligt belyser nu rådande <strong>för</strong>hållanden. Sådan anpassning av statistiken leder<br />
vanligen till att jäm<strong>för</strong>barheten över tiden <strong>för</strong>sämras.
Användares jäm<strong>för</strong>elsemöjligheter <strong>för</strong>bättras om statistiken åtföljs av kommentarer,<br />
angående effekter dels av vidtagna <strong>för</strong>ändringar i framställningen av statistiken, dels av<br />
omvärlds<strong>för</strong>ändringar (t.ex. skatteomläggningar).<br />
4.2 Jäm<strong>för</strong>barhet mellan grupper<br />
Denna <strong>kvalitets</strong>komponent avser hur ensartade definitionerna av statistiska målstorheter<br />
<strong>och</strong> även undersökningsmetoder är. När de statistikvärden man vill grunda<br />
en jäm<strong>för</strong>else på kommer från en <strong>och</strong> samma undersökning <strong>för</strong>eligger normalt "full<br />
jäm<strong>för</strong>barhet". När de kommer från olika producenter (olika statistikprogram, olika<br />
statistikbyråer, m.m.) <strong>för</strong>eligger möjlighet till divergenser.<br />
Exempel<br />
Statistik används ofta i internationellt samarbete, t.ex. EU. Det kan handla om<br />
att fastställa ekonomiska bidrag med utgångspunkt från medlemsländers ekonomiska<br />
situation. Det är då angeläget att de olika ländernas ekonomiska statistik<br />
avser "samma sak". Som en konsekvens finns EU-<strong>för</strong>ordningar avseende olika<br />
statistikområden, vilka syftar till ensartade definitioner.<br />
4.3 Samanvändbarhet med annan statistik<br />
Ofta vill man belysa ett sakproblem med statistikvärden <strong>för</strong> olika målstorheter <strong>och</strong><br />
från olika undersökningar. Målstorheternas definitioner (ifråga om objekt, variabler,<br />
population, referenstider) skall då helst vara lika i de olika undersökningarna.<br />
Denna <strong>kvalitets</strong>komponent avser i vilken utsträckning så är fallet.<br />
Exempel<br />
Om man vill bedöma konsekvenserna av vissa tänkbara ändringar i inkomstbeskattningen<br />
av individer, skulle det kunna vara av intresse att kombinera statistik<br />
från följande SCB - undersökningar; Inkomst<strong>för</strong>delningsundersökningen<br />
(HINK), Hushållens utgifter (HUT) <strong>och</strong> Bostads- <strong>och</strong> hyresundersökningen<br />
(BHU). Det är då naturligtvis önskvärt att t.ex. "hushåll" <strong>och</strong> "disponibel<br />
inkomst" definieras på samma sätt i de tre undersökningarna.<br />
Kommentar om samanvändbarhet<br />
Ibland justeras statistiken från en undersökning så att den blir konsistent med statistik<br />
från en annan undersökning, <strong>och</strong> därmed bekvämare att användas tillsammans med<br />
denna. Konsistensvillkor ges ofta av att man fordrar att justerade statistikvärden skall<br />
uppfylla relationer som man på teoretiska grunder vet gäller <strong>för</strong> målstorheterna.<br />
Exempel: Landets ekonomiska utveckling följs med såväl "snabb" (t.ex. månatlig) statistik<br />
som med mer omsorgsfull <strong>och</strong> djupgående årlig statistik, framtagna av olika undersökningar.<br />
I det sammanhanget är ett naturligt konsistenskrav att summan av de tolv<br />
månadsvärdena är lika med årsvärdet.<br />
11
12<br />
5 STATISTIKENS TILLGÄNGLIGHET <strong>och</strong> FÖRSTÅELIGHET<br />
gäller statistikens spridning <strong>och</strong> <strong>för</strong>ståelighet<br />
5.1 Spridningsformer<br />
Kvalitetskomponenten avser de distributionsmedia <strong>och</strong> distributionskanaler som<br />
används <strong>för</strong> att <strong>för</strong>medla statistiken till användare.<br />
Kommentar om spridningsformer<br />
Statistik är ofta ett av flera underlagsmaterial i kartläggningar, utredningar <strong>och</strong><br />
forskningsprojekt. För att en användare enkelt skall kunna vidarebehandla statistiken<br />
<strong>och</strong>/eller integrera den med annat material skall den helst finnas tillgänglig i en form som<br />
svarar mot dennes önskemål. Exempel: Statistik från diskett eller Internet kan medge<br />
enkel <strong>och</strong> snabb sammanställning av egna tabeller, egna beräkningar m.m.<br />
5.2 Presentation<br />
Kvalitetskomponenten avser hur den statistiska informationen presenteras i olika<br />
publikationer <strong>och</strong> databaser; <strong>för</strong>ekomst <strong>och</strong> omfattning av textavsnitt, diagram,<br />
tabeller, referenser <strong>och</strong> bilder. Avser också hur väl särskilt intressanta sakaspekter<br />
på statistiken lyfts fram.<br />
5.3 Dokumentation<br />
Kvalitetskomponenten avser användares möjligheter att få tillgång till beskrivningar<br />
av statistiken i sig, <strong>och</strong> hur den framställdes. Teknisk beskrivning av den process<br />
som ledde fram till statistiken ges i <strong>för</strong>sta hand av undersökningens produktionsdokumentation.<br />
Beskrivning av statistiken ges i <strong>kvalitets</strong>deklarationen.<br />
Kommentar om dokumentation<br />
För användare som avser att själva vidarebearbeta primärmaterial (se nedan) är en väl<br />
genomarbetad produktionsdokumentation ofta en nödvändig <strong>för</strong>utsättning.<br />
5.4 Tillgång till primärmaterial<br />
Med primärmaterial avses grunddata så som de <strong>för</strong>eligger i undersökningens slutliga<br />
observationsregister. Ibland är användare intresserade av statistik som inte<br />
finns framtagen, men som primärmaterialet ger underlag <strong>för</strong>. Två huvudmöjligheter<br />
<strong>för</strong>eligger då.<br />
- Producenten gör specialbearbetningar av primärmaterialet enligt användarens<br />
önskemål <strong>och</strong> anvisningar.<br />
- Användaren får tillgång till (avidentifierat) primärmaterial <strong>för</strong> egen bearbetning.<br />
Kommentarer om tillgång till primärmaterial<br />
Användare med väl specificerade frågeställningar är ofta intresserade av att få specialbearbetningar<br />
ut<strong>för</strong>da av producenten. Viktiga aspekter är då hur snabbt sådana kan<br />
göras, <strong>och</strong> till vilken kostnad.<br />
Forskare <strong>och</strong> utredare är ofta angelägna om att få tillgång till primärmaterial <strong>för</strong> egen<br />
bearbetning. Därigenom får de möjlighet att analysera materialet snabbare <strong>och</strong>/eller mer<br />
flexibelt än när producenten genom<strong>för</strong> specialbearbetningar.<br />
5.5 Upplysningstjänster<br />
Kvalitetskomponenten avser användares möjligheter dels att få svar på frågor om<br />
specifik statistik, dels att få hjälp att hitta i "lagret" av officiell (<strong>och</strong> annan) statistik.<br />
Beroende på upplysningsönskemålet kan det tillmötesgås genom hänvisning till<br />
statistikprogramansvarig funktion/person, till central upplysningstjänst, till forsknings<br />
- <strong>och</strong> utredningsinstitut (<strong>för</strong> analys <strong>och</strong> tolkning), eller till någon annan adekvat<br />
instans.
Riktlinjer <strong>för</strong> <strong>kvalitets</strong>deklaration av statistik<br />
Underlag <strong>för</strong> <strong>kvalitets</strong>bedömning <strong>och</strong> statistikanvändning<br />
För att en användare skall kunna bedöma om han/hon har intresse av en viss statistik,<br />
<strong>och</strong> hur den i så fall kan användas, behöver han/hon information om statistikens<br />
egenskaper i olika avseenden, dess kvalitet. I de två <strong>för</strong>egående kapitlen har ett<br />
<strong>kvalitets</strong>begrepp <strong>för</strong> officiell statistik formulerats <strong>och</strong> <strong>för</strong>klarats. I detta kapitel ges<br />
<strong>riktlinjer</strong> <strong>för</strong> hur producenten skall utforma information till användare om statistiks<br />
kvalitet, göra en <strong>kvalitets</strong>deklaration.<br />
All svensk officiell statistik (SOS) skall <strong>kvalitets</strong>deklareras. Detta gäller oavsett<br />
statistikens form <strong>och</strong> medium <strong>för</strong> spridningen, <strong>för</strong> <strong>Statistiska</strong> Meddelanden (SM),<br />
årsböcker, i databaser, på diskett eller på något annat sätt, <strong>och</strong> oavsett om den tidigare<br />
publicerats i annan version.<br />
De <strong>riktlinjer</strong> som presenteras här är utformade i <strong>för</strong>sta hand med tanke på årliga<br />
undersökningars primära publicering i SM <strong>och</strong> andra liknande publikationer. I<br />
andra fall kan <strong>kvalitets</strong>deklarationerna behöva utformas på annorlunda sätt, t.ex. av<br />
utrymmes- <strong>och</strong>/eller struktureringsskäl. Allmänt gäller dock att de <strong>riktlinjer</strong> som<br />
presenteras här bör följas så långt som möjligt. Vidare kan sägas :<br />
- att <strong>kvalitets</strong>deklaration av kortperiodisk (månatlig, kvartalsvis) statistik ges<br />
genom referens till en <strong>kvalitets</strong>deklaration som utges minst en gång om<br />
året, helst vid årets <strong>för</strong>sta publicering.<br />
- att <strong>kvalitets</strong>deklaration av sekundärpublicerad statistik (t.ex. vissa årsböc-<br />
ker med statistik från olika källor) ges dels genom en <strong>för</strong>kortad <strong>kvalitets</strong>-<br />
deklaration som omfattar särskilt viktiga aspekter, dels genom referens<br />
till den fullständiga <strong>kvalitets</strong>deklarationen i källpublikationen.<br />
Kvalitetsdeklarationerna skall ha en enhetlig struktur, som ansluter till <strong>kvalitets</strong>begreppets<br />
komponenter Innehåll, Till<strong>för</strong>litlighet, Aktualitet, Jäm<strong>för</strong>barhet <strong>och</strong><br />
samanvändbarhet samt Tillgänglighet <strong>och</strong> <strong>för</strong>ståelighet.<br />
Härvid skall följande framhållas. <strong>Kvalitetsbegrepp</strong>ets primära uppgift är att <strong>för</strong>teckna<br />
de aspekter på statistik som spelar roll <strong>för</strong> hur väl den tillgodoser användares<br />
informationsbehov. Att ge en strukturmall <strong>för</strong> <strong>kvalitets</strong>deklarationer är en åtföljande<br />
uppgift, där <strong>kvalitets</strong>begreppets fullständiga komponentlista ibland kan upplevas<br />
som väl lång. T.ex. behöver producenten inte uttala sig om ett SM:s <strong>för</strong>ståelighet,<br />
den kan ju läsaren själv bedöma. Det underlag som producenten skall tillhandahålla<br />
varierar i omfattning <strong>och</strong> karaktär <strong>för</strong> de olika komponenterna. Riktmärket skall<br />
dock alltid vara att ge tillräcklig information <strong>för</strong> att en användare i ett <strong>för</strong>sta steg<br />
skall kunna bedöma om statistiken är användbar <strong>för</strong> hans/hennes syften, <strong>och</strong> i ett<br />
andra steg kunna <strong>för</strong>stå hur statistiken används på ett riktigt sätt.<br />
Riktlinjerna ges i termer av en mall <strong>för</strong> <strong>kvalitets</strong>deklaration, vilken börjar på nästa<br />
sida. I mallens punkter ges anvisningar om vilken information om statistiken som<br />
producenten skall ge under punkterna ifråga.<br />
13
14<br />
Mall <strong>för</strong> <strong>kvalitets</strong>deklaration av statistik<br />
Kvalitetsdeklarationen skall ha användare av statistiken som målgrupp, <strong>och</strong> dess<br />
<strong>för</strong>ståelighet skall relateras till användarna. Producentinriktade begrepp <strong>och</strong> termer<br />
bör undvikas så långt möjligt. Hänvisa gärna till mer ut<strong>för</strong>lig dokumentation, tekniska<br />
rapporter o. dyl.<br />
0 INLEDNING<br />
Beskriv här undersökningens syfte <strong>och</strong> <strong>för</strong>utsättningar, om sådan information inte<br />
ges på annan plats i publikationen. Ta med information om undersökningen som<br />
underlättar <strong>för</strong>ståelsen <strong>för</strong> <strong>kvalitets</strong>deklarationen, t.ex. något om undersökningsplan<br />
<strong>och</strong> uppgiftsinsamling. Annan information som eventuellt kan lämnas här är sammanhang<br />
med andra statistiska undersökningar, andra publiceringsformer, beställar/producent<strong>för</strong>hållande,<br />
m.m.<br />
1 STATISTIKENS INNEHÅLL<br />
Under Innehåll skall fram<strong>för</strong> allt ges information om använda definitioner.<br />
1.1 <strong>Statistiska</strong> målstorheter<br />
Syftar till att ge användaren underlag <strong>för</strong> att bedöma hur väl statistikens storheter<br />
ansluter till hans/hennes sakproblem.<br />
1.1.1 Objekt <strong>och</strong> population<br />
Definiera målpopulationens objekt <strong>och</strong> avgränsning. I den mån undersökningen<br />
omfattar viktiga objekt, som använts vid uppgiftsinsamlingen men inte ingår i<br />
redovisningen, beskriv dem här.<br />
1.1.2 Variabler<br />
Definiera statistikens variabler, inklusive viktiga observationsvariabler som inte<br />
ingår i redovisningen.<br />
1.1.3 <strong>Statistiska</strong> mått<br />
Specificera de statistiska mått som ingår i de statistiska storheterna.<br />
1.1.4 Redovisningsgrupper<br />
Specificera de variabler som använts vid indelning i redovisningsgrupper <strong>för</strong> statistiken,<br />
<strong>och</strong> ange på hur detaljerad nivå redovisningen sker. Om gruppindelningar<br />
är baserade på standarder (t.ex. den <strong>för</strong> näringsgrensindelning), ge hänvisning till<br />
standarden ifråga. Speciellt intressanta redovisningsgrupper kan nämnas särskilt.<br />
1.1.5 Referenstider<br />
Ange relevanta referenstider <strong>för</strong> statistiken. Ibland är det lämpligt att inkludera<br />
referenstiderna redan i definitionerna av objekt <strong>och</strong> variabler. I så fall räcker det<br />
med en hänvisning här.<br />
1.2 Fullständighet<br />
Kvalitetskomponenten avser statistiksystem, <strong>och</strong> vid deklaration av statistik från en<br />
enskild undersökning finns vanligen inte mycket att säga.<br />
2 STATISTIKENS TILLFÖRLITLIGHET<br />
Under Till<strong>för</strong>litlighet ges dels information om statistikens osäkerhet, inklusive<br />
beskrivning av osäkerhetskällor, dels <strong>för</strong>ekomst av osäkerhetsmått <strong>och</strong> deras innebörd.<br />
Informationen skall syfta till att hjälpa en användare att kunna ta ställning till<br />
om statistiken är tillräckligt till<strong>för</strong>litlig <strong>för</strong> hans/hennes användningssyfte, <strong>och</strong> att<br />
kunna använda statistiken på ett riktigt sätt.<br />
2.1 Till<strong>för</strong>litlighet totalt
Idealt anges statistikvärdens osäkerhet med osäkerhetsintervall (konfidensintervall<br />
<strong>och</strong>/eller bedömningsintervall). När sådana presenteras ingår de ofta som del av<br />
själva tabellmaterialet <strong>och</strong> skall då inte redovisas också i <strong>kvalitets</strong>deklarationen.<br />
Ibland tillhandahålls endast mer översiktsmässiga numeriska osäkerhetsmått.<br />
I många fall kan producenten inte beskriva statistikens till<strong>för</strong>litlighet i termer av<br />
osäkerhetsintervall. Den information som kan ges avser då arten av <strong>och</strong> styrkan i<br />
källor till osäkerhet, <strong>och</strong> deras tänkbara kvantitativa konsekvenser <strong>för</strong> statistiken.<br />
Ibland kan producenten ha <strong>för</strong>hållandevis säker uppfattning om riktningen på en<br />
<strong>för</strong>eliggande skevhet, även om det är ogörligt att säga något säkert om dess storlek.<br />
Oavsett om osäkerhetsintervall presenteras eller inte, skall tillgänglig information<br />
om osäkerhetskällor redovisas under punkt 2.2. Denna information bör vara såväl<br />
deskriptiv som, i den mån det går, kvantitativ.<br />
Under 2.1 redovisas en sammanfattande bedömning av de olika osäkerhetskällornas<br />
relativa vikt i den totala avvikelsen.<br />
2.2 Osäkerhetskällor<br />
2.2.1 Urval<br />
Om statistiken kommer från en urvalsundersökning, beskriv det använda urvals<strong>och</strong><br />
skattnings<strong>för</strong>farandet. Det senare är vanligen utformat så att det också omfattar<br />
justering <strong>för</strong> bortfall <strong>och</strong> ibland även <strong>för</strong> täckningsbrister <strong>och</strong> mätfel. Det är då<br />
lämpligt att beskriva hela skattnings<strong>för</strong>farandet här.<br />
När ett sannolikhetsurval använts, kan osäkerhet som beror på inskränkningen till<br />
ett urval vanligen anges med hjälp av konfidensintervall, men andra osäkerhetsmått<br />
<strong>för</strong>ekommer också. Ofta gäller att konfidensintervall (eller ekvivalenta osäkerhetsmått)<br />
fångar upp osäkerhet som härrör inte bara från urvalet, utan också från en<br />
eller flera av källorna ramtäckning, mätning <strong>och</strong> svarsbortfall. Beskriv här hur<br />
osäkerhetsmåtten beräknats <strong>och</strong> hur de skall tolkas. Om ett icke - sannolikhetsurval<br />
använts, informera om detta <strong>och</strong> diskutera urvalets representativitet.<br />
2.2.2 Ramtäckning<br />
Beskriv brister i fråga om rampopulationens täckning av målpopulationen, <strong>och</strong> de<br />
bedömda konsekvenserna <strong>för</strong> statistikens till<strong>för</strong>litlighet. Om skattnings<strong>för</strong>farandet<br />
omfattar justering <strong>för</strong> ramtäckningsbrister, nämn det <strong>och</strong> beskriv justeringarna här<br />
eller under Urval.<br />
2.2.3 Mätning<br />
Beskriv det använda mät<strong>för</strong>farandet. När frågeformulär använts bör detta redovisas<br />
i sin helhet eller i lämpligt sammandrag. Redovisa mätsvårigheter som uppträtt vid<br />
insamlingen av uppgifter <strong>och</strong> deras troliga konsekvenser <strong>för</strong> statistikens till<strong>för</strong>litlighet.<br />
Om redovisade konfidensintervall fångar upp också osäkerhet från slumpmässiga<br />
mätfel, nämn detta <strong>och</strong> ge beskrivning här eller under Urval. Om justeringar <strong>för</strong><br />
systematiska mätfel gjorts, beskriv dessa här eller under Urval.<br />
2.2.4 Svarsbortfall<br />
Ange kvantitativa <strong>och</strong> kvalitativa aspekter på bortfallet; bortfallsandel (vägd<br />
<strong>och</strong>/eller ovägd), uppdelning i "avböjd medverkan" respektive "ej anträffad", kända<br />
eller <strong>för</strong>modade bortfallsmönster, åtgärder <strong>för</strong> att minska bortfallet, m.m. Redovisa<br />
bortfallets bedömda konsekvenser <strong>för</strong> statistikens till<strong>för</strong>litlighet. Beskriv metod(er)<br />
<strong>för</strong> bortfallskompensation i skattnings<strong>för</strong>farandet, här eller under Urval.<br />
2.2.5 Bearbetning<br />
15
16<br />
Redovisa orsaker till osäkerhet som emanerar från databeredningen (dataregistrering,<br />
kodning <strong>och</strong> granskning/rättning) <strong>och</strong> de numeriska beräkningarna. Ange de<br />
bedömda konsekvenserna av eventuella kvarstående fel.<br />
2.2.6 Modellantaganden<br />
Termen ”modell” är mycket allmän. Som nämns i beskrivningen av denna <strong>kvalitets</strong>komponent<br />
ligger ofta modellantaganden till grund <strong>för</strong> val av såväl urvals- <strong>och</strong><br />
skattnings<strong>för</strong><strong>för</strong>ande som <strong>för</strong>faranden <strong>för</strong> att i skattningssteget justera <strong>för</strong> ramtäckningsbrister,<br />
brister i mätnings<strong>för</strong>farandet <strong>och</strong> bortfall. I den mån sådana modellantaganden<br />
gjorts, redovisas de under respektive punkt ovan. Denna punkt avser<br />
endast osäkerhet som härrör från andra modellantaganden.<br />
Redovisa tänkbara orsaker till, <strong>och</strong> bedömda konsekvenser av, att modellantaganden<br />
inte är helt uppfyllda.<br />
2.3 Redovisning av osäkerhetsmått<br />
Denna punkt avser endast huruvida osäkerhetsmått anges eller ej, <strong>och</strong> när sådana<br />
ges, av vilken typ de är. Osäkerhetsmåtten själva återfinns antingen i tabellmaterialet<br />
eller under <strong>för</strong>egående punkter. Osäkerhet kan även beskrivas summariskt<br />
enligt Bilaga 2, vars huvudsyfte är att standardisera beteckningssättet.<br />
3 STATISTIKENS AKTUALITET<br />
Under Aktualitet skall sådan information ges som hjälper användare att bedöma hur<br />
väl statistiken beskriver nuläget.<br />
3.1 Frekvens<br />
Ange undersöknings-, publicerings- <strong>och</strong> uppgiftsinsamlingsfrekvenser <strong>för</strong> statistiken.<br />
Kommentera eventuella genom<strong>för</strong>da eller planerade <strong>för</strong>ändringar.<br />
3.2 Framställningstid<br />
Ange framställningstiden <strong>för</strong> statistiken. Kommentera eventuella <strong>för</strong>skjutningar <strong>och</strong><br />
planerade <strong>för</strong>ändringar.<br />
3.3 Punktlighet<br />
Ange med vilken punktlighet statistiken framställts. För en återkommande undersökning<br />
kan <strong>för</strong>skjutningar <strong>och</strong> <strong>för</strong>ändringar i publiceringsplaner kommenteras här.<br />
4 JÄMFÖRBARHET <strong>och</strong> SAMANVÄNDBARHET<br />
4.1 Jäm<strong>för</strong>barhet över tiden<br />
Ge en resumé över i vilken utsträckning statistiska målstorheter (objekt, variabler,<br />
statistiska mått, m.m.) <strong>och</strong> undersökningsmetod legat fasta respektive ändrats över<br />
tiden. I den mån <strong>för</strong>ändringar skett i samhället som påverkar statistiken, t.ex. nya<br />
lagar <strong>och</strong> avtal, beskriv dem, <strong>och</strong> hur de har påverkat eller tänks kunna påverka<br />
statistiken. Beskriv konsekvenser av eventuella metod<strong>för</strong>ändringar. Peka på <strong>för</strong>ekomst<br />
av tidsseriebrott, <strong>och</strong> beskriv åtgärder <strong>för</strong> att mildra dem. Vid jäm<strong>för</strong>else med<br />
en tidigare referenstid, ange om denna var extrem/ovanlig i något avseende.<br />
4.2 Jäm<strong>för</strong>barhet mellan grupper<br />
Ange i vilken utsträckning statistikens målstorheter överensstämmer med målstorheter<br />
i annan statistik som det kan finnas intresse att jäm<strong>för</strong>a med, t.ex. <strong>för</strong> internationella<br />
jäm<strong>för</strong>elser. Kommentera även undersökningsmetoden i detta avseende.<br />
Om skillnader <strong>för</strong>eligger, beskriv deras innebörd <strong>för</strong> jäm<strong>för</strong>barhet. Avgränsningen<br />
av statistik som det kan finnas intresse att jäm<strong>för</strong>a med blir en bedömningsfråga.<br />
4.3 Samanvändbarhet med annan statistik
Ange annan statistik som är särskilt naturlig att användas tillsammans med den<br />
statistik som <strong>kvalitets</strong>deklareras. Ange i vilken utsträckning dels målstorheter dels<br />
undersökningsmetoder <strong>och</strong> åtföljande eventuella skevheter överensstämmer eller<br />
skiljer sig. Avgränsningen av "annan statistik" blir en bedömningsfråga.<br />
5 TILLGÄNGLIGHET <strong>och</strong> FÖRSTÅELIGHET<br />
För Tillgänglighet <strong>och</strong> <strong>för</strong>ståelighet är behovet av information <strong>för</strong> vissa underkomponenter<br />
inte så stort, eftersom publikationen i sig utgör en del av underlaget<br />
<strong>för</strong> en <strong>kvalitets</strong>bedömning. T.ex. aspekten ”presentation” avser utformning av text,<br />
tabeller, diagram, o. dyl. som användaren i normalfallet direkt kan studera i publikationen.<br />
Informationen syftar till att ge användaren underlag <strong>för</strong> att bedöma hur<br />
väl statistiken tillmötesgår hans/hennes önskemål i fråga om spridningsformer <strong>och</strong><br />
de servicemöjligheter som erbjuds i anslutning till den publicerade statistiken.<br />
5.1 Spridningsformer<br />
Redovisa de distributionskanaler <strong>och</strong> publiceringsmedia som används <strong>för</strong> statistiken.<br />
När tillämpligt, informera användare om att det endast är begränsade delar av<br />
framtagen statistik som publiceras, på grund av kostnadsrestriktioner, begränsat<br />
användarintresse, m.m.<br />
5.2 Presentation<br />
I normalfallet utgör publikationen själv bedömningsunderlaget <strong>och</strong> inga ytterligare<br />
kommentarer behövs.<br />
5.3 Dokumentation<br />
Ange andra källor <strong>för</strong> information om statistiken <strong>och</strong> om den framställningsprocess<br />
som ledde fram till den.<br />
5.4 Tillgång till primärmaterial<br />
Redovisa i stora drag användares möjligheter att få specialbearbetningar ut<strong>för</strong>da,<br />
<strong>och</strong> möjligheter att få tillgång till avidentifierat primärmaterial.<br />
5.5 Upplysningstjänster<br />
Ange vart en användare kan vända sig <strong>för</strong> att få ytterligare hjälp att <strong>för</strong>stå <strong>och</strong> analysera<br />
statistiken, samt finna annan relaterad statistik.<br />
17
Bilaga 1. Begrepp <strong>och</strong> termer i anslutning till statistiska<br />
undersökningar<br />
En statistisk undersökning syftar till kunskap om värdena på statistiska storheter,<br />
d.v.s storheter som ger en sammanfattande numerisk beskrivning av <strong>för</strong>hållanden i<br />
en grupp. Det karaktäristiska <strong>för</strong> en sådan undersökning är att den i ett <strong>för</strong>sta steg<br />
omfattar insamling av uppgifter, som i ett andra steg bearbetas till statistik.<br />
Termen "statistisk undersökning" används med litet olika innebörder. Ibland avser<br />
den en enskild undersökning, medan den i andra fall syftar på en hel serie av återkommande,<br />
väsentligen likadana undersökningar. Konsumentprisindex (KPI) - undersökningen<br />
kan t.ex. avse såväl en bestämd KPI - omgång (t.ex. den som ledde<br />
fram till KPI - värdet <strong>för</strong> mars 1999) som den undersökningsserie som ger ifrån sig<br />
månatliga <strong>och</strong> årliga KPI - värden. I det följande avses med statistisk undersökning<br />
en "enskild" undersökning.<br />
Man möter ibland svårigheter vid avgränsningen av den undersökning som skall<br />
dokumenteras, vars statistik skall <strong>kvalitets</strong>deklareras, el. dyl. Svårigheterna kan<br />
exemplifieras med undersökningsaktiviteterna som leder fram till KPI - värden. Sett<br />
mer i detalj omfattar de ett antal delundersökningar (avseende livsmedel, kläder,<br />
hyror, m.m.), vilka mycket väl kan betraktas som självständiga undersökningar.<br />
Ofta finns ingen självklar början <strong>och</strong> slut i ett undersökningssammanhang, ingen<br />
självklar "avgränsning i rummet". Analoga svårigheter <strong>för</strong> "avgränsning i tiden"<br />
kan också <strong>för</strong>eligga, särskilt vid periodiskt upprepade undersökningar. Det går inte<br />
att ge allmänna regler <strong>för</strong> hur man avgränsar en undersökning. I det praktiska fallet<br />
får avgränsningen göras på det sätt som bedöms vara mest ändamålsenligt <strong>för</strong> det<br />
aktuella beskrivningssyftet.<br />
I stort sett oberoende av hur en undersökning avgränsas, kan den beskrivas med<br />
uppdelning efter nedanstående moment, vilka ansluter till den normala undersökningsgången;<br />
planering (moment 1 <strong>och</strong> 2), uppgiftsinsamling (moment 3) samt<br />
skattning <strong>och</strong> resultatredovisning (moment 4).<br />
Moment 1: Statistikens innehåll<br />
Moment 2: Undersökningsplan<br />
Moment 3: Uppgiftsinsamling<br />
Moment 4: Skattning <strong>och</strong> resultatredovisning<br />
Följande genomgång av begrepp <strong>och</strong> termer görs genom en beskrivning av en statistisk<br />
undersökning med ovanstående momentindelning. Termer som önskas framhävda<br />
är kursiverade, <strong>och</strong> de preciseras/definieras av sin omgivande text.<br />
Moment 1. Statistikens innehåll<br />
Utgångspunkten <strong>för</strong> en statistisk undersökning är ett sakproblem, vilket kan gälla<br />
sociala, ekonomiska, miljömässiga <strong>för</strong>hållanden, eller något annat. Det genererar ett<br />
statistiskt problem med frågor som : Vilka statistiska storheter skulle belysa sakproblemet<br />
väl ? Hur kan exakta eller skattade värden på dessa storheter tas fram ?<br />
Vilka kostnader blir det fråga om ?<br />
Det i statistiksammanhang centrala begreppet är statistisk storhet. Det avser ett<br />
"teoretiskt" ("sant") värde, som definieras av att :<br />
- ett bestämt statistiskt mått används <strong>för</strong> att sammanfatta<br />
- värdena på en eller flera variabler<br />
- <strong>för</strong> objekten i en bestämd grupp.<br />
Objekten kan vara personer, <strong>för</strong>etag, händelser, <strong>för</strong>emål, m.m. Hela objektkollektivet<br />
kallas populationen. Ofta är också olika delpopulationer av intresse, <strong>och</strong><br />
sådana benämns redovisningsgrupper. Med en variabel avses en egenskap hos<br />
objekten, vilken kan vara såväl kvantitativ som kvalitativ. Ett statistiskt mått är en<br />
19
20<br />
beräkningsregel <strong>för</strong> sammanfattande, t.ex. räkning av antal, beräkning av summa,<br />
medelvärde eller median. Ett exempel där storheten beror av två variabler är korrelationskoefficient.<br />
I en undersöknings <strong>för</strong>sta planeringsomgång riktar sig beställarens/användarens<br />
intresse mot statistiska storheter som ansluter till dennes sakproblem, användarens<br />
statistiska intressestorheter. Funnes inte ekonomiska, tidsmässiga eller andra restriktioner,<br />
skulle undersökningen genom<strong>för</strong>as så att värden på intressevariablerna<br />
samlades in <strong>för</strong> samtliga objekt i intressepopulationen. I praktiken genom<strong>för</strong>s dock<br />
sådana "ideala" totalundersökningar sällan. Oftast skulle det bli <strong>för</strong> dyrt, eller ta <strong>för</strong><br />
lång tid att undersöka de objekt <strong>och</strong> variabler man är mest intresserad av. Istället<br />
inriktas undersökningen mot statistiska storheter som, även om de inte helt överensstämmer<br />
med de ideala, bedöms ligga tillräckligt nära dessa <strong>och</strong> vara lättare eller<br />
billigare att undersöka. Objekt, variabler, populationsavgränsning, m.m. som man<br />
väljer att använda i undersökningen benämns med prefixet mål, i sammansättningar<br />
som målobjekt, målpopulation, målvariabel, m.m. Den uppsättning statistikvärden<br />
som undersökningen i <strong>för</strong>sta hand skall resultera i kallas dess tabellplan.<br />
Ett annat vanligt avsteg från den ideala totalundersökningen är att man, fram<strong>för</strong> allt<br />
av kostnads- <strong>och</strong> tidsskäl, undersöker endast ett urval av populationens objekt. Då<br />
kommer medvetet viss osäkerhet in i statistiken. Även när utformningen är av<br />
totalundersökningstyp <strong>för</strong>eligger "störningar" som bidrar till osäkerhet; svarsbortfall,<br />
mätfel, ramtäckningsbrister, m.m. Praktiska undersökningar leder normalt inte<br />
till exakt fastställande av värdena på målstorheterna, utan till statistikvärden som är<br />
skattningar. Statistikuppgift <strong>för</strong>ekommer vanligt som synonym till statistikvärde.<br />
Härvid är den "kategoriska" ledstjärnan att sträva efter väntevärdesriktiga skattningar,<br />
sådana som är "i genomsnitt riktiga". Oftast leder strävandena till statistik<br />
som är, åtminstone så gott som, väntevärdesriktig, men man kan inte alltid undvika<br />
skevhet (bias) i skattningar, d.v.s. att de är <strong>för</strong>enade med systematisk över - eller<br />
underskattning.<br />
Statistikvärden är, som sagt, oftast <strong>för</strong>enade med viss osäkerhet. Ju mindre osäkert,<br />
desto mer till<strong>för</strong>litligt är ett statistikvärde. En statistisk undersökning skall helst<br />
utformas så att meningsfulla osäkerhetsmått <strong>för</strong> statistikvärdena kan beräknas, <strong>och</strong><br />
också beräknas <strong>och</strong> redovisas. Statistiks användbarhet som analys- <strong>och</strong> beslutsunderlag<br />
beror av dess till<strong>för</strong>litlighet. Ju mer till<strong>för</strong>litlig den är, desto bättre underlag<br />
utgör den. Kostnaderna <strong>för</strong> att framställa statistik hänger följdriktigt samman<br />
med dess till<strong>för</strong>litlighet. Ju mer till<strong>för</strong>litlig statistik som önskas, desto högre blir <strong>för</strong><br />
det mesta kostnaden. Åtminstone i en andra planeringsomgång är det där<strong>för</strong> viktigt<br />
att beställare/användare <strong>och</strong> producent kommer till sam<strong>för</strong>stånd om hur statistikens<br />
till<strong>för</strong>litlighet <strong>och</strong> undersökningskostnader skall balansera varandra.<br />
Terminologiska kommentarer<br />
Objekt <strong>och</strong> variabel: Ett flertal synonymer till "objekt" <strong>för</strong>ekommer, bl.a. element, enhet,<br />
elementär enhet, individ <strong>och</strong> objektinstans. Även <strong>för</strong> "variabel" finns synonymer, bl.a.<br />
egenskap <strong>och</strong> attribut.<br />
Statistisk storhet: Förekommande synonymer är parameter <strong>och</strong> karakteristika.<br />
Redovisningsgrupp: Alternativa termer med ungefär samma innebörd är delpopulation,<br />
grupp, klass, domän.
Moment 2. Undersökningsplan<br />
Observationsobjekt <strong>och</strong> uppgiftskälla<br />
Den mest resurskrävande delen av en statistisk undersökning är vanligen uppgiftsinsamlingen.<br />
En <strong>för</strong>ekommande synonym till uppgift är observation. Man brukar<br />
skilja mellan grunduppgifter (t.ex. ett frågesvar inhämtat genom intervju, eller<br />
inkomstuppgifter från Riksskatteverket) <strong>och</strong> härledda uppgifter. De senare framkommer<br />
genom att grunduppgifter kombineras, enligt någon <strong>för</strong>eskriven härledningsregel,<br />
med varandra eller med uppgifter som producenten <strong>för</strong>fogar över.<br />
Planen <strong>för</strong> en uppgiftsinsamling skall ge svar på bl.a. följande frågor. Vem/vad vill<br />
man samla in uppgifter om? Vem vill man inhämta uppgifter från? Hur kommer<br />
man i kontakt med uppgiftskällan? Ett objekt som man hämtar in uppgifter om<br />
kallas ett observationsobjekt, <strong>och</strong> variabler som man samlar in värden på kallas<br />
observationsvariabler. En instans från vilken uppgifter inhämtas kallas en uppgiftskälla.<br />
För ett <strong>och</strong> samma observationsobjekt kan det vara aktuellt att inhämta<br />
uppgifter från flera olika uppgiftskällor. Om uppgiftskällan är en person (t.ex. när<br />
en individ lämnar uppgifter om sig själv) talar man hellre om uppgiftslämnare.<br />
Även register, databaser, o.dyl. kan vara uppgiftskällor. När uppgiftskällan är ett<br />
<strong>för</strong>etag/organisation är vanligen en person utpekad att ansvara <strong>för</strong> att uppgifter<br />
lämnas, dessas riktighet, m.m., en kontaktperson.<br />
Ram<strong>för</strong>farande<br />
Proceduren <strong>för</strong> att fastställa observationsobjekt <strong>och</strong> komma i kontakt med uppgiftskällor<br />
kallas undersökningens ram<strong>för</strong>farande. I "nybörjarboken" ser ram<strong>för</strong>farandet<br />
<strong>för</strong> en urvalsundersökning ut så här. En lista <strong>för</strong>eligger, kallad ram, vars<br />
element ett - till - ett korresponderar med objekten i målpopulationen. Ett urval dras<br />
genom att man låter slumpen välja ut ett antal ramelement, <strong>och</strong> korresponderande<br />
populationsobjekt utgör urvalet som skall observeras. Uppgifter om utvalda objekt<br />
inhämtas direkt från dem själva. Vid detta enkla ram<strong>för</strong>farande <strong>för</strong>eligger ett - till -<br />
ett korrespondens mellan "ramelement", "objekt i målpopulationen", "observationsobjekt"<br />
<strong>och</strong> "uppgiftskälla". I många undersökningar är dock vissa, ibland<br />
t.o.m. alla, dessa instanser olika. Man kan urskilja två huvudtyper <strong>för</strong> en uppgiftsinsamlings<br />
struktur.<br />
Observationsobjektbaserat insamlings<strong>för</strong>farande:<br />
Först fastläggs vilka observationsobjekten skall vara. Därefter kommer uppgiftskällorna<br />
in i bilden (eventuellt är de observationsobjekten själva).<br />
Uppgiftskällebaserat insamlings<strong>för</strong>farande:<br />
• Först fastläggs vissa primära uppgiftskällor som man skall vända sig till.<br />
Hos dessa görs anmodanden av typen: "Var vänlig ange alla objekt (av<br />
angivet slag) som är relaterade (enligt angiven regel) till Er, samt deras<br />
värden på följande variabler: ...........".<br />
• Först därefter vet man precis vilka observationsobjekt som ingår i undersökningen.<br />
Eventuellt fortsätter uppgiftsinsamlingen <strong>för</strong> framkomna objekt,<br />
<strong>och</strong> det kan då vara aktuellt att vända sig till sekundära uppgiftskällor.<br />
Ovanstående insamlingstyper kan benämnas insamling enligt "listmodell" respektive<br />
"klustermodell". Det behöver inte vara självklart vilken av modellerna som<br />
skall användas <strong>för</strong> en speciell undersökning, <strong>och</strong> det finns också mellanvarianter.<br />
Ett huvudinstrument <strong>för</strong> en uppgiftsinsamling, oavsett dess typ, är undersökningens<br />
ram. Dess centrala del utgörs av en eller flera <strong>för</strong>teckningar (vanligen av möjliga<br />
observationsobjekt eller uppgiftskällor). Härvid skall <strong>för</strong>teckning uppfattas i vid<br />
mening. Den vanligaste typen av <strong>för</strong>teckning är ett elektroniskt register, men den<br />
kan vara en lista på papper, en karta, m.m. Objekten i en ram<strong>för</strong>teckning kallas<br />
ramelement. Med undersökningens ram<strong>för</strong>farande avses den totala proceduren <strong>för</strong><br />
21
22<br />
att bestämma precis vilka observationsobjekten <strong>och</strong> uppgiftskällorna skall vara.<br />
Själva ram<strong>för</strong>teckningen räcker dock inte <strong>för</strong> att lägga fast ram<strong>för</strong>farandet, utan<br />
regler <strong>för</strong> hur ramelementen leder (är kopplade) till observationsobjekt <strong>och</strong> uppgiftskällor<br />
måste också anges. (Ett exempel på en litet mer sofistikerad koppling är<br />
när man väljer ut hushåll genom att <strong>för</strong>st välja ut personer, ur en ram med personer,<br />
<strong>och</strong> sedan låta de urvalda personernas hushåll utgöra urvalet av hushåll.)<br />
En ytterligare viktig sak är att ramen skall kunna <strong>för</strong>se undersökaren med kontaktväg<br />
till uppgiftskällan (postadress, telefonnummer, o.dyl.).<br />
I nästa diskussion görs uppdelning efter total- respektive urvalsundersökningar.<br />
Totalundersökningar<br />
Uppgiftsinsamlingen i en totalundersökning avser samtliga observationsobjekt som<br />
ramen leder till. Idealt in<strong>för</strong>skaffar man därigenom uppgifter <strong>för</strong> samtliga objekt i<br />
målpopulationen. I praktiken <strong>för</strong>eligger dock störningar av olika slag.<br />
En sådan gäller defekter i ramens täckning. I praktiken kan ett ram<strong>för</strong>farande med<strong>för</strong>a<br />
såväl att man missar vissa observationsobjekt som borde vara med, som att<br />
man tar med objekt i onödan. För enkelhets skull antas att observations- <strong>och</strong> målobjekt<br />
är av samma typ, vilket de dock i det allmänna fallet inte behöver vara. Med<br />
rampopulationen menas då de objekt som ramelementen leder till. Den del av<br />
rampopulationen som faller inom målpopulationen kallas <strong>för</strong> den nåbara delen av<br />
målpopulationen. De objekt i målpopulationen som ligger utan<strong>för</strong> rampopulationen<br />
kallas (ram)undertäckningen. Den omfattar alltså objekt som inte kan nås via ram<strong>för</strong>farandet.<br />
Den del av rampopulationen som faller utan<strong>för</strong> målpopulationen kallas<br />
(ram)övertäckningen. Härvid <strong>för</strong>utsätts att ramens kopplingsregler är sådana att<br />
man inte med hjälp av informationen i ramen kan avgöra om ett ramelement leder<br />
till ett intressant objekt eller ett övertäckningsobjekt, utan att det avgörandet fordrar<br />
observation. Annorlunda uttryckt: Övertäckning som kan identifieras i ramen<br />
bortses från. Begreppen illustreras i nedanstående figur.<br />
Rampopulation<br />
Målpopulation<br />
Figur. Illustration av täcknings<strong>för</strong>hållanden.<br />
Övertäckning<br />
Nåbar del av<br />
målpopulation<br />
Undertäckning<br />
Under- <strong>och</strong> övertäckning in<strong>för</strong>des ovan under premissen att observations- <strong>och</strong> målobjekt<br />
är av samma typ, men begreppen används mer allmänt på följande sätt.<br />
Undertäckningen utgörs av de objekt i målpopulationen som ram<strong>för</strong>farandet inte<br />
leder till uppgifter om. Övertäckningen utgörs av objekt som ram<strong>för</strong>farandet leder<br />
till (åtminstone vissa) uppgifter om, trots att de ligger utan<strong>för</strong> målpopulationen.<br />
Vanligen avbryts uppgiftsinsamlingen <strong>för</strong> dessa objekt.<br />
Konsekvenserna av under - <strong>och</strong> övertäckning är olika till sin karaktär. Undertäckning<br />
innebär att uppgifter inte samlas in <strong>för</strong> en del av den målpopulation som statistiken<br />
skall uttala sig om, <strong>och</strong> konsekvensen kan bli skevhet i statistiken. Övertäckning<br />
innebär att man använder undersökningsresurser på ointressanta objekt.<br />
Om populationstillhörigheten inte kontrolleras, kan konsekvensen även här bli<br />
skevhet i statistiken.
Urvalsundersökningar<br />
Uppgiftsinsamlingen till en urvalsundersökning avser endast ett urval av de observationsobjekt/uppgiftskällor<br />
som ramen, här kallad urvalsramen, leder till. En<br />
sådan undersökning innebär alltså "ekonomiserad" uppgiftsinsamling jäm<strong>för</strong>t med<br />
en totalundersökning. Vid en urvalsundersökning möter man problem avseende hur<br />
man skall göra inferens till populationsstorheter från observationer på bara ett urval<br />
av objekt, vilket diskuteras litet mer ingående under Moment 4.<br />
Ramtäckningsproblem <strong>för</strong>eligger även vid urvalsundersökningar. Under premissen<br />
att observations- <strong>och</strong> målobjekten är av samma typ, definieras rampopulationen <strong>för</strong><br />
en urvalsundersökning som de målobjekt som urvalsramen leder till. Efter den<br />
modifikationen av rampopulation gäller det som tidigare sagts om under - <strong>och</strong> övertäckning<br />
<strong>för</strong> totalundersökningar också <strong>för</strong> urvalsundersökningar.<br />
Helst skall ett urval vara ett sannolikhetsurval. Därvid låter man en slumpmekanism<br />
operera på urvalsramen <strong>och</strong> generera ett urval av ramelement, som i sin tur leder till<br />
objekturvalet som skall observeras. Härvid skall slumpen operera på ett så<br />
kontrollerat sätt att man <strong>för</strong> en godtycklig delmängd i rampopulationen kan beräkna<br />
sannolikheten att just den blir objekturvalet. Speciellt innebär detta att<br />
urvalssannolikheten <strong>för</strong> varje objekt i rampopulationen kan beräknas. Vidare skall<br />
varje objekt i rampopulationen ha positiv urvalssannolikhet.<br />
Till<strong>för</strong>litligheten i resulterande statistikvärden påverkas av den urvalsutformning<br />
<strong>och</strong> den urvalsallokering (val av urvalsstorlekar) som används. Urvalsutformningar<br />
med stratifierat urval är vanligt <strong>för</strong>ekommande, varvid urvalsramen <strong>för</strong>st delas upp<br />
i åtskilda delar, (urvals)stratan, från vilka delurval dras oberoende av varandra.<br />
Insamlingsmetod/mät<strong>för</strong>farande<br />
Det finns många sätt att samla in uppgifter på. Ett är att helt enkelt över<strong>för</strong>a uppgifter<br />
från ett eller flera externa register. Vid mer egentlig insamling talar man om<br />
mätningar (eller observationer), mätmetod, mätinstrument, o.dyl.<br />
Vid individundersökningar är frågeformuläret det karaktäristiska mätinstrumentet.<br />
Härvid kan svar inhämtas via blankett som distribueras per post eller genom intervju<br />
(med telefon- <strong>och</strong> besöksintervju som huvudmöjligheter), m.m. För att få bra<br />
mätvärden via ett frågeformulär är det viktigt att formuläret är väl utformat ifråga<br />
om språk, anvisningar, frågornas ordningsföljd, m.m. Praktisk utprovning bör ingå i<br />
konstruktionen av ett frågeformulär.<br />
Andra möjligheter att samla in uppgifter på är via diskett eller Internet. Fysikaliska<br />
mätmetoder <strong>för</strong>ekommer också, t.ex. <strong>för</strong> att ge uppgiftsunderlag till miljöstatistik.<br />
Avbrytning<br />
Ibland leder ram<strong>för</strong>farandet till objekt <strong>för</strong> vilka man inte vill påbörja/fortsätta insamling<br />
av uppgifter <strong>för</strong> de egentliga observationsvariablerna. Enligt någon<br />
bestämd avbrottsregel avslutas uppgiftsinsamlingen vid vissa svarskombinationer<br />
på vissa, oftast initiala, frågor. (T.ex. med anvisning av typen: Om svaret på <strong>för</strong>egående<br />
fråga är "Nej", avsluta <strong>och</strong> sänd tillbaka blanketten.) Det vanligaste skälet<br />
<strong>för</strong> att avbryta en uppgiftsinsamling är att det framgår av lämnade uppgifter att objektet<br />
är ett övertäckningsobjekt <strong>och</strong> därmed ointressant, men det finns även andra<br />
skäl. Man brukar ofta uttrycka avbrytning med att objekt identifieras som övertäckning,<br />
vare sig detta är helt adekvat eller ej.<br />
Planerat observationsregister<br />
När en undersöknings målobjekt <strong>och</strong> målvariabler <strong>och</strong> dess ram<strong>för</strong>farande (inklusive<br />
observationsobjekt <strong>och</strong> -variabler) är fastlagda, har man "spänt upp" undersökningens<br />
planerade observationsregister. Det kan, åtminstone schematiskt, ses<br />
som en tabell med observationsobjekt i raderna <strong>och</strong> variabler i kolumnerna. Tabel-<br />
23
24<br />
lens celler är dock fortfarande tomma. Observationsregistret skall härbärgera såväl<br />
grunduppgifter som samlas in, som variabelvärden som härleds ur dessa (åtminstone<br />
dem man vill spara).<br />
Moment 3. Uppgiftsinsamling<br />
Nästa steg är att, så långt möjligt, inhämta avsedda uppgifter till det planerade<br />
observationsregistret. Vid en totalundersökning är allt klart <strong>för</strong> uppgiftsinsamlingen.<br />
Vid en urvalsundersökning gäller att <strong>för</strong>st ut<strong>för</strong>a urvalsdragningen, så att de<br />
avsedda observationsobjekten/primära uppgiftskällorna får identitet.<br />
Förutom den egentliga uppgiftsinsamlingen vidtas olika insamlingsadministrativa<br />
åtgärder. När uppgifter samlas in medelst postenkät, ingår åtgärder som utsändning,<br />
påminnelse, <strong>och</strong> avprickning. I slutändan av en uppgiftsinsamling kan det vara<br />
aktuellt att övergå till alternativt insamlings<strong>för</strong>farande (t.ex. från postenkät till<br />
telefonintervju, eventuellt bara <strong>för</strong> ett urval av dem som resterar).<br />
Uppgiftsinsamlingar utsätts så gott som alltid <strong>för</strong> störningar, som med<strong>för</strong> att man<br />
inte får in uppgifter exakt enligt plan, vilket i sin tur bidrar till statistikens osäkerhet.<br />
Nedan diskuteras sådana osäkerhetskällor.<br />
Mätning/observation<br />
Det händer att en lämnad uppgift inte överensstämmer med det "sanna" värdet<br />
enligt variabelns definition. Det finns en mängd skäl till att så kan vara fallet, t.ex.<br />
att blankettfrågan inte passar ihop med uppgiftskällans bok<strong>för</strong>ing, frågan är tvetydigt<br />
formulerad, personer har bristande minne, uppgiftslämnare kan vara slarviga<br />
(eller ännu värre, medvetet vilseledande), fysikaliska mätmetoder kan vara behäftade<br />
med brister, m.m. Allmänt talar man om att mätfel <strong>för</strong>eligger. Mätfel bidrar<br />
naturligtvis till statistiks osäkerhet, <strong>och</strong> kan göra det såväl på ett systematiskt sätt<br />
(med<strong>för</strong>ande skevhet) som på ett tillfälligt sätt (som inte leder till skevhet, men ökar<br />
osäkerheten).<br />
Svarsbortfall<br />
Svarsbortfall, eller vanligen bara bortfall, uppstår när värden på en eller flera observationsvariabler<br />
inte kan inhämtas. Termen "bortfall" skall uppfattas i den vida<br />
mening som indikeras av engelskans "missing value". Den omfattar t.ex. att uppgifter<br />
saknas, där<strong>för</strong> att de av en eller annan anledning inte kunde över<strong>för</strong>as från ett<br />
administrativt register. Om man <strong>för</strong> ett objekt inte överhuvud erhåller några<br />
användbara uppgifter sägs objektbortfall <strong>för</strong>eligga. Huvudanledningarna <strong>för</strong> detta är<br />
misslyckat kontaktetablerande ("ej anträffad") <strong>och</strong> avböjd medverkan ("vägran").<br />
Ett observationsobjekt <strong>för</strong> vilket åtminstone vissa användbara uppgifter erhålls sägs<br />
vara svarande. Ett objekt som lämnar uppgifter nog <strong>för</strong> att kunna identifieras som<br />
övertäckningsobjekt räknas som svarande. Vid objektbortfall kan det vara aktuellt,<br />
även om det är ovanligt i Sverige, att enligt någon <strong>för</strong>eskriven regel substituera<br />
bortfallna observationsobjektet med andra.<br />
Om användbara uppgifter inhämtats <strong>för</strong> vissa, men inte alla, observationsvariabler<br />
sägs partiellt bortfall <strong>för</strong>eligga (<strong>för</strong> variabler utan värden).<br />
Databeredning<br />
Insamlade uppgifter <strong>för</strong>s in i observationsregistret. Vid över<strong>för</strong>ing av muntliga eller<br />
skriftliga uppgifter till elektroniskt medium talar man om dataregistrering. Det är<br />
ibland aktuellt att enligt givna regler kategoriindela variabelvärden som angetts med<br />
öppna svar (i "klartext", t.ex. yrke), att koda uppgifterna. Genom granskning kan<br />
man sålla fram uppgifter som är, eller misstänks vara, behäftade med fel, särskilt<br />
inkonsistenser <strong>och</strong>/eller grova fel ("slarvfel"). Sedan kan åtgärder vidtas <strong>för</strong> att<br />
kontrollera uppgifterna, vanligen genom att kontakta uppgiftskällan. Kontroller kan
leda till att fel uppdagas <strong>och</strong> att uppgifter rättas/ändras. Dataregistrering, kodning<br />
<strong>och</strong> granskning/rättning kallas sammantaget databeredning.<br />
Slutligt observationsregister<br />
Nästa steg är att framställa det slutliga observationsregistret. För många, <strong>för</strong>hoppningsvis<br />
den stora majoriteten, av cellerna i det planerade observationsregistret har<br />
man lyckats i insamlingen, <strong>och</strong> de innehåller uppgifter. Vissa celler saknar dock<br />
uppgifter beroende på bortfall. Med dessa kan <strong>för</strong>faras på olika sätt.<br />
Vanligen accepteras att uppgift saknas, vilket sedan beaktas på lämpligt sätt i<br />
skattningarna. I andra fall in<strong>för</strong>s "<strong>för</strong>modade" värden istället <strong>för</strong> de saknade,<br />
imputeringar görs. Celler kan också sakna värden där<strong>för</strong> att de svarar mot övertäcknings/avbrytningsobjekt.<br />
Räkning av bortfalls- <strong>och</strong> övertäckningsobjekt görs,<br />
eftersom deras antal spelar roll vid skattningarna.<br />
Beräkning av värden på härledda variabler som skall sparas är ytterligare ett<br />
moment i framställningen av det slutliga observationsregistret, vars innehåll kallas<br />
undersökningens primärmaterial.<br />
Moment 4. Skattning <strong>och</strong> resultatredovisning<br />
Primärmaterialet utgör underlaget <strong>för</strong> statistiken från undersökningen. Steget härifrån<br />
till statistikvärden innehåller huvudingrediensen skattning (estimation), som<br />
diskuteras mer ingående nedan.<br />
Åtminstone när det handlar om officiell statistik görs den framtagna statistiken<br />
allmänt tillgänglig, offentliggörs (publiceras). Härvid kan olika spridningsmedia<br />
(papperstryck, diskett, databas, m.m.) används <strong>och</strong> olika spridningskanaler (Statistiskt<br />
Meddelande, årsbok, inläggning i databas, Reuter, m.m.).<br />
Statistik bör presenteras så att den är lätt att <strong>för</strong>stå <strong>och</strong> överblicka, <strong>för</strong> vilket utformningen<br />
av text, tabeller, diagram, o.dyl. spelar roll. Vidare bör undersökningens<br />
sakmässiga huvudresultat lyftas fram.<br />
Ofta publiceras inte all statistik som tas fram, utan bara sådan som bedöms vara<br />
"mest intressant". Ibland är användare med speciella sakproblem intresserade av<br />
statistik som inte tagits fram, men som kan framställas på basis av primärmaterialet.<br />
De kan då efterfråga av producenten genom<strong>för</strong>da specialbearbetningar. En annan<br />
möjlighet är att en användare får tillgång till (avidentifierat) primärmaterial, <strong>och</strong><br />
därigenom själv kan framställa statistik. Utredare <strong>och</strong> forskare är ofta angelägna om<br />
den sistnämnda modellen, som möjliggör snabb <strong>och</strong> flexibel analys.<br />
Skattning<br />
Steget från primärmaterial till statistikvärden innehåller vanligen ett statistiskt inferensproblem,<br />
beroende på att primärmaterialet normalt inte innebär att man känner<br />
de exakta variabelvärdena <strong>för</strong> samtliga objekt i den målpopulation som statistiken<br />
skall uttala sig om. Vid en urvalsundersökning är man säker på att komma i den<br />
situationen, men man gör det ofta också vid totalundersökningar, beroende på<br />
ramtäckningsbrister, bortfall <strong>och</strong> mätfel.<br />
Punktskattningar, statistikvärden<br />
En beräkningsalgoritm som leder från primärmaterialet till statistikvärden kallas ett<br />
(punkt)skattnings<strong>för</strong>farande eller (punkt)estimations<strong>för</strong>farande. Vid skattning är<br />
den "kategoriska" ledstjärnan att sträva efter väntevärdesriktiga ("riktiga i genomsnitt")<br />
skattningar. Oftast leder strävandena till, åtminstone så gott som väntevärdesriktig<br />
statistik, men man kan inte alltid undvika skevhet (bias) i skattningarna,<br />
d.v.s. systematiska över - eller underskattningar.<br />
Givet en skattnings (åtminstone approximativa) väntevärdesriktighet är nästa princip<br />
att skattnings<strong>för</strong>farandet skall leda till så till<strong>för</strong>litlig statistik som möjligt, mer<br />
25
26<br />
tekniskt uttryckt ha så liten (punkt)estimatorvarians som möjligt. Strävanden efter<br />
till<strong>för</strong>litliga skattningar börjar redan vid valet av urvalsutformning <strong>och</strong> urvalsstorlek(ar).<br />
Härvid är det aktuellt att använda kunskap/antaganden om <strong>för</strong>hållanden i<br />
populationen, bl.a. om hur vissa variablers värden varierar över denna. För att (med<br />
givna undersökningsresurser) uppnå statistik med god till<strong>för</strong>litlighet kan det vara<br />
<strong>för</strong>delaktigt att på lämpligt sätt utnyttja hjälpinformation (som kan avse alla objekt i<br />
populationen eller bara vissa "totaler").<br />
En vanlig struktur i skattnings<strong>för</strong>faranden är att varje svarande objekt tillordnas ett<br />
uppräkningstal, <strong>och</strong> att totaler skattas genom att summera uppräknade observationer<br />
(= observerat värde × uppräkningstal). Uppräkningstal är exempel på härledda<br />
variabler som normalt sparas i det slutliga observationsregistret.<br />
Vid skattningar måste man (explicit eller implicit) ta hänsyn till bortfall, brister i<br />
ramtäckningen samt mätfel, när sådana störningar <strong>för</strong>eligger. Förfaranden med detta<br />
syfte brukar kallas justeringar. De måste baseras på modeller <strong>för</strong> hur störningarna<br />
uppstod. Bortfallsjustering kallas också bortfallskompensation. Ett vanligt<br />
<strong>för</strong>farande är s.k. rak uppräkning, som innebär att man skattar som om de svarande<br />
utgjorde det ursprungliga urvalet.<br />
Beräkningsdelen av skattningarna, vilken numera i stort sett alltid ut<strong>för</strong>s av dator,<br />
kan vålla komplikationer. Felaktiga resultat på grund av otillräcklig numerisk precision<br />
<strong>för</strong>ekommer dock knappast längre. Huvudrisken utgörs av felprogrammering<br />
av skattningsformler. Här <strong>för</strong>eligger ofta <strong>för</strong>hållandet att stora fel avslöjar sig själva<br />
genom att leda till uppenbart orimliga resultat, medan mindre lapsusar kan undgå<br />
upptäckt.<br />
Osäkerhet <strong>och</strong> skattning av sådan<br />
Som redan pekats på flera gånger är ett statistikvärde normalt endast en skattning av<br />
den statistiska målstorheten. Då <strong>för</strong>eligger en avvikelse mellan statistikvärdet <strong>och</strong><br />
målstorheten. Det är naturligtvis önskvärt att kunna ange en begränsning <strong>för</strong> en<br />
avvikelses absoluta värde, vilket dock är inte alldeles enkelt eftersom målstorhetens<br />
värde är okänt. (Kände man det skulle man eliminera avvikelsen.) Uttalanden om<br />
avvikelser faller med nödvändighet under kategorin "utsagor om rådande<br />
osäkerhet", ett begreppsmässigt intrikat område. Som bäst kan man uttala sig om en<br />
avvikelses troliga största absoluta värde, vilket vanligen görs i termer av<br />
osäkerhetsintervall med nedanstående innebörd.<br />
Det är högst troligt att målstorhetens värde ligger i :<br />
osäkerhetsintervall = statistikvärde ± osäkerhetsmarginal.<br />
Tekniskt presenteras osäkerhetsintervall antingen som ("objektiva") konfidensintervall<br />
eller som ("subjektiva") bedömningsintervall. De senare är baserade på<br />
tidigare utvärderingar, ämnes<strong>för</strong>ståelse, undersökningserfarenhet, m.m.<br />
Vad gäller konfidensintervall, anges sådana i officiell statistik oftast som "statistikvärdet<br />
± 2 × estimatorns skattade standardavvikelse", där 2 är en avrundning av<br />
normal<strong>för</strong>delningsvärdet 1,96 , vilket också används. Under allmänna <strong>för</strong>utsättningar<br />
har ett sådant konfidensintervall (approximativt) 95% konfidensnivå/grad.<br />
Statistikvärdens osäkerhet kan också anges med andra osäkerhetsmått. Förekommande<br />
sådana är variationskoefficient (= estimatorns standardavvikelse delad med<br />
statistikvärdet) <strong>och</strong> relativ osäkerhetsmarginal (= 2 [eller 1,96] × variationskoefficienten).<br />
Dessa osäkerhetsmått, liksom konfidensintervall, beräknas genom att man<br />
i ett <strong>för</strong>sta steg skattar (punkt)estimatorns varians. Beräkning av osäkerhetsmått<br />
brukar där<strong>för</strong> också åberopas som variansskattning, <strong>och</strong> en beräkningsprocedur <strong>för</strong><br />
det syftet kallas ett variansskattnings<strong>för</strong>farande.
Idealt skall ett osäkerhetsmått avse den totala avvikelsen mellan statistikvärde <strong>och</strong><br />
målstorhet, men det är ofta svårt att ange sådana totala osäkerhetsmått. Ofta är det<br />
lättare att uttala sig om delavvikelser som relaterar till en eller flera av de osäkerhetskällor<br />
som kan påverka statistiken; ramtäckningsbrister, mätfel, bortfall, bearbetningsfel.<br />
I vissa fall kommer osäkerhet in också där<strong>för</strong> att ett modellberoende<br />
skattnings<strong>för</strong>farande använts <strong>och</strong> att modellantagandena inte varit helt uppfyllda.<br />
Terminologiska kommentarer<br />
Uppräkningstal: Förekommande synonymer är vägningstal <strong>och</strong> (uppräknings)vikt.<br />
Osäkerhetsmått: En estimators skattade standardavvikelse kallas ibland estimatorns medelfel,<br />
<strong>och</strong> variationskoefficienten <strong>för</strong> det relativa medelfelet.<br />
27
Bilaga 2. Summarisk redovisning av osäkerhet<br />
Huvudregeln är att osäkerhetsmått bör presenteras i nära anslutning till de statistikvärden<br />
de avser. I vissa fall kan detta dock vara mindre lämpligt, av utrymmesskäl<br />
eller <strong>för</strong> att osäkerhetsmåtten "tynger" i tabellerna. För att ändå ge information om<br />
osäkerheten i anslutning till statistikvärdena kan det, åtminstone ibland, vara praktiskt<br />
att använda en kort summarisk beskrivning av osäkerheten med hjälp av bokstäver.<br />
I nedanstående tablå anges en standard <strong>för</strong> detta <strong>för</strong>farande. Om det används<br />
i t.ex. ett SM, skall naturligtvis också tablån ingå i SM:et. Först några begrepp.<br />
Relativa medelfelet <strong>för</strong> ett statistikvärde (med möjliga synonymer<br />
relativa standardavvikelsen <strong>och</strong> variationskoefficienten) =<br />
= statistikvärdets (skattade) standardavvikelse<br />
.<br />
statistikvärdet<br />
Med ett statistikvärdes relativa osäkerhetsmarginal (relativa felmarginal) avses<br />
endera av 2 × relativa medelfelet eller 1,96 × relativa medelfelet, beroende på vilket<br />
av normal<strong>för</strong>delningens 1,96 <strong>och</strong> det avrundade värdet 2 som <strong>för</strong>edras.<br />
Under allmänna <strong>för</strong>utsättningar gäller att<br />
statistikvärdet × (1 ± den relativa osäkerhetsmarginalen)<br />
ger ett konfidensintervall <strong>för</strong> målstorheten, med cirka 95% konfidensnivå.<br />
Standard <strong>för</strong> bokstavsbeteckning av<br />
relativa osäkerhetsmarginaler<br />
Relativ osäkerhetsmarginal<br />
Övre gränsen är uteslutande<br />
Bokstavs -<br />
beteckning<br />
0% – 2% A<br />
2% – 5% B<br />
5% – 10% C<br />
10% – 20% D<br />
20% – 50% E<br />
50% – 100% F<br />
100% – G<br />
Kommentar<br />
I termer av relativt medelfel (variationskoefficient) har bokstäverna följande innebörd.<br />
A : Det relativa medelfelet (variationskoefficienten) ligger mellan 0 % <strong>och</strong> 1 %, B : Det relativa<br />
medelfelet (variationskoefficienten) ligger mellan 1 % <strong>och</strong> 2,5 %, o.s.v.<br />
Exempel: Nedanstående tabell ger ett fiktivt exempel på hur osäkerhet<br />
kan anges med bokstäver.<br />
Godsslag<br />
Totalt 300 677 B<br />
Spannmål 3 584 E<br />
Rundvirke 45 321 C<br />
Livsmedel <strong>och</strong> djurfoder 28 432 C<br />
Oljeprodukter 16 420 D<br />
Jord, sten, grus o sand 65 436 D<br />
Natur- <strong>och</strong> konstgödsel 2 803 F<br />
Under 1998 med lastbil transporterad<br />
godsmängd. Sort 1000 ton.<br />
29
Bilaga 3. <strong>Kvalitetsbegrepp</strong>et på engelska<br />
The following is a translation of the material on pages 1-12.<br />
Quality Concept for Official Statistics<br />
1 On quality in general<br />
In everyday language "quality" is about where on a scale bad - good - excellent a<br />
user places a certain product (commodity or service) compared with other similar<br />
products. Often, however, the word "quality" is also given a positive connotation,<br />
as a synonym to "good quality". This possible value judgement makes the notion<br />
somewhat difficult to handle, and it may be defined in different ways.<br />
The views on quality, and ideas about how to develop products with good quality<br />
have varied over time. During recent decades the quality philosophy for producers<br />
of goods and services has gradually come to be dominated by the approach labelled<br />
total quality, with central points as formulated in (i) and (ii) below.<br />
(i) The user shall be in focus. A product's quality is determined by (existing and<br />
potential) users' opinions of the product and its fitness for their poses.<br />
For the above slogan formulation to have practical effects, it must be made operational.<br />
A first step is to formulate a concrete quality concept for the product. With<br />
(i) as background the producer's quality concept may be specified as follows.<br />
(ii) Quality refers to all aspects of a product which are of relevance for how<br />
well it meets users' needs and expectations.<br />
This definition takes into account a user oriented quality concept. For the producer<br />
it has in the first place a descriptive meaning. For him/her the quality concept is<br />
essentially a listing of the aspects of a product, which users consider when judging<br />
how well it satisfies their needs and expectations. In doing so, they consider aspects<br />
of the product's functioning as well as services in conjunction with its acquisition,<br />
use and maintenance. The quality concept does not, however, imply on whether the<br />
product is of good or bad quality in any absolute sense.<br />
For the user "quality" has a more valuing signification. His/her quality assessment<br />
depends not only on the product per se, but also on its intended use. The same<br />
product may be judged to have good quality for one kind of use, but poor for<br />
another. The user is sovereign in knowing about his/her needs and expectations, and<br />
is therefore the one to make quality assessments. For the producer it is of course<br />
highly important to learn about users' opinions on quality, since they provide the<br />
basis for work towards better quality (greater user satisfaction).<br />
The concrete quality concept for a specific product is of importance in at least the<br />
following contexts.<br />
Design of quality declarations : By making a quality declaration the producer can<br />
specify the properties of a product so that it can be used in a proper way, and<br />
inform users about what quality in different respects they can count on.<br />
In quality improvement work : Since user opinions and preferences change over<br />
time, the producer must continuously strive to adapt the product to new needs<br />
and expectations. A user oriented quality concept facilitates communication<br />
between user and producer.<br />
In evaluations of productivity : It is always of importance that production processes<br />
are as efficient as possible. A producer therefore wants to be able to judge<br />
the relative benefits and costs for different parts of the production process. The<br />
quality concept provides one of the instruments for efficiency evaluation and an<br />
optimal allocation of production resources.<br />
31
32<br />
Quality and statistics<br />
The term "statistics" is used with somewhat different meanings. Here its chief<br />
interpretation is "a summarising numerical description of the conditions for a<br />
group". Statistics are produced to provide information which sheds light on subject<br />
matter problems. They often constitute vital basic information in planning and<br />
decision contexts. They also provide information to the general public, investigators,<br />
researchers and others about "the state of affairs".<br />
The basic notion in statistics contexts is statistical characteristic, which is a<br />
numerical value determined as follows. A statistical measure (e.g. "number of",<br />
mean or median) is used to summarise individual variable values for the objects in<br />
a group. The totality of considered objects is called the population.<br />
Examples of statistical characteristics are : (i) Production value for the Swedish<br />
shipbuilding industry during 1998. In this case the population = Swedish shipbuilding<br />
enterprises (during 1998), the variable = production value during 1998, the<br />
statistical measure = sum. (ii) Average disposable income during 1998 for a<br />
Stockholm family with two children. In this case the population = families with two<br />
children who 1998 lived in Stockholm, the variable = disposable income, the<br />
statistical measure = mean.<br />
The purpose of a statistical survey is to acquire information about the value of one<br />
or more statistical characteristics for a population, usually also for various subgroups<br />
of the population. The characteristics with which the survey is concerned are<br />
called the target characteristics. They have "true" but unknown values. A survey<br />
typically comprises two main steps, first the collection of primary data for<br />
individual objects and thereafter the compilation of statistics, which estimate the<br />
target characteristics.<br />
The word "estimate" used above indicates that statistics usually do not provide perfectly<br />
true values of target characteristic, but are subject to some uncertainty. The<br />
"categorical imperative" for a surveyor is to strive for estimates which are unbiased<br />
("on average correct"). There are many potential sources of inaccuracy. For a sample<br />
survey the obvious source of inaccuracy is that perfect information about a<br />
population cannot be gained by observing only a sample of its members. Total<br />
inspection surveys as well as sample surveys are affected also by other kinds of<br />
disturbances, which contribute to the inaccuracy of the final statistics. Sources of<br />
inaccuracy, in addition to sampling, which are discussed in more detail later on are:<br />
frame deficiencies, measurement errors, non - response, processing errors and non -<br />
perfect model assumptions.<br />
When the "total quality" concept formulated in the previous section is applied to the<br />
"product" statistics it leads to the following definition.<br />
(iii) Quality of statistics refers to all aspects of statistics, which are relevant<br />
for how well they meet users' needs for statistical information.<br />
As a background to the quality concept to be formulated below we will comment on<br />
some aspects of statistics, which are important to a majority of users. The subsequent<br />
section "Elaboration on the quality components" contains a more detailed<br />
discussion of the aspects.<br />
Mostly users have a strong desire for timely statistics, meaning (at least ideally) that<br />
they describe the "now" state of affairs. Factors which affect timeliness are<br />
swiftness in data collection and subsequent compilations, and for repeated surveys<br />
how frequently they are executed.<br />
A common and important usage of statistics is for comparisons, over time (via time<br />
series) as well as between groups. Fair comparisons require coherence of the target
characteristics to be compared. This requirements is also important when statistics<br />
from different sources are to be combined.<br />
Statistics are made available to users by different dissemination forms, via different<br />
media (e.g. on paper, on diskettes and other electronic media) and through different<br />
channels (e.g. periodical reports by mail, year books, Reuter, Internet). Statistical<br />
information is presented in different ways, in tables, charts, text, etc.<br />
Some users want statistics other than those published regularly. Sometimes such<br />
statistics, although not published, are available by the producer, in other cases they<br />
can be created by special processing of the primary data. A further alternative,<br />
which is requested by many users, in particular researchers and investigators, is<br />
direct access to (de-identified) primary data, which allows the users to derive statistics<br />
and make analyses themselves according to their own specific interests.<br />
Users' confidence in statistics depends on their beliefs about errors, unintentional as<br />
well as intentional. Not even a very careful statistics producer can avoid some<br />
unintentional uncertainty in the statistics. It is a fact of life, however, that deliberately<br />
false, non-objective, statistics sometimes occur, which of course is a serious<br />
quality deficiency. However, the aspect objectivity is not included in the quality<br />
concept. It is more or less impossible to judge if statistics are objective or not, and<br />
producers of false statistics would not inform their users about it. As regards Sweden,<br />
the law 1992 : 889 states the following. "Official statistics shall be objective<br />
and generally available".<br />
As already said, "user" refers to existing as well as potential users. There will<br />
always be organisations and persons who consider that their needs are not met by<br />
the official statistics, either because the statistics are not produced at all or because<br />
available statistics is not accurate enough. Producers should be keen to take such<br />
requirements into account when evaluating and revising surveys.<br />
Quality concept for official statistics<br />
How a user delimits the portion of statistics, with which his/her quality opinion is<br />
concerned, depends on his/her specific subject matter problem and application<br />
interest. "The statistics" may consist of a single value, of all statistics from a particular<br />
survey or statistics from different surveys to be used together. It may also<br />
concern "flows" (over time) of statistics. It is of course so that the more the concerned<br />
portion of statistics encompasses, the more quality aspects does it have. The<br />
following quality concept is meant to be applicable whatever the statistics extent<br />
may be, but for small "statistics packages" some of the quality components may be<br />
irrelevant.<br />
There is no self-evident division of the total collection of quality aspects for statistics<br />
into main aspects and sub-aspects. The quality concept which is presented<br />
below has the following five main components. (1) Contents, which concerns the<br />
target characteristics. (2) Accuracy, concerning sources of inaccuracy and their<br />
effects on the statistics. (3) Timeliness, concerning time aspects of relevance for<br />
how well the statistics describe the "now" situation. (4) Coherence especially comparability,<br />
concerning possibilities to make comparisons, over time and between<br />
groups, and to use the statistics jointly with statistics from other sources. (5) Availability<br />
and clarity, concerning physical availability of the statistics and their understandability.<br />
It has been emphasised earlier that the quality concept is user oriented. As a consequence,<br />
it should as far as possible be formulated from the users' point of view (not<br />
the producers'). There are exceptions from this principle, however, particularly for<br />
the quality component "accuracy". For the user "overall accuracy" is of chief interest,<br />
while its decomposition into different uncertainty sources, as is made in the<br />
quality is of a technical, producer oriented nature. The reason for specifying "nar-<br />
33
34<br />
row" uncertainty sources is that it is usually difficult to be specific about overall<br />
accuracy, while it may be possible to inform about how and with what effect at least<br />
some of the uncertainty sources affect the statistics.<br />
In the table below, the quality concept is structured by main components and subcomponents.<br />
The components are more elaborately described in next chapter.<br />
Quality concept for official statistics<br />
CONTENTS<br />
• Statistical target characteristics<br />
- Units and population<br />
- Variables<br />
- Statistical measures<br />
- Study domains<br />
- Reference times<br />
• Comprehensiveness<br />
ACCURACY<br />
• Overall accuracy<br />
• Sources of inaccuracy<br />
⋅ Sampling<br />
⋅ Frame coverage<br />
⋅ Measurement<br />
⋅ Non - response<br />
⋅ Data processing<br />
⋅ Model assumptions<br />
• Presentation of accuracy measures<br />
TIMELINESS<br />
• Frequency<br />
• Production time<br />
• Punctuality<br />
COMPARABILITY and COHERENCE<br />
• Comparability over time<br />
• Comparability between domains<br />
• Coherence with other statistics<br />
AVAILABILITY and CLARITY<br />
• Dissemination forms<br />
• Presentation<br />
• Documentation<br />
• Access to micro data<br />
• Information services
Elaboration on the quality components<br />
This chapter specifies and discusses the components of the quality concept, with<br />
emphasis on their descriptive meaning. For some of them comments are made on<br />
users' views. The discussion follows the structure of the quality concept, in particular<br />
for numbering components and sub - components.<br />
A reader who meets technical and/or terminological difficulties in the reading, may<br />
be assisted by the Appendix 1, which treats concepts and terminology in conjunction<br />
with statistical surveys. [The appendix is not translated into English, however.]<br />
CONTENTS of the statistics<br />
concerns the statistical target characteristics<br />
1.1 Statistical target characteristics<br />
A target characteristic (with target parameter as a common synonym) is defined as<br />
follows. A specific statistical measure is used to summarise the individual variable<br />
values for the objects in a group. The totality of objects under consideration is<br />
referred to as the population.<br />
1.1.1 - 1.1.3 Objects and population, variables, and statistical measures<br />
These quality components concern definitions of objects, variables and statistical<br />
measures which are involved in the target characteristics.<br />
1.1.4 Study domains<br />
Most surveys present statistics not only for the entire population, but also for study<br />
domains (subpopulations and (sub)groups are common synonyms). One speaks of<br />
"breaking down" statistics to subgroups. A premise for breaking down is, of course,<br />
that variables which specify subgroups are known (by observations or otherwise).<br />
There are restraining factors, however, for how far statistics may be broken down.<br />
One is simply that the more subgroups one takes into account, the more work and<br />
publication space is required. Another is that integrity may be jeopardised.<br />
Moreover, when statistics from sample surveys are derived for successively smaller<br />
domains, their accuracy deteriorates and ultimately becomes so bad that the<br />
statistics no longer are meaningful. Breaking down has to be terminated at an<br />
appropriate level.<br />
The foremost aspects of this quality component are :<br />
- Specification of what kind of variables are used to form study domains.<br />
- Specification of how far - going the division into study domains is.<br />
Objects and variables have reference times, as is further discussed in point 1.1.5.<br />
Example<br />
SCB conducts each year an Income survey (HINK), which reports on the income<br />
distribution for Sweden's population. Reference period is calendar year.<br />
A central object in the survey is "family", consisting of either<br />
two adults ( ≥ 18 years) living together "as if married" and the children (< 18<br />
years) who might live with them, or<br />
a single adult and the children who might live with him/her.<br />
The population consists of all families who lived in the country during at<br />
least half the calendar year.<br />
Examples of variables for families: Wages during the year, disposable income<br />
during the year, socio - economic group, number of children.<br />
35
36<br />
Examples of study domains : Two - adult families with three or more children,<br />
families of a single adult with children, farmer families.<br />
The dominating types of statistical measure are means and "number of", but<br />
others also occur, e.g. median.<br />
Examples of target characteristics : Average wage during the year for blue<br />
colour worker families, average disposable income during the year for two -<br />
adult families without children, median income for senior - salaried -employee<br />
families, number of farmer families.<br />
Comments on statistical target characteristics<br />
A user's wishes about statistical information depend on his/her subject matter problem.<br />
Of course he/she wants that target characteristics should relate closely to the concrete<br />
problem. The better objects, variables, statistical measures, and reference times agree<br />
with his/her interests, the better the quality is as regards target characteristics.<br />
A user who may participate in the planning of a new survey or in the re - designing of an<br />
existing one has the opportunity to influence the choices of objects, variables, statistical<br />
measures, and reference times. However, since surveys normally have many users, conflicting<br />
wishes often turn up, and compromises have to be made. Even in situations with<br />
consensus about target characteristics, cost and/or timeliness considerations may lead to<br />
target characteristics that differ from the ideal ones.<br />
Comment on study domains<br />
If a user's interest focuses on certain specific groups, he/she of course is keen to have<br />
statistics reported for these groups. If the user's interests are more general, he/she may<br />
pay most regard to a detailed division into study domains.<br />
1.1.5 Reference time<br />
Objects and variables have temporal dimensions. The time may be narrowly<br />
delimited, e.g. be a specific date, which is called the reference time point. A longer<br />
time span, e.g. a calendar year, is referred to as the reference period. Usually reference<br />
times agree for variables and objects in a target characteristic, but they need<br />
not. Several reference times may be involved in a target characteristic, notably in<br />
those which measure changes.<br />
For statistics from recurrent surveys (e.g. about average yearly wages) it is natural<br />
to view population and variables as being the same in each survey round (although<br />
"updated" between rounds), while the reference time changes. For statistics from<br />
one - time surveys it is often more natural to view reference time as part of the definitions<br />
of objects and variables. (Example : Objects may be defined as "women<br />
aged 16 – 50 years who lived in Stockholm July 1st, 1998".) Whether it is most<br />
convenient to regard reference times as "independent" or as "part of the object/variable"<br />
depends on the specific situation.<br />
Example<br />
Object and variable with the same reference time : Average work income<br />
during 1998 for persons who lived in the country during 1998.<br />
Object and variables with different reference times : Salary during 1998 for<br />
persons who graduated as civil engineers in 1988.<br />
Variables with different reference times : That consumer price index for July<br />
1998 was 257 means (somewhat sweepingly) that a specific "commodity bas-<br />
ket" which in the base year 1980 cost 100 SEK, in July 1998 cost 257 SEK.<br />
Here 1998 as well as July 1980 appear as reference times for prices.
1.2 Comprehensiveness<br />
This quality component concerns how well the output from a "statistics system"<br />
describes a subject matter field in its "vital aspects". (For instance, how well the<br />
labour market statistics informs about vital aspects of the labour market.) However,<br />
no statistics system will live up to what all users regard as all the vital aspects of the<br />
subject matter field, but it can do so in a greater or less degree.<br />
2 ACCURACY of the statistics<br />
concerns agreement between statistics and target<br />
characteristics<br />
Usually there are so many disturbances in a statistical survey that the statistics do<br />
not give exact values of the target characteristics, only estimates. Here, the lead star<br />
is unbiased ("correct in average") estimates. Normally there is a discrepancy/deviation<br />
("error") between a statistic and its target value. The smaller the<br />
discrepancy is, the more accurate the statistic is. Of course users want discrepancies<br />
to be small, preferably negligible.<br />
Often, however, deviations are not negligible, and this is partcularly the case for<br />
statistics from sample surveys. Then, at least statistically knowledgeable users want<br />
numerical bounds for the deviations, referred to as accuracy measures or<br />
uncertainty measures. The derivation of such measures is a somewhat intricate<br />
matter, though, since the discrepancies depend on the target values, which are<br />
unknown. (If they were known, a survey would be superfluous.) Statements about<br />
accuracy of statistics inevitably fall in the category "statements concerning prevailing<br />
uncertainty", a conceptually intricate topic. The common way to present<br />
accuracy information is by uncertainty intervals, as indicated below.<br />
It is likely that the value of the target characteristic lies in :<br />
uncertainty interval = statistic ± margin of uncertainty.<br />
Often such an interval is a confidence interval with a specified confidence level. If<br />
this is 95 % , the interval encompasses the target value with a likelihood of 95 %.<br />
Other accuracy measures, in essence equivalent to a confidence interval,. are : standard<br />
deviation, coefficient of variation and relative margin of error. Sometimes<br />
uncertainty intervals are based on special evaluations of the survey, subject matter<br />
knowledge, experience, etc. Then one talks about judgement intervals.<br />
A classification of "errors" which is helpful in some contexts is as random or systematic.<br />
Random errors "fluctuate around 0", while systematic ones tend to "pull in<br />
the same direction" (have the same sign). Systematic errors may lead to biased statistics.<br />
2.1 Overall accuracy<br />
A user is chiefly interested in how well he/she can rely on the statistic from an<br />
overall point of view, i.e. to have a limit for the total deviation between the statistic<br />
and the target value. Sometimes, but as an exception rather than a rule, the producer<br />
can exhibit quantitative overall uncertainty intervals. Mostly, however, precise<br />
information can only be given concerning the extent and consequences of certain<br />
narrower sources of inaccuracy.<br />
A comment on accuracy<br />
Production of statistics can often be speeded up if standards of accuracy are lowered (by<br />
accepting large non - response, incomplete editing, etc.). Production time and accuracy<br />
are in conflict. In cases where fast statistics are judged to be important the dilemma is<br />
often handled by presenting "preliminary" statistics in a first round, and later "definite"<br />
statistics with better accuracy.<br />
37
38<br />
2.2 Sources of inaccuracy<br />
At least as a first approximation, with pedagogical merits, the total deviation may<br />
be seen as a sum of partial deviations emanating from different error sources. It<br />
should be noted, however, that (i) partial errors may cancel one another (by having<br />
different signs) (ii) assigning a particular survey weakness to a specific error<br />
sources is sometimes discretionary.<br />
2.2.1 Sampling<br />
This quality component concerns the part of the total deviation which is due to the<br />
fact that only a sample of objects are observed. Uncertainty intervals can often be<br />
given in the form of confidence interval.<br />
2.2.2 Coverage<br />
This quality component concerns the part of the total deviation which is due to the<br />
fact that the population determined by the survey frame differs from the target<br />
population.<br />
2.2.3 Measurement<br />
This quality component concerns the part of the total deviation which is due to<br />
measurement difficulties.<br />
2.2.4 Non - response<br />
Non - response occurs when values for one or more variables are not obtained. The<br />
term should be interpreted in the wide sense "missing value". (It covers e.g. the<br />
possibility that data are missing because they, for one reason or another, could not<br />
be transferred from an external register.) If no usable data are obtained for an<br />
observation object, one speaks of object non - response. If usable values are collected<br />
for some, but not all, variables, one speaks of partial non - response.<br />
The quality component concerns the part of the total deviation which is due to non -<br />
response.<br />
2.2.5 Data processing<br />
This quality component concerns the part of the total deviation which is due to<br />
imperfection in the data processing, which comprises editing (data entry, coding,<br />
scrutiny/correction) and estimation/aggregation. For a sample survey the estimation<br />
procedure is closely related to the sampling procedure. It is therefore often natural<br />
to merge the two into the combined aspect "sampling and estimation".<br />
2.2.6 Model assumptions<br />
This quality component concerns the part of the total deviation which is due to the<br />
fact that statistics depend on model assumptions which are not perfectly fulfilled.<br />
Choices of sampling and estimation procedures are often based on assumptions,<br />
which matter for the accuracy of the resulting statistics but not for their unbiasedness.<br />
Moreover, adjustments to parry non - response and deficiencies in coverage<br />
and measurement are usually based on model assumptions. The mentioned types of<br />
model assumptions are preferably referred to the specific error source, while the<br />
present quality component concerns model assumptions in addition to those relating<br />
to sampling, frame coverage, measurement and non - response. Examples are :<br />
extrapolation models, models for dividing totals into sub - totals and models for<br />
estimating contributions from non - observed parts of the population.<br />
2.3 Presentation of accuracy measures<br />
This quality component concerns whether or not disseminated statistics are accompanied<br />
by uncertainty measures.
Comments on accuracy measures<br />
In planning and decision contexts statistics are often, at least in a first round, used so that<br />
reasoning is carried out under the premise that the statistics provide correct values.<br />
However, many users are aware that they may come to more or less misleading<br />
conclusions by disregarding the uncertainty. Those who want to judge the consequences<br />
of uncertainty are in markedly different situations if uncertainty measures are presented<br />
or not. With accuracy measures available, users who are knowledgeable in statistics can<br />
make well - founded judgements of the possible consequences of the uncertainty, and<br />
thereby make appropriate adjustments to their preliminary conclusions.<br />
Accuracy measures are of relevance not least for estimates of change.<br />
3 TIMELINESS of the statistics<br />
concerns the relation of statistics to the current state of<br />
affairs<br />
Users normally want statistics that describe the "now" situation, timely statistics.<br />
The time between "now" and the reference time plays the central role. It depends on<br />
production time, publication frequency and punctuality.<br />
Comment on timeliness<br />
Another important aspect when judging timeliness of statistics is how fast reality<br />
changes. When judging whether statistics are sufficiently up - to - date, the user combines<br />
the "age" of the statistics with his/her own views on the pace of change in the real world<br />
phenomenon under consideration.<br />
3.1 Frequency<br />
Statistics from recurrent surveys are usually produced according to a regular timetable<br />
(monthly, quarterly, annually, etc.). It is then natural to speak of frequency (or<br />
periodicity).<br />
- Survey frequency is the periodicity of reference times.<br />
- Data collection frequency is the periodicity of the producer's data collection.<br />
- Dissemination frequency is the periodicity with which statistics are published.<br />
Usually the three frequencies agree, but they may differ. Users normally care most<br />
about reference time and dissemination frequencies.<br />
Example<br />
The SCB Investment survey illustrates that the frequencies mentioned<br />
above may differ. This survey collects primary data and publishes statis-<br />
tics three times a year, while quarters are reference periods.<br />
3.2 Production time<br />
Production time concerns the time lag between reference time (reference time point<br />
or end of reference period) and publication time.<br />
3.3 Punctuality<br />
Punctuality concerns the agreement between promised and factual dissemination<br />
times.<br />
Comments on frequency, production time and punctuality<br />
Statistics users are commonly anxious that statistics should be available at the "right<br />
time" (e.g. to a prescribed date for decision taking). For a one - time survey the crucial<br />
component is the production time. For recurrent surveys publication frequency and<br />
punctuality are also important.<br />
For economical statistics which affect financial markets, requirements on punctuality and<br />
simultaneity can be as high as fractions of a second.<br />
39
40<br />
Survey frequency matters not only for timeliness, a user with "historical" interest<br />
cares as well. The higher this frequency is, the better the details of a development<br />
can be studied.<br />
4 COMPARABILITY and COHERENCE<br />
concerns how well different statistics can be used together<br />
A common and important usage of statistics is for making comparisons, comparisons<br />
over time (time series) and comparisons between groups. The latter often concern<br />
geographical groups, e.g. comparison of conditions in different countries.<br />
However, they may also concern groups of another nature (than geographical), e.g.<br />
comparison of disposable income for two - adults families with 0, 1, 2, 3 and 4+<br />
children respectively.<br />
Comparisons over time and between groups should ideally be made using statistics<br />
with the "same" target characteristic, but for different reference times and for different<br />
groups. How "similar" target characteristics are, depends primarily on their<br />
definition. Another factor may also be important. Generally formulated this concerns<br />
the fact that what one "really" measures depends on how one measures. The<br />
employed survey methodology is often crucial for the comparability of statistics. It<br />
is advantageous if the same kind of observation objects, questionnaire, data collection<br />
method, estimation procedure, etc. have been used.<br />
What is said above is accentuated by the following. Even if biased statistics are an<br />
abomination, the negative effects of bias are mitigated if the statistics to be compared<br />
are "similarly biased". When using a common survey method, the aim is of<br />
course that the method will lead to unbiased statistics. If there is bias, however, it<br />
will be of the same kind, which facilitates comparisons.<br />
This quality component, including also the sub-component "coherence with other<br />
statistics", concerns similarity of the definitions of target characteristics and of<br />
survey methodology.<br />
Comments on comparability<br />
How meaningful conclusions one can draw from comparing statistics depends not only<br />
on how "similar" target values are. Of course, it also depends on the accuracy of the statistics<br />
used for comparison. If they are very inaccurate, differences may stem from casual<br />
"noise" rather than "real" differences.<br />
4.1 Comparability over time<br />
This quality aspect concerns to what extent the target characteristics for a recurrent<br />
survey have been stable or changed over time.<br />
Even for statistics with the same contents and method interesting comparisons<br />
interest may be troublesome to make because of seasonal and/or calendar variations.<br />
(For instance, Easter may fall in different quarters in different years, and the<br />
number of working days may vary between months.) Procedures for seasonal<br />
adjustments facilitate comparisons, in particular for short - term statistics.<br />
Comments on comparability over time<br />
For this quality aspect there are often conflicting interests. A user who is chiefly<br />
interested in the long - term development of a specific phenomenon will want the<br />
statistics with different reference times to tell about "the same thing ", i.e. that target<br />
characteristics, and survey method have been unchanged over time. Users whose main<br />
interest is the "present and future state of affairs" will want reality changes to be<br />
followed by appropriate changes in the statistics, aiming at a good description of present<br />
conditions. Such changes usually deteriorate comparability over time.<br />
Adequate comparisons over time are facilitated if the statistics are accompanied by<br />
information about earlier changes in circumstances which affect the statistics (e.g.<br />
changes in taxation rules), in survey methodology, etc.
4.2 Comparability between domains<br />
This quality component concerns how similar definitions of target characteristics<br />
and survey methods are. When statistics to be used in comparisons come from the<br />
same survey, "full comparability" usually is obtained. When they come from different<br />
producers (different surveys, different statistical offices, etc.) there may be<br />
divergences.<br />
Example<br />
Statistics are often used in international co - operation. An example is the EU<br />
context, where financial dues are based on the member countries' economical<br />
situation. In such a case it is important that the "same" statistics from different<br />
countries tell about "the same thing". As a consequence, there are a multitude<br />
of EU regulations aiming at harmonised statistics.<br />
4.3 Coherence with other statistics<br />
Often subject matter fields are investigated by employing statistics (with different<br />
target characteristics) from different surveys. In that case definitions of objects,<br />
variables, population and reference times, which enter in the different targets should<br />
preferably be the same. The quality aspect concerns to what extent this holds.<br />
Example<br />
If one wants to assess the consequences of certain potential changes in the<br />
rules concerning income taxation and social benefits, it might be of interest to<br />
combine statistics from the SCB surveys as the Income survey (HINK), the<br />
Expenditure survey (HUT) and the Rent survey (BHU). Of course, it is then<br />
highly desirable that e.g. "household" and "disposable income" are defined in<br />
the same way in the three surveys.<br />
Comment on coherence<br />
Sometimes statistics from one survey are adjusted so as to be consistent with statistics<br />
from another survey, thereby facilitating joint use of the statistics. Consistency may be<br />
created by requiring that the adjusted statistics should satisfy relations which are known<br />
to hold for the target characteristics.<br />
Example: Sweden's economical development is followed through "fast" (monthly) statistics<br />
as well as more careful and deep-going yearly statistics, which are produced by different<br />
surveys. In this context a natural consistency requirement is that the twelve (adjusted)<br />
monthly values should add up to the (possibly adjusted) value for the year.<br />
41
42<br />
AVAILABILITY and CLARITY<br />
Concerns physical availability and intellectual clarity of statistics<br />
5.1 Forms of dissemination<br />
This quality component concerns distribution media and distribution channels for<br />
the dissemination of the statistics.<br />
Comments on dissemination forms<br />
Statistics often are just one of many data materials in investigations, research projects,<br />
etc. For a user to be able to easily carry out compilations from the statistics and/or<br />
integrate them with other material, they should preferably be available in "the most<br />
suitable" form. Example : Statistics on diskette or from Internet may allow for simple and<br />
fast own compilation of tables, own derivations, etc.<br />
5.2 Presentation<br />
This quality component concerns how the statistical information is presented as<br />
regards text, charts, pictures, references, etc. Also how particularly interesting<br />
aspects on new statistics are highlighted.<br />
5.3 Documentation<br />
This quality component concerns users' possibilities to find descriptions of the statistics<br />
themselves, and how they were produced. A technical description of the<br />
process which generated the statistics is given in a production documentation, while<br />
the statistics are described in a quality declaration.<br />
Comment on documentation<br />
For users who intend to make their own compilations from primary data (see below) an<br />
informative production documentation is usually a necessary instrument.<br />
5.4 Access to micro data<br />
Here micro data stands for the primary data as they appear in a survey's final<br />
observation register. Certain users are interested in statistics which are not, but<br />
could be derived from the micro data. There are then two chief alternatives.<br />
- The producer makes special derivations, in accordance with the user's requests.<br />
- The user gets access to micro data for his/her own analysis.<br />
Comments on access to micro data<br />
Users with well specified problems usually prefer special derivations made by the<br />
producer. Important aspects are how fast, and to what cost such derivations can be made.<br />
Researchers and investigators are often anxious to get access to micro data for their own<br />
analyses. Thereby they get the opportunity to analyse the material faster (often also<br />
cheaper) and/or in a more flexible way than with the producer as intermediary.<br />
5.5 Information services<br />
This quality component concerns users' possibilities (i) to get answers to questions<br />
concerning specific statistics, (ii) to get assistance in finding their way in the "store"<br />
of official (and other) statistics. Depending on the nature of the wish for assistance,<br />
it may be met by reference to the concerned survey, the central information desk, an<br />
appropriate research institute or to some other relevant office.
Bilaga 4. Exempel på <strong>kvalitets</strong>deklarationer<br />
I detta avsnitt ges fyra exempel på <strong>kvalitets</strong>deklarationer av statistik i SM från återkommande<br />
SCB-undersökningar. Avsikten är att visa hur de olika komponenterna i <strong>kvalitets</strong>redovisningen<br />
kan hanteras <strong>för</strong> några olika typer av statistiska undersökningar.<br />
De två <strong>för</strong>sta exemplen, avseende årlig befolkningsstatistik 1998 respektive arbetskraftsundersökningarna<br />
(AKU) januari 2000, är avsedda att bl.a. illustrera <strong>kvalitets</strong>redovisning<br />
vid de två huvudtyperna av statistiska undersökningar, total- respektive urvalsundersökning<br />
(med sannolikhetsurval). En ytterligare aspekt på befolkningsstatistiken är<br />
att den är s.k. registerbaserad statistik, d.v.s. statistik där hela uppgiftsunderlaget inhämtas<br />
från administrativa register. Det tredje exemplet, prisindex i producent- <strong>och</strong> importled<br />
(PPI) under 2000, illustrerar <strong>kvalitets</strong>redovisning av indextal. En ytterligare aspekt<br />
av intresse är att PPI baseras på subjektiva urval. Det sista exemplet gäller statistik över<br />
gödselmedel i jordbruket 1997. Det illustrerar <strong>kvalitets</strong>redovisning av statistik med rätt<br />
starka inslag av modellantaganden.<br />
Exemplen följer <strong>kvalitets</strong>redovisningsmallen i detta MIS, <strong>och</strong> de har arbetats ut i efterhand<br />
i <strong>för</strong>hållande till de SM vars statistik de <strong>kvalitets</strong>redovisar.<br />
43
Kvalitetsdeklaration av<br />
Årlig befolkningsstatistik 1998<br />
0 INLEDNING<br />
Statistikprogrammet Årlig befolkningsstatistik tar fram totalräknad statistik om Sveriges<br />
befolkning, dels dess antalsmässiga <strong>för</strong>delning efter ett flertal olika aspekter som kön,<br />
ålder, region, medborgarskap, m.fl., dels antalet "demografiska händelser" under senaste<br />
året genom födslar, dödsfall, flyttningar, in - <strong>och</strong> utvandringar, m.fl. Dessutom beräknas<br />
demografiska standardmått som medellivslängd, dödsrisk, m.fl. Resultatredovisning sker<br />
främst i fyra publikationsserier, <strong>för</strong> vilka bidragen med referensår 1998 anges nedan.<br />
Föreliggande <strong>kvalitets</strong>deklaration gäller 1998 års statistik.<br />
Statistiskt meddelande BE 12 SM 9801: Folkmängden i hela riket, länen <strong>och</strong> kommunerna<br />
31 december 1998, snabbstatistik. Preliminära uppgifter.<br />
Befolkningsstatistik 1998 Del 1 - 2 : Folkmängden <strong>och</strong> dess <strong>för</strong>ändringar i<br />
kommuner m.m. Inrikes <strong>och</strong> utrikes flyttningar.<br />
Befolkningsstatistik 1998 Del 3 : Folkmängden efter kön, ålder <strong>och</strong> medbor-<br />
garskap m.m.<br />
Befolkningsstatistik 1998 Del 4 : Födda <strong>och</strong> döda, civilståndsändringar m.m.<br />
Statistiken baseras på uppgifter från landets folkbok<strong>för</strong>ingssystem. Detta sköts sedan<br />
1991 av Skattemyndigheten, <strong>och</strong> grundläggande uppgifter inhämtas av <strong>och</strong> registreras<br />
vid myndighetens lokala kontor. Dessa <strong>för</strong>medlar veckovis nyinkomna uppgifter om<br />
födslar, dödsfall, flyttningar inom landet, in - <strong>och</strong> utvandringar, mm. till landets centrala<br />
befolkningsregister, Registret över totalbefolkningen (RTB), som handhas av <strong>Statistiska</strong><br />
<strong>centralbyrån</strong> (SCB). Uppgifterna i RTB utgör underlaget <strong>för</strong> befolkningsstatistiken.<br />
1 STATISTIKENS INNEHÅLL<br />
1.1 <strong>Statistiska</strong> målstorheter<br />
Målstorheterna <strong>för</strong> 1998 års befolkningsstatistik är av nedanstående tre slag.<br />
• Folkmängdsuppgifter avseende situationen 31 dec 1998. Antal personer efter<br />
ålder, kön, län, kommun, <strong>för</strong>samling, civilstånd, medborgarskap, mm.<br />
• Antal "demografiska händelser" under år 1998, födslar, dödsfall, flyttningar,<br />
civilstånds<strong>för</strong>ändringar, medborgarskaps<strong>för</strong>ändringar mm.<br />
• Olika demografiska standardmått som medellivslängd, dödsrisk, summerad<br />
fruktsamhet, spädbarnsdödlighet, m.fl.<br />
1.1.1 Objekt <strong>och</strong> population<br />
Den totala populationen <strong>för</strong> 1998 års befolkningsstatistik utgjordes av alla personer som<br />
var folkbok<strong>för</strong>da i Sverige någon period under år 1998.<br />
Huvudregeln i folkbok<strong>för</strong>ings<strong>för</strong>ordningen är att en person bok<strong>för</strong>s på den fastighet där<br />
han/hon vistas regelmässigt. Vid tveksamhet om var en person bor fästs avseende vid<br />
främst var personen har sitt arbete <strong>och</strong>/eller sin familj. Nyfödda barn folkbok<strong>för</strong>s där<br />
modern är bok<strong>för</strong>d vid nedkomsten. Om hon då ej är folkbok<strong>för</strong>d, bok<strong>för</strong>s barnet på den<br />
<strong>för</strong>samling där födseln ägde rum.<br />
De viktigaste undantagen från huvudregeln anges nedan.<br />
Personer som är folkbok<strong>för</strong>da i, men inte bor i Sverige<br />
- Svenska medborgare som flyttar utomlands är folkbok<strong>för</strong>da i Sverige om<br />
vistelsen utomlands avses vara kortare än ett år.<br />
- Personer som är anställda utomlands i svenska statens tjänst, huvudsakligen<br />
UD - <strong>och</strong> SIDA - anställda, folkbok<strong>för</strong>s i Sverige. Så även deras familjemed-<br />
lemmar <strong>och</strong> eventuella svenska tjänstefolk.<br />
45
46<br />
- Svenska missionärer <strong>och</strong> präster som är anställda utomlands <strong>och</strong> deras med-<br />
följande familj får vara folkbok<strong>för</strong>da i Sverige.<br />
I ovannämnda fall folkbok<strong>för</strong>s personerna antingen under rubriken "på <strong>för</strong>samlingen<br />
skrivna" eller på en fastighet där man fortfarande disponerar bostad.<br />
Personer som bor i landet, men inte är folkbok<strong>för</strong>da i Sverige<br />
- Personer som vid inflyttningen avser att vistas i Sverige kortare tid än ett år.<br />
- Utomnordiska medborgare måste ha uppehållstillstånd <strong>för</strong> att bli folkbok<strong>för</strong>da.<br />
Normalt tar det cirka fyra månader att få sådant (om man får det).<br />
- Utländska medborgare som tillhör utländsk beskickning / konsulat eller dess<br />
tjänstefolk folkbok<strong>för</strong>s inte i Sverige.<br />
1.1.2 Variabler<br />
En post i Registret över totalbefolkningen (RTB) avser en person. För varje person registreras<br />
värdena på ett stort antal variabler ( = uppgifter om personen). Nedan anges <strong>för</strong><br />
befolkningsstatistiken viktiga variabler. I stort gäller att deras definitioner framgår av<br />
benämningarna, men några kommentarer ges.<br />
Ålder 31 dec 1998 mäts i hela år.<br />
Ålder vid demografiska händelser under 1998 som barnafödande, civilstånds<strong>för</strong>ändring,<br />
flyttning, m.fl.<br />
Civilstånd 31 december 1998 med kategorier ogift, gift, skild, änka/änkling, registrerad<br />
partner, separerad partner, efterlevande partner.<br />
Civilstånds<strong>för</strong>ändring under 1998 med kategorier giftermål, skilsmässa, makes<br />
dödsfall, partnerregistrering, partnerseparation, partners dödsfall.<br />
Flyttning under 1998, flyttningsdatum : "Flyttning" avser flyttning till annan<br />
fastighet, inte inom samma fastighet. Om flyttningen anmäls senast en vecka efter<br />
att den skedde, gäller den nya adressen från <strong>och</strong> med den faktiska flyttningsdagen.<br />
Vid senare anmälan gäller den nya adressen från den dag då anmälan inkom till<br />
Skattemyndigheten.<br />
Folkbok<strong>för</strong>ingslän/<strong>för</strong>samling 31 dec 1998 är det län/<strong>för</strong>samling som inrymmer<br />
den fastighet där personen var folkbok<strong>för</strong>d 31 dec 1998.<br />
Födelselän anges enligt den länsindelning som gällde vid födelsetidpunkten. Uppgiften<br />
ändras ej med anledning av senare <strong>för</strong>ändringar av länsindelning.<br />
Födelseland, <strong>för</strong>äldrars födelseland anges enligt de statsrättsliga <strong>för</strong>hållanden<br />
som gällde vid födelsetidpunkten. Politiska <strong>och</strong> geografiska <strong>för</strong>ändringar därefter<br />
med<strong>för</strong> inte ändring i folkbok<strong>för</strong>ingen.<br />
Utrikes född : Före 1947 räknades alla barn som fötts utan<strong>för</strong> Sverige som "utrikes<br />
födda". Efter 1947 registreras inte ett utomlands fött barn som "utrikes fött" om<br />
modern vid nedkomsten var folkbok<strong>för</strong>d i Sverige.<br />
Invandring/utvandring under 1998 : För att registreras som invandrare (immigrant)<br />
skall personen avse att bo i Sverige minst ett år. Analogt, <strong>för</strong> att registreras<br />
som utvandrare (emigrant) skall personen avse att bo utomlands under minst ett år.<br />
Invandringsår : Om en person invandrat i Sverige flera gånger är invandringsår<br />
året <strong>för</strong> senaste invandring. Personer som invandrade <strong>för</strong>e 1968 saknar uppgift<br />
om invandringsår.<br />
Medborgarskap 31 dec 1998, medborgarskaps<strong>för</strong>ändring under 1998 : Medborgarskap<br />
ska i princip gälla nu existerande statsbildning. Uppgiften uppdateras, så<br />
långt sig göra låter, med hänsyn till bl.a. politiska/geografiska <strong>för</strong>ändringar.<br />
1.1.3 <strong>Statistiska</strong> mått<br />
Lejonparten av befolkningsstatistiken utgörs av värden på statistiska storheter/parametrar<br />
av typerna total (med "antal" som vanligaste variant) <strong>och</strong> medelvärde (med "andel",
"kvot", "intensitet" <strong>och</strong> "risk" som varianter). Vissa storheter av typ fraktil (medianer<br />
<strong>och</strong> kvartiler) redovisas också. De viktigaste storheterna kommenteras nedan.<br />
Storheter av typ total<br />
Folkmängd avser antal folkbok<strong>för</strong>da personer per 31 december 1998. Befolknings-<br />
<strong>för</strong>ändringen är skillnaden mellan folkmängden vid årets början <strong>och</strong> slut.<br />
Antal födda <strong>och</strong> antal döda under 1998 redovisas. Den naturliga folkökningen, även<br />
kallat födelseöverskottet, är skillnaden mellan antal födda <strong>och</strong> döda.<br />
Antal inflyttade <strong>och</strong> antal utflyttade under 1998 i bestämda regioner redovisas.<br />
Flyttningsöverskottet är skillnaden mellan antal in - <strong>och</strong> utflyttade. När "regionen"<br />
är Sverige handlar det om antal invandrare <strong>och</strong> antal utvandrare under 1998.<br />
Skillnader kallas nettoinvandring/utvandring under 1998.<br />
Storheter av typ medelvärde (andel, kvot, risk, mm.)<br />
Medelfolkmängden är genomsnittet av folkmängden i början <strong>och</strong> slutet av året.<br />
Mått avseende födslar <strong>och</strong> fertilitet<br />
Könskvot är antal födda pojkar per 1000 födda flickor<br />
Flerbördskvot är antal flerbördsbarn (tvillingar, trillingar, mm.) per 1000 födda.<br />
Dödföddkvot är antal dödfödda barn per 1000 födda (levande <strong>och</strong> döda).<br />
Spädbarnsdödlighet avser andelen levande födda barn som dör <strong>för</strong>e ett års ålder.<br />
Nettoreproduktionstalet (<strong>för</strong> kvinnor) är kvoten mellan antalen kvinnor i två suc-cessiva<br />
generationer, med hänsyn tagen till såväl fruktsamhet som dödlighet.<br />
Bruttoreproduktionstalet (<strong>för</strong> kvinnor) är kvoten mellan antal kvinnor i två succes-<br />
siva generationer, med bortseende från dödlighet <strong>för</strong>e fruktsamhetsperiodens slut.<br />
Åldersdifferentierade fruktsamhetstal anger antalet barn som 1000 kvinnor får<br />
under sin reproduktionsperiod med antagande om att nu aktuell fruktsamhet fort-<br />
satt gäller <strong>och</strong> att ingen av kvinnorna dör <strong>för</strong>e 50 års ålder.<br />
Den samlade legala abortkvoten anger antalet legala aborter som 1000 kvinnor<br />
genomgår under hela sin reproduktionsperiod, under antagandet att nu aktuell<br />
legal - abort - frekvens forsatt gäller <strong>och</strong> att kvinnorna inte dör <strong>för</strong>e 50 års ålder.<br />
Mått avseende mortalitet<br />
Dödstalet anger kvoten mellan antalet dödsfall under en period <strong>och</strong> den folkmängd,<br />
som under perioden var utsatt <strong>för</strong> risk att dö. Talet uttrycks oftast i promille.<br />
Vid framställning av livslängdstabellerna användes nedanstående formel.<br />
Dödsrisk <strong>för</strong> en x - åring under period t : q x = Dx<br />
/ ( M x + d x ) ,<br />
D x<br />
M x<br />
= antal dödsfall bland x - åringar under period t,<br />
= (totala) risktiden i åldern x år under period t<br />
dx = antal x - åringar som under period t avled samma kalenderår som<br />
de fyllde x år.<br />
Dödsrisk <strong>för</strong> en 0 - åringar beräknades :<br />
= D / F , med F <strong>för</strong> antalet levande födda under period t.<br />
q0 0<br />
I åldrarna 91 år <strong>och</strong> däröver har de i livslängdstabellerna använda dödsriskerna beräknats<br />
genom utjämning av preliminärt beräknade risker. Till <strong>och</strong> med 1986 baserades<br />
denna utjämning på den s.k. Wittsteins formel. Eftersom metoden visade sig överskatta<br />
dödsriskerna i de högsta åldrarna utarbetades en ny utjämningsmetod, vilken används<br />
numera. Den beskrivs i Martinelle, S. (1987): A Generalized Perks Formula for Old Age<br />
Mortality, R&D Report, Statistics Sweden.<br />
Kvarlevande vid ålder x, betecknat lx , avser antalet individer bland 100 000 levande<br />
födda som vid nu aktuella dödsrisker beräknas uppnå åldern x år. Antalet 0 - år-<br />
47
48<br />
ingar är l0 = 100 000 <strong>och</strong> antalet kvarlevande vid övriga åldrar beräknas enligt<br />
nedan där qx är års - dödsrisken <strong>för</strong> en x - åring :<br />
l 1 − q .<br />
( )<br />
1 1 1 x = x−<br />
x−<br />
Återstående medellivslängd <strong>för</strong> en x - åring, betecknad ex ,utgörs av det antal år<br />
som i genomsnitt återstår att leva <strong>för</strong> en x - åring. Återstående medellivslängd vid<br />
födseln kallas kortare <strong>för</strong> bara medellivslängd. Beräknas enligt nedan :<br />
w<br />
ex ∑<br />
i=<br />
x<br />
= L l , där<br />
i<br />
x<br />
w står <strong>för</strong> den högsta ålder (i hela år) som antas kunna uppnås,<br />
L = 1 + 1 +1 / 2 .<br />
Lx = "genomlevda tiden i en åldersklass", som beräknas ( )<br />
x x x<br />
Måttet ifråga är baserat på antagandet att dödsfallen i en åldersklass är jämnt <strong>för</strong>delade<br />
över året. Detta antagande är dock inte tillämpbart under <strong>för</strong>sta levnadsåret. För<br />
det används :<br />
= a ⋅ l + 1− a ⋅ l , där<br />
( ) 1<br />
L0 0 0<br />
0<br />
a0 = medelålder <strong>för</strong> dem som dör under sitt <strong>för</strong>sta levnadsår.<br />
Sannolik medellivslängd är den ålder vid vilken hälften av den ursprungliga födel-<br />
sekullen avlidit.<br />
1.1.4 Redovisningsgrupper<br />
I det följande står SM resp. Befstat <strong>för</strong> publikationerna som nämns i Inledning samt<br />
BEFPAKfm <strong>och</strong> BEFPAKfä <strong>för</strong> tabellpaketen som nämns i Avsnitt 5.1.<br />
SM BE redovisar folkmängd <strong>och</strong> befolknings<strong>för</strong>ändringar i riket, län, kommuner <strong>och</strong><br />
storstadsområden, samt in - <strong>och</strong> utvandrare efter medborgarskap.<br />
I Befstat 1 - 2 görs genomgående indelning efter län, kommun, storstadsområde, riksområde,<br />
landsting <strong>och</strong> landskap. Folkmängdsstatistiken underindelas efter kön, ålder,<br />
civilstånd samt, in- <strong>och</strong> utflyttningsland. För födda indelas efter kön <strong>och</strong> moderns ålder,<br />
<strong>för</strong> döda efter kön, ålder <strong>och</strong> civilstånd. För flyttningar efter kön, ålder <strong>och</strong><br />
medborgarskap. Immigranter <strong>och</strong> emigranter redovisas med indelning efter län, kön,<br />
ålder, medborgarskapsland, in - <strong>och</strong> utvandringsår.<br />
I Befstat 3 indelas efter län, kommun, storstadsområde, A - region, riksområden, kön,<br />
ålder, civilstånd, medborgarskap, födelseort, födelselän, födelseland, invandringsår<br />
samt ursprungsland.<br />
I Befstat del 4 varierar indelningarna mellan de olika kapitlen. För befolkningens<br />
sammansättning indelas efter län, kön, ålder <strong>och</strong> civilstånd <strong>och</strong> <strong>för</strong> befolknings<strong>för</strong>ändringar<br />
efter län <strong>och</strong> civilstånd. För födda indelas efter län, kön, moderns ålder,<br />
moderns födelseort <strong>och</strong> folkbok<strong>för</strong>ingslän, moderns födelseland, moderns medborgarskap,<br />
moderns civilstånd, antal av modern dödfödda respektive levande födda barn,<br />
tidigare födda barn, barnets ordningsnummer, barnets medborgarskap, barnets födelseår,<br />
barnets födelsemånad, <strong>för</strong>äldrarnas ålder, <strong>för</strong>äldrarnas medborgarskap,<br />
<strong>för</strong>äldrarnas vigselår. För döda indelas efter län, kön, ålder, civilstånd <strong>och</strong><br />
medborgarskap. För civilståndsändringar efter län, kommun, kön, ålder,<br />
medborgarskap, födelseland, makarnas ålder, makarnas <strong>för</strong>utvarande civilstånd,<br />
äktenskapets varaktighet, vigselår, antal år sedan vigselåret samt barnantal. För<br />
medborgarskapsbyten indelas efter kön, ålder, civilstånd, tidigare <strong>och</strong> nuvarande<br />
medborgarskap, <strong>för</strong>utvarande medborgarskap samt invandringsår.<br />
I BEFPAKfm indelas efter kön, ålder, civilstånd, medborgarskap, födelseland, utländsk<br />
bakgrund <strong>och</strong> invandringsår, län, kommun, <strong>för</strong>samling samt delområde inom kommun. I<br />
BEFPAKfä indelas efter kön, ålder, medborgarskapsland, in-/utflyttningsområde, inkomst<br />
samt utbildning. De regionala indelningar som görs är län, kommuner, <strong>för</strong>samlingar<br />
<strong>och</strong> delområden inom kommuner.
Kommentar angående regionala indelningar i statistiken <strong>för</strong> 1998<br />
Folkmängdsstatistiken avser <strong>för</strong>hållandena 31 december 1998 med den indelning i<br />
administrativa områden som gäller från 1:a januari 1999. I tabeller som innehåller<br />
uppgifter även <strong>för</strong> andra år än 1998 har justering gjorts endast vid indelningsändringar<br />
av sådan storlek att minst en hel <strong>för</strong>samling över<strong>för</strong>ts till eller slagits samman med<br />
annan <strong>för</strong>samling. Befolknings<strong>för</strong>ändringar under 1998 redovisas enligt den regionala<br />
indelning som gällde 1 januari 1998<br />
1.1.5 Referenstider<br />
I SM <strong>och</strong> Befolkningsstatistik del 1 - 4 (se Inledning) är referenstidpunkten 31 december<br />
1998 <strong>för</strong> statistik som avser folkmängd. För statistik om demografiska händelser<br />
(födslar, dödsfall, flyttningar, mm.) är referensperioden året 1998.<br />
I BEFPAKpaketen (se Avsnitt 5.1) är referensperioderna årets fyra kvartal <strong>och</strong> referenstidpunkterna<br />
de fyra kvartalssluten.<br />
1.2 Fullständighet<br />
Statistiken om befolkningen som individer är mycket fullständig, icke minst i ett<br />
internationellt perspektiv. Det gäller också <strong>för</strong> individers "generationskopplingar".<br />
Statistik om "sammanboendegrupper", familjer <strong>och</strong> hushåll av olika slag, är dock <strong>för</strong><br />
närvarande inte så bra som önskvärt. Som ett exempel kan befolkningsstatistiken inte<br />
redovisa antal "två - vuxen - familjer med tre barn" i landet. Huvudproblemet därvidlag är<br />
att en stor del av dagens familjer/hushåll är baserade på icke-registrerat sammanboende,<br />
medan RTB endast har uppgifter om registrerade sådana, genom vigsel <strong>och</strong> registrerande<br />
av partnerskap. I detta avseende kan dock räknas med avsevärda <strong>för</strong>bättringar i<br />
framtiden, av följande skäl. För närvarande sker folkbok<strong>för</strong>ing på fastighet, <strong>och</strong> i<br />
fastigheter med flera lägenheter vet man inte hur fastighetens individer "hänger ihop".<br />
En genomgripande omläggning av folkbok<strong>för</strong>ingssystemet pågår dock. Steg ett i<br />
omläggningen är att upprätta ett lägenhetsregister där varje lägenhet får unik identitet. I<br />
steg två folkbok<strong>för</strong>s personer på lägenhet, istället <strong>för</strong> som nu på fastighet. Därigenom<br />
<strong>för</strong>bättras möjligheten att ta fram statistik om familjer <strong>och</strong> hushåll avsevärt.<br />
2 STATISTIKENS TILLFÖRLITLIGHET<br />
2.1 Till<strong>för</strong>litlighet totalt<br />
Befolkningsstatistiken baseras, som sagt, på uppgifter i Registret över totalbefolkningen<br />
(RTB). Kontrollundersökningar av RTB : s innehåll som gjorts genom åren har genomgående<br />
visat att registret har mycket god täckning, aktualitet <strong>och</strong> uppgiftsriktighet<br />
åtminstone <strong>för</strong> i Sverige födda personer. I stort bedöms befolkningsstatistiken där<strong>för</strong><br />
vara mycket till<strong>för</strong>litlig.<br />
De till<strong>för</strong>litlighetsproblem som finns gäller fram<strong>för</strong> allt utrikes födda personer. Skälen<br />
anges nedan under osäkerhetskällan "ramtäckning".<br />
2.2 Osäkerhetskällor<br />
För statistik allmänt talas om felkällorna urval, ramtäckning, mätning, svarsbortfall,<br />
bearbetning <strong>och</strong> modellantaganden, vilka var <strong>och</strong> en kommenteras i det följande. För<br />
den slags totalundersökning som befolkningsstatistiken är, kunde sägas att egentligen<br />
bara en felkälla <strong>för</strong>eligger, nämligen "brister i rapporteringen". Dessa beror fram<strong>för</strong> allt<br />
dels på underlåtenhet, senfärdighet, slarv, glömska mm. från rapporteringsskyldigas sida<br />
att anmäla <strong>för</strong>ändringar dels på att de, medvetet eller omedvetet, lämnar felaktiga<br />
uppgifter. Vidare finns möjligheten att de lokala skattekontoren släpar efter i sin<br />
rapportering till SCB. I stort är dock rapporteringsrutinerna mycket snabba.<br />
Hur man klassificerar på ovan nämnda osäkerhetskällor de fel som brister i rapporteringen<br />
leder till är åtskilligt skönsmässigt. I det följande görs uppdelningen att rapporteringsbrister<br />
som leder till att RTB saknar personer som borde vara med i registret eller<br />
omfattar personer som inte borde vara med klassificeras som ramtäckningsbrister. Rap-<br />
49
50<br />
porteringsbrister som leder till felaktiga variabelvärden betraktas som mätfel, medan<br />
svarsbortfall anses inte <strong>för</strong>ekomma.<br />
2.2.1 Urval<br />
Befolkningsstatistiken är totalräknad <strong>och</strong> har därmed ingen urvalsosäkerhet.<br />
2.2.2 Ramtäckning<br />
Täckningsbrister handlar om dels undertäckning, vilket <strong>för</strong>eligger om personer som är<br />
bosatta i landet saknas i RTB, dels övertäckning, vilket <strong>för</strong>eligger om personer i RTB<br />
inte längre ingår i befolkningen (har avlidit eller lämnat landet).<br />
Undertäckning uppstår om födslar <strong>och</strong> invandringar sker utan att komma till RTB:s<br />
kännedom. Den bedöms vara mycket liten av nedanstående huvudskäl.<br />
(i) Att rapportera till folkbok<strong>för</strong>ingssystemet ligger som tjänsteansvar <strong>för</strong> särskilda<br />
professioner (enskilda <strong>för</strong>eträdare eller institutioner), som barnmorskor, vigsel<strong>för</strong>rättare,<br />
läkare, invandrarverk, domstolar, m.fl. Den rapporteringen kan på goda grunder <strong>för</strong>utsättas<br />
vara mycket välskött.<br />
(ii) RTB avvaktades t.o.m. utgången av januari 1999 innan befolkningsstatistiken <strong>för</strong><br />
1998 framtogs. Med de snabba rapporteringsrutinerna bedöms <strong>för</strong> sent inkomna uppgifter<br />
ge upphov till endast <strong>för</strong>sumbar undertäckning.<br />
För nyfödda bedöms undertäckningen med<strong>för</strong>a ett fel om högst 0,1 % i folkmängdsstatistiken<br />
<strong>för</strong> "0 - åringar". Invandringen <strong>för</strong>anleder något större undertäckning, men<br />
även den bedöms vara <strong>för</strong>sumbar. Den främsta orsaken till viss "invandringsundertäckning"<br />
är den <strong>för</strong>hållandevis långa tiden mellan invandring <strong>och</strong> registreringstidpunkten.<br />
(Exempel : För invandrare som fick sina beslut om uppehållstillstånd under<br />
1986 var mediantiden från ansökan till folkbok<strong>för</strong>ing 21 veckor.) Tidsskillnaden ifråga<br />
bedöms ligga avsevärt under genomsnittet <strong>för</strong> nordiska invandrare, eftersom dessa kan<br />
bosätta sig i Sverige utan uppehållstillstånd.<br />
En till det nyssnämnda relaterad problematik om statistikens beskrivning av det "reella"<br />
demografiska skeendet är följande. Många flyktingar som fått uppehållstillstånd måste<br />
av bostadsskäl bo kvar i flykting<strong>för</strong>läggningar i väntan på kommunplacering, <strong>och</strong> folkbok<strong>för</strong>s<br />
då på <strong>för</strong>läggningen. Det med<strong>för</strong> att statistiken <strong>för</strong> kommuner med flykting<strong>för</strong>läggningar<br />
kan uppvisa en skev bild av den mer långsiktiga befolkningsutvecklingen.<br />
Övertäckning i RTB uppstår om dödsfall <strong>och</strong> utvandringar inte kommer till RTB : s kännedom.<br />
Mot bakgrund av det som sägs i (i) ovan, bedöms övertäckning med anledning<br />
av ej rapporterade dödsfall vara mycket liten.<br />
Det som dock vållar en icke <strong>för</strong>sumbar övertäckning är att <strong>för</strong>hållandevis många<br />
utländska medborgare som varit bosatta i Sverige återvänder till sina ursprungsländer<br />
utan att anmäla det till svensk myndighet. Vid kontroll i samband med folk- <strong>och</strong><br />
bostadsräkningen 1985 bedömdes övertäckningen ifråga då uppgå till 0,1 % av hela<br />
befolkningen. I delpopulationen "utländska medborgare" var övertäckningen 1,0 % <strong>för</strong><br />
nordiska medborgare <strong>och</strong> 2,8 % <strong>för</strong> övriga medborgarskap tillsammans. I en studie från<br />
1994 (Nilsson, Brister i folkbok<strong>för</strong>ingen, PM, 1994) fram<strong>för</strong>s hypotesen att övertäckningen<br />
bland "utrikes födda" kunde vara så stor som 10 %. En studie med indirekt skattning<br />
av övertäckningen, baserad på dödlighetsberäkningar, redovisas i "Qvist, J. Täckningsproblem<br />
i Registret över totalbefolkningen RTB. SCB, R&D Report 1999 : 1".<br />
Beräkningarna ger vid handen att övertäckningen bland utomnordiska invandrare torde<br />
ligga i intervallet 25 - 50 000 personer, vilket innebär 4 - 8 % av de utomnordiska invandrarna.<br />
2.2.3 Mätning<br />
Rapporteringen till folkbok<strong>för</strong>ingssystemet enligt punkt (i) i Avsnitt 2.2.2 bedöms ske<br />
mycket omsorgsfullt <strong>och</strong> därmed <strong>för</strong>anleda mycket små mätfel <strong>för</strong> berörda variabler.<br />
Större mätfel befaras <strong>för</strong> variabler som beror av rapporteringar som personerna själva<br />
skall göra, t.ex. om flyttningar. En kontrollmöjlighet i detta avseende ges i anslutning till
myndigheters massutsändning av brev, t.ex. skattsedlar <strong>och</strong> röstkort. På basis av<br />
returnerade <strong>för</strong>sändelser kan kontrolleras bl.a. om flyttning anmälts i rätt tid <strong>och</strong> om<br />
folkbok<strong>för</strong>ingens adress överensstämmer med den faktiska. I anslutning till folk - <strong>och</strong><br />
bostadsräkningarna 1975, 1980 <strong>och</strong> 1985 gjordes sådana kontroller. Från dessa framgick<br />
att brister främst gällde det som diskuteras i Avsnitt 2.2.2, nämligen underlåten<br />
rapportering av utvandring. En mer ingående redogörelse <strong>för</strong> resultaten av kontrollerna<br />
ges i Folkmängd Del 1 - 2 <strong>för</strong> 1988.<br />
2.2.4 Svarsbortfall<br />
Bortfall <strong>för</strong>ekommer inte.<br />
2.2.5 Bearbetning<br />
Dataregistrering sker i <strong>för</strong>sta omgången vid de lokala skattemyndigheterna. Därvid görs<br />
vissa maskinella kontroller <strong>och</strong> rättelser. När aviseringarna sedan kommer till SCB<br />
granskas uppgifterna innan inläggning sker i RTB. Felaktigheter som upptäcks skickas<br />
tillbaka till skattemyndigheten <strong>för</strong> utredning/rättning.<br />
Befolkningsstatistiken framställs via en databas som genereras från RTB. Programvara<br />
<strong>för</strong> framtagning av statistiken är så väl utprovad att beräkningsfel betraktas som i stort<br />
sett obefintliga.<br />
2.2.6 Modellantaganden<br />
Antalsstatistiken är inte baserad på några modellantaganden. De demografiska måtten<br />
däremot vilar på modellantaganden, som till sin övervägande del är allmänt vedertagna<br />
bland befolkningsstatistiker. Ett särfall utgörs dock av den använda metoden <strong>för</strong><br />
beräkning av dödrisker <strong>för</strong> åldrarna 91 år <strong>och</strong> däröver, se Avsnitt 1.1.3, dödsrisker.<br />
2.3 Redovisning av osäkerhetsmått<br />
Befolkningsstatistiken redovisas utan numeriska osäkerhetsmått.<br />
3 STATISTIKENS AKTUALITET<br />
3.1 Frekvens<br />
Statistiken i de publikationer som nämns i Inledning framtas <strong>och</strong> publiceras en gång per<br />
år. Statistiken till BEFPAK - folkmängd (se Avsnitt 5.1) tas fram tre gånger per år, efter<br />
sluten av 2 : a, 3 : e <strong>och</strong> 4 : e kvartalen. Statistiken <strong>för</strong> kommuner <strong>och</strong> <strong>för</strong>samlingar i<br />
BEFPAK - befolknings<strong>för</strong>ändringar produceras varje kvartal. Statistik <strong>för</strong> mindre<br />
områden än <strong>för</strong>samlingar tas fram en gång om året, i anslutning till helårsskiftet.<br />
3.2 Framställningstid<br />
Referenstidpunkt <strong>och</strong> referensperiodens sluttid <strong>för</strong> 1998 års befolkningsstatistik var sista<br />
december. Framställningstiderna, såväl <strong>för</strong> 1998 års statistik (som var sen) som <strong>för</strong><br />
"normala" år, <strong>för</strong> publikationerna i Inledning framgår av det som sägs nedan under<br />
punktlighet. För BEFPAKpaketen är framställningstiden 14 dagar.<br />
3.3 Punktlighet<br />
Den årliga befolkningsstatistiken utkommer normalt mycket punktligt, dvs. publicering<br />
sker i enlighet med tidigare angiven publiceringsplan.<br />
Tyvärr var dock 1998 års statistik <strong>för</strong>hållandevis starkt <strong>för</strong>senad. Orsaken var en<br />
genomgripande omläggning av RTB:s datorsystem, från stordator till PC - miljö.<br />
Huvudpublikationerna utkom enligt följande. SM : et utkom i enlighet med plan 29<br />
december 1998. Befolkningsstatistik 1998 Del 1 - 2 utkom i juli 1999, mot planerat i<br />
juni, Del 3 utkom i november 1999, mot planerat i september, <strong>och</strong> Del 4 utkom i juli<br />
2000, mot planerat i december 1999.<br />
51
52<br />
4 JÄMFÖRBARHET <strong>och</strong> SAMANVÄNDBARHET<br />
4.1 Jäm<strong>för</strong>barhet över tiden<br />
I <strong>och</strong> med att RTB - systemet baseras på folkbok<strong>för</strong>ingssystemet är det beroende av<br />
folkbok<strong>för</strong>ingens definitioner <strong>och</strong> regler. Sedan RTB - systemet upprättades 1968 har<br />
folkbok<strong>för</strong>ingens innehåll varit i stort o<strong>för</strong>ändrat, <strong>och</strong> därmed också RTB : s<br />
variabeluppsättning <strong>och</strong> variabeldefinitioner. Som helhet gäller där<strong>för</strong> att befolkningsstatistik<br />
är mycket väl jäm<strong>för</strong>bar över tiden. Några <strong>för</strong>ändringar bör dock pekas på,<br />
vilket görs nedan.<br />
Folkbok<strong>för</strong>ingens omorganisation<br />
Den 1 juli 1991 övertog de lokala skattekontoren ansvaret från pastorsämbetena <strong>för</strong><br />
folkbok<strong>för</strong>ingen på lokal nivå. I anslutning till omorganisationen ersattes det gamla<br />
regelverket med ny lagtext. I stort sammanfaller dock de nya <strong>och</strong> gamla reglerna.<br />
Ändrade regler <strong>för</strong> studerande<br />
Sedan 1991 gäller att personer som är över 17 år <strong>och</strong> går på postgymnasial utbildning<br />
ska vara folkbok<strong>för</strong>da där de bor. Tidigare var det vanligt att sådana studerande var<br />
folkbok<strong>för</strong>da i <strong>för</strong>äldrahemmet. Kommuner med universitet <strong>och</strong> högskolor har sedan<br />
1991 där<strong>för</strong> fått en registrerad inflyttning som är större än den verkliga. Folkökningen i<br />
dessa kommuner är delvis en effekt av den nya folkbok<strong>för</strong>ingslagen.<br />
Ändrade regler <strong>för</strong> nyfödda<br />
Begreppet född inom respektive utom äktenskapet har efter 1976 utgått ur all lagstiftning.<br />
Från <strong>och</strong> med 1977 redovisas statistik om födda med indelning efter moders<br />
civilstånd, i analogi med tidigare indelning efter inom / utom äktenskap.<br />
Före 1973 angavs nyfött barns ordningsnummer endast <strong>för</strong> barn födda inom bestående<br />
äktenskap ingångna 1950 eller senare. Ordningsnumret avsåg makarnas samtliga<br />
gemensamma barn (födda levande <strong>och</strong> döda). Från mitten av 1973 får RTB istället<br />
uppgift om det antal barn som modern, oavsett civilstånd, tidigare fött (levande <strong>och</strong><br />
döda).<br />
Från 1:a juli 1979 ändrades lagstiftningen om medborgarskap <strong>för</strong> barn vars far har<br />
utländskt <strong>och</strong> mor svenskt medborgarskap. Tidigare fick dessa barn vid födseln enbart<br />
faderns medborgarskap, men numera blir de alltid svenska medborgare. Bestämmelsen<br />
med<strong>för</strong> att barn i större utsträckning än tidigare får dubbelt medborgarskap vid födseln. I<br />
den svenska folkbok<strong>för</strong>ingen registreras dock enbart det svenska medborgarskapet.<br />
Civilstånds<strong>för</strong>ändringar<br />
Lagstiftningen om skilsmässor ändrades 1 januari 1974. Ändringarna innebär bl.a. att<br />
det tidigare hemskillnadsåret ersattes med "en betänketid om sex månader", vilken dock<br />
ej behövs om makarna saknar barn under 16 år <strong>och</strong> är överens om skilsmässan. Den<br />
kraftiga ökningen av skilsmässor under 1974 <strong>och</strong> 1975 skall ses mot nämnda bakgrund.<br />
Fr.o.m. 1995 särredovisas nyregistrerade partnerskap, med indelning efter län, kön <strong>och</strong><br />
ålder. I antalsstatistiken om befolkningen efter civilstånd ingår fr.o.m 1998 nyregistrerade<br />
partnerskap <strong>och</strong> upplösta partnerskap i "gifta" respektive "skilda".
Medborgarskapsbyten<br />
Fr.o.m. 1974 sätts i statistiken året <strong>för</strong> byte till svenskt medborgarskap till året efter<br />
beslutet.<br />
Ändrad beräkning av dödsrisker<br />
Som nämns i Avsnitt 1.1.3 har beräkningen av de i livslängdstabellerna använda<br />
dödsriskerna <strong>för</strong> åldrarna 91 år <strong>och</strong> däröver ändrats, från användning av den s.k.<br />
Wittsteins utjämningsmetod till SCB:s "egen" metod. Den nya metoden användes <strong>för</strong>sta<br />
gången i 1987 års tabeller. Dödsriskerna i åldrarna över 95 år är där<strong>för</strong> numera väsentligt<br />
lägre än tidigare. Därmed har också kvarlevandetal <strong>och</strong> återstående medellivslängder<br />
höjts <strong>för</strong> de allra äldsta. En jäm<strong>för</strong>else mellan metoderna redovisas i Befolknings<strong>för</strong>ändringar<br />
Del 3 <strong>för</strong> åren 1987, 1988 <strong>och</strong> 1989.<br />
4.2 Jäm<strong>för</strong>barhet mellan grupper<br />
Sveriges befolkningsstatistik är anpassad till internationella standarder, <strong>och</strong> är därmed<br />
väl jäm<strong>för</strong>bar med andra länders statistik. Ett (internationellt) önskemål som vi dock inte<br />
kan möta är att redovisa statistik om omfattning av <strong>och</strong> orsaker till s.k. "short - term<br />
migration". Skälet är att i Sverige registreras endast in - <strong>och</strong> utvandringar med avsedd<br />
varaktighet om minst ett år (se Avsnitt 1.1.2).<br />
Även om det inte direkt gäller befolkningsstatistiken bör nämnas att RTB spelar en<br />
viktig allmänt samordnande roll <strong>för</strong> statistik från SCB. Så gott som alla urvalsundersökningar<br />
avseende individer, familjer <strong>och</strong> hushåll använder RTB som urvalsram,<br />
<strong>och</strong> hämtar demografisk bakgrundsinformation därifrån. Statistik från dessa<br />
undersökningar blir därigenom "automatiskt" samordnad.<br />
4.3 Samanvändbarhet med annan statistik<br />
Som nämns ovan, har RTB en "styrande" roll <strong>för</strong> mycken SCB - statistik. Som konsekvens<br />
är befolkningsstatistik <strong>och</strong> annan SCB - statistik väl samanvändbar.<br />
5 TILLGÄNGLIGHET <strong>och</strong> FÖRSTÅELIGHET<br />
5.1 Spridningsformer<br />
De viktigaste utflödena <strong>för</strong> befolkningsstatistik, ingående i Sveriges offentliga statistik<br />
(SOS), är de fyra publikationsserier som anges i Inledning. Den normala gången <strong>för</strong><br />
deras framtagande är följande. Under vecka 52 i referensåret presenteras ett<br />
pressmeddelande med preliminära befolkningssiffror <strong>för</strong> riket, <strong>och</strong> i nära anslutning till<br />
detta ett Statistiskt meddelande (SM) med fylligare regional redovisning. Den<br />
detaljerade, <strong>och</strong> definitiva, statistiken utkommer under efterföljande år i<br />
Befolkningsstatistik Del 1 - 2, 3 <strong>och</strong> 4 (se Inledning).<br />
Stora delar av statistiken görs också tillgänglig i Sveriges statistiska databaser på<br />
Internet samt på SCB:s webbplats www.scb.se. Där finns t.ex. statistik om folkmängd,<br />
födda, döda <strong>och</strong> flyttningar.<br />
Utöver SOS - statistiken framtas, främst <strong>för</strong> användning av länsstyrelser, landsting <strong>och</strong><br />
kommuner, ett stort antal s.k. råtabeller med produktbenämningar :<br />
BEFPAK - folkmängd <strong>och</strong> BEFPAK - befolknings<strong>för</strong>ändringar.<br />
Dessa redovisar löpande under året kvartalsvisa avstämningar av såväl folkmängd som<br />
befolknings<strong>för</strong>ändringar. Enskilda personer kan få tillgång till BEFAK - tabellerna hos<br />
programmet <strong>för</strong> befolkningsstatistik vid SCB i Örebro, länsstyrelsernas regionalekonomiska<br />
enheter, landstingens planeringsavdelningar samt hos kommunerna.<br />
För att peka på intressanta <strong>för</strong>ändringar i befolkningens storlek <strong>och</strong> sammansättning<br />
publiceras emellanåt pressmeddelanden av regional <strong>och</strong>/eller rikstäckande art. Artiklar<br />
<strong>och</strong> demografiska rapporter framställs mer eller mindre kontinuerligt <strong>för</strong> publicering i<br />
tidskrifter, presentation på seminarier <strong>och</strong> konferenser, mm. Vart femte år görs<br />
uppdaterad publicering i serien Demografiska rapporter Livslängdstabeller.<br />
53
54<br />
5.2 Presentation<br />
Statistiken redovisas i form av text, tabeller, diagram.<br />
5.3 Dokumentation<br />
RTB:s fullständiga variabeluppsättning mm. är dokumenterad enligt SCB:s dokumentationssystem<br />
SCBDOK. Dokumentationen finns tillgänglig bl.a. på SCB:s<br />
webbplats.<br />
5.4 Tillgång till primärmaterial<br />
Mikrodatamaterial finns lagrat i olika delregister inom RTB-systemets ram. Årsskiftesversionerna<br />
av RTB finns långtidsarkiverade hos Riksarkivet, <strong>och</strong> detsamma<br />
gäller årsversionerna av <strong>för</strong>ändringsregistren.<br />
Forskare m.fl. kan efter prövning få tillgång till avidentifierat mikromaterial. Möjligheten<br />
används <strong>för</strong> närvarande främst av medicinska forskare.<br />
5.5 Upplysningstjänster<br />
Ytterligare upplysningar om befolkningsstatistiken kan fås på nedanstående ställen:<br />
Befolkningsstatistikens talsvar telefon 019 - 17 - 69 00,<br />
SCB:s webbplats www.scb.se under rubriken Befolkning,<br />
E-mailadress: befolkning@scb.se.
Kvalitetsdeklaration av<br />
Arbetskraftsundersökningarna (AKU) januari 2000<br />
0 INLEDNING<br />
Arbetskraftsundersökningarna (AKU) framställer månatlig statistik om <strong>för</strong>hållandena på<br />
arbetsmarknaden med tonvikt på antal <strong>och</strong> andel sysselsatta <strong>och</strong> arbetslösa. Statistiken<br />
redovisas med en mängd gruppindelningar. AKU är en urvalsundersökning som varje<br />
månad undersöker, medelst telefonintervju, cirka 17 000 personer. Statistik publiceras<br />
cirka två veckor efter månadens utgång, dels i ett Statistiskt Meddelande (SM) med<br />
översiktliga resultat, dels i AKU : Grundtabeller med detaljerade resultat. Månadsundersökningarnas<br />
uppgifter ligger också till grund <strong>för</strong> kvartals - <strong>och</strong> årsstatistik. Föreliggande<br />
<strong>kvalitets</strong>deklaration avser statistiken <strong>för</strong> januari 2000.<br />
1 STATISTIKENS INNEHÅLL<br />
1.1 <strong>Statistiska</strong> målstorheter<br />
De statistiska storheter / parametrar som primärt skattas gäller hur Sveriges befolkning i<br />
arbets<strong>för</strong> ålder <strong>för</strong>delar sig antalsmässigt efter olika aspekter på deras arbetsmarknadssituation.<br />
Ett flertal indelningar görs, bl.a. efter demografi (kön, ålder,<br />
boendeort, civilstånd, barninnehav, nationalitet, mm.). Skattade gruppstorlekar, <strong>och</strong> även<br />
andra grupptotaler, ger underlag <strong>för</strong> att skatta olika medelvärden (inklusive andelar),<br />
t.ex. andelen arbetslösa <strong>och</strong> genomsnittlig arbetstid.<br />
1.1.1 Objekt <strong>och</strong> population<br />
AKU:s målpopulation (undersökningspopulation) utgörs av i Sverige bosatta personer<br />
som fyllt 16 men ej 65 år. Populationen kallas befolkningen, om än litet oegentligt<br />
eftersom den endast utgör ett åldersutsnitt ur landets totala befolkning.<br />
1.1.2 Variabler<br />
De variabler som är av betydelse i AKU kan indelas i bakgrundsvariabler, arbetsmarknadsvariabler<br />
<strong>och</strong> hjälpvariabler, <strong>och</strong> så görs i följande beskrivning.<br />
BAKGRUNDSVARIABLER<br />
Dessa utgörs främst av demografiska variabler som kön, ålder, civilstånd, barninnehav,<br />
boendelän/kommun, nationalitet, mm. Initiala värden (som kontrolleras vid intervjuerna)<br />
hämtas från AKU:s urvalsram, SCB:s Registret över totalbefolkningen (RTB).<br />
ARBETSMARKNADSVARIABLER<br />
En ideal AKU - undersökning skulle gå till så att varje person i befolkningen (16 - 64 år)<br />
efter varje vecka tillfrågades om sin arbetsmarknadssituation under veckan ifråga, kallad<br />
mätveckan. Nedanstående variabler tar fasta på personens situation under mätveckan.<br />
AKU:s målstorheter utgörs dock inte av veckovisa <strong>för</strong>hållanden utan av månadsvisa,<br />
kvartalsvisa <strong>och</strong> årsvisa sådana, som ger genomsnittsvärden över de mätveckor som<br />
ingår i AKU:s "månader", "kvartal" <strong>och</strong> "år", vilka ligger mycket nära motsvarande<br />
kalenderperioder. En "AKU - månad" omfattar 4 eller 5 veckor, ett "kvartal" 13 veckor<br />
<strong>och</strong> ett "år" 52 (undantagsvis 53) veckor. Januari år 2000 bestod av veckorna 1, 2, 3 <strong>och</strong><br />
4.<br />
Arbetskraftsstatus<br />
Figur 1 anger kategorier <strong>för</strong> arbetskraftsstatus, som mer ingående definieras nedan.<br />
55
56<br />
Arbetskraften<br />
Arbetskraften utgörs av personer som antingen är sysselsatta eller arbetslösa enligt<br />
nedanstående definitioner. Övriga klassificeras som ej i arbetskraften (med synonym<br />
utan<strong>för</strong> arbetskraften).<br />
Sysselsatta<br />
En person är sysselsatt under mätveckan om villkoren 1 eller 2 nedan gäller.<br />
1 Personen är sysselsatt <strong>och</strong> i arbete om han/hon under mätveckan ut<strong>för</strong> minst<br />
en timmes arbete som avlönad arbetstagare, som egen <strong>för</strong>etagare (inklusive fri<br />
yrkesutövare) eller som oavlönad medhjälpare i <strong>för</strong>etag som tillhör familjemed-<br />
lem i samma hushåll.<br />
2 Personen är sysselsatt men tillfälligt frånvarande om han/hon normalt är sys-<br />
selsatt enligt 1, men är tillfälligt frånvarande från arbetet under hela mätveckan,<br />
oavsett om frånvaron är betald eller ej. Orsaker till tillfällig frånvaro är bl.a.<br />
sjukdom, semester, tjänstledighet (t.ex. <strong>för</strong> vård av barn), (kortvarig) värnplikt<br />
<strong>och</strong> arbetskonflikt.<br />
Personer som under mätveckan har anställningsstöd, offentligt skyddat arbete, arbete vid<br />
Samhall eller är anställd med lönebidrag klassificeras som sysselsatta.<br />
Undersysselsatta<br />
Person som är sysselsatt men av arbetsmarknadsskäl arbetar mindre än han/hon önskar<br />
sägs vara undersysselsatt.<br />
I arbete<br />
I arbetskraften<br />
Befolkningen<br />
Ej i arbets-<br />
kraften<br />
Sysselsatta Arbetslösa Velat arbeta Ej velat arbeta<br />
Tillfälligt frånvarande<br />
hela mätveckan<br />
Kunde arbeta<br />
(latent arbetssökande)<br />
Förhindrad att<br />
arbeta<br />
Figur 1. Grundläggande klassificering avseende arbetskraftsstatus<br />
Arbetslösa<br />
Huvudregeln är att en person är arbetslös under mätveckan om han/hon inte är sysselsatt<br />
(enligt ovan) <strong>och</strong> dessutom uppfyller (i) - (iii) nedan.<br />
(i) Vill arbeta.<br />
(ii) Kan börja ett arbete inom 14 dagar.<br />
(iii) Har sökt arbete under de senaste fyra veckorna (inkl. mätveckan), eller<br />
inväntar att börja nytt arbete inom kort (inom fyra veckor efter mätveckan).<br />
Från huvudregeln görs följande undantag.<br />
En heltidsstuderande person som ej var sysselsatt (enligt ovan) under mät-veckan <strong>och</strong><br />
dessutom uppfyller (i) - (iii) klassificeras dock ej som arbetslös, utan som tillhörande<br />
"ej i arbetskraften". Här gör AKU avsteg från ILO : s internationella rekommendationer.
Latent arbetssökande<br />
En delgrupp av "ej i arbetskraften" utgörs av de latent arbetssökande, som utgörs av<br />
personer som ville <strong>och</strong> kunde arbeta under mätveckan men ej hade sökt arbete, samt<br />
heltidsstuderande som sökt arbete.<br />
Anknytningsgrad till arbetsmarknaden<br />
Klassificerar befolkningen i kategorierna fast, lös <strong>och</strong> utan anknytning.<br />
Fast anknytning har personer med fast anställning samt <strong>för</strong>etagare <strong>och</strong> deras medhjälpande<br />
familjemedlemmar.<br />
Lös anknytning har personer med tidsbegränsad anställning samt ej sysselsatta personer<br />
som dock arbetat någon gång under det senaste året.<br />
Utan anknytning är ej sysselsatta personer som inte arbetat under det senaste året.<br />
Gruppen inkluderar arbetso<strong>för</strong>mögna <strong>och</strong> personer med arbete/vistelse utomlands.<br />
Studier<br />
Variablerna utgörs av svar på frågor som ställs till alla utom personer som vistas<br />
utomlands, är långvarigt sjuka eller intagna <strong>för</strong> vård, om huruvida man studerade under<br />
mätveckan, <strong>och</strong> om så huruvida studierna var hel - eller deltidsstudier, samt antalet<br />
studietimmar under mätveckan.<br />
YTTERLIGARE ARBETSMARKNADSVARIABLER<br />
De ytterligare arbetsmarknadsvariablerna är mer eller mindre olika beroende på personens<br />
arbetskraftsstatus (sysselsatt, arbetslös eller utan<strong>för</strong> arbetskraften, mm.).<br />
Variabler <strong>för</strong> sysselsatta<br />
Viktiga variabler är yrke, yrkesställning, näringsgren, anställningens art, arbetstid,<br />
fack<strong>för</strong>bundstillhörighet, bisyssla, studier, frånvaro. Flertalet definieras/kommenteras<br />
nedan.<br />
Yrke<br />
Från <strong>och</strong> med 1997 klassas yrke enligt Standard <strong>för</strong> svensk yrkesklassificering (SSYK),<br />
som är den svenska versionen av EU : s yrkesklassificering ISCO 88 COM.<br />
Yrkesställning<br />
Har kategorierna anställda, <strong>för</strong>etagare <strong>och</strong> medhjälpande familjemedlemmar.<br />
Anställda underindelas i fast anställda ( = har tillsvidareanställning) <strong>och</strong> tidsbegränsat<br />
anställda (= personer med anställningsstöd, säsongarbete, provanställning, praktiktjänstgöring,<br />
objekt/projektanställning, mm.).<br />
Näringsgren<br />
Näringsgren bestäms av verksamheten vid det arbetsställe där personen är<br />
(huvud)sysselsatt. Fr.o.m. 1995 klassificerar AKU enligt SNI92 (Standard <strong>för</strong> svensk<br />
näringsgrensindelning 1992), vilken är den svenska versionen av EU:s standard NACE<br />
(Nomenclature Generale des Activités Economiques).<br />
Anställningens art (<strong>för</strong> anställda)<br />
Avser arbetsgivarens sektor enligt SCB:s standard <strong>för</strong> sektorstillhörighet, med kategorier<br />
statlig, affärsdrivande verk, primärkommunal, landstingskommunal, övriga offentliga<br />
institutioner samt enskilt <strong>för</strong>etagande. AKU aggregerar indelningen till statlig ( = statlig<br />
+ affärsdrivande), kommunal ( = primärkommunal + landstingskommunal + övriga<br />
offentliga institutioner) samt enskild.<br />
Arbetstid<br />
Det antal timmar en person arbetar under mätveckan kallas faktiskt arbetad tid medan<br />
vanlig arbetstid avser den arbetstid som personen skall arbeta enligt överenskommelse.<br />
57
58<br />
Frånvaroorsak<br />
Svar på frågor till personer som var tillfälligt frånvarande under mätveckan.<br />
Bisyssla<br />
Sysselsatta personer har en bisyssla om de svarar ja på frågan: "Har Du mer än ett<br />
jobb/arbete, ett extraknäck eller någon (betald) bisyssla?”<br />
Variabler <strong>för</strong> arbetslösa<br />
Yrke, näringsgren fack<strong>för</strong>bundstillhörighet, bisyssla, mm. definieras som <strong>för</strong> sysselsatta,<br />
utifrån <strong>för</strong>hållandena när den arbetslöses senast var sysselsatt. Särskilda variabler är<br />
antal arbetslöshetsveckor, sätt att söka arbete, önskad arbetstid, m.fl.<br />
Variabel <strong>för</strong> personer utan<strong>för</strong> arbetskraften<br />
Gäller huvudsaklig verksamhet, som omfattar hemarbete, pensionerad, studerande,<br />
värnpliktig, långvarigt sjuk, m.fl., enligt personens egen bedömning .<br />
HJÄLPVARIABLER<br />
Bland dessa ingår några uppgifter från registret som ligger till grund <strong>för</strong> SCB:s<br />
Registerbaserade arbetsmarknadsstatistik (RAMS). RAMS tar fram årlig totalräknad<br />
statistik <strong>och</strong> RAMS - registret omfattar (åtminstone i princip) hela befolkningen (t.o.m. i<br />
alla åldrar). Dess variabelinnehåll ansluter till AKU:s, med referenstidpunkt november.<br />
T.ex. avser RAMS - sysselsatt en persons sysselsättningssituation under november.<br />
Jäm<strong>för</strong>t med AKU är uppgifterna i RAMS "dåligt aktuella", registret har en<br />
framställningstid om cirka ett <strong>och</strong> halvt år. För AKU spelar RAMS - uppgifter roll<br />
fram<strong>för</strong> allt som hjälpinformation <strong>för</strong> urval <strong>och</strong> skattning.<br />
Hjälpinformation <strong>för</strong> samma syfte hämtas också från Arbetsmarknadsstyrelsens (AMS)<br />
arbetssökanderegister.<br />
1.1.3 <strong>Statistiska</strong> mått<br />
Merparten av statistiken från AKU utgörs av skattade värden på statistiska storheter/<br />
parametrar av typ totaler <strong>och</strong> medelvärden (med "andel" som vanligt specialfall).<br />
Skattningar redovisas med ett flertal gruppindelningar, vilka beskrivs i Avsnitt 1.1.4.<br />
Dessutom beräknas statistikens osäkerhet med hjälp av skattade standardavvikeser.<br />
Nedan anges de viktigaste målstorheterna.<br />
Storheter av typ total<br />
Huvudstorheter är antal sysselsatta, antal arbetslösa, antal personer i <strong>och</strong> utan<strong>för</strong><br />
arbetskraften. Ytterligare exempel är följande. För sysselsatta : antal personer i arbete,<br />
summa faktiskt arbetade timmar <strong>och</strong> antal undersysselsatta resp. latent arbetslösa. För<br />
sysselsatta, som studerar : antal studietimmar under mätveckan.<br />
Storheter av typ medelvärde<br />
Några exempel ges nedan.<br />
Relativt arbetslöshetstal = andel arbetslösa i arbetskraften.<br />
Relativt arbetskraftstal = arbetskraftens andel av befolkningen (16 - 64 år).<br />
Sysselsättningsintensitet = andel sysselsatta i befolkningen (16 - 64 år).<br />
Relativt frånvarotal = andel tillf. frånvarande under mätveckan bland sysselsatta.<br />
Medelarbetstid (<strong>för</strong> sysselsatta) = genomsnittlig arbetstid under mätveckan.<br />
1.1.4 Redovisningsgrupper<br />
De statistiska målstorheterna skattas <strong>för</strong> en mängd olika redovisningsgrupper ( = delgrupper<br />
av populationen), vilka skapas genom mer eller mindre långtgående korsindelningar<br />
med hjälp av olika "indelningsvariabler", där bakgrundsvariablerna spelar central<br />
roll. I det följande ges exempel på indelningsvariabler. Det skulle dock <strong>för</strong>a <strong>för</strong> långt att
precist beskriva vilka korsindelningar som görs, <strong>för</strong> mer fullständig information hänvisas<br />
till AKU : Grundtabeller. I stort sett alla indelningar tar fasta på kön, ålder (med 5 -<br />
<strong>och</strong> 10 - årsklasser) <strong>och</strong> boendelän. Ytterligare exempel på indelningsvariabler ges<br />
nedan.<br />
För statistik om befolkningen: Arbetskraftsstatus, aspekter på barninnehav (antal barn,<br />
yngsta barnets ålder, <strong>för</strong>ekomst av barn under 17 år), vanligen arbetad tid.<br />
För statistik avseende sysselsatta: Anknytningsgrad till arbetsmarknaden, näringsgren,<br />
yrke, anställningens art, yrkesställning, bisyssla, vanligen arbetad tid.<br />
För statistik avseende sysselsatta <strong>och</strong> anställda: Förutom "gängse" variabler <strong>för</strong> sysselsatta,<br />
hel - resp. deltid, skäl <strong>för</strong> att arbeta mer än vanligt, vanligen arbetad tid, skäl <strong>för</strong> att<br />
arbeta mindre än önskat, genomsnittlig önskad ökad arbetstid.<br />
För statistik avseende sysselsatta i arbete: Faktisk <strong>och</strong> vanlig arbetstid, anknytningsgrad<br />
till arbetsmarknaden, yrke, näringsgren, aspekter på barninnehav, huvud - resp. bisyssla,<br />
anställningens art.<br />
För statistik avseende sysselsatta men tillfälligt frånvarande: Förutom "gängse" variabler<br />
<strong>för</strong> sysselsatta, huvudsaklig frånvaroorsak, aspekter på barninnehav, antal frånvarotimmar,<br />
vanligen arbetad tid, huvud - <strong>och</strong> bisyssla.<br />
För statistik avseende arbetslösa : Arbetslöshetstidens längd, ny - eller återinträde på<br />
arbetsmarknaden, sätt att söka arbete, genomsnittlig arbetslöshetstid, önskad arbetstid,<br />
anledning till att man slutade <strong>för</strong>egående arbete, aspekter på barninnehav.<br />
För statistik avseende personer utan<strong>för</strong> arbetskraften: Huvudsaklig verksamhet, önskemål<br />
om <strong>och</strong> möjlighet till <strong>för</strong>värvsarbete. För latent arbetssökande : önskad arbetstid.<br />
1.1.5 Referenstider<br />
Statistikens referensperiod är veckorna 1, 2, 3 <strong>och</strong> 4 år 2000, 3 - 30 januari.<br />
1.2 Fullständighet<br />
AKU är fram<strong>för</strong> allt en enskild undersökning. Se dock Avsnitt 4.3.<br />
2 STATISTIKENS TILLFÖRLITLIGHET<br />
2.1 Till<strong>för</strong>litlighet totalt<br />
Liksom i stort sett all statistik är även AKU - statistiken behäftade med viss osäkerhet. I<br />
Avsnitt 2.2 görs en genomgång av AKU : s felkällor <strong>och</strong> deras konsekvenser. De fel som<br />
spelar störst roll är urvalsfel (som beror på att endast ett urval undersökts), bortfallsfel<br />
(som beror på att svar saknas helt eller delvis från vissa utvalda) samt mätfel (som<br />
uppkommer främst p.g.a. att frågor eller svar missuppfattas).<br />
Vid bedömning av hur fel påverkar statistiken från en undersökning skiljer man mellan<br />
slumpmässiga fel ( = fel som "fluktuerar kring 0") <strong>och</strong> systematiska fel (fel som till sin<br />
majoritet går åt samma håll). De senare med<strong>för</strong> större eller mindre skevhet i statistiken<br />
(systematisk över- eller underskattning) vilket de slumpmässiga felen inte gör, men<br />
dessa bidrar till statistikens osäkerhet. Med total osäkerhet / fel avses det sammantagna<br />
felet (systematiskt fel + slumpmässigt fel).<br />
För osäkerheten som emanerar från slumpmässiga fel kan felgränser beräknas från de<br />
observerade värdena, i form av konfidensintervall Y $ ± 1.96 × Dˆ , med Y $ <strong>för</strong><br />
punktskattningen ( = statistikvärdet) <strong>och</strong> D <strong>för</strong> skattad standardavvikelse <strong>för</strong><br />
ˆ $ Y . Ett<br />
sådant intervall innehåller med stor trolighet (cirka 95 %) det riktiga värdet på den<br />
statistiska storhet som $ Y skattar. Om skevheten är obetydlig anger ett konfidensintervall<br />
statistikvärdets totala osäkerhet.<br />
Det är avsevärt svårare att ange gränser <strong>för</strong> den osäkerhet som emanerar från eventuella<br />
systematiska fel. Det kräver särskilda, oftast mycket resurskrävande, utvärde-<br />
59
60<br />
ringsinsatser <strong>och</strong> sådana görs där<strong>för</strong> endast intermittent. På basis av gjorda studier<br />
bedöms att den helt övervägande delen av AKU : s statistik har <strong>för</strong>sumbar skevhet, <strong>och</strong><br />
därav följer att konfidensintervallen ger god uppfattning om total till<strong>för</strong>litlighet. Varning<br />
ges dock dels <strong>för</strong> skattningar på riksnivå av antal personer utan<strong>för</strong> arbetskraften samt <strong>för</strong><br />
statistik om utländska medborgare. Den senare frågan diskuteras i Avsnitten 2.2.2 <strong>och</strong><br />
2.2.4.<br />
2.2 Osäkerhetskällor<br />
Allmänt talar man om felkällorna urval, ramtäckning, mätning, svarsbortfall, bearbetning<br />
<strong>och</strong> modellantaganden, vilka alla behandlas i det följande. Men som redan nämnts<br />
är det främst mätning <strong>och</strong> bortfall som vållar problem i AKU.<br />
2.2.1 Urval <strong>och</strong> estimation<br />
Urval<br />
Ett AKU - urval utgörs av ett antal personer ur befolkningen (16 - 64 år). Som urvalsram<br />
används åldersutsnittet ifråga i Registret över totalbefolkningen (RTB). Utsnittet<br />
omfattar cirka 5 500 000 personer. RTB uppdateras veckovis via aviseringar från<br />
folkbok<strong>för</strong>ingsmyndigheten ( = Skattemyndigheten) om födslar, dödsfall, flyttningar<br />
inom landet, in - <strong>och</strong> utvandringar, mm.<br />
RTB innehåller demografiska variabler (kön, ålder, boendeort, mm.) som spelar roll dels<br />
vid urvalsdragningen dels som (initial)värden <strong>för</strong> bakgrundsvariablerna (se Avsnitt<br />
1.1.2). I urvalsramen kompletteras RTB - informationen genom på<strong>för</strong>ande av sysselsättningsstatus<br />
enligt RAMS - registret (se Avsnitt 1.1.2, hjälpvariabler). Den<br />
informationen, som är cirka 2 år gammal, används som hjälpinformation vid urvalsdragningen<br />
<strong>och</strong> efterföljande skattning.<br />
AKU använder ett <strong>för</strong>farande med urvalspaneler, vilket med<strong>för</strong> att en utvald person<br />
intervjuas var tredje månad tills han/hon varit med i undersökningen 8 gånger, dvs.<br />
under cirka två år. Beskrivet i stora drag är urvals<strong>för</strong>farandet stratifierat urval med<br />
systematiskt urval inom stratan. Urvalsstratana skapas genom korsindelning med<br />
avseende på boendelän, kön, medborgarskap (svensk/ej svensk) <strong>och</strong> RAMS – sysselsättningsstatus,<br />
vilket leder till 192 urvalsstratan. Variabeln "ålder" används inte vid<br />
stratumindelningen, men kommer in som "implicit" stratifieringsvariabel genom att de<br />
stratumvisa systematiska urvalen dras med urvalsramen sorterad efter ålder. Urvalsfraktionen<br />
är något högre <strong>för</strong> utländska än <strong>för</strong> svenska medborgare. Skälet är krav på<br />
särskild redovisning <strong>för</strong> utländska medborgare, t.o.m. uppdelade efter nationalitet, varvid<br />
det handlar om, relativt sett, mycket små grupper. Urvalssystemet är utformat så att<br />
ett månadsurval omfattar cirka 17 000 personer.<br />
Estimation<br />
Om svarsbortfall inte <strong>för</strong>elåg, skulle AKU : s estimation göras enligt "läroboken" <strong>för</strong><br />
skattning vid stratifierat urval, men bortfallet <strong>för</strong>anleder justeringar. En "lättvindig"<br />
metod <strong>för</strong> att skatta "trots bortfall" är s.k. (enkel) "rak uppräkning", vilken innebär att<br />
man skattar som om de svarande utgör de ursprungligt utvalda. För att inte leda till skev<br />
statistik <strong>för</strong>utsätter den metoden att "arbetsmarknads<strong>för</strong>hållanden <strong>för</strong> svarande <strong>och</strong><br />
bortfall är i stort sett lika". Den kan dock leda till allvarlig skevhet om det <strong>för</strong>eligger<br />
samspel mellan "svarsbenägenhet" <strong>och</strong> "värdena på arbetsmarknadsvariabler". Härvidlag<br />
vets att personer med lös anknytning till arbetsmarknaden (vilka till stor del utgörs av<br />
arbetslösa) har klart lägre svarsbenägenhet än övriga. Okritisk rak uppräkning skulle<br />
därigenom leda till att bl.a. "antal arbetslösa" underskattas.<br />
Skevheten kan dock reduceras avsevärt genom att i urvalet <strong>och</strong> estimationen beakta s.k.<br />
svarshomogenitetsgrupper, <strong>för</strong>utsatt att hjälpvariabler <strong>för</strong> att kunna identifiera sådana<br />
finns tillgängliga. Tidigare använde AKU en uppräkning efter kön, ålder <strong>och</strong> län, men<br />
1993 in<strong>för</strong>des ett nytt <strong>för</strong>farande. Skattningar avseende hela riket baserades på två<br />
poststratifieringssystem det ena med uppräkning baserad på hjälpvariablerna "ingår i<br />
AMS arbetssökanderegister med uppdelning på kön <strong>och</strong> ålder" <strong>och</strong> det andra, ”sysselsatt<br />
enligt RAMS med uppdelning på näringsgren kön <strong>och</strong> ålder.” Det nya <strong>för</strong>farandet
med<strong>för</strong>de avsevärd reduktion av tidigare skevhet <strong>för</strong> skattningar på riksnivå, men<br />
slopandet av län som hjälpvariabel innebar samtidigt att skattningar avseende län<br />
<strong>för</strong>sämrades. Ett speciellt poststratifieringssystem med befolkningen <strong>för</strong>delad efter kön<br />
ålder <strong>och</strong> region utvecklades där<strong>för</strong> <strong>för</strong> skattningar på länsnivå. En kvarstående brist i<br />
det nya estimationssystemet var emellertid bristande konsistens mellan riksskattningar<br />
<strong>och</strong> regionala skattningar .<br />
Ytterligare modifiering av estimations<strong>för</strong>farandet har gjorts sedan dess.<br />
Senaste omläggningen, som gjordes i oktober 1999, syftar till att integrera riksskattningar<br />
<strong>och</strong> regionala skattningar i ett <strong>och</strong> samma system <strong>för</strong> att undvika den tidigare<br />
nämnda inkonsistensen. Systemet utvecklades också med restriktionen att inga tidsseriebrott<br />
skulle ske <strong>för</strong> skattningarna på riksnivå .<br />
Efter senaste omläggningen vilar estimationen på två delsystem, vilka skiljer sig ifråga<br />
om den hjälpinformation som används <strong>för</strong> bortfallskompensation. Den numera använda<br />
tekniken är hämtad från "generaliserad regressionsestimation".<br />
I det ena delsystemet skattas storlekar/totaler <strong>för</strong> grupper inom delpopulationen "sysselsatta"<br />
(exempel är "antal sysselsatta", "antal i arbete" <strong>och</strong> "antal arbetade timmar").<br />
Här används enbart urvalsstratana som svarshomogenitetsgrupper, men <strong>för</strong> att uppnå bra<br />
bortfallskompensation är därvidlag viktigt att variabeln "RAMS - sysselsatt" ingår som<br />
hjälpvariabel, <strong>för</strong>utom de allmänna bakgrundsvariablerna.<br />
I det andra delsystemet skattas storlekar/totaler <strong>för</strong> grupper inom delpopulationen<br />
"arbetslösa" (exempel är "antal arbetslösa" <strong>och</strong> "totalt antal arbetslöshetsmånader"). Här<br />
görs bortfallskompensationen med användande av, utöver variablerna som genererar<br />
urvalsstratana, den ytterligare hjälpvariabeln "ingår i AMS arbetssökanderegister".<br />
Storlekar / totaler <strong>för</strong> grupper som omfattar såväl sysselsatta som arbetslösa skattas sedan<br />
genom att kombinera skattningar från de två delsystemen. Några exempel :<br />
Antal i arbetskraften = antal sysselsatta + antal arbetslösa<br />
Antal ej i arbetskraften = antal i befolkningen (enligt RTB) - antal i<br />
arbetskraften.<br />
När man har skattningar av gruppstorlekar <strong>och</strong> andra totaler skattas de olika slagen av<br />
medelvärden på naturligt sätt som kvoter mellan skattade totaler.<br />
Som del av skattningsberäkningarna tas också fram skattade standardavvikelser <strong>för</strong><br />
punktskattningarna. Dessa ger underlag <strong>för</strong> beräkning av konfidensintervall som fångar<br />
upp osäkerhetsbidrag från de slumpmässiga felen (slumpurvalet <strong>och</strong> slumpmässiga mät -<br />
<strong>och</strong> bortfallsstörningar).<br />
Ut<strong>för</strong>lig beskrivning av estimations<strong>för</strong>farandet ges i Mirza & Hörngren (2001) : Urvals-<br />
<strong>och</strong> estimations<strong>för</strong>farande i de svenska arbetskraftsundersökningarna.<br />
2.2.2 Ramtäckning<br />
Täckningsbrister handlar om dels undertäckning, som <strong>för</strong>eligger om personer (16 - 64)<br />
som är bosatta i Sverige saknas i urvalsramen (dvs. i RTB) dels övertäckning, som<br />
<strong>för</strong>eligger om personer i urvalsramen inte längre ingår i landets befolkning.<br />
Den undertäckning som finns i AKU hänger främst ihop med att immigranter i landet<br />
("invandrare" + "hemvändare") kommer till RTB:s kännedom med viss "eftersläpning".<br />
Effekten på statistiken bedöms dock vara högst obetydlig. Litet mer komplicerande är att<br />
AKU - urval dras en gång per år, <strong>och</strong> att utvalda personer intervjuas under en<br />
tvåårsperiod. En urvalspanel dragen ett visst år undertäcker där<strong>för</strong> i någon mån<br />
immigranter vid efterföljande års undersökningar. Även detta <strong>för</strong>hållande bedöms ha<br />
marginell effekt på AKU - statistiken.<br />
AKU:s övertäckning beror fram<strong>för</strong> allt på "eftersläpning" i rapporteringen av dödsfall<br />
<strong>och</strong> utvandringar. RTB : s snabba uppdateringsrutiner med<strong>för</strong> att urvalsramen har<br />
obetydlig övertäckning åtminstone vad gäller svenska medborgare, men inte riktigt lika<br />
bra <strong>för</strong> utländska, särskilt utomnordiska, medborgare. Skälet är att vissa utomlands<br />
61
62<br />
födda personer lämnar Sverige utan att anmäla det till svensk myndighet. Sådana<br />
personer skulle helst inte ingå i urvalsramen eftersom de inte längre är bosatta i landet,<br />
<strong>och</strong> "bristen" ifråga uppdagas oftast inte heller eftersom de inte nås <strong>för</strong> intervju.<br />
Därigenom blir de felaktigt klassade som "bortfall" trots att "övertäckning" är det<br />
adekvata, <strong>och</strong> denna felklassning leder till viss skevhet i statistiken. Övertäckningen<br />
ifråga är av storleksordningen 25 000 - 50 000 personer. Frågan diskuteras vidare i<br />
Avsnitt 2.2.4.<br />
Sammanfattningsvis är dock bedömningen att, bortsett från statistik avseende<br />
utomnordiska invandrare, har bristerna i AKU : s urvalsram ingen menlig effekt på<br />
statistiken.<br />
2.2.3 Mätning<br />
Datainsamling<br />
Uppgifter till AKU inhämtas av SCB - intervjuare genom datorstödda telefonintervjuer,<br />
vilka följer en standardiserad blankett. Vid <strong>för</strong>sta intervjutillfället (av de 8) görs<br />
noggrann kartläggning av personens arbetsmarknadssituation, generellt <strong>och</strong> <strong>för</strong><br />
mätveckan. Vid efterföljande tillfällen görs <strong>för</strong> vissa variabler (arbetskraftsstatus, yrke,<br />
arbetsplats, m.fl.) endast uppföljning av om <strong>för</strong>ändring skett. Uppgifter om<br />
arbetssituationen under mätveckan inhämtas dock varje gång. Uppgiftsinsamlingen<br />
illustreras i Figur 2 nedan.<br />
En utvald person informeras per brev, ungefär två veckor i <strong>för</strong>väg, om att hon/han blivit<br />
utvald att delta i AKU, <strong>och</strong> kommer att bli kontaktad <strong>för</strong> telefonintervju. I brevet finns<br />
också en broschyr med information om undersökningen (syfte, uppläggning, mm.). Om<br />
det inte går att nå en utvald person via telefon görs besöksintervju, vilket dock gäller<br />
bara cirka 1/2 % av samtliga intervjuer. I vissa fall, t.ex. vid sjukdom eller språksvårigheter<br />
görs indirekt intervju ( = annan person svarar <strong>för</strong> utvald persons räkning), vilket<br />
<strong>för</strong>ekommer i cirka 3 % av intervjuerna.<br />
Intervjuer avseende en viss mätvecka påbörjas dagen efter veckans utgång. Flertalet av<br />
intervjuerna genom<strong>för</strong>s under loppet av en dryg vecka.
Blankett <strong>för</strong> ny<br />
klassificering<br />
Blankett <strong>för</strong> klassificeringskontroll<br />
Intervju 1<br />
Frågor om urvalspersonensarbetsmarknadssituation<br />
över<strong>för</strong>ing av<br />
uppgifter<strong>för</strong> nästa<br />
intervjutillfälle<br />
Intervju 2-8<br />
Klassificeringskontroll<br />
Uppifterna<br />
avviker<br />
Omklassificering<br />
Uppgifterna<br />
överensstämmer<br />
Figur 2. Flödesschema <strong>för</strong> uppgiftsinsamlingen<br />
Frågor om<br />
mätveckan<br />
Frågor om<br />
mätveckan<br />
Frågor om<br />
mätveckan<br />
Mätfel<br />
AKU har genom<strong>för</strong>t s.k. återintervjustudier <strong>för</strong> att få uppfattning om <strong>för</strong>ekomst av<br />
mätfel <strong>och</strong> dessas eventuella snedvridande konsekvenser. De tre senaste studierna<br />
gjordes 1978, 1989/90 samt 1994/95. Som exempel visas i Tabell 1 några resultat från<br />
studierna, avseende felklassificering av arbetskraftsstatus, med en 5 - kategori - indelning<br />
<strong>och</strong> en "<strong>för</strong>grovning" av denna till 3 kategorier. Nettofel är andel felaktigt medtagna<br />
minus andel felaktigt uteslutna personer. Bruttofel är summan av andelarna felaktigt<br />
medtagna <strong>och</strong> felaktigt uteslutna personer. I tabellen skall " + " <strong>och</strong> " - " tolkas som att<br />
"ordinarie" AKU överskattar respektive underskattar.<br />
Tabell 1. Nettofel (i %)<br />
Variabel Arbetskraftsstatus 1978 89/90 94/95<br />
1 Ej i arbetskraften, exkl.<br />
arb.o<strong>för</strong>mögna<br />
+ 11% + 8 % + 3 %<br />
2 Sysselsatta, i arbete -1% - 1 % 0 %<br />
Arbets- 3 Sysselsatta, tillfälligt frånvarande +19% + 1 % - 4 %<br />
marknads- 4 Arbetslösa -3% - 16 % - 2 %<br />
status 5 Ej i arbetskraften +arbetso<strong>för</strong>mögna -46% 0 % + 2 %<br />
63<br />
Sysselsatta (2 + 3) +1% -1% 0 %<br />
Arbetslösa (4) -3% -16% - 2 %<br />
Ej i arbetskraften (1 + 5) -2% +7% + 3 %
64<br />
Mätfelsstudien 94/95 gav vid handen att bruttofelet <strong>för</strong> "samtliga" vid klassning av<br />
arbetskraftsstatus enligt 3 - kategori - indelningen var 3 % .<br />
Från Tabell 1 framgår att utvecklingen över tiden gått mot det markant bättre, 94/95 års<br />
felprocenter ses som "acceptabla", även om strävan naturligtvis är att eliminera dem helt.<br />
2.2.4 Svarsbortfall<br />
Allmänt om AKU : s bortfall <strong>och</strong> bortfallsklassificering<br />
Om inga uppgifter erhålls <strong>för</strong> en utvald person sägs objektsbortfall <strong>för</strong>eligga.<br />
Huvudorsakerna till sådant är att personen ej anträffas <strong>för</strong> intervju eller vägrar<br />
medverka i undersökningen. Om en utvald person ger frågesvar som räcker <strong>för</strong> att kunna<br />
klassificera med avseende på arbetskraftsstatus, anknytningsgrad till arbetsmarknaden<br />
samt arbetade timmar, men inte på vissa andra frågor, <strong>för</strong>eligger partiellt bortfall <strong>för</strong><br />
variablerna utan värden, men om svar saknas på nyssnämnda "centrala" frågor klassas<br />
personen som objektsbortfall. Klassningen ifråga spelar roll vid estimationen. Figur 3<br />
visar hur AKU : s bortfallsfrekvenser utvecklats sedan 1987.<br />
AKU gör inga substitutioner <strong>för</strong> ej anträffade eller ej spårade personer. Heller görs inga<br />
imputeringar med anledning av svarsbortfall.<br />
I Avsnitt 2.2.1, estimation beskrivs det <strong>för</strong>farande <strong>för</strong> bortfallsjustering som används.<br />
Den senast genom<strong>för</strong>da studien av bortfallsskevhet gjordes i anslutning till 1993 års<br />
omläggning av estimations<strong>för</strong>farandet. På basis av den studien bedöms att "antal<br />
sysselsatta" <strong>och</strong> "antal arbetslösa" i riket skattas med relativ bortfallsskevhet som är<br />
mindre än 1 % respektive 3 %.<br />
En orsak till felaktig bortfallsklassficering<br />
När man söker efter telefonnummer till utvalda personer är <strong>för</strong>sta instans TeleMedias<br />
telefonnummerregister. Genom detta erhålls telefonnummer till cirka 60 % av de<br />
utvalda. Övriga ombeds per post att sända in ett svarskort med uppgift om<br />
telefonnummer <strong>och</strong> lämplig kontakttidpunkt. I (kontaktvägs)spårningen sker dock<br />
misslyckanden. Om telefonnummer eller annan kontaktväg inte kan fås fram, klassas<br />
personen som bortfall. Detta leder i vissa fall till felaktig klassificering som "bortfall"<br />
istället <strong>för</strong> det korrekta "övertäckning", vilket i sin tur leder till viss skevhet i<br />
skattningarna.<br />
Nyssnämnda fel är särskilt frekvent <strong>för</strong> utomnordiska medborgare som lämnat Sverige<br />
utan att anmäla detta till svensk myndighet (se Avsnitt 2.2.2). Någon djupgående<br />
utredning av felets konsekvenser <strong>för</strong> AKU - statistiken har ännu inte gjorts.<br />
procent<br />
Figur 3. Bortfall 1987-1998<br />
16<br />
14<br />
12<br />
10<br />
8<br />
6<br />
4<br />
2<br />
Totalt<br />
Ej anträffade<br />
Vägrare<br />
0<br />
1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998
2.2.5 Bearbetning<br />
Granskning <strong>och</strong> rättning<br />
Granskning <strong>och</strong> rättning sker i huvudsak vid intervjun eftersom de ut<strong>för</strong>s med datorstöd<br />
med inbyggda logiska kontroller <strong>och</strong> värdekontroller. Vid kodningen (se nedan) finns<br />
inbyggd kontroll i form av värdekontroller.<br />
Dataregistrering <strong>och</strong> kodning<br />
I <strong>och</strong> med att telefonintervjuerna är datorstödda sker huvuddelen av dataregistreringen i<br />
direkt anslutning till uppgiftsinsamlingen. Den enda ytterligare registrering som görs<br />
hänger samman med kodningen av variablerna näringsgren, anställningens art, yrke<br />
samt socioekonomisk grupp (enligt SCB : s SEI - klassificering).<br />
2.2.6 Modellantaganden<br />
AKU : s statistik beror inte av andra modellantaganden än de som används <strong>för</strong> bortfallskompensationen.<br />
De handlar fram<strong>för</strong> allt om att svarsbenägenheter verkligen är<br />
homogena inom använda svarshomogenitetsgrupper. Så bedöms vara fallet.<br />
2.3 Redovisning av osäkerhetsmått<br />
Standardavvikelser <strong>för</strong> de mest efterfrågade månads-, kvartals- <strong>och</strong> årsskattningarna<br />
beräknas <strong>och</strong> publiceras löpande i SM. Därmed har användare den information som<br />
behövs <strong>för</strong> enkel beräkning av konfidensintervall. En gång per år (i januari) utkommer<br />
den särskilda publikationen AKU:Standardavvikelser, med standardavvikelser <strong>för</strong><br />
skattningarna i AKU : Grundtabeller. Beräkningen av standardavvikelserna sker dock i<br />
direkt anslutning till framtagandet av grundtabellerna.<br />
3 STATISTIKENS AKTUALITET<br />
3.1 Undersöknings - <strong>och</strong> publiceringsfrekvenser<br />
AKU genom<strong>för</strong>s månatligen <strong>och</strong> statistik <strong>för</strong> varje månad redovisas såväl i SM som i<br />
AKU : Grundtabeller. Baserat på uppgifterna till månadsundersökningarna framtas också<br />
statistik med kvartal <strong>och</strong> år som referensperiod, vilken redovisas i särskilda<br />
publikationer, SM <strong>och</strong> grundtabeller.<br />
3.2 Framställningstid<br />
Uppgiftsinsamlingen avslutas normalt cirka 10 dagar efter utgången av månadens sista<br />
mätvecka. Ytterligare 1 - 2 dagar därefter publiceras ett Pressmeddelande med<br />
översiktliga resultat. SM <strong>och</strong> AKU : Grundtabeller <strong>för</strong> månaden utkommer cirka 2<br />
veckor efter månadens slut. Motsvarande <strong>för</strong> kvartal är cirka 3 veckor efter kvartalets<br />
slut <strong>och</strong> <strong>för</strong> år cirka 1 månad efter årets slut.<br />
3.3 Punktlighet<br />
Pressmeddelandet <strong>för</strong> AKU januari 2000 publicerades den 14 februari, vilket var<br />
planerad publiceringstidpunkt. SM <strong>för</strong> månaden utkom, i enlighet med publiceringsplanen,<br />
den 21 februari.<br />
4 JÄMFÖRBARHET <strong>och</strong> SAMANVÄNDBARHET<br />
4.1 Jäm<strong>för</strong>barhet över tiden<br />
Under drygt 25 år efter starten 1960 genom<strong>för</strong>des AKU utan egentliga <strong>för</strong>ändringar i<br />
vare sig definitioner eller metod (inklusive intervjublankett). För att undersökningen<br />
bättre skulle spegla <strong>för</strong>hållanden <strong>och</strong> bättre fånga upp <strong>för</strong>ändringar på arbetsmarknaden<br />
gjordes en omfattande revision av innehållet (inklusive definitioner), med<br />
implementering fr.o.m. 1987 års undersökning. Möjligheterna till jäm<strong>för</strong>elser bakåt i<br />
tiden <strong>för</strong>svårades därmed. För att inte <strong>för</strong>lora jäm<strong>för</strong>barhet av AKU - resultat <strong>för</strong>e <strong>och</strong><br />
efter 1987 gjordes datainsamling <strong>och</strong> bearbetning <strong>för</strong> år 1986 med såväl gammalt som<br />
65
66<br />
nytt <strong>för</strong>farande. Härigenom erhölls bl.a. kunskap om metodskillnadernas betydelse <strong>för</strong><br />
resultaten.<br />
Ytterligare <strong>för</strong>ändringar har gjorts sedan 1987. Med börja i 1993 undersökningar<br />
in<strong>för</strong>des dels ett nytt estimations<strong>för</strong>farande med ändrad bortfallskompensation, som<br />
modifierades 1999, dels nytt mätveckossystem. Numera är årets alla veckor mätveckor,<br />
mot tidigare endast två av "månadens" 4 eller 5 veckor.<br />
Fr.o.m 1995 använder AKU, liksom hela SCB, standarden SNI92 <strong>för</strong> näringsgrensindelning,<br />
<strong>och</strong> fr.o.m 1997 den nya standarden SSYK <strong>för</strong> yrkesklassificering.<br />
Liksom vid revisionen 1987 med<strong>för</strong>de <strong>för</strong>ändringarna 1993, 1995 <strong>och</strong> 1997 brott i<br />
tidsserierna. För att kunna jäm<strong>för</strong>a AKU - resultat <strong>för</strong>e 1995 med resultat från senare år<br />
har ett omfattande länkningsarbete ut<strong>för</strong>ts, <strong>och</strong> statistiken <strong>för</strong> 1987 - 1994 har justerats<br />
med hänsyn till <strong>för</strong>ändringarna 1993 <strong>och</strong> 1995. Någon länkning mellan gammal <strong>och</strong> ny<br />
yrkesstandard har dock inte gjorts, <strong>och</strong> kommer heller inte att göras, eftersom de två<br />
standarderna bygger på helt olika klassificeringsprinciper.<br />
Säsongsrensning av tidsserier över arbetslöshet <strong>och</strong> sysselsättning görs, i syfte att öka<br />
möjligheten att bedöma kortsiktiga <strong>för</strong>ändringar.<br />
4.2 Jäm<strong>för</strong>barhet mellan grupper<br />
AKU följer internationella rekommendationer <strong>och</strong> standarder <strong>för</strong> klassificeringar (med<br />
undantag <strong>för</strong> det som nämns under "ej i arbetskraften" i Avsnitt 1.1.2). Samanvändbarheten<br />
med andra länders arbetskraftsundersökningar är där<strong>för</strong> mycket god.<br />
AKU deltar i samarbete, lett av EU:s statistikkontor Eurostat, med syfte att uppnå<br />
ytterligare <strong>för</strong>bättring av jäm<strong>för</strong>barheten mellan EU - ländernas arbetskraftsundersökningar.<br />
4.3 Samanvändbarhet med annan statistik<br />
Förutom i AKU tar SCB fram statistik om sysselsättning i vissa andra undersökningar,<br />
särskilt Registerbaserad arbetsmarknadsstatistik (RAMS) <strong>och</strong> Företagsbaserad<br />
sysselsättningsstatistik samt inom Nationalräkenskaperna (NR). Resultaten från dessa<br />
undersökningar är dock inte helt jäm<strong>för</strong>bara med AKU:s, huvudsakligen beroende på<br />
skillnader i definitioner, undersökningsmetod <strong>och</strong> referenstidpunkt.<br />
Nedanstående diagram belyser definitionsskillnader. Där jäm<strong>för</strong>s statistik över "antal<br />
anställda" från AKU <strong>och</strong> Företagsbaserad sysselsättningsstatistik (i diagrammen refererad<br />
till med KS <strong>och</strong> KSP). AKUkv <strong>och</strong> AKUks står <strong>för</strong> AKU:s "vanliga" respektive<br />
säsongrensade kvartalsstatistik.<br />
Tusentals<br />
3900<br />
3800<br />
3700<br />
3600<br />
3500<br />
3400<br />
3300<br />
Totalt antal anställda<br />
KS<br />
AKUkv<br />
AKUks<br />
3200<br />
971 972 973 974 981 982 983 984 991 992 993 994 År/kv
Tusental<br />
Tusentals<br />
1420<br />
1400<br />
1380<br />
1360<br />
1340<br />
1320<br />
1300<br />
1280<br />
1260<br />
1240<br />
1220<br />
Antal anställda i offentlig sektor<br />
1200<br />
971 972 973 974 981 982 983 984 991 992 993 994<br />
2600<br />
2400<br />
2200<br />
2000<br />
971<br />
972<br />
973<br />
974<br />
Antal anställda privat sektor<br />
981<br />
982<br />
LFS<br />
983<br />
Nästa diagram visar utvecklingar av "antal sysselsatta" enligt AKU, angiven med<br />
engelsk akronym LFS (<strong>för</strong> Labour Force Survey), respektive Nationalräkenskaperna<br />
med nya "EU - mallen" ESA. Också det belyser definitionsskillnader, vilka här.<br />
Fram<strong>för</strong> allt beror på följande <strong>för</strong>hållanden. (i) NR klassificerar värnpliktiga som<br />
sysselsatta, medan de enligt AKU inte ingår i arbetskraften. (ii) AKU mäter antal<br />
sysselsatta <strong>för</strong> åldrarna 16 - 64 år, medan NR mäter "oavsett ålder".<br />
4 250<br />
4 200<br />
4 150<br />
4 100<br />
4 050<br />
4 000<br />
3 950<br />
3 900<br />
3 850<br />
3 800<br />
3 750<br />
Sysselsatta (i 1000-tal)<br />
1993 1994 1995 1996 1997 1998 1999<br />
Dessutom publicerar Arbetsmarknadsstyrelsen (AMS) varje månad statistik om "antal<br />
arbetssökande" ( = personer registrerade som arbetssökande vid arbets<strong>för</strong>medlingarna,<br />
<strong>och</strong> som kan ta arbete direkt). AMS : s månadsstatistik är ett bra komplement till AKU,<br />
984<br />
991<br />
992<br />
KS<br />
AKUkv<br />
AKUks<br />
993<br />
AKU<br />
KSP<br />
ESA<br />
LFS<br />
67<br />
994<br />
År/kv<br />
År/kv
68<br />
särskilt genom att den är totalräknad <strong>och</strong> kan brytas ned längre regionalt än AKU:s<br />
urvalbaserade statistik.<br />
Trots de skillnader som <strong>för</strong>eligger mellan statistikkällorna ger de sammantaget en god<br />
bild över sysselsättningen <strong>och</strong> arbetslösheten i landet<br />
5 TILLGÄNGLIGHET <strong>och</strong> FÖRSTÅELIGHET<br />
5.1 Spridningsformer<br />
En <strong>för</strong>sta presentation av de viktigaste månadsresultaten görs i ett pressmeddelande.<br />
Resultat från AKU avseende månad, kvartal <strong>och</strong> år presenteras regelbundet i serien<br />
<strong>Statistiska</strong> meddelanden (SM), undergrupp AM. Med samma periodicitet som SM<br />
publiceras mer detaljerad redovisning i AKU : Grundtabeller, vilka framtas i såväl tryckt<br />
form som på diskett. De kompletteras av de särskilda publikationerna AKU :<br />
Standardavvikelser.<br />
Förutom i tryck finns delar av AKU - statistiken också i SCB : s statistiska databaser<br />
(Tidsseriedatabasen samt Ekonomisk snabbstatistik) samt i Sveriges statistiska<br />
databaser, som (utan kostnad) är åtkomliga via SCB : s hemsida på Internet.<br />
Dessutom framställs på uppdrag s.k. tilläggstabeller, vilka täcker olika användares<br />
speciella behov. Vidare sker redovisning av vissa AKU - resultat SCB - publikationerna<br />
Allmän månadsstatistik, Statistisk årsbok <strong>och</strong> SCB Indikatorer.<br />
<strong>Statistiska</strong> meddelanden (SM) med månadsstatistik utkommer månatligen. Sammanfattande<br />
redovisningar av tidigare års AKU - statistik, med tidsserier <strong>och</strong> redogörelser<br />
<strong>för</strong> definitioner <strong>och</strong> undersökningsmetoder, finns publicerade i SM enligt<br />
följande : För 1961 - 1969 i AM 1969 : 57, <strong>för</strong> 1963 - 1975 i AM 1978 : 32, <strong>för</strong> 1970 - 1980<br />
i AM 1981 : 33, <strong>för</strong> 1976 - 1985 i AM 12 SM 8602, <strong>för</strong> 1980 - 1990 i AM 65 SM 9101,<br />
<strong>för</strong> 1985 - 1994 i AM 65 SM 9501. SM kan beställas från SCB, Publikationstjänsten, 701<br />
89 Örebro, tel : 019 - 176 800, fax: 019 - 176 932. Grundtabeller inkl. standardavvikelser<br />
omfattar cirka 3 000 sidor under ett år. Dessa kan beställas från SCB,<br />
Arbetskraftsundersökningarna (AKU), Box 24 300, 104 51 Stockholm, tel : 08 - 5069<br />
4000, fax : 08 - 5069 4812.<br />
5.2 Presentation<br />
Framgår av detta SM.<br />
5.3 Dokumentation<br />
Nedan anges skrifter, som ger <strong>för</strong>djupad information om AKU. Rapporterna kan erhållas<br />
från SCB, Avdelningen <strong>för</strong> arbetsmarknads- <strong>och</strong> utbildningsstatistik, tel: 08/5069 4000,<br />
fax: 08/5069 4812<br />
Kristiansson K-E (1988): Industrisysselsättningens utveckling. En utredning av skillnaden<br />
mellan AKU <strong>och</strong> NR. Bakgrundsfakta till arbetsmarknadsstatistiken 1988:1.<br />
Wessberg O (1988): Revision av innehåll <strong>och</strong> definitioner i arbetskraftsundersökningarna<br />
(RIDA). Bakgrundsfakta till arbetsmarknadsstatistiken 1988:5.(Finns i engelsk översättning i<br />
Bakgrundsfakta till arbetsmarknadsstatistiken 1989:3.)<br />
Japec L (1992): Förändringar i arbetskraftsundersökningarna. Bakgrundsfakta till arbetsmarknadsstatistiken<br />
1992:1.<br />
Hörngren J (1992): Nytt mätveckssystem i AKU fr o m 1993. PM 1992-04-18.<br />
Hörngren J <strong>och</strong> Larsson M (1992): Bortfallsstudier i AKU. Bakgrundsfakta till arbetsmarknadsstatistiken<br />
1992:7.<br />
Hörngren J (1992): Användning av register som hjälpinformation i arbetskraftsundersökningarna.<br />
PM 1992-10-10. (Finns i engelsk översättning i SCB R&D Report 1992:13).<br />
Larsson M (1994): Studie av centrala intervjuer <strong>och</strong> fältintervjuer i AKU. En jäm<strong>för</strong>else av<br />
bortfall <strong>och</strong> bruttofel. Bakgrundsfakta till arbetsmarknads-<strong>och</strong> utbildningsstatistiken 1994:6.
Henkel M (1994):. Dokument<strong>för</strong>teckning med kommentarer avseende <strong>kvalitets</strong>-<strong>och</strong> utvecklingsarbete<br />
AKU 1970-1992. PM 1994-05-31.<br />
Mirza H (1995): Kvartals-<strong>och</strong> årsskattningar, AKU. PM 1995-10-10.<br />
Mirza H (1995): Volym faktiskt arbetade timmar i AKU. PM 1995-12-08.<br />
Olofsson A. (1996): De svenska arbetskraftsundersökningarna (AKU). Bakgrundsfakta till<br />
arbetsmarknadsstatistiken 1996:2.<br />
Mirza H (1996): En enda uppräkningsvikt i ordinarie AKU. PM 1996-10-07.<br />
Zetterberg J (1997): Flödesstatistik i arbetsmarknadsforskningen. Bakgrundsfakta till<br />
arbetsmarknads- <strong>och</strong> utbildningsstatistiken 1997:2.<br />
Farm A (1997): Arbetslöshet, nyanställningar <strong>och</strong> vakanser i flödesstatistik. Bakgrundsfakta till<br />
arbetsmarknads- <strong>och</strong> utbildningsstatistiken 1997:3. (Finns i engelsk översättning i Bakgrundsfakta<br />
till arbetsmarknads- <strong>och</strong> utbildningsstatistiken 1999:2)<br />
Kristiansson K-E ( 1997): Skattning av brutto<strong>för</strong>ändringar i AKU. PM 1997-04-28 (Finns i engelsk<br />
översättning)<br />
Mirza H <strong>och</strong> Olofsson A: Studie av frågeordningen avseende arbetstider. PM 1997-12-30.<br />
Mirza H, Kristiansson K-E (1999): Skattning av brutto<strong>för</strong>ändringar i AKU. PM 1999-04-27<br />
Andersson C et al: Individ- <strong>och</strong> <strong>för</strong>etagsbaserad sysselsättningsstatistik – en jäm<strong>för</strong>else mellan<br />
AKU <strong>och</strong> KS. PM 2000-10-05.<br />
Mirza H. & Hörngren J. (2001): Urvals- <strong>och</strong> estimations<strong>för</strong>farandet i arbetskraftsundersökningarna<br />
(AKU).<br />
5.4 Tillgång till primärmaterial<br />
Grunduppgifter från AKU lagras i SCB : s gemensamma mikrodatabas, <strong>och</strong> AKU - data<br />
fr.o.m. 1993 finns där. Inläggning av mikrodata sker varje månad, dokumenterade enligt<br />
SCB : s dokumentationssystem SCBDOK.<br />
SCB ut<strong>för</strong> på beställning specialbearbetningar av primärmaterial. Forskare m.fl. kan<br />
efter prövning få tillgång till avidentifierat material <strong>för</strong> egen bearbetning.<br />
5.5 Upplysningstjänster<br />
För ytterligare upplysningar kontakta SCB 08 - 50694000 vx <strong>och</strong> begär AKU eller via e -<br />
post aku@scb.se.<br />
69
Kvalitetsdeklaration av<br />
Prisindex i producent- <strong>och</strong> importled (PPI) år 2000<br />
0 INLEDNING<br />
Prisindex i producent- <strong>och</strong> importled (PPI) mäter <strong>och</strong> redovisar månadsvis den genomsnittliga<br />
prisutvecklingen <strong>för</strong> olika branscher inom jord- <strong>och</strong> skogsbruk, mineralutvinning,<br />
tillverkningsindustrin <strong>och</strong> energiområdet. Priserna avser under månaden genomsnittligt<br />
fakturerade priser på specificerade utvalda varor med konstant kvalitet. Ett urval<br />
om drygt 1 200 <strong>för</strong>etag lämnar uppgifter, som avser det <strong>för</strong>sta distributionsledet, då<br />
varorna levereras från svenska producenter eller kommer in i Sverige. Statistiken<br />
används <strong>för</strong> ekonomisk analys, prisomräkning (deflatering) <strong>och</strong> prisreglering (t.ex.<br />
prisjusteringsklausuler i avtal). – Det finns även årsindextal.<br />
1 STATISTIKENS INNEHÅLL<br />
1.1 <strong>Statistiska</strong> målstorheter<br />
PPI redovisar i indexform prisutveckling i producent- <strong>och</strong> importled med uppdelning på<br />
fem huvudserier.<br />
Varor indelas i tre slag, nämligen<br />
a. inhemskt <strong>för</strong>brukade svensktillverkade varor<br />
b. exporterade varor<br />
c. importerade varor<br />
De fem serierna är<br />
– hemmamarknadsprisindex, som avser a<br />
– exportprisindex, som avser b<br />
– importprisindex, som avser c<br />
– inhemsk produktion, som erhålls genom att sammanväga a <strong>och</strong> b<br />
– prisindex <strong>för</strong> inhemsk tillgång, som erhålls genom att sammanväga a <strong>och</strong> c<br />
(korrigerad med tull- <strong>och</strong> in<strong>för</strong>selavgifter)<br />
Därutöver finns en speciell indexserie <strong>för</strong> petroleumprodukter.<br />
Två klassificeringssystem används. Det ena är en varunomenklatur, benämnd Kombinerad<br />
Nomenklatur (KN), som består av c:a 10 000 varugrupper <strong>och</strong> som är baserad på<br />
en internationell varunomenklatur (Combined Nomenclature, CN). Varje sådan varugrupp<br />
identifieras med ett åttasiffrigt statistiskt nummer (statnr). KN används primärt <strong>för</strong><br />
tulländamål.<br />
Det andra klassificeringssystemet är en näringsgrensindelning <strong>för</strong> klassificering av produktionsenheter,<br />
nämligen 1992 års standard <strong>för</strong> svensk näringsgrensindelning (SNI 92).<br />
Denna svenska indelning har som bas EUs näringsgrensstandard i dess reviderade<br />
version NACE Rev.1, vilken i sin tur är samordnad med FNs näringsgrensstandard ISIC<br />
Rev.3. Indelningen <strong>för</strong> produktionsenheter kan uttryckas i termer av de produkter som<br />
aktivitetsarterna resulterar i, <strong>och</strong> denna produktindelning benämns Prod-SNI. Nedan<br />
används termen bransch, <strong>och</strong> delvis även SNI, rätt fritt, t.ex. utan att strikt skilja på de<br />
båda bemärkelserna (enheter <strong>och</strong> produkter). SNI 92 har fem nivåer som anges med en<br />
sifferkod med en siffra per nivå. I PPI-systemet används en finare indelning med<br />
ytterligare en nivå. Det finns även bokstavskoder <strong>för</strong> högre nivåer. Den översta nivån<br />
kallas avdelning.<br />
Klassificeringssystemen hör ihop genom att varje statnr tillhör en viss bransch. Det finns<br />
dock några kombinationer av KN <strong>och</strong> SNI där denna koppling inte är uppenbar.<br />
71
72<br />
1.1.1 Objekt <strong>och</strong> population<br />
Objekten i PPI är varugrupper. Populationen utgörs av alla varugrupper (statnr) som hör<br />
till följande branscher, uttryckta i produkttermer.<br />
SNI-avdelning Benämning<br />
A produkter från jord- <strong>och</strong> skogsbruk<br />
B fisk<br />
C produkter från utvinning av mineral<br />
D industriprodukter<br />
E el, gas, värme <strong>och</strong> vatten<br />
En varugrupp (ett statnr) kan innehålla många varor. Det är varor som prismäts. Dessa<br />
varor identifieras genom verbala beskrivningar <strong>och</strong> ofta artikelnummer. Se vidare p.<br />
2.2.3.<br />
Ytterligare ett objekt i PPI, vilket används <strong>för</strong> urval <strong>och</strong> insamling av uppgifter, är <strong>för</strong>etag,<br />
se vidare p. 2.2.1.<br />
1.1.2 Variabler<br />
PPI:s huvudvariabel är producentpris (vid import importpris), som är det pris som<br />
producenten erhåller <strong>för</strong> en vara vid <strong>för</strong>säljning i <strong>för</strong>sta ledet. Priset ska avse fritt fabrik<br />
<strong>för</strong> svensk marknad <strong>och</strong> fob (free on board) <strong>för</strong> export. Vid import är priset cif (cost,<br />
insurance, freight). Priset ska vara genomsnittligt fakturerat pris per enhet under<br />
månaden. Mervärdesskatt <strong>och</strong> andra varuskatter ingår ej, dock gäller <strong>för</strong> indexserien <strong>för</strong><br />
petroleumprodukter att miljö- <strong>och</strong> energiskatter adderas till priset.<br />
Utöver det genomsnittliga priset, undersökningens huvudvariabel, ska uppgifter som<br />
gäller export <strong>och</strong> import lämnas om faktureringsvaluta <strong>och</strong> rapporteringsvaluta (priset<br />
kan lämnas i svenska kronor eller utländsk valuta) <strong>och</strong> om importland.<br />
1.1.3 <strong>Statistiska</strong> mått<br />
PPI kan grovt beskrivas som ett kedjat prisindex av typen Laspeyres. Ett okedjat<br />
prisindex av typen Laspeyres kan schematiskt skrivas på nedanstående sätt, där P betecknar<br />
enhetspris, Q betecknar kvantitet <strong>och</strong> summeringen görs över varugrupper (indiceras<br />
med k). Det är en jäm<strong>för</strong>else mellan priser vid tidpunkten t <strong>och</strong> bastidpunkten 0.<br />
Kvantiteterna Q betraktas som kända, medan priserna P mäts.<br />
I<br />
0t<br />
∑ P Q<br />
k =<br />
∑ P Q<br />
k<br />
tk 0k<br />
0k 0k<br />
Dessutom ingår en faktor 100, så att indexvärdet vid bastidpunkten är 100. Ett prisindex<br />
av denna typ kan skrivas som ett vägt medelvärde av prisutvecklingar enligt nedan, där<br />
V är produkten av enhetspris <strong>och</strong> kvantitet; V = P Q, så V är värdet. Vikten W 0k <strong>för</strong> den<br />
k:te varugruppen är dess relativa värde vid bastidpunkten.<br />
tk<br />
I0t W0k k 0k<br />
P<br />
V<br />
= ∑ med W0k<br />
=<br />
P<br />
∑ V<br />
Ovanstående index har en fast bas. Ett kedjeindex med länkning vid tidpunkterna<br />
1, 2, ... , (t-1) kan i sin enklaste form skrivas schematiskt på nedanstående sätt.<br />
t<br />
'<br />
I0t =∏I(s-1)s<br />
s=1<br />
Vikterna ändras successivt, <strong>och</strong> vid tidpunkten s avser de den närmast <strong>för</strong>egående tidpunkten<br />
(s-1). PPI är ett kedjeindex med årslänkar. Vikterna avser år, <strong>och</strong> priser mäts<br />
per månad. I den sista länken i månads-PPI jäm<strong>för</strong>s månaden i fråga med <strong>för</strong>egående<br />
december. Årsindex bildas genom att ta årsmedelvärdet.<br />
k<br />
0k<br />
0k
1.1.4 Redovisningsgrupper<br />
Indexvärden redovisas <strong>för</strong> var <strong>och</strong> en av de fem huvudserierna med <strong>för</strong>delning på<br />
branscher. Detaljeringsgraden i redovisningen i <strong>Statistiska</strong> meddelanden är minst 2siffer-bransch;<br />
flera branscher redovisas dock med finare indelning. I Sveriges<br />
<strong>Statistiska</strong> Databaser redovisas indexserierna t.o.m. nivån 4-siffer-bransch.<br />
De fem huvudserierna redovisas också med uppdelning på konsumtions-, insats-,<br />
investerings- samt energirelaterade varor. Indexserien <strong>för</strong> petroleumprodukter redovisas<br />
med uppdelning på fyra bränsleslag.<br />
1.1.5 Referenstider<br />
Indextalen avser en månad samt år <strong>för</strong> det beräknade årsmedelvärdet, årsindex. Basåret<br />
är 1990 (årsmedelvärdet).<br />
1.2 Fullständighet<br />
Prisindexar <strong>för</strong> ytterligare näringsgrenar (tjänstebranscher) är under uppbyggnad, även<br />
där avseende producentledet.<br />
2 STATISTIKENS TILLFÖRLITLIGHET<br />
2.1 Till<strong>för</strong>litlighet totalt<br />
Det är inte möjligt att ange osäkerhetsmarginaler <strong>för</strong> de beräknade indexvärdena främst<br />
<strong>för</strong> att PPI:s urval är subjektivt <strong>och</strong> inte slumpmässigt.<br />
2.2 Osäkerhetskällor<br />
Bland osäkerhetskällorna som beskrivs nedan torde mätfel <strong>och</strong> urval ge de största bidragen<br />
till osäkerheten.<br />
2.2.1 Urval<br />
Statistiken baseras på ett urval av varugrupper. Urvalet görs i tre steg.<br />
I <strong>för</strong>sta steget väljs de varugrupper (statnr) som ska ingå i undersökningen. Den årliga<br />
statistiken <strong>för</strong> industrins varuproduktion (IVP) <strong>och</strong> utrikeshandelsstatistiken (UHS) ger<br />
tillsammans varuproduktions-, export- <strong>och</strong> importvärden per statnr <strong>och</strong> därmed SNI.<br />
Härur beräknas värden <strong>för</strong> hemmamarknaden, se vidare p. 2.2.2. Alla SNI-grupper på<br />
femsiffernivå som har ett årsvärde på mer än 250 miljoner kronor (mkr) i löpande priser<br />
ingår i princip. På denna SNI-nivå väljs ett antal statnr subjektivt med målsättningen att<br />
de ska ha ett stort värde <strong>och</strong> vara representativa vad gäller prisutveckling <strong>för</strong> den SNIgrupp<br />
de tillhör. Ett statnr med ett årsvärde på mer än 350 mkr ingår i princip alltid i<br />
urvalet. Vid kontakter med <strong>för</strong>etag som säljer skräddarsydda varor kan det dock visa sig<br />
omöjligt att få priser <strong>för</strong> jäm<strong>för</strong>bara produkter. Flera statnr kan <strong>för</strong>as samman till en<br />
grupp.<br />
I andra steget används register från IVP <strong>och</strong> UHS med <strong>för</strong>etag (tillverkare <strong>och</strong><br />
importörer) <strong>för</strong> de i <strong>för</strong>sta steget utvalda varugrupperna. Målsättningen här är att välja<br />
<strong>för</strong>etag med stora värden.<br />
I tredje steget väljs representantvaror, som är väl specificerade varor inom varugrupp.<br />
Det görs efter samråd med uppgiftslämnaren på <strong>för</strong>etaget. Strävan är att varan ska ha en<br />
prisutveckling som är ett genomsnitt <strong>för</strong> varugruppen, ha ett stort värde <strong>och</strong> helst<br />
<strong>för</strong>säljning varje månad. I synnerhet det <strong>för</strong>sta kravet är svårt att bedöma i <strong>för</strong>väg.<br />
In<strong>för</strong> varje kalenderår gås urvalet igenom med bl.a. en översyn av varugrupper där stora<br />
<strong>för</strong>ändringar framkommit. Urvalet modifieras dessutom fortlöpande, främst beroende på<br />
att varor utgår, <strong>och</strong> det kompletteras årligen i synnerhet <strong>för</strong> snabbt expanderande<br />
branscher.<br />
73
74<br />
Antalet insamlade prisuppgifter varje månad är c:a 1 800 <strong>för</strong> svenska marknaden, c:a<br />
1 000 <strong>för</strong> exportmarknaden <strong>och</strong> c:a 1 400 <strong>för</strong> importmarknaden. Drygt 1 200 <strong>för</strong>etag<br />
lämnar uppgifter. För många redovisningsgrupper är antalet prisuppgifter litet <strong>och</strong><br />
publiceras inte på grund av gällande sekretessregler.<br />
Det kan finnas flera prisuppgifter <strong>för</strong> ett statnr genom att flera <strong>för</strong>etag lämnar uppgift<br />
<strong>och</strong>/eller genom att varugruppen representeras av flera varor. Prisutvecklingen <strong>för</strong> en<br />
sådan varugrupp beräknas som ett vägt medelvärde av de enskilda uppgifterna.<br />
Årsvärden <strong>för</strong> valda <strong>för</strong>etag används normalt <strong>för</strong> att bilda vikter (se även p. 2.2.2). Om<br />
ett <strong>för</strong>etag lämnar flera uppgifter, så delas <strong>för</strong>etagets vikt oftast i lika delar.<br />
2.2.2 Ramtäckning<br />
In<strong>för</strong> kalenderårsskifte görs en sambearbetning av flera underlag <strong>för</strong> att få fram såväl en<br />
ram <strong>för</strong> urval som vikter till index. Underlag fås från UHS, från IVP avseende SNIavdelningarna<br />
C <strong>och</strong> D, från den årliga energistatistiken avseende avdelning E samt från<br />
Statens Jordbruksverk avseende avdelningarna A <strong>och</strong> B. Uppgifterna avser året <strong>för</strong>e det<br />
enligt indexkonstruktionen önskvärda året. UHS ger uppgifter om export <strong>och</strong> import,<br />
medan övriga underlag avser produktion, <strong>för</strong>säljning eller liknande. Värden <strong>för</strong><br />
hemmamarknaden måste härledas.<br />
IVP samlar in uppgifter om <strong>för</strong>säljning av egentillverkade varor vid arbetsställen inom<br />
industri<strong>för</strong>etag med minst tjugo anställda <strong>och</strong> industriarbetsställen med minst tjugo<br />
anställda inom andra <strong>för</strong>etag; <strong>för</strong> några enstaka branscher gäller minst tio anställda.<br />
Modellskattningar görs <strong>för</strong> gruppen 10-19 anställda därutöver, likaså <strong>för</strong> svarsbortfall<br />
(men ej mindre <strong>för</strong>etag). Det sker med hjälp av ett administrativt material (standardiserade<br />
räkenskapsutdrag) från Riksskatteverket (RSV). Detta material ger en total <strong>för</strong>säljning<br />
per <strong>för</strong>etag, vilken sedan inom IVP <strong>för</strong>delas till statnr-nivån. – Värdena i IVP ska<br />
avse kalenderår, men räkenskapsår <strong>för</strong>ekommer.<br />
Beträffande UHS täcks all export <strong>och</strong> import med länder utan<strong>för</strong> EU via tulluppgifter.<br />
För handel med länder inom EU insamlas uppgifter blankettvägen från <strong>för</strong>etag med<br />
ut<strong>för</strong>sel- respektive in<strong>för</strong>selvärden om minst 1.5 mkr på tolv månader. Från <strong>för</strong>etag med<br />
värden under 1.5 mkr <strong>och</strong> <strong>för</strong>etag med bortfall skattas uppgifter via RSVs momsregister<br />
<strong>och</strong> modeller <strong>för</strong> varu<strong>för</strong>delning.<br />
En del skillnader i definitioner <strong>och</strong> täckning mellan underlagen framgår av de korta<br />
beskrivningarna ovan. Även om IVP i sig har med t.ex. reparationer <strong>och</strong> installationer,<br />
så har PPI av tradition exkluderat dessa delar utom <strong>för</strong> SNI 22, <strong>för</strong>lagsverksamhet. Om<br />
varuklassificeringen i något underlag är felaktig, så blir det en fortplantning av fel till<br />
PPI. Både vikter <strong>och</strong> urval påverkas. Särskilt differenserna mellan värden i IVP <strong>och</strong><br />
UHS <strong>för</strong> hemmamarknaden är känsliga. Det <strong>för</strong>ekommer att negativa differenser mellan<br />
värden i IVP <strong>och</strong> UHS sätts till noll <strong>och</strong> att klassificeringar korrigeras. Exporterade<br />
varor behöver dock inte vara producerade i landet utan kan vara s.k. reexport. Viss<br />
justering görs <strong>för</strong> detta.<br />
Ytterligare en täckningsbrist i PPI, vilken delvis beror på underlagen, uppkommer<br />
genom eftersläpning i tid i in<strong>för</strong>ande av nya varor <strong>och</strong> borttagande av <strong>för</strong>åldrade.<br />
Kontakter med valda <strong>för</strong>etag kan dock ge uppgifter även om nya varor.<br />
Felkällan ramtäckning torde som helhet ge ett relativt måttligt bidrag till osäkerheten.<br />
2.2.3 Mätning<br />
Det finns flera mätsvårigheter. En sådan gäller att priset i princip ska avse samma vara<br />
över tiden <strong>och</strong> inte inkludera <strong>kvalitets</strong><strong>för</strong>ändringar. Om kvaliteten ändras går det<br />
vanligen inte att få reda på hur priset påverkas <strong>och</strong> på så sätt beräkna prisändringen vid<br />
o<strong>för</strong>ändrad produktionsmetod. I stället används som regel några olika metoder, beroende<br />
på information, <strong>för</strong> att rensa bort effekten på priset. Om det inte är möjligt att få<br />
prisuppgift på både den gamla <strong>och</strong> nya varan under samma period, betraktas varorna<br />
som två olika varor <strong>och</strong> pris<strong>för</strong>ändringen <strong>för</strong> skiftet sätts därmed till noll. I de fall båda
varuvarianterna säljs under samma tid, kan priser <strong>och</strong> prisutveckling länkas samman. –<br />
För persondatorer används <strong>för</strong> <strong>kvalitets</strong>värdering en metod kallad hedonisk regression.<br />
En andra mätsvårighet ligger i att priser ska vara fakturerade priser. I vissa branscher ger<br />
många uppgiftslämnare listpriser. Vidare ska rabatter vara fråndragna men är det inte<br />
alltid. Vid analys av prisutveckling under begränsad tid, 1-3 år, är detta ett problem,<br />
särskilt inom livsmedelsbranschen, där listpriser är vanligt <strong>för</strong>ekommande. I en situation<br />
då t.ex. minskad efterfrågan eller ökad konkurrens leder till ökade inslag av rabatter, så<br />
överskattar ett index baserat på listpriser den verkliga prisutvecklingen.<br />
En tredje mätsvårighet gäller rapportering i utländska valutor. Det ideala vore att räkna<br />
om export- <strong>och</strong> importpriser enligt de kurser som faktiskt tillämpats mellan köpare <strong>och</strong><br />
säljare under mätmånaden. I de fall priser rapporteras i utländsk valuta används<br />
Tullverkets växelkurser <strong>för</strong> valutaomräkningen. Dessa kurser baseras på dagskursen<br />
tredje onsdagen månaden <strong>för</strong>e PPIs mätmånad, med viss korrigering <strong>för</strong> kurser som<br />
avvikit med mer än 5 % under mätmånaden. Anledningen till att denna metod används i<br />
stället <strong>för</strong> t.ex. Riksbankens genomsnittskurser under månaden, är i <strong>för</strong>sta hand att<br />
nationalräkenskaperna (NR) kräver samma omräkningsmetod <strong>för</strong> PPI som utrikeshandelsstatistiken<br />
använder. Totalt lämnas c:a 15 % av samtliga exportuppgifter <strong>och</strong> c:a<br />
25 % av samtliga importuppgifter i utländsk valuta, medan övriga priser är i svenska<br />
kronor. Vidare <strong>för</strong>ekommer i de fall uppgiftslämnaren själv gör valutaomräkningen ofta<br />
att valutasäkringar eller <strong>för</strong>utbestämda kurser o.dyl. används, vilket ej blir korrekt.<br />
Felkällan mätning torde tillsammans med urval ge det största bidraget till osäkerheten.<br />
2.2.4 Svarsbortfall<br />
Det <strong>för</strong>eligger skyldighet enligt lag <strong>för</strong> <strong>för</strong>etagen att lämna prisuppgifter. Svarsbortfallet<br />
<strong>för</strong> en normal månad brukar vara 1-2 % av prisuppgifterna. Bortfallet beror i regel inte<br />
på vägran, utan på att kontaktpersonen inte är anträffbar. Detta gör att bortfallet är större<br />
<strong>för</strong> mätmånaderna juni <strong>och</strong> juli än <strong>för</strong> andra månader. Den låga bortfallsandelen beror<br />
delvis på att i urvals<strong>för</strong>farandet ingår en telefonkontakt <strong>för</strong> att precisera vara;<br />
uppgiftslämnandet motiveras.<br />
Vid bortfall används (imputeras) <strong>för</strong>egående månads prisuppgift. Detta gäller även i de<br />
fall ingen <strong>för</strong>säljning eller import <strong>för</strong>ekommit under månaden. Detta kan med<strong>för</strong>a en<br />
olycklig eftersläpning, <strong>och</strong> det finns planer på att ändra <strong>för</strong>farandet till att använda<br />
”besläktade” inkomna uppgifter om prisuveckling <strong>för</strong> samma månad.<br />
Denna felkälla torde ge ett relativt måttligt bidrag till osäkerheten.<br />
2.2.5 Bearbetning<br />
De insamlade prisuppgifterna granskas dels enskilt, dels på aggregerad nivå. Vid<br />
insamling via TDE (touchtone data entry; knapptelefon) finns också en speciell kontroll<br />
inbyggd i dialogen. Denna gör uppgiftslämnaren medveten om när priserna <strong>för</strong>ändrats<br />
mer än 5 % från <strong>för</strong>ra månaden, <strong>och</strong> då ges möjlighet att korrigera priset eller tala in<br />
anledningen till pris<strong>för</strong>ändringen. Vid oklarheter tas kontakt med uppgiftslämnaren.<br />
Denna felkälla torde ge ett relativt litet bidrag till osäkerheten.<br />
2.2.6 Modellantaganden<br />
De vikter som används i indexberäkningen ska idealt vara relativa värden <strong>för</strong>egående år.<br />
Det finns ej så aktuella värden i IVP <strong>och</strong> UHS, utan endast årsvärden avseende året<br />
dess<strong>för</strong>innan. Dessa värden skrivs fram med prisutvecklingen enligt PPI inom<br />
varugruppen det senaste året. I detta <strong>för</strong>farande ligger ett modellantagande om att<br />
kvantiteterna har <strong>för</strong>ändrats med samma faktor <strong>för</strong> alla varor. Den beräknade<br />
prisutvecklingen beaktar ej säsongvariationer i kvantiteter.<br />
Om det saknas representantvaror <strong>för</strong> en bransch med årsvärdet över 250 mkr eller en<br />
varugrupp (statnr) med årsvärdet över 350 mkr, så läggs i allmänhet en ”vara” in i<br />
observationsregistret med tillhörande vikt. En form av modellberoende skattning görs<br />
75
76<br />
<strong>för</strong> denna ”vara” genom att priserna får följa en annan utvald prisutveckling. Därvid<br />
väljs en annan bransch (eller samma bransch på en annan marknad), den bransch som<br />
<strong>för</strong>väntas ha den mest likartade prisutvecklingen som den saknade branschens eller<br />
varugruppens.<br />
Denna felkälla torde ge ett visst bidrag till osäkerheten.<br />
2.3 Redovisning av osäkerhetsmått<br />
Ingen redovisning.<br />
3 STATISTIKENS AKTUALITET<br />
3.1 Frekvens<br />
Både undersökning <strong>och</strong> publicering är månatliga. Dessutom publiceras årligen<br />
indextal avseende kalenderår.<br />
3.2 Framställningstid<br />
Statistiken publiceras kl. 10.00 c:a 25 dagar efter månadens slut, dock något senare <strong>för</strong><br />
januari på grund av urvalsbyte. Årsindex publiceras efter ungefär 1½ månad.<br />
3.3 Punktlighet<br />
Publiceringen följer publiceringsplanen; bara något mycket enstaka undantag har<br />
funnits.<br />
4 JÄMFÖRBARHET <strong>och</strong> SAMANVÄNDBARHET<br />
4.1 Jäm<strong>för</strong>barhet över tiden<br />
En väsentlig definitions<strong>för</strong>ändring har gjorts genom att index ändrats från fastbasindex,<br />
som användes under perioden 1968-1979, till kedjeindex fr.o.m. 1980.<br />
Den tidigare branschindelningen SNI 69 användes <strong>för</strong> PPI t.o.m. 1994. Index med<br />
branschindelning enligt SNI 92 finns fr.o.m. 1990. I denna serie har index <strong>för</strong> perioden<br />
1990-1994 åstadkommits med tillbakaräkning. Den som vill ha en sammanhängande indexserie<br />
gör <strong>för</strong> månadsindex lämpligast länkningen vid december 1994 <strong>och</strong> <strong>för</strong> årsmedelvärdena<br />
vid året 1994.<br />
Byte av varunomenklatur har gjorts dels <strong>för</strong> mätåret 1988, från CCCN- till HS-nomenklaturen,<br />
dels <strong>för</strong> mätåret 1998 från HS- till KN-nomenklaturen. Dessa <strong>för</strong>ändringar<br />
påverkar inte den publicerade indelningen, men de har <strong>för</strong>svårat viktberäkningarna.<br />
4.2 Jäm<strong>för</strong>barhet mellan grupper<br />
Behovet av samordnade definitioner <strong>för</strong> PPI inom medlemsländerna i EU finns fastlagda<br />
i <strong>för</strong>ordning om konjunkturstatistik antagen av EU:s råd (<strong>för</strong>ordning 1164/98, maj<br />
1998). Samordningen behövs bl.a. <strong>för</strong> att på ett jäm<strong>för</strong>ande sätt kunna bedöma <strong>och</strong><br />
redovisa den ekonomiska utvecklingen i länderna.<br />
I utrikeshandelsstatistiken publiceras kvartalsvisa prisindexar <strong>för</strong> export- <strong>och</strong><br />
importvaror, vilka bygger på beräkningar av dels enhetspriser <strong>för</strong> homogena varor ur<br />
UHS, dels uppgifter från PPI-systemet (export- <strong>och</strong> importprisindex) <strong>för</strong> övriga<br />
varuområden. Dessa prisindexar är av typen Paasche (kvantiteterna avser den aktuella<br />
tidpunkten) <strong>och</strong> redovisas med uppdelning enligt varunomenklaturen SITC Rev.3<br />
(Standard International Trade Classification).<br />
4.3 Samanvändbarhet med annan statistik<br />
PPI används <strong>för</strong> deflatering (fastprisberäkning) i NR, UHS <strong>och</strong> i annan kortperiodisk<br />
<strong>och</strong> årlig ekonomisk statistik. Indelningar <strong>och</strong> standarder överensstämmer, med vissa<br />
mindre undantag, av vilka de viktigaste angetts ovan.
PPI – eller snarare gruppen konsumtionsvaror inom serien <strong>för</strong> inhemsk tillgång – tas<br />
ibland som en prognos på prisutvecklingen av konsumentprisindex (KPI). Jäm<strong>för</strong>elser<br />
av PPI <strong>och</strong> KPI är dock vanskliga att göra till följd av skillnaderna dem emellan. Det<br />
<strong>för</strong>eligger en tids<strong>för</strong>dröjning från produktion till <strong>för</strong>säljning i detaljhandel, <strong>och</strong> den kan<br />
variera mellan varugrupper. De konsumtionsvaror som prismäts i PPI går inte enbart till<br />
detaljhandeln, som mäts av KPI, utan även till exempelvis storhushåll. Dessutom<br />
används olika modeller i beräkningarna. Detta ger en systematisk skillnad: indextalet<br />
enligt KPI blir lägre.<br />
5 TILLGÄNGLIGHET <strong>och</strong> FÖRSTÅELIGHET<br />
5.1 Spridningsformer<br />
Statistiken görs tillgänglig via pressmeddelande, Statistiskt meddelande (månad <strong>och</strong> år)<br />
med beteckningen P 10 SM, Allmän månadsstatistik, SCB-Indikatorer, tidningen<br />
Byggindex, SCB:s webbsida <strong>och</strong> Sveriges <strong>Statistiska</strong> Databaser (SSD). Vissa <strong>för</strong>ändringstal<br />
(avseende export-, import- <strong>och</strong> producentprisindex) läggs ut elektroniskt i Ekonomisk<br />
snabbstatistik i samband med publiceringen. Den mest ut<strong>för</strong>liga publiceringen<br />
görs i SSD, indexserier på minst nivån 4-siffer-bransch. Ytterligare indexserier, på 5-<br />
<strong>och</strong> 6-siffer-bransch, så långt sekretesskraven tillåter, hålls tillgängliga på datalistor<br />
inom SCB <strong>och</strong> kan erhållas genom kontakt med programmet Priser.<br />
5.2 Presentation<br />
Framgår av publiceringen.<br />
5.3 Dokumentation<br />
Det finns en speciell, av International Monetary Fund (IMF) standardiserad dokumentation,<br />
över PPI. Den är tillgänglig på IMFs hemsida under adress<br />
http://dsbb.imf.org/country<br />
Prisindex i producent- <strong>och</strong> importled, version 1, januari 1991, SCB. Översiktlig<br />
beskrivning av statistikproduktionen.<br />
Prisindex i producent- <strong>och</strong> importled, innehålls- <strong>och</strong> metodbeskrivning, augusti 1991,<br />
SCB. Beskriver bl.a. indexsystemets uppbyggnad <strong>och</strong> redovisar vägningstal.<br />
Using Hedonic Regression for Computer Equipment in the Producer Price Index, R & D<br />
Report 1989:25, SCB. Beskrivning på engelska av användningen av s.k. hedonisk<br />
regression <strong>för</strong> <strong>kvalitets</strong>värdering av persondatorer.<br />
5.4 Tillgång till primärmaterial<br />
Det finns möjligheter <strong>för</strong> användare att enligt en särskild prislista få specialbearbetningar<br />
gjorda i form av aggregeringar till bransch- <strong>och</strong> varugruppsnivåer.<br />
Primärmaterial hålls tillgängliga <strong>för</strong> forskare efter särskilt tillstånd.<br />
5.5 Upplysningstjänster<br />
Upplysningar om <strong>och</strong> frågor rörande PPI kan fås genom att ta kontakt med prisprogrammets<br />
jourtelefon 08-506 944 68 eller via e-mail med adress priser@scb.se. Även<br />
den centrala informationsservicen vid SCB kan kontaktas.<br />
77
78<br />
Kvalitetsdeklaration av<br />
Gödselmedel i jordbruket 1997<br />
Förbrukningsstatistik genom intervjuer<br />
0 INLEDNING<br />
SCB:s Gödselmedelsundersökningar (GU) inleddes 1988 med syfte att få fram kunskap<br />
om användningen av handels- <strong>och</strong> stallgödsel regionalt <strong>och</strong> <strong>för</strong> enskilda grödor. Sådan<br />
kunskap behövs i <strong>för</strong>sta hand <strong>för</strong> uppföljning av uppsatta miljömål, som underlag <strong>för</strong><br />
näringsläckageberäkningar till luft <strong>och</strong> vatten <strong>och</strong> <strong>för</strong> rådgivning inom växtnäringsområdet.<br />
Ur miljösynpunkt är <strong>för</strong>lusterna av kväve <strong>och</strong> fosfor av störst betydelse. För att få till<br />
stånd en minskning av <strong>för</strong>lusterna omfattas svenskt jordbruk av flera miljöpolitiska<br />
beslut.<br />
GU följde från början de objektiva skördeuppskattningarna, <strong>och</strong> därtill hörande urval.<br />
Från 1995 har ett helt eget urval dragits. In<strong>för</strong> 1997 års undersökning gjordes en översyn<br />
i samråd med bl.a. Jordbruksverket, Lantbruksuniversitetet, Jordbrukstekniska institutet<br />
<strong>och</strong> Naturvårdsverket. Syftet med översynen var främst att <strong>för</strong>bättra statistiken över<br />
stallgödselhanteringen, som bl.a. har relevans <strong>för</strong> ammoniakavgång till luft <strong>och</strong><br />
näringsläckage.<br />
1 STATISTIKENS INNEHÅLL<br />
1.1 <strong>Statistiska</strong> målstorheter<br />
Det finns två huvudgrupper av statistiska målstorheter. Den ena gäller de kvantiteter av<br />
olika näringsämnen som till<strong>för</strong>s åker- <strong>och</strong> betesmark genom handels- <strong>och</strong> stallgödsel.<br />
Två exempel i denna grupp är total mängd till<strong>för</strong>d växttillgängligt kväve till åkermarken<br />
inom ett område <strong>och</strong> hektargivan <strong>för</strong> kalium på endast handelsgödslad areal. Den andra<br />
huvudgruppen gäller olika aspekter på stallgödsel: hanteringssätt, lagringskapacitet,<br />
spridningsteknik <strong>och</strong> -intensitet, anskaffning/leverans, stallperiodens längd <strong>för</strong><br />
nötkreatur. Ett exempel här är andel stallgödslad areal.<br />
1.1.1 Objekt <strong>och</strong> population<br />
Objekten är av två typer: lantbruks<strong>för</strong>etag <strong>och</strong> fält hos lantbruks<strong>för</strong>etag. Ett fält är<br />
antingen åkermark eller betesmark. Företagen tilldelas ett storleksmått, som kallas<br />
standardarbetstid <strong>och</strong> beräknas från arbetskraftsbehov. Den ena målpopulationen utgörs<br />
av alla lantbruks<strong>för</strong>etag med en standardarbetstid om minst 150 timmar, <strong>och</strong> den andra<br />
målpopulationen är all åker- <strong>och</strong> betesmark hos dessa <strong>för</strong>etag.<br />
1.1.2 Variabler<br />
• Mängd använd handelsgödsel av olika sorter på åkermark <strong>och</strong> betesmark utan<strong>för</strong><br />
åkermark<br />
• Mängd använd stallgödsel på åkermark <strong>och</strong> betesmark<br />
• Mängd kväve, fosfor, kalium resp. svavel som sprids på åker- <strong>och</strong> betesmark<br />
• Spridningstekniker <strong>för</strong> stallgödsel<br />
• Grödarealer <strong>för</strong> cirka 25 olika grödslag<br />
• Lagringskapacitet <strong>och</strong> hanteringssätt <strong>för</strong> stallgödsel från olika djurslag<br />
• Anskaffning/leverans av stallgödsel, användning av avloppsslam <strong>och</strong> andra organiska<br />
produkter<br />
• Typ av gödselhanteringsanläggning <strong>för</strong> olika djurslag
• Stallperiodens längd <strong>för</strong> nötkreatur<br />
• Spridningsintervall <strong>för</strong> stallgödsel<br />
1.1.3 <strong>Statistiska</strong> mått<br />
<strong>Statistiska</strong> mått är dels summor <strong>och</strong> medelvärden, dels andelar, se exempel ovan.<br />
1.1.4 Redovisningsgrupper<br />
Den finaste geografiska redovisningen i SM:et är län, i övriga fall sker redovisning <strong>för</strong><br />
produktionsområden eller <strong>för</strong> hela riket. För grödor sker redovisningen antingen uppdelat<br />
på enskilda grödor enligt indelningen hos LBR, eller på fyra ackumulerade grödgrupper<br />
(samtliga åkergrödor, spannmål, slåttervall <strong>och</strong> övriga åkergrödor).<br />
Redovisning sker, när så är relevant, <strong>för</strong> olika slag av husdjur, såsom mjölkkor, övriga<br />
nötkreatur, suggor <strong>och</strong> galtar, slaktsvin samt fjäderfä.<br />
Andra indelningar är efter näringsämnen (kväve, fosfor, kalium, svavel) <strong>och</strong> storleksgrupper<br />
(ha åker).<br />
1.1.5 Referenstider<br />
Statistik om gödselanvändning avser ett gödselår, här 1996-97. Detta gödselår börjar<br />
1996 i <strong>och</strong> med gödslingen in<strong>för</strong> höstsådden <strong>och</strong> avslutas med skörden på sommaren/<br />
hösten 1997. Tidsperioden innefattar all gödsling <strong>för</strong> de grödor som skördas under denna<br />
säsong.<br />
För hanteringssätt <strong>och</strong> lagringskapacitet gäller uppgifterna den 10 juni.<br />
Referenstiden <strong>för</strong> stallperiod är 1 juli 1996 – 30 juni 1997.<br />
1.2 Fullständighet<br />
Undersökningen täcker <strong>och</strong> beskriver gödselmedelsanvändning <strong>och</strong> -hantering. Om man<br />
vill beskriva växtnäring i ett vidare miljöperspektiv, är statistiken i behov av komplettering.<br />
Exempelvis behövs <strong>för</strong> gårdarna i populationen bättre uppgifter om jordarter, samt<br />
mer kunskap om utfodring av husdjuren.<br />
2 STATISTIKENS TILLFÖRLITLIGHET<br />
2.1 Till<strong>för</strong>litlighet totalt<br />
Statistiken om handelsgödsel får anses tämligen säker. Större osäkerhet råder i statistiken<br />
om stallgödsel, då stallgödselgivor är svårare <strong>för</strong> lantbrukarna att kvantifiera, samtidigt<br />
som omräkningsfaktorerna <strong>för</strong> olika näringsämnen är mer osäkra.<br />
2.2 Osäkerhetskällor<br />
2.2.1 Urval<br />
Urvalsram är Lantbruksregistret, LBR, (med totalt cirka 90 000 lantbruks<strong>för</strong>etag) exklusive<br />
<strong>för</strong>etag med en standardarbetstid mindre än 150 timmar per år. Ramen stratifieras<br />
i 8 strata per län efter driftsinriktning, totalt 192 strata. Urvalsmetoden avseende<br />
lantbruks<strong>för</strong>etag är ett stratifierat urval med pps inom strata: urvalssannolikheten är<br />
inom varje stratum proportionell mot storleken, <strong>för</strong>etagets standardarbetstid. Inom varje<br />
lantbruks<strong>för</strong>etag väljs sedan <strong>för</strong> varje gröda det största fältet ut. Det <strong>för</strong>stnämnda urvalet<br />
bestod av cirka 3 950 <strong>för</strong>etag.<br />
Skattnings<strong>för</strong>farandet använder gängse formler <strong>för</strong> urvalsmetoden, där urvalssannolikheterna<br />
beror av stratum <strong>och</strong> storlek inom stratum. Justering görs <strong>för</strong> bortfall men inte<br />
<strong>för</strong> täckningsbrister, se nedan.<br />
Tidigare har urvalsfel redovisats <strong>för</strong> hektargivorna. Typiska medelfel var då 1-5 % på<br />
riksnivå, på länsnivå cirka 2-3 gånger större. Detta avser svarande <strong>för</strong>etag efter justering<br />
<strong>för</strong> bortfall.<br />
79
80<br />
2.2.2 Ramtäckning<br />
LBR, som används som ram efter att små <strong>för</strong>etag tagits bort, beräknas ha ytterst små<br />
täckningsfel. I <strong>och</strong> med att urvalet till GU dras från <strong>för</strong>egående års register kan lantbruks<strong>för</strong>etag<br />
ha <strong>för</strong>ändrats i <strong>för</strong>hållande till uppgifterna i LBR. Detta bedöms mestadels<br />
ha endast liten betydelse <strong>för</strong> skattningarna.<br />
Det finns en undertäckning genom nystartade lantbruks<strong>för</strong>etag. Dessa uppskattas utgöra<br />
högst 3 % av <strong>för</strong>etagspopulationen antalsmässigt. I skattnings<strong>för</strong>farandet görs ingen<br />
kompensation <strong>för</strong> denna undertäckning Den övertäckning i urvalet som utgörs av nedlagda<br />
lantbruks<strong>för</strong>etag ges nollvärden i skattnings<strong>för</strong>farandet. Den population som<br />
skattningarna avser är därmed något mindre än målpopulationen. Se även Svarsbortfall<br />
nedan.<br />
2.2.3 Mätning<br />
Undersökningsresultaten grundar sig på jordbrukarnas uppgifter, <strong>för</strong>medlade av telefonintervjuare.<br />
Protokollet som telefonintervjuarna fyller i finns som bilaga sist i SM:et.<br />
De mätfel som uppkommer <strong>och</strong> som exempelvis beror på glömska, miss<strong>för</strong>stånd, hörfel<br />
med mera är mycket svårbedömt, men kan troligen i enskilda fall vara stort. Dessutom<br />
kan osäkerheten i uppgifter om gödselgivornas storlek vara betydande. Detta gäller speciellt<br />
<strong>för</strong> stallgödsel.<br />
Hänsyn till osäkerhet i mätningen tas genom att redovisningen begränsats till resultat<br />
som grundas på minst 30 observationer.<br />
2.2.4 Svarsbortfall<br />
Objektbortfallet i undersökningen uppgick antalsmässigt till ca 11 %, varav ca 8 % berodde<br />
på vägran från jordbrukarnas sida att medverka i undersökningen. I bortfallet ingår<br />
dessutom ett antal ofullständiga protokoll samt <strong>för</strong>etag som <strong>för</strong>ändrats så mycket<br />
jäm<strong>för</strong>t med LBR-uppgifterna (t.ex. genom köp) att de ej kunnat nyttjas i undersökningen.<br />
Utöver bortfallet av hela <strong>för</strong>etag tillkommer ett partiellt bortfall av enstaka<br />
uppgifter i varierande omfattning.<br />
I skattnings<strong>för</strong>farandet behandlades de svarande som om de varit det ursprungliga urvalet.<br />
Bakom detta ligger ett antagande om att <strong>för</strong>etag som är bortfall inte skiljer sig från<br />
svarande <strong>för</strong>etag i samma stratum.<br />
2.2.5 Bearbetning<br />
Blanketten skannades <strong>och</strong> granskades genom avstämningar med LBR-uppgifter <strong>och</strong> med<br />
rimlighetskontroller <strong>för</strong> gödselgivor. Bearbetningarna ligger i ett PC-baserat<br />
client/serversystem.<br />
2.2.6 Modellantaganden<br />
GU:s skattningar av hur mycket kväve, fosfor <strong>och</strong> kalium som sprids på åkermark <strong>och</strong><br />
betesmark är modellberoende. Skattningarna går till så att lantbrukarna <strong>för</strong>st svarar på<br />
intervjufrågor om använda kvantiteter handels- <strong>och</strong> stallgödsel av olika slag. På dessa<br />
uppgifter läggs sedan omräkningsfaktorer <strong>för</strong> att erhålla skattade kvantiteter av olika<br />
näringsämnen, enligt formeln (per gödselmedel):<br />
Mängd spridd näring (av typ N från gödselmedel G) =<br />
= mängd spridd gödsel (av typ G) x näringsinnehåll (andel av N i G)<br />
Uppgifter om näringsinnehåll i handelsgödsel av olika sorter kommer från tillverkarnas<br />
innehållsdeklarationer, <strong>och</strong> här är uppgifterna tämligen säkra. För stallgödsel av olika<br />
typer har tillämpats omräkningsfaktorer enligt Jordbruksverkets STANK-modell. Dessa<br />
omräkningsfaktorer anses mer osäkra, eftersom de bygger på <strong>för</strong>söksdata <strong>och</strong> bl.a. <strong>för</strong>utsätter<br />
vissa foderstater <strong>och</strong> viss gödselhantering. Någon felskattning finns inte <strong>för</strong> omräkningsfaktorerna.
2.3 Redovisning av osäkerhetsmått<br />
Inga osäkerhetsmått beräknas <strong>för</strong> 1997 års undersökning.<br />
3 STATISTIKENS AKTUALITET<br />
3.1 Frekvens<br />
Undersökningen genom<strong>för</strong>s <strong>och</strong> publiceras vartannat år. Nästa undersökning gäller gödselåret<br />
1998-99.<br />
3.2 Framställningstid<br />
Framställningstiden var 6 månader.<br />
3.3 Punktlighet<br />
Resultaten publicerades enligt plan i maj månad 1998.<br />
4 JÄMFÖRBARHET <strong>och</strong> SAMANVÄNDBARHET<br />
4.1 Jäm<strong>för</strong>barhet över tiden<br />
Vissa metod<strong>för</strong>ändringar har skett sedan GU inleddes 1988, av både urval <strong>och</strong> beräkningsmodeller.<br />
Dessutom har storleken på urvalet varierats.<br />
En stor <strong>för</strong>ändring ägde rum från <strong>och</strong> med 1995 års undersökning, när urvalsmetod byttes<br />
<strong>och</strong> gårdarna tilldelats urvalssannolikhet i relation till beräknat antal standardarbetstimmar<br />
på <strong>för</strong>etaget. Tidigare har urvalssannolikheten bestämts utifrån ett arealmått,<br />
beräknat med något olika vikt <strong>för</strong> olika grödor.<br />
En annan stor <strong>för</strong>ändring genom<strong>för</strong>des efter en översyn in<strong>för</strong> 1997 års undersökning,<br />
vilken resulterade i att Jordbruksverkets STANK-modell in<strong>för</strong>des <strong>för</strong> skattning av<br />
näringsinnehåll i stallgödsel. Dessutom tillkom fler <strong>och</strong> mer detaljerade frågor om gödselhantering.<br />
I 1988 <strong>och</strong> 1997 års undersökningar ingick lantbruks<strong>för</strong>etag med mer än 2,0 hektar<br />
åkerareal, medan i de tre mellanliggande undersökningarna endast ingått <strong>för</strong>etag med<br />
mer än 5,0 hektar. Företag mellan 2,1 <strong>och</strong> 5,0 hektar svarar <strong>för</strong> ca 2 % av åkerarealen<br />
<strong>och</strong> 15 % av antalet <strong>för</strong>etag <strong>och</strong> torde ha en gödsel<strong>för</strong>brukning per hektar under genomsnittet.<br />
4.2 Jäm<strong>för</strong>barhet mellan grupper<br />
I Sverige finns ingen annan statistik om gödselmedelsanvändning med samma detaljeringsgrad.<br />
Redovisningen <strong>för</strong> grödor/grödgrupper är unik, liksom uppgifterna om stallgödselanvändningen.<br />
Möjligheter till internationella jäm<strong>för</strong>elser saknas i stor utsträckning.<br />
På vissa håll finns dock en bra uppfattning om gödselhanteringen, exempelvis i<br />
Nederländerna.<br />
Det ligger nära till hands att jäm<strong>för</strong>a den i GU uppmätta användningen av handelsgödsel<br />
med <strong>för</strong>säljningsstatistiken, som redovisas årligen av SCB. Under gödselåret 1996-97<br />
var <strong>för</strong>säljningen av kväve i medeltal <strong>för</strong> riket 7 % högre än den uppgivna användningen<br />
till åkermark exklusive betesmark enligt GU, medan fosfor<strong>för</strong>säljningen visade sig 3 %<br />
lägre än användningen. Före jäm<strong>för</strong>elsen har <strong>för</strong>säljningssiffrorna reducerats med beräknad<br />
användning utan<strong>för</strong> åkermarken, d.v.s. gödsling av betesmark, grönytor, golfbanor,<br />
handelsträdgårdar <strong>och</strong> privata trädgårdar. Skillnaden mellan <strong>för</strong>säljning <strong>och</strong> användning<br />
är olika stor i olika län, enligt ett mönster som är likartat mellan åren.<br />
Ett annat fall där man med hjälp av andra undersökningar får fram en skattning som kan<br />
jäm<strong>för</strong>as med GU gäller kvävet i stallgödsel. Med hjälp av SM-rapporterna över Handelsgödsel,<br />
stallgödsel <strong>och</strong> kalk i jordbruket <strong>och</strong> Utsläpp till luft av ammoniak i Sverige<br />
kan man, genom att subtrahera den totala kväve<strong>för</strong>lusten i form av ammoniakavgång<br />
81
82<br />
från producerad mängd stallgödsel, beräkna mängden totalkväve i stallgödsel som till<strong>för</strong>ts<br />
åkermarken. Denna kvantitet borde motsvara den gödsel som lantbrukarna spridit<br />
ut på åkrarna enligt Gödselundersökningen, inklusive marginell användning av stallgödsel<br />
utan<strong>för</strong> jordbrukssektorn. Samstämmigheten beror på schablontalen <strong>för</strong> gödselproduktion<br />
hos olika djursorter, skattningen i GU av använd gödsel, <strong>och</strong> dessutom vilka<br />
omräkningstal som används <strong>för</strong> näringsinnehållet i producerad respektive använd gödsel.<br />
Enligt beräkningarna <strong>för</strong> gödselåret 1996-97, blir mängden kväve i producerad stallgödsel<br />
(efter ammoniak<strong>för</strong>luster) i medeltal på riksnivå 5 % lägre än användningen, medan<br />
mängden fosfor i producerad stallgödsel blev 10 % högre än beräknad användning.<br />
Även denna skillnad är olika stor i olika län. Urvalsosäkerheten kan <strong>för</strong>klara en del av<br />
men inte hela dessa skillnader, som behöver analyseras vidare.<br />
4.3 Samanvändbarhet med annan statistik<br />
Urvalsramen LBR används också <strong>för</strong> ett flertal andra undersökningar. Definitionen av<br />
jordbruks<strong>för</strong>etag är gängse, liksom indelningarna i grödor, djurgrupper <strong>och</strong> regioner.<br />
God samanvändbarhet med annan jordbruksstatistik torde <strong>för</strong>eligga.<br />
5 TILLGÄNGLIGHET <strong>och</strong> FÖRSTÅELIGHET<br />
5.1 Spridningsformer<br />
GU publiceras vartannat år i <strong>Statistiska</strong> meddelanden (Mi 30 SM). I samma serie redovisades<br />
också separat fram till 1995 näringsämneskvantiteterna enligt GU, nedbrutna på<br />
avrinningsområden. 1995 utgavs en sammanställning av långa regionala tidsserier över<br />
<strong>för</strong>säljningen av handelsgödsel <strong>och</strong> kalk, samt produktionen av stallgödsel. På SCB:s<br />
hemsida finns pressmeddelanden, en kort presentation av undersökningen, samt även ett<br />
par tabeller <strong>och</strong> diagram. I samlingspublikationen Naturmiljön i siffror finns en sammanställning<br />
av resultaten.<br />
I SM:ets tabellavdelning redovisas endast resultat <strong>för</strong> samtliga åkergrödor, spannmål,<br />
slåttervall <strong>och</strong> summan av övriga åkergrödor. En tabellbilaga med mer detaljerad redovisning<br />
kan beställas från SCB.<br />
5.2 Presentation<br />
Presentation framgår av SM.<br />
5.3 Dokumentation<br />
Det finns ingen lättillgänglig dokumentation utöver SM.<br />
5.4 Tillgång till primärmaterial<br />
Primärdata <strong>för</strong> enskilda <strong>för</strong>etag finns sparade <strong>för</strong> alla undersökningsår från <strong>och</strong> med<br />
1988. Specialbearbetningar ut<strong>för</strong>s på uppdragsbasis. Forskare, utredare, m.fl. kan få<br />
tillgång till avidentifierat material efter särskild prövning.<br />
5.5 Upplysningstjänster<br />
Vid frågor om statistiken kontakta Sven Strömberg vid SCB, telefon: 08-506 947 45,<br />
telefax 08-506 947 63, e-post: sven.strömberg@scb.se. För upplysningar om emissionsfaktorer<br />
enligt STANK-modellen, rörande näringsinnehåll i stallgödsel kontakta Jordbruksverket,<br />
551 82 Jönköping, telefon 036-15 50 00.