14.09.2013 Views

Kvalitetsbegrepp och riktlinjer för kvalitets - Statistiska centralbyrån

Kvalitetsbegrepp och riktlinjer för kvalitets - Statistiska centralbyrån

Kvalitetsbegrepp och riktlinjer för kvalitets - Statistiska centralbyrån

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

(Huvud)<br />

<strong>Kvalitetsbegrepp</strong> <strong>och</strong> <strong>riktlinjer</strong> <strong>för</strong> <strong>kvalitets</strong>-<br />

deklaration av officiell statistik<br />

Quality definition and recommendations for<br />

quality declarations of official statistics<br />

(fot)


Producent: <strong>Statistiska</strong> <strong>centralbyrån</strong>, Utvecklingsavdelningen, Metodenheten<br />

Förfrågningar: Eva Elvers, tfn 08 - 506 947 14 e-post: eva.elvers@scb.se


Förord<br />

Frågor som har att göra med statistikens kvalitet <strong>och</strong> hur den kan <strong>för</strong>bättras har alltid<br />

varit centrala <strong>för</strong> <strong>Statistiska</strong> <strong>centralbyrån</strong> (SCB). I det arbetet ingår att definiera<br />

vad man vill mena med kvalitet i samband med statistik <strong>och</strong> att utforma verktyg <strong>för</strong><br />

att följa <strong>och</strong> <strong>för</strong>bättra kvaliteten hos olika statistikprodukter.<br />

Som ett led i <strong>kvalitets</strong>arbetet presenterar SCB i detta Meddelande i samordningsfrågor<br />

(MIS) dels ett <strong>kvalitets</strong>begrepp <strong>för</strong> officiell statistik, dels anvisningar <strong>för</strong><br />

utformning av <strong>kvalitets</strong>deklarationer. MIS:et är främst avsett att vara ett hjälpmedel<br />

<strong>för</strong> producenter av officiell statistik, både i arbetet med att utveckla statistiken <strong>och</strong><br />

vid utformningen av den <strong>kvalitets</strong>deklaration som skall åtfölja all officiell statistik.<br />

Förhoppningsvis kan MIS:et också vara till hjälp <strong>för</strong> beställare <strong>och</strong> användare av<br />

statistik.<br />

Detta MIS ersätter MIS 1994:3 "<strong>Kvalitetsbegrepp</strong> <strong>och</strong> <strong>riktlinjer</strong> <strong>för</strong> <strong>kvalitets</strong>redovisning<br />

av statistik". Det överensstämmer i det väsentliga med sin <strong>för</strong>egångare, men<br />

vissa revisioner har gjorts. Huvudskälen <strong>för</strong> dessa har varit dels att komma nära det<br />

<strong>kvalitets</strong>begrepp som är under framväxt hos EU:s statistikbyrå Eurostat, dels<br />

önskemål om att undanröja vissa konstaterade olägenheter med <strong>för</strong>egående<br />

<strong>kvalitets</strong>begrepp.<br />

Kvalitetsarbete är en kontinuerlig process som hämtar impulser från såväl användning<br />

<strong>och</strong> produktion av statistik som forskning. För det fortsatta arbetet välkomnar<br />

SCB synpunkter på innehållet i detta MIS från intressenter såväl inom som utom<br />

det officiella statistiksystemet.<br />

MIS:et har utarbetats av Eva Elvers <strong>och</strong> Bengt Rosén, SCB.<br />

<strong>Statistiska</strong> <strong>centralbyrån</strong> i april 2001<br />

Svante Öberg


Innehålls<strong>för</strong>teckning Sida<br />

Förord<br />

Bakgrund <strong>för</strong> <strong>och</strong> syfte med detta MIS<br />

<strong>Kvalitetsbegrepp</strong> <strong>för</strong> officiell statistik 1<br />

Allmänt om kvalitet 1<br />

Kvalitet <strong>och</strong> statistik 2<br />

<strong>Kvalitetsbegrepp</strong> <strong>för</strong> officiell statistik 3<br />

Kvalitetskomponenternas innebörd 5<br />

Statistikens innehåll 5<br />

Statistikens till<strong>för</strong>litlighet 7<br />

Statistikens aktualitet 9<br />

Statistikens jäm<strong>för</strong>barhet <strong>och</strong> samanvändbarhet 10<br />

Statistikens tillgänglighet <strong>och</strong> <strong>för</strong>ståelighet 12<br />

Riktlinjer <strong>för</strong> <strong>kvalitets</strong>deklaration av statistik 13<br />

Underlag <strong>för</strong> <strong>kvalitets</strong>bedömning <strong>och</strong> statistikanvändning 13<br />

Mall <strong>för</strong> <strong>kvalitets</strong>deklaration av statistik 14<br />

Bilaga 1 Begrepp <strong>och</strong> termer i anslutning till statistiska undersökningar 19<br />

Bilaga 2 Summarisk redovisning av osäkerhet 29<br />

Bilaga 3 <strong>Kvalitetsbegrepp</strong>et – översättning till engelska 31<br />

Bilaga 4 Exempel 43


Bakgrund <strong>för</strong> <strong>och</strong> syfte med detta MIS<br />

Beslutsfattare, planerare, media, allmänhet, m.fl. efterfrågar statistik som belyser<br />

olika samhällsaspekter <strong>och</strong> deras <strong>för</strong>ändringar. Information önskas om befolkningen,<br />

näringslivet, fastighetsbeståndet, miljön, osv. Sveriges officiella statistik<br />

syftar till att möta sådana informationsönskemål.<br />

I <strong>och</strong> med att samhället <strong>för</strong>ändras, ändras också behov <strong>och</strong> önskemål om den officiella<br />

statistikens innehåll. Nya önskemål tillkommer <strong>och</strong> gamla blir överspelade.<br />

Likaså ändras de tekniska, juridiska <strong>och</strong> opinionsmässiga <strong>för</strong>utsättningarna <strong>för</strong><br />

insamling av grunduppgifter till statistik <strong>och</strong> <strong>för</strong> spridning av statistiken. För att<br />

möta behoven väl behöver statistiken där<strong>för</strong> ständigt utvecklas <strong>och</strong> anpassas, i samarbete<br />

mellan beställare, användare <strong>och</strong> producenter.<br />

Informationsönskemålen om samhällets olika sektorer är så mångskiftande att de<br />

inte kan mötas av officiell statistik med precis det innehåll <strong>och</strong> den till<strong>för</strong>litlighet<br />

som varje enskild användare helst skulle vilja. Åtskillig statistik används där<strong>för</strong><br />

även <strong>för</strong> andra ändamål <strong>och</strong> på andra sätt än vad den främst är framtagen <strong>för</strong>. För att<br />

undvika felanvändningar är det viktigt att producenterna tillhandahåller klar<br />

information om statistikens egenskaper, d.v.s. en <strong>kvalitets</strong>/varudeklaration.<br />

Detta Meddelande i samordningsfrågor (MIS) presenterar dels ett <strong>kvalitets</strong>begrepp<br />

<strong>för</strong> officiell statistik, dels <strong>riktlinjer</strong> <strong>för</strong> utformning av <strong>kvalitets</strong>deklarationer av<br />

officiell statistik. Sådana angavs senast i MIS 1994:3 "<strong>Kvalitetsbegrepp</strong> <strong>och</strong> <strong>riktlinjer</strong><br />

<strong>för</strong> <strong>kvalitets</strong>deklaration av officiell statistik". Huvudanledningar till att MIS:et<br />

nu revideras är dels att undanröja vissa konstaterade olägenheter med <strong>för</strong>egående<br />

<strong>kvalitets</strong>begrepp dels att komma nära det <strong>kvalitets</strong>begrepp som är under framväxt<br />

hos EU:s statistikbyrå Eurostat.<br />

Viktig bakgrund <strong>för</strong> arbete med <strong>riktlinjer</strong> <strong>för</strong> <strong>kvalitets</strong>deklarationer ges av <strong>för</strong>ordningen<br />

om den officiella statistiken (SFS 1992:1668, senast ändrad i SFS 1999:3).<br />

Där anges att officiell statistik skall <strong>kvalitets</strong>deklareras, <strong>och</strong> att SCB skall meddela<br />

<strong>för</strong>eskrifter <strong>för</strong> <strong>kvalitets</strong>deklarationer. SCB har <strong>för</strong>eskrivit att officiell statistik skall<br />

åtföljas av en <strong>kvalitets</strong>deklaration vilken skall offentliggöras <strong>och</strong> finnas tillgänglig<br />

på samma sätt som den officiella statistiken. För att kunna ge allmänna råd i<br />

anlutning till <strong>för</strong>eskrifterna behöver SCB ett MIS av här <strong>för</strong>eliggande slag. Det är i<br />

<strong>för</strong>sta hand avsett att vara ett hjälpmedel <strong>för</strong> statistikproducenter vid deras utarbetande<br />

av <strong>kvalitets</strong>deklarationer, men det kan <strong>för</strong>hoppningsvis också vara till<br />

hjälp <strong>för</strong> beställare <strong>och</strong> användare av statistik.<br />

Kvalitetssynen i detta MIS överensstämmer med den i MIS 1994:3. Huvudramen<br />

ges av begreppet totalkvalitet, en ram som successivt anammats inom såväl offentlig<br />

som privat verksamhet. Utvecklingslinjen ifråga återfinns också hos statistiska<br />

centralbyråer i andra länder.<br />

Första kapitlet behandlar statistikkvalitet. Det börjar med en allmän diskussion av<br />

kvalitet, <strong>och</strong> mynnar ut i en strukturering av <strong>kvalitets</strong>begreppet <strong>för</strong> statistik. Kapitlet<br />

därefter beskriver innebörden i de olika komponenter som tillsammans bildar<br />

<strong>kvalitets</strong>begreppet. I tredje kapitlet formuleras <strong>riktlinjer</strong> <strong>för</strong> hur en <strong>kvalitets</strong>deklaration<br />

skall disponeras <strong>och</strong> vilken information som statistikproducenterna bör<br />

tillhandahålla <strong>för</strong> de olika <strong>kvalitets</strong>komponenterna. Begrepp <strong>och</strong> termer i anslutning<br />

till statistiska undersökningar <strong>för</strong>klaras i Bilaga 1. En möjlighet <strong>för</strong> summariskt<br />

angivande av osäkerhetsmarginaler anges i Bilaga 2. I Bilaga 3 är <strong>kvalitets</strong>begreppet<br />

översatt till engelska.


MIS:et saknar medvetet en genomgående numrering, <strong>för</strong> att undvika sammanblandning<br />

med den numrering som är avsedd att användas i <strong>kvalitets</strong>deklarationer.<br />

Den numreringen in<strong>för</strong>s i kapitlet om Kvalitetskomponenternas innebörd <strong>och</strong><br />

används sedan också i kapitlet om Riktlinjer <strong>för</strong> <strong>kvalitets</strong>deklarationer.


<strong>Kvalitetsbegrepp</strong> <strong>för</strong> officiell statistik<br />

Allmänt om kvalitet<br />

I vardagsspråket handlar "kvalitet" om var på skalan dålig - ganska bra - utmärkt en<br />

användare anser att en viss produkt (vara eller tjänst) ligger i jäm<strong>för</strong>else med andra<br />

liknande produkter. Ofta används emellertid ordet "kvalitet" också med en positiv<br />

värdeladdning, som synonym till "god kvalitet". Denna möjliga värdeladdning med<strong>för</strong><br />

att termen är litet svår att hantera, <strong>och</strong> att den kan definieras på olika sätt.<br />

Synen på kvalitet <strong>och</strong> idéer om hur man skall utveckla produkter med god kvalitet<br />

har varierat under tidernas lopp. Under senare decennier har <strong>kvalitets</strong>tänkandet hos<br />

producenter av varor <strong>och</strong> tjänster kommit att allt mer bli baserat på synsättet totalkvalitet,<br />

<strong>för</strong> vilket huvudpunkter ges av (i) <strong>och</strong> (ii) nedan.<br />

(i) Användaren skall stå i centrum. En produkts <strong>kvalitets</strong>status avgörs av<br />

(faktiska <strong>och</strong> potentiella) användares uppfattningar om produkten <strong>och</strong><br />

dess användbarhet.<br />

För att ovanstående slagordsmässiga formulering skall leda till praktiska effekter<br />

måste den operationaliseras. Ett <strong>för</strong>sta steg är att formulera ett konkret <strong>kvalitets</strong>begrepp<br />

<strong>för</strong> den aktuella produkten. Utgående från punkt (i) ovan kan producentens<br />

<strong>kvalitets</strong>begrepp definieras på följande sätt.<br />

(ii) Kvalitet åsyftar alla egenskaper hos en produkt som har betydelse <strong>för</strong><br />

hur väl denna tillfredsställer användares behov <strong>och</strong> <strong>för</strong>väntningar.<br />

Denna definition innebär ett användarorienterat <strong>kvalitets</strong>begrepp som <strong>för</strong> producenten<br />

i <strong>för</strong>sta hand får en deskriptiv innebörd. För honom/henne är <strong>kvalitets</strong>begreppet<br />

fram<strong>för</strong> allt en <strong>för</strong>teckning av de aspekter på en produkt som användare<br />

fäster avseende vid när de bedömer hur bra den tillgodoser deras behov <strong>och</strong> <strong>för</strong>väntningar.<br />

Därvid beaktas aspekter såväl på hur produkten fungerar som på service<br />

i samband med in<strong>för</strong>skaffande <strong>och</strong> användning. Begreppet tar däremot inte ställning<br />

till om produkten i någon absolut mening skall anses vara bra eller dålig.<br />

För användaren har kvalitet en mer värderande innebörd. Dennes <strong>kvalitets</strong>omdöme<br />

beror dock inte enbart på produkten i sig, utan också på hur den är avsedd att<br />

användas. En <strong>och</strong> samma produkt kan mycket väl anses ha god kvalitet <strong>för</strong> en viss<br />

användning, men dålig <strong>för</strong> en annan. Användaren är den som vet vilka behov <strong>och</strong><br />

<strong>för</strong>väntningar han/hon har, <strong>och</strong> är där<strong>för</strong> den som står <strong>för</strong> <strong>kvalitets</strong>bedömningen. För<br />

producenten är det naturligtvis högst angeläget att ta reda på användares <strong>kvalitets</strong>bedömningar,<br />

eftersom de ger underlag <strong>för</strong> utvecklingsarbete mot bättre kvalitet<br />

(större användartillfredsställelse).<br />

Det <strong>för</strong> en produkt konkret formulerade <strong>kvalitets</strong>begreppet har betydelse i bl.a.<br />

nedanstående sammanhang:<br />

Utformning av <strong>kvalitets</strong>deklarationer : Genom en <strong>kvalitets</strong>deklaration kan producenten<br />

beskriva en produkts egenskaper så att den kan användas på rätt sätt, <strong>och</strong><br />

informera användare om den kvalitet de i olika avseenden kan räkna med.<br />

I <strong>kvalitets</strong><strong>för</strong>bättringsarbete : Eftersom användarnas värderingar <strong>och</strong> preferenser<br />

ändras över tiden måste producenten ständigt sträva efter att anpassa sin produkt till<br />

nya önskemål. Ett användarorienterat <strong>kvalitets</strong>begrepp underlättar kommunikationen<br />

mellan användare <strong>och</strong> producent.<br />

Vid produktivitetsutvärdering: Det är alltid angeläget att produktionsresurser utnyttjas<br />

så bra som möjligt. En producent vill där<strong>för</strong> kunna utvärdera relativ nytta<br />

<strong>och</strong> kostnader <strong>för</strong> olika resurser i produktionsprocessen. <strong>Kvalitetsbegrepp</strong>et ger ett<br />

av instrumenten <strong>för</strong> utvärdering <strong>och</strong> resursallokering.<br />

1


2<br />

Kvalitet <strong>och</strong> statistik<br />

Termen statistik används med litet olika betydelser. Här har det huvudinnebörden<br />

"sammanfattande numerisk beskrivning av <strong>för</strong>hållanden i en grupp". Statistik tas<br />

fram <strong>för</strong> att ge information som kan belysa konkreta sakproblem. Den utgör ofta en<br />

viktig del av besluts- <strong>och</strong> planeringsunderlag, men ger också information till allmänhet,<br />

utredare, forskare m.fl. om "sakernas tillstånd <strong>och</strong> utveckling".<br />

Det i statistiksammanhang centrala begreppet är statistisk storhet. En sådan är ett<br />

värde, som definieras av att ett statistiskt mått (antal, medelvärde, median, m.fl.)<br />

används <strong>för</strong> att sammanfatta värdena på en variabel (= egenskap) hos objekten i en<br />

grupp. Det "totala" objektkollektivet kallas populationen.<br />

Exempel på statistiska storheter : (i) Förädlingsvärdet i svensk varvsindustri under<br />

1998. Här är objektgruppen = <strong>för</strong>etagen i svensk varvsindustri under 1998, variabeln<br />

= <strong>för</strong>ädlingsvärde <strong>och</strong> det statistiska måttet = summa. (ii) Genomsnittlig disponibel<br />

inkomst under 1998 <strong>för</strong> i Stockholm bosatta tvåbarnsfamiljer. Här är objektgruppen<br />

= tvåbarnsfamiljer som bodde i Stockholm 1998, variabeln = disponibel inkomst <strong>och</strong><br />

det statistiska måttet = medelvärde.<br />

En statistisk undersökning går ut på att skaffa kunskap om värdena på en eller flera<br />

statistiska storheter <strong>för</strong> en population, <strong>och</strong> oftast också <strong>för</strong> delgrupper i denna. De<br />

statistiska storheter som en undersökning gäller kallas dess målstorheter. De har<br />

"sanna" men okända värden. En statistisk undersökning omfattar normalt två<br />

huvudmoment, insamling av grunduppgifter (primäruppgifter), respektive bearbetning<br />

av dessa till statistikvärden, som skattar målstorheterna.<br />

Ordet "skattning" indikerar fram<strong>för</strong> allt att ett statistikvärde normalt inte anger ett<br />

helt korrekt värde på motsvarande målstorhet, utan är <strong>för</strong>enat med viss osäkerhet.<br />

Det "kategoriska" kravet vid skattning är att sträva efter väntevärdesriktiga ("i<br />

genomsnitt riktiga") skattningar. Det finns flera möjliga källor till osäkerhet. Vid en<br />

urvalsundersökning <strong>för</strong>eligger den uppenbara osäkerhetskällan att inte alla objekt i<br />

populationen undersöks. I såväl total- som urvalsundersökningar kommer också<br />

andra slag av störningar in i undersökningsprocessen <strong>och</strong> bidrar till osäkerhet i<br />

statistiken. Osäkerhetskällor utöver urval, vilka diskuteras mer ingående längre<br />

fram, är : brister i täckningen av målpopulationen, mätfel, svarsbortfall, bearbetningsfel<br />

samt inte helt uppfyllda modellantaganden.<br />

När det allmänna total<strong>kvalitets</strong>begrepp som formulerades i <strong>för</strong>egående avsnitt tilllämpas<br />

på statistik ger det följande definition<br />

(iii) Statistiks kvalitet avser alla egenskaper hos statistik som har betydelse<br />

<strong>för</strong> hur väl denna tillgodoser användares informationsbehov.<br />

För att ge bakgrund åt det <strong>kvalitets</strong>begrepp som formuleras litet längre fram anges<br />

härnäst några aspekter på statistik, som flertalet användare fäster avseende vid. En<br />

mer fullständig diskussion ges i kapitlet om Kvalitetskomponenternas innebörd.<br />

Vanligtvis efterfrågas aktuell statistik, varmed avses (åtminstone idealt) statistik<br />

som beskriver nuläget. Faktorer som påverkar aktualiteten är snabbheten i uppgiftsinsamling<br />

<strong>och</strong> bearbetning, <strong>och</strong> <strong>för</strong> återkommande undersökningar hur frekvent de<br />

genom<strong>för</strong>s.<br />

En vanlig <strong>och</strong> viktig användning av statistik är att göra jäm<strong>för</strong>elser, dels jäm<strong>för</strong>elser<br />

över tiden (med hjälp av tidsserier) dels jäm<strong>för</strong>elser mellan olika grupper. Rättvisande<br />

jäm<strong>för</strong>elser ställer konsistenskrav på statistikvärdenas målstorheter, krav<br />

som också aktualiseras när statistikvärden från olika statistikkällor skall användas<br />

tillsammans.<br />

Framtagen statistik görs tillgänglig <strong>för</strong> användarna med olika spridningsformer, via<br />

olika media (papper, elektroniskt medium, m.m.) <strong>och</strong> via olika kanaler (<strong>Statistiska</strong>


Meddelanden per post, årsbok, på diskett, uttag från databas, m.m.). Informationen<br />

kan också presenteras på olika sätt, i text, diagram, tabeller, m.m.<br />

Vissa användare efterfrågar annan statistik än den som publiceras reguljärt. En del<br />

sådan statistik finns ofta redan framtagen hos producenten, eller kan tas fram av<br />

denne genom specialbearbetning av primärmaterial. Ett alternativ, som önskas särskilt<br />

av forskare, utredare, m.fl., är att få direkttillgång till (avidentifierat) primärmaterial,<br />

vilket ger möjlighet att själv framställa statistik man är intresserad av.<br />

Användares tilltro till statistik beror av deras uppfattning om såväl oavsiktliga som<br />

avsiktliga fel. Inte ens den mest omsorgsfulle statistikproducent kan undvika viss,<br />

men oavsiktlig, osäkerhet i statistiken. Att medvetet felaktig, icke objektiv, statistik<br />

kan <strong>för</strong>ekomma är känt. Aspekten objektivitet <strong>för</strong>s dock inte in i <strong>kvalitets</strong>begreppet.<br />

Det är nästan ogörligt att bedöma om statistik är framställd på ett objektivt sätt eller<br />

inte. För Sveriges del säger lagen 1992 : 889 om den officiella statistiken: Den<br />

officiella statistiken skall vara objektiv <strong>och</strong> allmänt tillgänglig.<br />

Som redan sagts avser "användare" såväl faktiska som potentiella användare. Det<br />

finns alltid organisationer <strong>och</strong> personer som inte får sina statistikönskemål tillgodosedda,<br />

antingen där<strong>för</strong> att önskad statistik inte framställs eller där<strong>för</strong> att framtagen<br />

statistik inte är tillräckligt bra <strong>för</strong> deras syften. Sådana önskemål bör beaktas<br />

när statistik utvärderas <strong>och</strong>/eller revideras.<br />

<strong>Kvalitetsbegrepp</strong> <strong>för</strong> officiell statistik<br />

Hur en användare avgränsar den statistik som dennes <strong>kvalitets</strong>bedömning avser<br />

beror av sakproblemet <strong>och</strong> användningssituationen. "Statistiken" kan bestå av ett<br />

enskilt statistikvärde, av alla statistikvärden från en enskild undersökning eller från<br />

flera olika undersökningar, som används tillsammans. Den kan också åsyfta ett<br />

flöde (över tiden) av statistikvärden. Naturligtvis gäller att ju mer omfattande statistiken<br />

är, desto fler aspekter har den. Följande <strong>kvalitets</strong>begrepp är avsett att kunna<br />

användas oavsett statistikens omfattning, men <strong>för</strong> små "statistikpaket" är vissa<br />

<strong>kvalitets</strong>komponenter ibland irrelevanta.<br />

Det finns inget självklart sätt att dela in en statistiks totala egenskapsuppsättning i<br />

huvud- <strong>och</strong> underaspekter. Den struktur som presenteras nedan har följande fem<br />

huvudkomponenter. (1) Innehåll, som fram<strong>för</strong> allt gäller statistikens målstorheter.<br />

(2) Till<strong>för</strong>litlighet, som avser osäkerhetskällor <strong>och</strong> dessas effekter på statistiken. (3)<br />

Aktualitet, som omfattar tidsaspekter som spelar roll <strong>för</strong> hur väl statistiken beskriver<br />

nuläget. (4) Jäm<strong>för</strong>barhet <strong>och</strong> samanvändbarhet, som avser möjligheter till<br />

jäm<strong>för</strong>elser, över tiden <strong>och</strong> mellan grupper, samt till att använda statistiken tillsammans<br />

med annan statistik. (5) Tillgänglighet <strong>och</strong> <strong>för</strong>ståelighet, som avser statistikens<br />

fysiska tillgänglighet <strong>och</strong> dess <strong>för</strong>ståelighet.<br />

Det har tidigare understrukits att <strong>kvalitets</strong>begreppet är användarorienterat, <strong>och</strong> det<br />

bör därmed så långt möjligt formuleras i termer av hur användaren ser på statistiken.<br />

Särskilt under komponenten Till<strong>för</strong>litlighet görs dock avsteg från denna princip.<br />

För användaren har den totala till<strong>för</strong>litligheten huvudintresset, medan uppdelningen<br />

på olika osäkerhetskällor är av produktionsteknisk natur. Att olika typer av<br />

osäkerhetskällor ändå specificeras beror på att det ofta är svårt att uttala sig om till<strong>för</strong>litligheten<br />

totalt, medan det kan vara möjligt att ge användare <strong>för</strong>hållandevis god<br />

information om hur, <strong>och</strong> med vilken effekt, åtminstone vissa av osäkerhetskällorna<br />

kan ha påverkat statistiken.<br />

3


4<br />

I tablån nedan struktureras <strong>kvalitets</strong>begreppet i huvud- <strong>och</strong> underkomponenter.<br />

Komponenternas innebörd beskrivs ut<strong>för</strong>ligare i nästa kapitel.<br />

INNEHÅLL<br />

• <strong>Statistiska</strong> målstorheter<br />

- Objekt <strong>och</strong> population<br />

- Variabler<br />

- <strong>Statistiska</strong> mått<br />

- Redovisningsgrupper<br />

- Referenstider<br />

• Fullständighet<br />

<strong>Kvalitetsbegrepp</strong> <strong>för</strong> officiell statistik<br />

TILLFÖRLITLIGHET<br />

• Till<strong>för</strong>litlighet totalt<br />

• Osäkerhetskällor<br />

⋅ Urval<br />

⋅ Ramtäckning<br />

⋅ Mätning<br />

⋅ Svarsbortfall<br />

⋅ Bearbetning<br />

⋅ Modellantaganden<br />

• Redovisning av osäkerhetsmått<br />

AKTUALITET<br />

• Frekvens<br />

• Framställningstid<br />

• Punktlighet<br />

JÄMFÖRBARHET <strong>och</strong> SAMANVÄNDBARHET<br />

• Jäm<strong>för</strong>barhet över tiden<br />

• Jäm<strong>för</strong>barhet mellan grupper<br />

• Samanvändbarhet med annan statistik<br />

TILLGÄNGLIGHET <strong>och</strong> FÖRSTÅELIGHET<br />

• Spridningsformer<br />

• Presentation<br />

• Dokumentation<br />

• Tillgång till primärmaterial<br />

• Upplysningstjänster


Kvalitetskomponenternas innebörd<br />

I detta kapitel görs en genomgång av <strong>kvalitets</strong>begreppets komponenter, med tyngdpunkt<br />

på deras deskriptiva innebörd. I vissa fall ges också kommentarer angående<br />

användares <strong>kvalitets</strong>bedömningsgrunder. Genomgången följer <strong>kvalitets</strong>begreppets<br />

tidigare angivna struktur, vilken också ligger till grund <strong>för</strong> den numrering av komponenter<br />

<strong>och</strong> underkomponenter som in<strong>för</strong>s.<br />

En läsare som upplever delar av framställningen som svår<strong>för</strong>ståeligt teknisk kan få<br />

hjälp från Bilaga 1. Där ges ut<strong>för</strong>ligare beskrivning av begrepp <strong>och</strong> termer i anslutning<br />

till statistiska undersökningar.<br />

1 STATISTIKENS INNEHÅLL<br />

gäller de statistiska målstorheterna<br />

1.1 <strong>Statistiska</strong> målstorheter<br />

En statistisk målstorhet bestäms av att ett statistiskt mått används <strong>för</strong> att sammanfatta<br />

värdena på en variabel <strong>för</strong> objekten i en grupp, varvid det totala objektkollektivet<br />

kallas <strong>för</strong> populationen. En rätt vanlig synonym till målstorhet är parameter.<br />

1.1.1 - 1.1.3 Objekt <strong>och</strong> population, variabler <strong>och</strong> statistiska mått<br />

Dessa <strong>kvalitets</strong>komponenter avser valet av objekt, variabler <strong>och</strong> statistiska mått som<br />

ingår i de statistiska målstorheterna.<br />

Såväl objekt som variabler har associerade referenstider, se 1.1.5.<br />

1.1.4 Redovisningsgrupper<br />

Oftast redovisas statistik inte bara <strong>för</strong> hela populationen utan också <strong>för</strong> delpopulationer,<br />

redovisningsgrupper. Man talar om att statistiken bryts ned på (del)grupper.<br />

En <strong>för</strong>utsättning <strong>för</strong> sådan nedbrytning är naturligtvis att man <strong>för</strong> undersökta objekt<br />

har uppgifter angående variabler som man vill göra indelningar efter. Faktorer som<br />

verkar återhållande <strong>för</strong> hur långt statistik bryts ned är dels att det krävs mer arbete<br />

<strong>och</strong> mer publiceringsutrymme ju fler grupper som tas med i redovisningen, dels att<br />

integritetskränkning kan uppstå. Vidare, särskilt <strong>för</strong> urvalsundersökningar med<strong>för</strong><br />

successiv minskning av redovisningsgruppers storlek att statistiken <strong>för</strong>r eller senare<br />

blir så osäker att den inte är användbar.<br />

Aspekter på denna <strong>kvalitets</strong>komponent är fram<strong>för</strong> allt<br />

- vilka indelningsvariabler som används <strong>för</strong> att skapa redovisningsgrupper,<br />

- hur långtgående indelningar i redovisningsgrupper som görs.<br />

Exempel<br />

SCB ut<strong>för</strong> årligen Inkomst<strong>för</strong>delningsundersökningen (HINK), som belyser befolkningens<br />

inkomst<strong>för</strong>hållanden. Referensperiod är kalenderår.<br />

Ett centralt objekt i undersökningen är "familj". En sådan består av antingen<br />

två vuxna (≥ 18 år) som sammanbor under äktenskapsliknande former <strong>och</strong><br />

de barn (< 18 år) som (eventuellt) bor hos dem, eller<br />

en ensamstående vuxen <strong>och</strong> de barn som (eventuellt) bor hos denne.<br />

Populationen utgörs av alla familjer som var bosatta i riket under mer än halva<br />

kalenderåret.<br />

Exempel på variabler <strong>för</strong> familjer: Årets arbetsinkomst, årets disponibla<br />

inkomst, socioekonomisk grupptillhörighet, antal barn.<br />

Exempel på redovisningsgrupper: Två - vuxen - familjer med tre eller fler barn,<br />

5


6<br />

familjer med ensamstående vuxen med barn, högre - tjänstemanna - familjer.<br />

De i HINK mest använda statistiska måtten är medelvärde <strong>och</strong> antal, men bl.a.<br />

median <strong>för</strong>ekommer också.<br />

Exempel på statistiska målstorheter: Genomsnittlig arbetsinkomst under året <strong>för</strong><br />

arbetarfamiljer, genomsnittlig disponibel inkomst under året <strong>för</strong> två - vuxen-<br />

familjer utan barn, medianinkomst <strong>för</strong> högre-tjänstemanna-familjer, antal lantbrukarfamiljer.<br />

Kommentarer om statistiska målstorheter<br />

En användares önskemål om statistisk information utgår från dennes sakproblem. I <strong>för</strong>sta<br />

hand är användaren intresserad av statistiska målstorheter som nära ansluter till det<br />

<strong>för</strong>eliggande sakproblemet. Ju bättre statistikens objekt, variabler, referenstider, m.m.<br />

överensstämmer med önskemålen, desto bättre är kvaliteten på denna punkt.<br />

En användare som kan delta i planering av ny eller i omläggning av existerande statistik<br />

har möjlighet att påverka valet av objekt, variabler <strong>och</strong> mått. Eftersom det ofta finns flera<br />

användare kan dock motstridiga önskemål <strong>för</strong>eligga, <strong>och</strong> ofta måste kompromisser göras.<br />

Även i fall där enighet råder kan man av kostnads- eller tidsskäl välja statistiska målstorheter<br />

som avviker från de ideala.<br />

Kommentarer om redovisningsgrupper<br />

Om användarens intresse är fokuserat på statistik <strong>för</strong> vissa bestämda grupper, fäster<br />

han/hon naturligtvis stort avseende vid om statistik redovisas <strong>för</strong> just de grupperna.<br />

Är användaren mer allmänt intresserad av en detaljrik bild, fäster han/hon kanske mest<br />

vikt vid hur långtgående indelningar som görs.<br />

1.1.5 Referenstider<br />

Objekt <strong>och</strong> variabler hän<strong>för</strong> sig till någon viss tid. Den kan vara snävt avgränsad,<br />

t.ex. till en bestämd dag, <strong>och</strong> man talar då om referenstidpunkt. När tiden är längre,<br />

t.ex. ett kalenderår, talar man om referensperiod. Referenstiderna <strong>för</strong> objekt <strong>och</strong><br />

variabler i en statistisk målstorhet sammanfaller oftast, men behöver inte göra det.<br />

Flera referenstider kan ingå, särskilt i målstorheter som avser <strong>för</strong>ändringar.<br />

För statistik från återkommande undersökningar (t.ex. avseende medellön <strong>för</strong><br />

arbetare inom industrin) är det ofta naturligt att betrakta population <strong>och</strong> variabler<br />

som desamma i varje undersökningsomgång, medan referenstiden ändras. För statistik<br />

från engångsundersökningar är det ofta naturligare att betrakta referenstid som<br />

del av definitionerna av objekt <strong>och</strong> variabler. (Exempelvis kan objekten definieras<br />

som "kvinnor i ålder 16 – 50 år som var bosatta i Stockholm 1 juli 1998".) Om det är<br />

mest ändamålsenligt att betrakta referenstiden som fristående eller som del av<br />

objekt <strong>och</strong> variabler får avgöras i det speciella fallet.<br />

Exempel<br />

Objekt <strong>och</strong> variabel med samma referenstid: Genomsnittlig arbetsinkomst<br />

under kalenderåret 1998 <strong>för</strong> personer bosatta i riket under hela 1998.<br />

Objekt <strong>och</strong> variabel med olika referenstid: Lön under 1998 <strong>för</strong> personer som<br />

avlade civilingenjörsexamen under 1988.<br />

Variabler med olika referenstider: Att konsumentprisindex <strong>för</strong> juli 1998 var<br />

257 kan (något svepande) tolkas så att en bestämd "varukorg" som under<br />

indexbasåret 1980 kostade 100 kronor, i juli 1998 kostade 257 kronor. Här<br />

figurerar såväl 1998 som juli 1980 som referenstider <strong>för</strong> prisuppgifter.


1.2 Fullständighet<br />

Denna <strong>kvalitets</strong>aspekt gäller hur väl ett statistiksystem <strong>och</strong> dess statistikutflöde<br />

täcker ett ämnesområdes "alla vitala delar". T.ex. hur fullständigt arbetsmarknadsstatistiken<br />

belyser arbetsmarknaden. Inget statistiksystem kommer att leva upp till<br />

vad alla användare anser vara ämnesområdets alla vitala delar, men det kan göra det<br />

bättre eller sämre.<br />

2 STATISTIKENS TILLFÖRLITLIGHET<br />

gäller statistikvärdens <strong>och</strong> målstorheters överensstämmelse<br />

Normalt <strong>för</strong>ekommer så mycket störningar i en statistisk undersökning att statistikvärden<br />

inte anger exakta värden på målstorheterna, utan skattningar av dessa. Härvid<br />

är ledstjärnan att sträva efter väntevärdesriktiga ("riktiga i genomsnitt") skattningar.<br />

Mellan ett statistikvärde <strong>och</strong> dess målstorhet <strong>för</strong>eligger normalt en avvikelse<br />

(ett "fel"). Ju mindre den <strong>för</strong>väntade absoluta avvikelsen är, desto till<strong>för</strong>litligare är<br />

statistiken, <strong>och</strong> ju större desto osäkrare. Hur stora avvikelser blir beror bl.a. på hur<br />

väl planerad <strong>och</strong> genom<strong>för</strong>d undersökningen är. Vid urvalsundersökningar spelar<br />

urvalsstorleken stor roll. Användares önskemål är naturligtvis att avvikelser skall<br />

vara små, helst <strong>för</strong>sumbara.<br />

Ofta är avvikelser dock inte <strong>för</strong>sumbara, vilket är särskilt tydligt <strong>för</strong> statistik från<br />

urvalsundersökningar. Då önskar åtminstone statistiskt välbevandrade användare<br />

numeriska begränsningar på avvikelsernas storlek, osäkerhetsmått. Att ange sådana<br />

begränsningar är dock inte alldeles enkelt, eftersom de definieras i termer av målstorheter<br />

som man inte har säker kunskap om. (Hade man det, behövdes inte undersökningen.)<br />

Uttalanden om statistiks till<strong>för</strong>litlighet faller med nödvändighet under<br />

kategorin "utsagor om rådande osäkerhet", vilket är ett begreppsmässigt intrikat<br />

område. Ett statistikvärdes till<strong>för</strong>litlighet/osäkerhet uttrycks vanligen med hjälp av<br />

ett osäkerhetsintervall med innebörd enligt nedan.<br />

Det är högst troligt att målstorhetens värde ligger i:<br />

osäkerhetsintervall = statistikvärde ± osäkerhetsmarginal.<br />

Ofta kan ett osäkerhetsintervall tolkas som ett konfidensintervall med angiven<br />

konfidensgrad. Om denna är vald till 95% innebär det att osäkerhetsintervallet<br />

omfattar målstorheten med 95% trolighet. Andra osäkerhetsmått som väsentligen är<br />

ekvivalenta med konfidensintervall : medelfel, variationskoefficient, relativ osäkerhetsmarginal.<br />

Ibland kan osäkerhetsintervall vara baserade på särskilda utvärderingar,<br />

erfarenhet, sakkunskap, m.m., varvid man talar om bedömningsintervall.<br />

En klassificering av "fel" är slumpmässiga (tillfälliga) respektive systematiska fel.<br />

De <strong>för</strong>ra fluktuerar kring 0 medan de senare till sin huvuddel har samma tecken.<br />

Systematiska fel leder till skevhet (bias) i statistiken.<br />

2.1 Till<strong>för</strong>litlighet totalt<br />

Användaren är vanligen mest intresserad av att få uppfattning om i vilken mån<br />

han/hon kan <strong>för</strong>lita sig på ett statistikvärde totalt sett, d.v.s. få en begränsning <strong>för</strong><br />

hela avvikelsen från målstorheten. I vissa fall kan producenten ge precis kvantitativ<br />

information om denna, i andra fall endast om hur någon/några, men inte alla, osäkerhetskällor<br />

kan ha påverkat till<strong>för</strong>litligheten.<br />

Kommentarer om till<strong>för</strong>litlighet<br />

Framställning av statistik kan ofta snabbas upp om man gör avkall på dess till<strong>för</strong>litlighet<br />

(genom stort svarsbortfall, ofullständig granskning, m.m.). Framställningstid <strong>och</strong> till<strong>för</strong>litlighet<br />

står i motsättning till varandra. I fall där snabb framtagning anses angelägen,<br />

brukar man lösa dilemmat genom att i en <strong>för</strong>sta omgång ta fram "preliminär" statistik,<br />

<strong>och</strong> senare "definitiv" statistik med bättre till<strong>för</strong>litlighet.<br />

7


8<br />

2.2 Osäkerhetskällor<br />

Åtminstone som en <strong>för</strong>sta approximation, med pedagogiska <strong>för</strong>tjänster, kan en total<br />

avvikelsen ses som en summa av partiella avvikelser, vilka emanerar från olika<br />

felkällor. Härvid skall dock framhållas dels att de partiella avvikelserna kan motverka<br />

varandra (genom att ha olika tecken) dels att uppdelningen på möjliga felkällor<br />

ibland kan vara något skönsmässig.<br />

2.2.1 Urval<br />

Kvalitetskomponenten avser den del av totala avvikelsen som beror på att statistiken<br />

är baserad på observationer på endast ett urval av objekt. Osäkerhetsmarginaler<br />

kan ofta anges i form av konfidensintervall.<br />

2.2.2 Ramtäckning<br />

Kvalitetskomponenten avser den del av totala avvikelsen som beror på skillnad<br />

mellan rampopulation <strong>och</strong> målpopulation.<br />

2.2.3 Mätning<br />

Kvalitetskomponenten avser den del av totala avvikelsen som beror på mätfel.<br />

2.2.4 Svarsbortfall<br />

Svarsbortfall, vanligen <strong>för</strong>kortat till bortfall, uppstår när värden på en eller flera<br />

observationsvariabler inte kan inhämtas. Termen skall uppfattas i den vida mening<br />

som indikeras av engelskans "missing value". Den omfattar t.ex. att uppgifter saknas,<br />

där<strong>för</strong> att de av en eller annan anledning inte kunde över<strong>för</strong>as från ett administrativt<br />

register. Om man <strong>för</strong> ett objekt inte erhåller några användbara uppgifter<br />

<strong>för</strong>eligger objektbortfall. Om användbara uppgifter inhämtats <strong>för</strong> vissa, men inte<br />

alla observationsvariabler <strong>för</strong>eligger partiellt bortfall (<strong>för</strong> variabler utan värden).<br />

Kvalitetskomponenten avser den del av totala avvikelsen som beror på bortfall.<br />

2.2.5 Bearbetning<br />

Kvalitetskomponenten avser den del av totala avvikelsen som beror på ofullkomligheter<br />

i bearbetningen, vilken omfattar databeredning (dataregistrering, kodning<br />

<strong>och</strong> granskning/rättning) <strong>och</strong> numeriska skattningsberäkningar. Själva skattnings<strong>för</strong>farandet<br />

hänger nära samman med urval, <strong>och</strong> det är oftast naturligast att <strong>för</strong>a<br />

samman dessa till en aspekt "urval <strong>och</strong> skattning/estimation".<br />

2.2.6 Modellantaganden<br />

Avser den del av den totala avvikelsen som beror på att statistiken är baserad på<br />

modellantaganden som inte är perfekt uppfyllda.<br />

Val av urvals- <strong>och</strong> skattnings<strong>för</strong>farande baseras ofta på modellantaganden, som<br />

spelar roll <strong>för</strong> skattningarnas precision men inte deras väntevärdesriktighet. För<br />

störningar på grund av täcknings - <strong>och</strong> mätningsbrister samt bortfall görs också ofta<br />

antaganden, som används <strong>för</strong> justeringar i skattningssteget. Nyssnämnda typer av<br />

modellantaganden hän<strong>för</strong>s till den aktuella osäkerhetskällan. Denna <strong>kvalitets</strong>komponent<br />

avser modellantaganden utöver dem som gäller urval, ramtäckning, mätning<br />

<strong>och</strong> bortfall. Exempel är framskrivningsmodeller, modeller <strong>för</strong> att ”<strong>för</strong>dela ned”<br />

statistik från stora till små redovisningsgrupper <strong>och</strong> modeller <strong>för</strong> att skatta ej<br />

undersökta delar av populationen.<br />

2.3 Redovisning av osäkerhetsmått<br />

Avser om konfidensintervall eller annat osäkerhetsmått redovisas.<br />

Kommentarer om osäkerhetsmått<br />

I planerings- <strong>och</strong> beslutssammanhang används statistik ofta så att man i en <strong>för</strong>sta omgång<br />

resonerar under premissen att statistikvärdena anger korrekta värden på målstorheterna.<br />

Många användare är dock medvetna om att de kan komma till mer eller mindre<br />

missvisande slutsatser genom att bortse från osäkerheten. Om de sedan vill bedöma


osäkerhetens konsekvenser, befinner de sig i markant olika situationer om numeriska<br />

osäkerhetsmått presenterats eller ej. Med tillgång till osäkerhetsmått kan en i statistikteori<br />

bevandrad användare göra välgrundade bedömningar av osäkerhetens konsekvenser, <strong>och</strong><br />

kan därmed göra adekvata "slutsatsjusteringar".<br />

Osäkerhetsmått behövs inte minst <strong>för</strong> <strong>för</strong>ändringsskattningar.<br />

3 STATISTIKENS AKTUALITET<br />

gäller statistikens relation till "nuläget"<br />

Användare efterfrågar vanligen statistik som beskriver "nuläget", eller med andra<br />

ord aktuell statistik. För statistiks aktualitet spelar naturligtvis tidsavståndet mellan<br />

"nu" <strong>och</strong> statistikens referenstid den centrala rollen. Den beror av framställningstid,<br />

publiceringsfrekvens <strong>och</strong> punktlighet.<br />

Kommentar om aktualitet<br />

En annan viktig faktor <strong>för</strong> statistiks aktualitet är hur snabbt verkligheten ändras. Vid<br />

bedömning av "tillräckligt aktuell" får användaren sammanväga ovan nämnda produktions<strong>för</strong>hållanden<br />

med sin egen uppfattning om verklighetens <strong>för</strong>ändringstakt.<br />

3.1 Frekvens<br />

Statistik från återkommande undersökningar tas vanligen fram enligt ett regelbundet<br />

schema (månatligen, kvartalsvis, årligen), <strong>och</strong> det är då naturligt att tala om frekvenser<br />

(eller periodiciteter).<br />

- Undersökningsfrekvensen avser periodiciteten i statistikens referenstid.<br />

- Publiceringsfrekvensen avser periodiciteten med vilken statistiken publiceras.<br />

- Uppgiftsinsamlingsfrekvensen avser periodiciteten med vilken grunduppgifter<br />

samlas in.<br />

I normalfallet sammanfaller de tre frekvenserna, men inte alltid. För användaren är<br />

de två sistnämnda frekvenserna normalt de viktigaste.<br />

Exempel<br />

SCB:s Investeringsenkät illustrerar att frekvenser kan skilja sig åt. Undersökningen<br />

samlar in uppgifter <strong>och</strong> publicerar statistik tre gånger per år,<br />

medan statistiken avser kvartal.<br />

3.2 Framställningstid<br />

Tiden mellan statistikens referenstid (referenstidpunkt eller referensperiodens slut)<br />

<strong>och</strong> dess publicering.<br />

3.3 Punktlighet<br />

Överensstämmelsen mellan utlovad <strong>och</strong> faktisk publiceringstid.<br />

Kommentarer om frekvens, framställningstid <strong>och</strong> punktlighet<br />

För en statistikanvändare är det ofta mycket viktigt att statistik <strong>för</strong>eligger i "rätt tid" (t.ex.<br />

till ett utsatt beslutsdatum). Vid engångsundersökningar hänger saken fram<strong>för</strong> allt på<br />

statistikens framställningstid. Vid återkommande undersökningar är publiceringsfrekvens<br />

<strong>och</strong> punktlighet också viktiga.<br />

För ekonomisk statistik som påverkar de finansiella marknaderna kan punktlighets- <strong>och</strong><br />

samtidighetskrav vara så höga som delar av sekund.<br />

Undersökningsfrekvensen spelar roll inte bara <strong>för</strong> statistiks aktualitet. Även en användare<br />

med "historiskt" intresse fäster vikt vid denna. Ju högre den är, desto mer i detalj kan en<br />

utveckling följas.<br />

9


10<br />

4 STATISTIKENS JÄMFÖRBARHET <strong>och</strong> SAMANVÄNDBARHET<br />

gäller främst målstorheters likhet<br />

En vanlig <strong>och</strong> viktig användning av statistik är <strong>för</strong> att göra jäm<strong>för</strong>elser, dels jäm<strong>för</strong>elser<br />

över tiden (tidsserier) dels jäm<strong>för</strong>elser mellan grupper. I det senare fallet<br />

handlar det ofta om geografiska grupper, t.ex. jäm<strong>för</strong>else av <strong>för</strong>hållanden i olika<br />

länder. Jäm<strong>för</strong>elser kan dock mycket väl gälla grupper av annan (än geografisk)<br />

natur, t.ex. jäm<strong>för</strong>else av <strong>för</strong>hållanden <strong>för</strong> två - vuxen - familjer med, 0, 1, 2, 3<br />

respektive 4 eller fler barn, d.v.s. med gruppindelning efter antalet barn.<br />

Vid jäm<strong>för</strong>elser vill man idealt ha tillgång till statistikvärden <strong>för</strong> "samma" målstorhet,<br />

vid olika tidpunkter respektive <strong>för</strong> olika grupper. Hur "lika" målstorheter är,<br />

beror på deras definition. Ytterligare en faktor finns ofta med i bilden. Allmänt uttryckt<br />

gäller att vad man "egentligen" mäter, ofta beror på hur man mäter. För statistikvärdens<br />

jäm<strong>för</strong>barhet spelar den använda undersökningsmetodiken ofta en<br />

betydande roll. Det är till jäm<strong>för</strong>barhetens <strong>för</strong>del om samma frågeformulär, samma<br />

datainsamlingsmetod, samma skattnings<strong>för</strong>farande, o.s.v. använts.<br />

Detta nyss sagda <strong>för</strong>stärks av följande <strong>för</strong>hållande. Även om skev statistik är en<br />

styggelse, mildras skevhetens negativa effekter om statistikvärden som man vill<br />

jäm<strong>för</strong>a är skeva på ett likartat sätt. Lika undersökningsmetod syftar naturligtvis i<br />

<strong>för</strong>sta hand till att leda till jäm<strong>för</strong>bar oskev statistik. Dock, om skevhet trots allt<br />

uppkommer blir den likartad, vilket underlättar jäm<strong>för</strong>else.<br />

Denna <strong>kvalitets</strong>komponent, inklusive delkomponenten "samanvändning med annan<br />

statistik", avser fram<strong>för</strong> allt likhet hos målstorheter <strong>och</strong> undersökningsmetoder.<br />

Kommentar om jäm<strong>för</strong>barhet<br />

Hur pregnanta slutsatser man kan dra från en jäm<strong>för</strong>else beror dock inte bara på hur<br />

"lika" de bakomliggande målstorheterna är. Den beror naturligtvis också på till<strong>för</strong>litligheten<br />

hos de statistikvärden som jäm<strong>för</strong>elsen baseras på. Om deras osäkerheter är<br />

stora kan observerade skillnader vara ett uttryck <strong>för</strong> tillfälligt ”brus” <strong>och</strong> inte <strong>för</strong> faktiska<br />

skillnader.<br />

4.1 Jäm<strong>för</strong>barhet över tiden<br />

Kvalitetsaspekten avser i vilken mån en återkommande undersöknings statistiska<br />

målstorheter <strong>och</strong> undersökningsmetod legat fasta eller ändrats över tiden.<br />

Även <strong>för</strong> statistik framställd med samma innehåll <strong>och</strong> metod kan saklogiskt intressanta<br />

jäm<strong>för</strong>elser vara svåra att göra till följd av bl.a. säsong- <strong>och</strong> kalendervariationer.<br />

(Påsken kan ligga i olika kvartal olika år, antalet arbetsdagar i en månad kan<br />

variera.) Säsongrensnings<strong>för</strong>faranden används <strong>för</strong> att underlätta jäm<strong>för</strong>elser, särskilt<br />

<strong>för</strong> kortperiodisk statistik.<br />

Kommentarer om jäm<strong>för</strong>barhet över tiden<br />

För denna <strong>kvalitets</strong>komponent <strong>för</strong>eligger ofta motstridiga användarintressen. En användare<br />

som är intresserad av utvecklingen i ett specifikt avseende är naturligtvis<br />

angelägen om att statistiken från de olika referenstiderna skall gälla "samma sak", d.v.s.<br />

att statistikens målstorheter <strong>och</strong> även dess eventuella skevhet (undersökningsmetodik)<br />

varit o<strong>för</strong>ändrade.<br />

Användare som fram<strong>för</strong> allt intresserar sig <strong>för</strong> "nuläge <strong>och</strong> framtid" vill ofta att omvärlds<strong>för</strong>ändringar<br />

skall åtföljas av motsvarande <strong>för</strong>ändringar i statistiken, så att den så<br />

väl som möjligt belyser nu rådande <strong>för</strong>hållanden. Sådan anpassning av statistiken leder<br />

vanligen till att jäm<strong>för</strong>barheten över tiden <strong>för</strong>sämras.


Användares jäm<strong>för</strong>elsemöjligheter <strong>för</strong>bättras om statistiken åtföljs av kommentarer,<br />

angående effekter dels av vidtagna <strong>för</strong>ändringar i framställningen av statistiken, dels av<br />

omvärlds<strong>för</strong>ändringar (t.ex. skatteomläggningar).<br />

4.2 Jäm<strong>för</strong>barhet mellan grupper<br />

Denna <strong>kvalitets</strong>komponent avser hur ensartade definitionerna av statistiska målstorheter<br />

<strong>och</strong> även undersökningsmetoder är. När de statistikvärden man vill grunda<br />

en jäm<strong>för</strong>else på kommer från en <strong>och</strong> samma undersökning <strong>för</strong>eligger normalt "full<br />

jäm<strong>för</strong>barhet". När de kommer från olika producenter (olika statistikprogram, olika<br />

statistikbyråer, m.m.) <strong>för</strong>eligger möjlighet till divergenser.<br />

Exempel<br />

Statistik används ofta i internationellt samarbete, t.ex. EU. Det kan handla om<br />

att fastställa ekonomiska bidrag med utgångspunkt från medlemsländers ekonomiska<br />

situation. Det är då angeläget att de olika ländernas ekonomiska statistik<br />

avser "samma sak". Som en konsekvens finns EU-<strong>för</strong>ordningar avseende olika<br />

statistikområden, vilka syftar till ensartade definitioner.<br />

4.3 Samanvändbarhet med annan statistik<br />

Ofta vill man belysa ett sakproblem med statistikvärden <strong>för</strong> olika målstorheter <strong>och</strong><br />

från olika undersökningar. Målstorheternas definitioner (ifråga om objekt, variabler,<br />

population, referenstider) skall då helst vara lika i de olika undersökningarna.<br />

Denna <strong>kvalitets</strong>komponent avser i vilken utsträckning så är fallet.<br />

Exempel<br />

Om man vill bedöma konsekvenserna av vissa tänkbara ändringar i inkomstbeskattningen<br />

av individer, skulle det kunna vara av intresse att kombinera statistik<br />

från följande SCB - undersökningar; Inkomst<strong>för</strong>delningsundersökningen<br />

(HINK), Hushållens utgifter (HUT) <strong>och</strong> Bostads- <strong>och</strong> hyresundersökningen<br />

(BHU). Det är då naturligtvis önskvärt att t.ex. "hushåll" <strong>och</strong> "disponibel<br />

inkomst" definieras på samma sätt i de tre undersökningarna.<br />

Kommentar om samanvändbarhet<br />

Ibland justeras statistiken från en undersökning så att den blir konsistent med statistik<br />

från en annan undersökning, <strong>och</strong> därmed bekvämare att användas tillsammans med<br />

denna. Konsistensvillkor ges ofta av att man fordrar att justerade statistikvärden skall<br />

uppfylla relationer som man på teoretiska grunder vet gäller <strong>för</strong> målstorheterna.<br />

Exempel: Landets ekonomiska utveckling följs med såväl "snabb" (t.ex. månatlig) statistik<br />

som med mer omsorgsfull <strong>och</strong> djupgående årlig statistik, framtagna av olika undersökningar.<br />

I det sammanhanget är ett naturligt konsistenskrav att summan av de tolv<br />

månadsvärdena är lika med årsvärdet.<br />

11


12<br />

5 STATISTIKENS TILLGÄNGLIGHET <strong>och</strong> FÖRSTÅELIGHET<br />

gäller statistikens spridning <strong>och</strong> <strong>för</strong>ståelighet<br />

5.1 Spridningsformer<br />

Kvalitetskomponenten avser de distributionsmedia <strong>och</strong> distributionskanaler som<br />

används <strong>för</strong> att <strong>för</strong>medla statistiken till användare.<br />

Kommentar om spridningsformer<br />

Statistik är ofta ett av flera underlagsmaterial i kartläggningar, utredningar <strong>och</strong><br />

forskningsprojekt. För att en användare enkelt skall kunna vidarebehandla statistiken<br />

<strong>och</strong>/eller integrera den med annat material skall den helst finnas tillgänglig i en form som<br />

svarar mot dennes önskemål. Exempel: Statistik från diskett eller Internet kan medge<br />

enkel <strong>och</strong> snabb sammanställning av egna tabeller, egna beräkningar m.m.<br />

5.2 Presentation<br />

Kvalitetskomponenten avser hur den statistiska informationen presenteras i olika<br />

publikationer <strong>och</strong> databaser; <strong>för</strong>ekomst <strong>och</strong> omfattning av textavsnitt, diagram,<br />

tabeller, referenser <strong>och</strong> bilder. Avser också hur väl särskilt intressanta sakaspekter<br />

på statistiken lyfts fram.<br />

5.3 Dokumentation<br />

Kvalitetskomponenten avser användares möjligheter att få tillgång till beskrivningar<br />

av statistiken i sig, <strong>och</strong> hur den framställdes. Teknisk beskrivning av den process<br />

som ledde fram till statistiken ges i <strong>för</strong>sta hand av undersökningens produktionsdokumentation.<br />

Beskrivning av statistiken ges i <strong>kvalitets</strong>deklarationen.<br />

Kommentar om dokumentation<br />

För användare som avser att själva vidarebearbeta primärmaterial (se nedan) är en väl<br />

genomarbetad produktionsdokumentation ofta en nödvändig <strong>för</strong>utsättning.<br />

5.4 Tillgång till primärmaterial<br />

Med primärmaterial avses grunddata så som de <strong>för</strong>eligger i undersökningens slutliga<br />

observationsregister. Ibland är användare intresserade av statistik som inte<br />

finns framtagen, men som primärmaterialet ger underlag <strong>för</strong>. Två huvudmöjligheter<br />

<strong>för</strong>eligger då.<br />

- Producenten gör specialbearbetningar av primärmaterialet enligt användarens<br />

önskemål <strong>och</strong> anvisningar.<br />

- Användaren får tillgång till (avidentifierat) primärmaterial <strong>för</strong> egen bearbetning.<br />

Kommentarer om tillgång till primärmaterial<br />

Användare med väl specificerade frågeställningar är ofta intresserade av att få specialbearbetningar<br />

ut<strong>för</strong>da av producenten. Viktiga aspekter är då hur snabbt sådana kan<br />

göras, <strong>och</strong> till vilken kostnad.<br />

Forskare <strong>och</strong> utredare är ofta angelägna om att få tillgång till primärmaterial <strong>för</strong> egen<br />

bearbetning. Därigenom får de möjlighet att analysera materialet snabbare <strong>och</strong>/eller mer<br />

flexibelt än när producenten genom<strong>för</strong> specialbearbetningar.<br />

5.5 Upplysningstjänster<br />

Kvalitetskomponenten avser användares möjligheter dels att få svar på frågor om<br />

specifik statistik, dels att få hjälp att hitta i "lagret" av officiell (<strong>och</strong> annan) statistik.<br />

Beroende på upplysningsönskemålet kan det tillmötesgås genom hänvisning till<br />

statistikprogramansvarig funktion/person, till central upplysningstjänst, till forsknings<br />

- <strong>och</strong> utredningsinstitut (<strong>för</strong> analys <strong>och</strong> tolkning), eller till någon annan adekvat<br />

instans.


Riktlinjer <strong>för</strong> <strong>kvalitets</strong>deklaration av statistik<br />

Underlag <strong>för</strong> <strong>kvalitets</strong>bedömning <strong>och</strong> statistikanvändning<br />

För att en användare skall kunna bedöma om han/hon har intresse av en viss statistik,<br />

<strong>och</strong> hur den i så fall kan användas, behöver han/hon information om statistikens<br />

egenskaper i olika avseenden, dess kvalitet. I de två <strong>för</strong>egående kapitlen har ett<br />

<strong>kvalitets</strong>begrepp <strong>för</strong> officiell statistik formulerats <strong>och</strong> <strong>för</strong>klarats. I detta kapitel ges<br />

<strong>riktlinjer</strong> <strong>för</strong> hur producenten skall utforma information till användare om statistiks<br />

kvalitet, göra en <strong>kvalitets</strong>deklaration.<br />

All svensk officiell statistik (SOS) skall <strong>kvalitets</strong>deklareras. Detta gäller oavsett<br />

statistikens form <strong>och</strong> medium <strong>för</strong> spridningen, <strong>för</strong> <strong>Statistiska</strong> Meddelanden (SM),<br />

årsböcker, i databaser, på diskett eller på något annat sätt, <strong>och</strong> oavsett om den tidigare<br />

publicerats i annan version.<br />

De <strong>riktlinjer</strong> som presenteras här är utformade i <strong>för</strong>sta hand med tanke på årliga<br />

undersökningars primära publicering i SM <strong>och</strong> andra liknande publikationer. I<br />

andra fall kan <strong>kvalitets</strong>deklarationerna behöva utformas på annorlunda sätt, t.ex. av<br />

utrymmes- <strong>och</strong>/eller struktureringsskäl. Allmänt gäller dock att de <strong>riktlinjer</strong> som<br />

presenteras här bör följas så långt som möjligt. Vidare kan sägas :<br />

- att <strong>kvalitets</strong>deklaration av kortperiodisk (månatlig, kvartalsvis) statistik ges<br />

genom referens till en <strong>kvalitets</strong>deklaration som utges minst en gång om<br />

året, helst vid årets <strong>för</strong>sta publicering.<br />

- att <strong>kvalitets</strong>deklaration av sekundärpublicerad statistik (t.ex. vissa årsböc-<br />

ker med statistik från olika källor) ges dels genom en <strong>för</strong>kortad <strong>kvalitets</strong>-<br />

deklaration som omfattar särskilt viktiga aspekter, dels genom referens<br />

till den fullständiga <strong>kvalitets</strong>deklarationen i källpublikationen.<br />

Kvalitetsdeklarationerna skall ha en enhetlig struktur, som ansluter till <strong>kvalitets</strong>begreppets<br />

komponenter Innehåll, Till<strong>för</strong>litlighet, Aktualitet, Jäm<strong>för</strong>barhet <strong>och</strong><br />

samanvändbarhet samt Tillgänglighet <strong>och</strong> <strong>för</strong>ståelighet.<br />

Härvid skall följande framhållas. <strong>Kvalitetsbegrepp</strong>ets primära uppgift är att <strong>för</strong>teckna<br />

de aspekter på statistik som spelar roll <strong>för</strong> hur väl den tillgodoser användares<br />

informationsbehov. Att ge en strukturmall <strong>för</strong> <strong>kvalitets</strong>deklarationer är en åtföljande<br />

uppgift, där <strong>kvalitets</strong>begreppets fullständiga komponentlista ibland kan upplevas<br />

som väl lång. T.ex. behöver producenten inte uttala sig om ett SM:s <strong>för</strong>ståelighet,<br />

den kan ju läsaren själv bedöma. Det underlag som producenten skall tillhandahålla<br />

varierar i omfattning <strong>och</strong> karaktär <strong>för</strong> de olika komponenterna. Riktmärket skall<br />

dock alltid vara att ge tillräcklig information <strong>för</strong> att en användare i ett <strong>för</strong>sta steg<br />

skall kunna bedöma om statistiken är användbar <strong>för</strong> hans/hennes syften, <strong>och</strong> i ett<br />

andra steg kunna <strong>för</strong>stå hur statistiken används på ett riktigt sätt.<br />

Riktlinjerna ges i termer av en mall <strong>för</strong> <strong>kvalitets</strong>deklaration, vilken börjar på nästa<br />

sida. I mallens punkter ges anvisningar om vilken information om statistiken som<br />

producenten skall ge under punkterna ifråga.<br />

13


14<br />

Mall <strong>för</strong> <strong>kvalitets</strong>deklaration av statistik<br />

Kvalitetsdeklarationen skall ha användare av statistiken som målgrupp, <strong>och</strong> dess<br />

<strong>för</strong>ståelighet skall relateras till användarna. Producentinriktade begrepp <strong>och</strong> termer<br />

bör undvikas så långt möjligt. Hänvisa gärna till mer ut<strong>för</strong>lig dokumentation, tekniska<br />

rapporter o. dyl.<br />

0 INLEDNING<br />

Beskriv här undersökningens syfte <strong>och</strong> <strong>för</strong>utsättningar, om sådan information inte<br />

ges på annan plats i publikationen. Ta med information om undersökningen som<br />

underlättar <strong>för</strong>ståelsen <strong>för</strong> <strong>kvalitets</strong>deklarationen, t.ex. något om undersökningsplan<br />

<strong>och</strong> uppgiftsinsamling. Annan information som eventuellt kan lämnas här är sammanhang<br />

med andra statistiska undersökningar, andra publiceringsformer, beställar/producent<strong>för</strong>hållande,<br />

m.m.<br />

1 STATISTIKENS INNEHÅLL<br />

Under Innehåll skall fram<strong>för</strong> allt ges information om använda definitioner.<br />

1.1 <strong>Statistiska</strong> målstorheter<br />

Syftar till att ge användaren underlag <strong>för</strong> att bedöma hur väl statistikens storheter<br />

ansluter till hans/hennes sakproblem.<br />

1.1.1 Objekt <strong>och</strong> population<br />

Definiera målpopulationens objekt <strong>och</strong> avgränsning. I den mån undersökningen<br />

omfattar viktiga objekt, som använts vid uppgiftsinsamlingen men inte ingår i<br />

redovisningen, beskriv dem här.<br />

1.1.2 Variabler<br />

Definiera statistikens variabler, inklusive viktiga observationsvariabler som inte<br />

ingår i redovisningen.<br />

1.1.3 <strong>Statistiska</strong> mått<br />

Specificera de statistiska mått som ingår i de statistiska storheterna.<br />

1.1.4 Redovisningsgrupper<br />

Specificera de variabler som använts vid indelning i redovisningsgrupper <strong>för</strong> statistiken,<br />

<strong>och</strong> ange på hur detaljerad nivå redovisningen sker. Om gruppindelningar<br />

är baserade på standarder (t.ex. den <strong>för</strong> näringsgrensindelning), ge hänvisning till<br />

standarden ifråga. Speciellt intressanta redovisningsgrupper kan nämnas särskilt.<br />

1.1.5 Referenstider<br />

Ange relevanta referenstider <strong>för</strong> statistiken. Ibland är det lämpligt att inkludera<br />

referenstiderna redan i definitionerna av objekt <strong>och</strong> variabler. I så fall räcker det<br />

med en hänvisning här.<br />

1.2 Fullständighet<br />

Kvalitetskomponenten avser statistiksystem, <strong>och</strong> vid deklaration av statistik från en<br />

enskild undersökning finns vanligen inte mycket att säga.<br />

2 STATISTIKENS TILLFÖRLITLIGHET<br />

Under Till<strong>för</strong>litlighet ges dels information om statistikens osäkerhet, inklusive<br />

beskrivning av osäkerhetskällor, dels <strong>för</strong>ekomst av osäkerhetsmått <strong>och</strong> deras innebörd.<br />

Informationen skall syfta till att hjälpa en användare att kunna ta ställning till<br />

om statistiken är tillräckligt till<strong>för</strong>litlig <strong>för</strong> hans/hennes användningssyfte, <strong>och</strong> att<br />

kunna använda statistiken på ett riktigt sätt.<br />

2.1 Till<strong>för</strong>litlighet totalt


Idealt anges statistikvärdens osäkerhet med osäkerhetsintervall (konfidensintervall<br />

<strong>och</strong>/eller bedömningsintervall). När sådana presenteras ingår de ofta som del av<br />

själva tabellmaterialet <strong>och</strong> skall då inte redovisas också i <strong>kvalitets</strong>deklarationen.<br />

Ibland tillhandahålls endast mer översiktsmässiga numeriska osäkerhetsmått.<br />

I många fall kan producenten inte beskriva statistikens till<strong>för</strong>litlighet i termer av<br />

osäkerhetsintervall. Den information som kan ges avser då arten av <strong>och</strong> styrkan i<br />

källor till osäkerhet, <strong>och</strong> deras tänkbara kvantitativa konsekvenser <strong>för</strong> statistiken.<br />

Ibland kan producenten ha <strong>för</strong>hållandevis säker uppfattning om riktningen på en<br />

<strong>för</strong>eliggande skevhet, även om det är ogörligt att säga något säkert om dess storlek.<br />

Oavsett om osäkerhetsintervall presenteras eller inte, skall tillgänglig information<br />

om osäkerhetskällor redovisas under punkt 2.2. Denna information bör vara såväl<br />

deskriptiv som, i den mån det går, kvantitativ.<br />

Under 2.1 redovisas en sammanfattande bedömning av de olika osäkerhetskällornas<br />

relativa vikt i den totala avvikelsen.<br />

2.2 Osäkerhetskällor<br />

2.2.1 Urval<br />

Om statistiken kommer från en urvalsundersökning, beskriv det använda urvals<strong>och</strong><br />

skattnings<strong>för</strong>farandet. Det senare är vanligen utformat så att det också omfattar<br />

justering <strong>för</strong> bortfall <strong>och</strong> ibland även <strong>för</strong> täckningsbrister <strong>och</strong> mätfel. Det är då<br />

lämpligt att beskriva hela skattnings<strong>för</strong>farandet här.<br />

När ett sannolikhetsurval använts, kan osäkerhet som beror på inskränkningen till<br />

ett urval vanligen anges med hjälp av konfidensintervall, men andra osäkerhetsmått<br />

<strong>för</strong>ekommer också. Ofta gäller att konfidensintervall (eller ekvivalenta osäkerhetsmått)<br />

fångar upp osäkerhet som härrör inte bara från urvalet, utan också från en<br />

eller flera av källorna ramtäckning, mätning <strong>och</strong> svarsbortfall. Beskriv här hur<br />

osäkerhetsmåtten beräknats <strong>och</strong> hur de skall tolkas. Om ett icke - sannolikhetsurval<br />

använts, informera om detta <strong>och</strong> diskutera urvalets representativitet.<br />

2.2.2 Ramtäckning<br />

Beskriv brister i fråga om rampopulationens täckning av målpopulationen, <strong>och</strong> de<br />

bedömda konsekvenserna <strong>för</strong> statistikens till<strong>för</strong>litlighet. Om skattnings<strong>för</strong>farandet<br />

omfattar justering <strong>för</strong> ramtäckningsbrister, nämn det <strong>och</strong> beskriv justeringarna här<br />

eller under Urval.<br />

2.2.3 Mätning<br />

Beskriv det använda mät<strong>för</strong>farandet. När frågeformulär använts bör detta redovisas<br />

i sin helhet eller i lämpligt sammandrag. Redovisa mätsvårigheter som uppträtt vid<br />

insamlingen av uppgifter <strong>och</strong> deras troliga konsekvenser <strong>för</strong> statistikens till<strong>för</strong>litlighet.<br />

Om redovisade konfidensintervall fångar upp också osäkerhet från slumpmässiga<br />

mätfel, nämn detta <strong>och</strong> ge beskrivning här eller under Urval. Om justeringar <strong>för</strong><br />

systematiska mätfel gjorts, beskriv dessa här eller under Urval.<br />

2.2.4 Svarsbortfall<br />

Ange kvantitativa <strong>och</strong> kvalitativa aspekter på bortfallet; bortfallsandel (vägd<br />

<strong>och</strong>/eller ovägd), uppdelning i "avböjd medverkan" respektive "ej anträffad", kända<br />

eller <strong>för</strong>modade bortfallsmönster, åtgärder <strong>för</strong> att minska bortfallet, m.m. Redovisa<br />

bortfallets bedömda konsekvenser <strong>för</strong> statistikens till<strong>för</strong>litlighet. Beskriv metod(er)<br />

<strong>för</strong> bortfallskompensation i skattnings<strong>för</strong>farandet, här eller under Urval.<br />

2.2.5 Bearbetning<br />

15


16<br />

Redovisa orsaker till osäkerhet som emanerar från databeredningen (dataregistrering,<br />

kodning <strong>och</strong> granskning/rättning) <strong>och</strong> de numeriska beräkningarna. Ange de<br />

bedömda konsekvenserna av eventuella kvarstående fel.<br />

2.2.6 Modellantaganden<br />

Termen ”modell” är mycket allmän. Som nämns i beskrivningen av denna <strong>kvalitets</strong>komponent<br />

ligger ofta modellantaganden till grund <strong>för</strong> val av såväl urvals- <strong>och</strong><br />

skattnings<strong>för</strong><strong>för</strong>ande som <strong>för</strong>faranden <strong>för</strong> att i skattningssteget justera <strong>för</strong> ramtäckningsbrister,<br />

brister i mätnings<strong>för</strong>farandet <strong>och</strong> bortfall. I den mån sådana modellantaganden<br />

gjorts, redovisas de under respektive punkt ovan. Denna punkt avser<br />

endast osäkerhet som härrör från andra modellantaganden.<br />

Redovisa tänkbara orsaker till, <strong>och</strong> bedömda konsekvenser av, att modellantaganden<br />

inte är helt uppfyllda.<br />

2.3 Redovisning av osäkerhetsmått<br />

Denna punkt avser endast huruvida osäkerhetsmått anges eller ej, <strong>och</strong> när sådana<br />

ges, av vilken typ de är. Osäkerhetsmåtten själva återfinns antingen i tabellmaterialet<br />

eller under <strong>för</strong>egående punkter. Osäkerhet kan även beskrivas summariskt<br />

enligt Bilaga 2, vars huvudsyfte är att standardisera beteckningssättet.<br />

3 STATISTIKENS AKTUALITET<br />

Under Aktualitet skall sådan information ges som hjälper användare att bedöma hur<br />

väl statistiken beskriver nuläget.<br />

3.1 Frekvens<br />

Ange undersöknings-, publicerings- <strong>och</strong> uppgiftsinsamlingsfrekvenser <strong>för</strong> statistiken.<br />

Kommentera eventuella genom<strong>för</strong>da eller planerade <strong>för</strong>ändringar.<br />

3.2 Framställningstid<br />

Ange framställningstiden <strong>för</strong> statistiken. Kommentera eventuella <strong>för</strong>skjutningar <strong>och</strong><br />

planerade <strong>för</strong>ändringar.<br />

3.3 Punktlighet<br />

Ange med vilken punktlighet statistiken framställts. För en återkommande undersökning<br />

kan <strong>för</strong>skjutningar <strong>och</strong> <strong>för</strong>ändringar i publiceringsplaner kommenteras här.<br />

4 JÄMFÖRBARHET <strong>och</strong> SAMANVÄNDBARHET<br />

4.1 Jäm<strong>för</strong>barhet över tiden<br />

Ge en resumé över i vilken utsträckning statistiska målstorheter (objekt, variabler,<br />

statistiska mått, m.m.) <strong>och</strong> undersökningsmetod legat fasta respektive ändrats över<br />

tiden. I den mån <strong>för</strong>ändringar skett i samhället som påverkar statistiken, t.ex. nya<br />

lagar <strong>och</strong> avtal, beskriv dem, <strong>och</strong> hur de har påverkat eller tänks kunna påverka<br />

statistiken. Beskriv konsekvenser av eventuella metod<strong>för</strong>ändringar. Peka på <strong>för</strong>ekomst<br />

av tidsseriebrott, <strong>och</strong> beskriv åtgärder <strong>för</strong> att mildra dem. Vid jäm<strong>för</strong>else med<br />

en tidigare referenstid, ange om denna var extrem/ovanlig i något avseende.<br />

4.2 Jäm<strong>för</strong>barhet mellan grupper<br />

Ange i vilken utsträckning statistikens målstorheter överensstämmer med målstorheter<br />

i annan statistik som det kan finnas intresse att jäm<strong>för</strong>a med, t.ex. <strong>för</strong> internationella<br />

jäm<strong>för</strong>elser. Kommentera även undersökningsmetoden i detta avseende.<br />

Om skillnader <strong>för</strong>eligger, beskriv deras innebörd <strong>för</strong> jäm<strong>för</strong>barhet. Avgränsningen<br />

av statistik som det kan finnas intresse att jäm<strong>för</strong>a med blir en bedömningsfråga.<br />

4.3 Samanvändbarhet med annan statistik


Ange annan statistik som är särskilt naturlig att användas tillsammans med den<br />

statistik som <strong>kvalitets</strong>deklareras. Ange i vilken utsträckning dels målstorheter dels<br />

undersökningsmetoder <strong>och</strong> åtföljande eventuella skevheter överensstämmer eller<br />

skiljer sig. Avgränsningen av "annan statistik" blir en bedömningsfråga.<br />

5 TILLGÄNGLIGHET <strong>och</strong> FÖRSTÅELIGHET<br />

För Tillgänglighet <strong>och</strong> <strong>för</strong>ståelighet är behovet av information <strong>för</strong> vissa underkomponenter<br />

inte så stort, eftersom publikationen i sig utgör en del av underlaget<br />

<strong>för</strong> en <strong>kvalitets</strong>bedömning. T.ex. aspekten ”presentation” avser utformning av text,<br />

tabeller, diagram, o. dyl. som användaren i normalfallet direkt kan studera i publikationen.<br />

Informationen syftar till att ge användaren underlag <strong>för</strong> att bedöma hur<br />

väl statistiken tillmötesgår hans/hennes önskemål i fråga om spridningsformer <strong>och</strong><br />

de servicemöjligheter som erbjuds i anslutning till den publicerade statistiken.<br />

5.1 Spridningsformer<br />

Redovisa de distributionskanaler <strong>och</strong> publiceringsmedia som används <strong>för</strong> statistiken.<br />

När tillämpligt, informera användare om att det endast är begränsade delar av<br />

framtagen statistik som publiceras, på grund av kostnadsrestriktioner, begränsat<br />

användarintresse, m.m.<br />

5.2 Presentation<br />

I normalfallet utgör publikationen själv bedömningsunderlaget <strong>och</strong> inga ytterligare<br />

kommentarer behövs.<br />

5.3 Dokumentation<br />

Ange andra källor <strong>för</strong> information om statistiken <strong>och</strong> om den framställningsprocess<br />

som ledde fram till den.<br />

5.4 Tillgång till primärmaterial<br />

Redovisa i stora drag användares möjligheter att få specialbearbetningar ut<strong>för</strong>da,<br />

<strong>och</strong> möjligheter att få tillgång till avidentifierat primärmaterial.<br />

5.5 Upplysningstjänster<br />

Ange vart en användare kan vända sig <strong>för</strong> att få ytterligare hjälp att <strong>för</strong>stå <strong>och</strong> analysera<br />

statistiken, samt finna annan relaterad statistik.<br />

17


Bilaga 1. Begrepp <strong>och</strong> termer i anslutning till statistiska<br />

undersökningar<br />

En statistisk undersökning syftar till kunskap om värdena på statistiska storheter,<br />

d.v.s storheter som ger en sammanfattande numerisk beskrivning av <strong>för</strong>hållanden i<br />

en grupp. Det karaktäristiska <strong>för</strong> en sådan undersökning är att den i ett <strong>för</strong>sta steg<br />

omfattar insamling av uppgifter, som i ett andra steg bearbetas till statistik.<br />

Termen "statistisk undersökning" används med litet olika innebörder. Ibland avser<br />

den en enskild undersökning, medan den i andra fall syftar på en hel serie av återkommande,<br />

väsentligen likadana undersökningar. Konsumentprisindex (KPI) - undersökningen<br />

kan t.ex. avse såväl en bestämd KPI - omgång (t.ex. den som ledde<br />

fram till KPI - värdet <strong>för</strong> mars 1999) som den undersökningsserie som ger ifrån sig<br />

månatliga <strong>och</strong> årliga KPI - värden. I det följande avses med statistisk undersökning<br />

en "enskild" undersökning.<br />

Man möter ibland svårigheter vid avgränsningen av den undersökning som skall<br />

dokumenteras, vars statistik skall <strong>kvalitets</strong>deklareras, el. dyl. Svårigheterna kan<br />

exemplifieras med undersökningsaktiviteterna som leder fram till KPI - värden. Sett<br />

mer i detalj omfattar de ett antal delundersökningar (avseende livsmedel, kläder,<br />

hyror, m.m.), vilka mycket väl kan betraktas som självständiga undersökningar.<br />

Ofta finns ingen självklar början <strong>och</strong> slut i ett undersökningssammanhang, ingen<br />

självklar "avgränsning i rummet". Analoga svårigheter <strong>för</strong> "avgränsning i tiden"<br />

kan också <strong>för</strong>eligga, särskilt vid periodiskt upprepade undersökningar. Det går inte<br />

att ge allmänna regler <strong>för</strong> hur man avgränsar en undersökning. I det praktiska fallet<br />

får avgränsningen göras på det sätt som bedöms vara mest ändamålsenligt <strong>för</strong> det<br />

aktuella beskrivningssyftet.<br />

I stort sett oberoende av hur en undersökning avgränsas, kan den beskrivas med<br />

uppdelning efter nedanstående moment, vilka ansluter till den normala undersökningsgången;<br />

planering (moment 1 <strong>och</strong> 2), uppgiftsinsamling (moment 3) samt<br />

skattning <strong>och</strong> resultatredovisning (moment 4).<br />

Moment 1: Statistikens innehåll<br />

Moment 2: Undersökningsplan<br />

Moment 3: Uppgiftsinsamling<br />

Moment 4: Skattning <strong>och</strong> resultatredovisning<br />

Följande genomgång av begrepp <strong>och</strong> termer görs genom en beskrivning av en statistisk<br />

undersökning med ovanstående momentindelning. Termer som önskas framhävda<br />

är kursiverade, <strong>och</strong> de preciseras/definieras av sin omgivande text.<br />

Moment 1. Statistikens innehåll<br />

Utgångspunkten <strong>för</strong> en statistisk undersökning är ett sakproblem, vilket kan gälla<br />

sociala, ekonomiska, miljömässiga <strong>för</strong>hållanden, eller något annat. Det genererar ett<br />

statistiskt problem med frågor som : Vilka statistiska storheter skulle belysa sakproblemet<br />

väl ? Hur kan exakta eller skattade värden på dessa storheter tas fram ?<br />

Vilka kostnader blir det fråga om ?<br />

Det i statistiksammanhang centrala begreppet är statistisk storhet. Det avser ett<br />

"teoretiskt" ("sant") värde, som definieras av att :<br />

- ett bestämt statistiskt mått används <strong>för</strong> att sammanfatta<br />

- värdena på en eller flera variabler<br />

- <strong>för</strong> objekten i en bestämd grupp.<br />

Objekten kan vara personer, <strong>för</strong>etag, händelser, <strong>för</strong>emål, m.m. Hela objektkollektivet<br />

kallas populationen. Ofta är också olika delpopulationer av intresse, <strong>och</strong><br />

sådana benämns redovisningsgrupper. Med en variabel avses en egenskap hos<br />

objekten, vilken kan vara såväl kvantitativ som kvalitativ. Ett statistiskt mått är en<br />

19


20<br />

beräkningsregel <strong>för</strong> sammanfattande, t.ex. räkning av antal, beräkning av summa,<br />

medelvärde eller median. Ett exempel där storheten beror av två variabler är korrelationskoefficient.<br />

I en undersöknings <strong>för</strong>sta planeringsomgång riktar sig beställarens/användarens<br />

intresse mot statistiska storheter som ansluter till dennes sakproblem, användarens<br />

statistiska intressestorheter. Funnes inte ekonomiska, tidsmässiga eller andra restriktioner,<br />

skulle undersökningen genom<strong>för</strong>as så att värden på intressevariablerna<br />

samlades in <strong>för</strong> samtliga objekt i intressepopulationen. I praktiken genom<strong>för</strong>s dock<br />

sådana "ideala" totalundersökningar sällan. Oftast skulle det bli <strong>för</strong> dyrt, eller ta <strong>för</strong><br />

lång tid att undersöka de objekt <strong>och</strong> variabler man är mest intresserad av. Istället<br />

inriktas undersökningen mot statistiska storheter som, även om de inte helt överensstämmer<br />

med de ideala, bedöms ligga tillräckligt nära dessa <strong>och</strong> vara lättare eller<br />

billigare att undersöka. Objekt, variabler, populationsavgränsning, m.m. som man<br />

väljer att använda i undersökningen benämns med prefixet mål, i sammansättningar<br />

som målobjekt, målpopulation, målvariabel, m.m. Den uppsättning statistikvärden<br />

som undersökningen i <strong>för</strong>sta hand skall resultera i kallas dess tabellplan.<br />

Ett annat vanligt avsteg från den ideala totalundersökningen är att man, fram<strong>för</strong> allt<br />

av kostnads- <strong>och</strong> tidsskäl, undersöker endast ett urval av populationens objekt. Då<br />

kommer medvetet viss osäkerhet in i statistiken. Även när utformningen är av<br />

totalundersökningstyp <strong>för</strong>eligger "störningar" som bidrar till osäkerhet; svarsbortfall,<br />

mätfel, ramtäckningsbrister, m.m. Praktiska undersökningar leder normalt inte<br />

till exakt fastställande av värdena på målstorheterna, utan till statistikvärden som är<br />

skattningar. Statistikuppgift <strong>för</strong>ekommer vanligt som synonym till statistikvärde.<br />

Härvid är den "kategoriska" ledstjärnan att sträva efter väntevärdesriktiga skattningar,<br />

sådana som är "i genomsnitt riktiga". Oftast leder strävandena till statistik<br />

som är, åtminstone så gott som, väntevärdesriktig, men man kan inte alltid undvika<br />

skevhet (bias) i skattningar, d.v.s. att de är <strong>för</strong>enade med systematisk över - eller<br />

underskattning.<br />

Statistikvärden är, som sagt, oftast <strong>för</strong>enade med viss osäkerhet. Ju mindre osäkert,<br />

desto mer till<strong>för</strong>litligt är ett statistikvärde. En statistisk undersökning skall helst<br />

utformas så att meningsfulla osäkerhetsmått <strong>för</strong> statistikvärdena kan beräknas, <strong>och</strong><br />

också beräknas <strong>och</strong> redovisas. Statistiks användbarhet som analys- <strong>och</strong> beslutsunderlag<br />

beror av dess till<strong>för</strong>litlighet. Ju mer till<strong>för</strong>litlig den är, desto bättre underlag<br />

utgör den. Kostnaderna <strong>för</strong> att framställa statistik hänger följdriktigt samman<br />

med dess till<strong>för</strong>litlighet. Ju mer till<strong>för</strong>litlig statistik som önskas, desto högre blir <strong>för</strong><br />

det mesta kostnaden. Åtminstone i en andra planeringsomgång är det där<strong>för</strong> viktigt<br />

att beställare/användare <strong>och</strong> producent kommer till sam<strong>för</strong>stånd om hur statistikens<br />

till<strong>för</strong>litlighet <strong>och</strong> undersökningskostnader skall balansera varandra.<br />

Terminologiska kommentarer<br />

Objekt <strong>och</strong> variabel: Ett flertal synonymer till "objekt" <strong>för</strong>ekommer, bl.a. element, enhet,<br />

elementär enhet, individ <strong>och</strong> objektinstans. Även <strong>för</strong> "variabel" finns synonymer, bl.a.<br />

egenskap <strong>och</strong> attribut.<br />

Statistisk storhet: Förekommande synonymer är parameter <strong>och</strong> karakteristika.<br />

Redovisningsgrupp: Alternativa termer med ungefär samma innebörd är delpopulation,<br />

grupp, klass, domän.


Moment 2. Undersökningsplan<br />

Observationsobjekt <strong>och</strong> uppgiftskälla<br />

Den mest resurskrävande delen av en statistisk undersökning är vanligen uppgiftsinsamlingen.<br />

En <strong>för</strong>ekommande synonym till uppgift är observation. Man brukar<br />

skilja mellan grunduppgifter (t.ex. ett frågesvar inhämtat genom intervju, eller<br />

inkomstuppgifter från Riksskatteverket) <strong>och</strong> härledda uppgifter. De senare framkommer<br />

genom att grunduppgifter kombineras, enligt någon <strong>för</strong>eskriven härledningsregel,<br />

med varandra eller med uppgifter som producenten <strong>för</strong>fogar över.<br />

Planen <strong>för</strong> en uppgiftsinsamling skall ge svar på bl.a. följande frågor. Vem/vad vill<br />

man samla in uppgifter om? Vem vill man inhämta uppgifter från? Hur kommer<br />

man i kontakt med uppgiftskällan? Ett objekt som man hämtar in uppgifter om<br />

kallas ett observationsobjekt, <strong>och</strong> variabler som man samlar in värden på kallas<br />

observationsvariabler. En instans från vilken uppgifter inhämtas kallas en uppgiftskälla.<br />

För ett <strong>och</strong> samma observationsobjekt kan det vara aktuellt att inhämta<br />

uppgifter från flera olika uppgiftskällor. Om uppgiftskällan är en person (t.ex. när<br />

en individ lämnar uppgifter om sig själv) talar man hellre om uppgiftslämnare.<br />

Även register, databaser, o.dyl. kan vara uppgiftskällor. När uppgiftskällan är ett<br />

<strong>för</strong>etag/organisation är vanligen en person utpekad att ansvara <strong>för</strong> att uppgifter<br />

lämnas, dessas riktighet, m.m., en kontaktperson.<br />

Ram<strong>för</strong>farande<br />

Proceduren <strong>för</strong> att fastställa observationsobjekt <strong>och</strong> komma i kontakt med uppgiftskällor<br />

kallas undersökningens ram<strong>för</strong>farande. I "nybörjarboken" ser ram<strong>för</strong>farandet<br />

<strong>för</strong> en urvalsundersökning ut så här. En lista <strong>för</strong>eligger, kallad ram, vars<br />

element ett - till - ett korresponderar med objekten i målpopulationen. Ett urval dras<br />

genom att man låter slumpen välja ut ett antal ramelement, <strong>och</strong> korresponderande<br />

populationsobjekt utgör urvalet som skall observeras. Uppgifter om utvalda objekt<br />

inhämtas direkt från dem själva. Vid detta enkla ram<strong>för</strong>farande <strong>för</strong>eligger ett - till -<br />

ett korrespondens mellan "ramelement", "objekt i målpopulationen", "observationsobjekt"<br />

<strong>och</strong> "uppgiftskälla". I många undersökningar är dock vissa, ibland<br />

t.o.m. alla, dessa instanser olika. Man kan urskilja två huvudtyper <strong>för</strong> en uppgiftsinsamlings<br />

struktur.<br />

Observationsobjektbaserat insamlings<strong>för</strong>farande:<br />

Först fastläggs vilka observationsobjekten skall vara. Därefter kommer uppgiftskällorna<br />

in i bilden (eventuellt är de observationsobjekten själva).<br />

Uppgiftskällebaserat insamlings<strong>för</strong>farande:<br />

• Först fastläggs vissa primära uppgiftskällor som man skall vända sig till.<br />

Hos dessa görs anmodanden av typen: "Var vänlig ange alla objekt (av<br />

angivet slag) som är relaterade (enligt angiven regel) till Er, samt deras<br />

värden på följande variabler: ...........".<br />

• Först därefter vet man precis vilka observationsobjekt som ingår i undersökningen.<br />

Eventuellt fortsätter uppgiftsinsamlingen <strong>för</strong> framkomna objekt,<br />

<strong>och</strong> det kan då vara aktuellt att vända sig till sekundära uppgiftskällor.<br />

Ovanstående insamlingstyper kan benämnas insamling enligt "listmodell" respektive<br />

"klustermodell". Det behöver inte vara självklart vilken av modellerna som<br />

skall användas <strong>för</strong> en speciell undersökning, <strong>och</strong> det finns också mellanvarianter.<br />

Ett huvudinstrument <strong>för</strong> en uppgiftsinsamling, oavsett dess typ, är undersökningens<br />

ram. Dess centrala del utgörs av en eller flera <strong>för</strong>teckningar (vanligen av möjliga<br />

observationsobjekt eller uppgiftskällor). Härvid skall <strong>för</strong>teckning uppfattas i vid<br />

mening. Den vanligaste typen av <strong>för</strong>teckning är ett elektroniskt register, men den<br />

kan vara en lista på papper, en karta, m.m. Objekten i en ram<strong>för</strong>teckning kallas<br />

ramelement. Med undersökningens ram<strong>för</strong>farande avses den totala proceduren <strong>för</strong><br />

21


22<br />

att bestämma precis vilka observationsobjekten <strong>och</strong> uppgiftskällorna skall vara.<br />

Själva ram<strong>för</strong>teckningen räcker dock inte <strong>för</strong> att lägga fast ram<strong>för</strong>farandet, utan<br />

regler <strong>för</strong> hur ramelementen leder (är kopplade) till observationsobjekt <strong>och</strong> uppgiftskällor<br />

måste också anges. (Ett exempel på en litet mer sofistikerad koppling är<br />

när man väljer ut hushåll genom att <strong>för</strong>st välja ut personer, ur en ram med personer,<br />

<strong>och</strong> sedan låta de urvalda personernas hushåll utgöra urvalet av hushåll.)<br />

En ytterligare viktig sak är att ramen skall kunna <strong>för</strong>se undersökaren med kontaktväg<br />

till uppgiftskällan (postadress, telefonnummer, o.dyl.).<br />

I nästa diskussion görs uppdelning efter total- respektive urvalsundersökningar.<br />

Totalundersökningar<br />

Uppgiftsinsamlingen i en totalundersökning avser samtliga observationsobjekt som<br />

ramen leder till. Idealt in<strong>för</strong>skaffar man därigenom uppgifter <strong>för</strong> samtliga objekt i<br />

målpopulationen. I praktiken <strong>för</strong>eligger dock störningar av olika slag.<br />

En sådan gäller defekter i ramens täckning. I praktiken kan ett ram<strong>för</strong>farande med<strong>för</strong>a<br />

såväl att man missar vissa observationsobjekt som borde vara med, som att<br />

man tar med objekt i onödan. För enkelhets skull antas att observations- <strong>och</strong> målobjekt<br />

är av samma typ, vilket de dock i det allmänna fallet inte behöver vara. Med<br />

rampopulationen menas då de objekt som ramelementen leder till. Den del av<br />

rampopulationen som faller inom målpopulationen kallas <strong>för</strong> den nåbara delen av<br />

målpopulationen. De objekt i målpopulationen som ligger utan<strong>för</strong> rampopulationen<br />

kallas (ram)undertäckningen. Den omfattar alltså objekt som inte kan nås via ram<strong>för</strong>farandet.<br />

Den del av rampopulationen som faller utan<strong>för</strong> målpopulationen kallas<br />

(ram)övertäckningen. Härvid <strong>för</strong>utsätts att ramens kopplingsregler är sådana att<br />

man inte med hjälp av informationen i ramen kan avgöra om ett ramelement leder<br />

till ett intressant objekt eller ett övertäckningsobjekt, utan att det avgörandet fordrar<br />

observation. Annorlunda uttryckt: Övertäckning som kan identifieras i ramen<br />

bortses från. Begreppen illustreras i nedanstående figur.<br />

Rampopulation<br />

Målpopulation<br />

Figur. Illustration av täcknings<strong>för</strong>hållanden.<br />

Övertäckning<br />

Nåbar del av<br />

målpopulation<br />

Undertäckning<br />

Under- <strong>och</strong> övertäckning in<strong>för</strong>des ovan under premissen att observations- <strong>och</strong> målobjekt<br />

är av samma typ, men begreppen används mer allmänt på följande sätt.<br />

Undertäckningen utgörs av de objekt i målpopulationen som ram<strong>för</strong>farandet inte<br />

leder till uppgifter om. Övertäckningen utgörs av objekt som ram<strong>för</strong>farandet leder<br />

till (åtminstone vissa) uppgifter om, trots att de ligger utan<strong>för</strong> målpopulationen.<br />

Vanligen avbryts uppgiftsinsamlingen <strong>för</strong> dessa objekt.<br />

Konsekvenserna av under - <strong>och</strong> övertäckning är olika till sin karaktär. Undertäckning<br />

innebär att uppgifter inte samlas in <strong>för</strong> en del av den målpopulation som statistiken<br />

skall uttala sig om, <strong>och</strong> konsekvensen kan bli skevhet i statistiken. Övertäckning<br />

innebär att man använder undersökningsresurser på ointressanta objekt.<br />

Om populationstillhörigheten inte kontrolleras, kan konsekvensen även här bli<br />

skevhet i statistiken.


Urvalsundersökningar<br />

Uppgiftsinsamlingen till en urvalsundersökning avser endast ett urval av de observationsobjekt/uppgiftskällor<br />

som ramen, här kallad urvalsramen, leder till. En<br />

sådan undersökning innebär alltså "ekonomiserad" uppgiftsinsamling jäm<strong>för</strong>t med<br />

en totalundersökning. Vid en urvalsundersökning möter man problem avseende hur<br />

man skall göra inferens till populationsstorheter från observationer på bara ett urval<br />

av objekt, vilket diskuteras litet mer ingående under Moment 4.<br />

Ramtäckningsproblem <strong>för</strong>eligger även vid urvalsundersökningar. Under premissen<br />

att observations- <strong>och</strong> målobjekten är av samma typ, definieras rampopulationen <strong>för</strong><br />

en urvalsundersökning som de målobjekt som urvalsramen leder till. Efter den<br />

modifikationen av rampopulation gäller det som tidigare sagts om under - <strong>och</strong> övertäckning<br />

<strong>för</strong> totalundersökningar också <strong>för</strong> urvalsundersökningar.<br />

Helst skall ett urval vara ett sannolikhetsurval. Därvid låter man en slumpmekanism<br />

operera på urvalsramen <strong>och</strong> generera ett urval av ramelement, som i sin tur leder till<br />

objekturvalet som skall observeras. Härvid skall slumpen operera på ett så<br />

kontrollerat sätt att man <strong>för</strong> en godtycklig delmängd i rampopulationen kan beräkna<br />

sannolikheten att just den blir objekturvalet. Speciellt innebär detta att<br />

urvalssannolikheten <strong>för</strong> varje objekt i rampopulationen kan beräknas. Vidare skall<br />

varje objekt i rampopulationen ha positiv urvalssannolikhet.<br />

Till<strong>för</strong>litligheten i resulterande statistikvärden påverkas av den urvalsutformning<br />

<strong>och</strong> den urvalsallokering (val av urvalsstorlekar) som används. Urvalsutformningar<br />

med stratifierat urval är vanligt <strong>för</strong>ekommande, varvid urvalsramen <strong>för</strong>st delas upp<br />

i åtskilda delar, (urvals)stratan, från vilka delurval dras oberoende av varandra.<br />

Insamlingsmetod/mät<strong>för</strong>farande<br />

Det finns många sätt att samla in uppgifter på. Ett är att helt enkelt över<strong>för</strong>a uppgifter<br />

från ett eller flera externa register. Vid mer egentlig insamling talar man om<br />

mätningar (eller observationer), mätmetod, mätinstrument, o.dyl.<br />

Vid individundersökningar är frågeformuläret det karaktäristiska mätinstrumentet.<br />

Härvid kan svar inhämtas via blankett som distribueras per post eller genom intervju<br />

(med telefon- <strong>och</strong> besöksintervju som huvudmöjligheter), m.m. För att få bra<br />

mätvärden via ett frågeformulär är det viktigt att formuläret är väl utformat ifråga<br />

om språk, anvisningar, frågornas ordningsföljd, m.m. Praktisk utprovning bör ingå i<br />

konstruktionen av ett frågeformulär.<br />

Andra möjligheter att samla in uppgifter på är via diskett eller Internet. Fysikaliska<br />

mätmetoder <strong>för</strong>ekommer också, t.ex. <strong>för</strong> att ge uppgiftsunderlag till miljöstatistik.<br />

Avbrytning<br />

Ibland leder ram<strong>för</strong>farandet till objekt <strong>för</strong> vilka man inte vill påbörja/fortsätta insamling<br />

av uppgifter <strong>för</strong> de egentliga observationsvariablerna. Enligt någon<br />

bestämd avbrottsregel avslutas uppgiftsinsamlingen vid vissa svarskombinationer<br />

på vissa, oftast initiala, frågor. (T.ex. med anvisning av typen: Om svaret på <strong>för</strong>egående<br />

fråga är "Nej", avsluta <strong>och</strong> sänd tillbaka blanketten.) Det vanligaste skälet<br />

<strong>för</strong> att avbryta en uppgiftsinsamling är att det framgår av lämnade uppgifter att objektet<br />

är ett övertäckningsobjekt <strong>och</strong> därmed ointressant, men det finns även andra<br />

skäl. Man brukar ofta uttrycka avbrytning med att objekt identifieras som övertäckning,<br />

vare sig detta är helt adekvat eller ej.<br />

Planerat observationsregister<br />

När en undersöknings målobjekt <strong>och</strong> målvariabler <strong>och</strong> dess ram<strong>för</strong>farande (inklusive<br />

observationsobjekt <strong>och</strong> -variabler) är fastlagda, har man "spänt upp" undersökningens<br />

planerade observationsregister. Det kan, åtminstone schematiskt, ses<br />

som en tabell med observationsobjekt i raderna <strong>och</strong> variabler i kolumnerna. Tabel-<br />

23


24<br />

lens celler är dock fortfarande tomma. Observationsregistret skall härbärgera såväl<br />

grunduppgifter som samlas in, som variabelvärden som härleds ur dessa (åtminstone<br />

dem man vill spara).<br />

Moment 3. Uppgiftsinsamling<br />

Nästa steg är att, så långt möjligt, inhämta avsedda uppgifter till det planerade<br />

observationsregistret. Vid en totalundersökning är allt klart <strong>för</strong> uppgiftsinsamlingen.<br />

Vid en urvalsundersökning gäller att <strong>för</strong>st ut<strong>för</strong>a urvalsdragningen, så att de<br />

avsedda observationsobjekten/primära uppgiftskällorna får identitet.<br />

Förutom den egentliga uppgiftsinsamlingen vidtas olika insamlingsadministrativa<br />

åtgärder. När uppgifter samlas in medelst postenkät, ingår åtgärder som utsändning,<br />

påminnelse, <strong>och</strong> avprickning. I slutändan av en uppgiftsinsamling kan det vara<br />

aktuellt att övergå till alternativt insamlings<strong>för</strong>farande (t.ex. från postenkät till<br />

telefonintervju, eventuellt bara <strong>för</strong> ett urval av dem som resterar).<br />

Uppgiftsinsamlingar utsätts så gott som alltid <strong>för</strong> störningar, som med<strong>för</strong> att man<br />

inte får in uppgifter exakt enligt plan, vilket i sin tur bidrar till statistikens osäkerhet.<br />

Nedan diskuteras sådana osäkerhetskällor.<br />

Mätning/observation<br />

Det händer att en lämnad uppgift inte överensstämmer med det "sanna" värdet<br />

enligt variabelns definition. Det finns en mängd skäl till att så kan vara fallet, t.ex.<br />

att blankettfrågan inte passar ihop med uppgiftskällans bok<strong>för</strong>ing, frågan är tvetydigt<br />

formulerad, personer har bristande minne, uppgiftslämnare kan vara slarviga<br />

(eller ännu värre, medvetet vilseledande), fysikaliska mätmetoder kan vara behäftade<br />

med brister, m.m. Allmänt talar man om att mätfel <strong>för</strong>eligger. Mätfel bidrar<br />

naturligtvis till statistiks osäkerhet, <strong>och</strong> kan göra det såväl på ett systematiskt sätt<br />

(med<strong>för</strong>ande skevhet) som på ett tillfälligt sätt (som inte leder till skevhet, men ökar<br />

osäkerheten).<br />

Svarsbortfall<br />

Svarsbortfall, eller vanligen bara bortfall, uppstår när värden på en eller flera observationsvariabler<br />

inte kan inhämtas. Termen "bortfall" skall uppfattas i den vida<br />

mening som indikeras av engelskans "missing value". Den omfattar t.ex. att uppgifter<br />

saknas, där<strong>för</strong> att de av en eller annan anledning inte kunde över<strong>för</strong>as från ett<br />

administrativt register. Om man <strong>för</strong> ett objekt inte överhuvud erhåller några<br />

användbara uppgifter sägs objektbortfall <strong>för</strong>eligga. Huvudanledningarna <strong>för</strong> detta är<br />

misslyckat kontaktetablerande ("ej anträffad") <strong>och</strong> avböjd medverkan ("vägran").<br />

Ett observationsobjekt <strong>för</strong> vilket åtminstone vissa användbara uppgifter erhålls sägs<br />

vara svarande. Ett objekt som lämnar uppgifter nog <strong>för</strong> att kunna identifieras som<br />

övertäckningsobjekt räknas som svarande. Vid objektbortfall kan det vara aktuellt,<br />

även om det är ovanligt i Sverige, att enligt någon <strong>för</strong>eskriven regel substituera<br />

bortfallna observationsobjektet med andra.<br />

Om användbara uppgifter inhämtats <strong>för</strong> vissa, men inte alla, observationsvariabler<br />

sägs partiellt bortfall <strong>för</strong>eligga (<strong>för</strong> variabler utan värden).<br />

Databeredning<br />

Insamlade uppgifter <strong>för</strong>s in i observationsregistret. Vid över<strong>för</strong>ing av muntliga eller<br />

skriftliga uppgifter till elektroniskt medium talar man om dataregistrering. Det är<br />

ibland aktuellt att enligt givna regler kategoriindela variabelvärden som angetts med<br />

öppna svar (i "klartext", t.ex. yrke), att koda uppgifterna. Genom granskning kan<br />

man sålla fram uppgifter som är, eller misstänks vara, behäftade med fel, särskilt<br />

inkonsistenser <strong>och</strong>/eller grova fel ("slarvfel"). Sedan kan åtgärder vidtas <strong>för</strong> att<br />

kontrollera uppgifterna, vanligen genom att kontakta uppgiftskällan. Kontroller kan


leda till att fel uppdagas <strong>och</strong> att uppgifter rättas/ändras. Dataregistrering, kodning<br />

<strong>och</strong> granskning/rättning kallas sammantaget databeredning.<br />

Slutligt observationsregister<br />

Nästa steg är att framställa det slutliga observationsregistret. För många, <strong>för</strong>hoppningsvis<br />

den stora majoriteten, av cellerna i det planerade observationsregistret har<br />

man lyckats i insamlingen, <strong>och</strong> de innehåller uppgifter. Vissa celler saknar dock<br />

uppgifter beroende på bortfall. Med dessa kan <strong>för</strong>faras på olika sätt.<br />

Vanligen accepteras att uppgift saknas, vilket sedan beaktas på lämpligt sätt i<br />

skattningarna. I andra fall in<strong>för</strong>s "<strong>för</strong>modade" värden istället <strong>för</strong> de saknade,<br />

imputeringar görs. Celler kan också sakna värden där<strong>för</strong> att de svarar mot övertäcknings/avbrytningsobjekt.<br />

Räkning av bortfalls- <strong>och</strong> övertäckningsobjekt görs,<br />

eftersom deras antal spelar roll vid skattningarna.<br />

Beräkning av värden på härledda variabler som skall sparas är ytterligare ett<br />

moment i framställningen av det slutliga observationsregistret, vars innehåll kallas<br />

undersökningens primärmaterial.<br />

Moment 4. Skattning <strong>och</strong> resultatredovisning<br />

Primärmaterialet utgör underlaget <strong>för</strong> statistiken från undersökningen. Steget härifrån<br />

till statistikvärden innehåller huvudingrediensen skattning (estimation), som<br />

diskuteras mer ingående nedan.<br />

Åtminstone när det handlar om officiell statistik görs den framtagna statistiken<br />

allmänt tillgänglig, offentliggörs (publiceras). Härvid kan olika spridningsmedia<br />

(papperstryck, diskett, databas, m.m.) används <strong>och</strong> olika spridningskanaler (Statistiskt<br />

Meddelande, årsbok, inläggning i databas, Reuter, m.m.).<br />

Statistik bör presenteras så att den är lätt att <strong>för</strong>stå <strong>och</strong> överblicka, <strong>för</strong> vilket utformningen<br />

av text, tabeller, diagram, o.dyl. spelar roll. Vidare bör undersökningens<br />

sakmässiga huvudresultat lyftas fram.<br />

Ofta publiceras inte all statistik som tas fram, utan bara sådan som bedöms vara<br />

"mest intressant". Ibland är användare med speciella sakproblem intresserade av<br />

statistik som inte tagits fram, men som kan framställas på basis av primärmaterialet.<br />

De kan då efterfråga av producenten genom<strong>för</strong>da specialbearbetningar. En annan<br />

möjlighet är att en användare får tillgång till (avidentifierat) primärmaterial, <strong>och</strong><br />

därigenom själv kan framställa statistik. Utredare <strong>och</strong> forskare är ofta angelägna om<br />

den sistnämnda modellen, som möjliggör snabb <strong>och</strong> flexibel analys.<br />

Skattning<br />

Steget från primärmaterial till statistikvärden innehåller vanligen ett statistiskt inferensproblem,<br />

beroende på att primärmaterialet normalt inte innebär att man känner<br />

de exakta variabelvärdena <strong>för</strong> samtliga objekt i den målpopulation som statistiken<br />

skall uttala sig om. Vid en urvalsundersökning är man säker på att komma i den<br />

situationen, men man gör det ofta också vid totalundersökningar, beroende på<br />

ramtäckningsbrister, bortfall <strong>och</strong> mätfel.<br />

Punktskattningar, statistikvärden<br />

En beräkningsalgoritm som leder från primärmaterialet till statistikvärden kallas ett<br />

(punkt)skattnings<strong>för</strong>farande eller (punkt)estimations<strong>för</strong>farande. Vid skattning är<br />

den "kategoriska" ledstjärnan att sträva efter väntevärdesriktiga ("riktiga i genomsnitt")<br />

skattningar. Oftast leder strävandena till, åtminstone så gott som väntevärdesriktig<br />

statistik, men man kan inte alltid undvika skevhet (bias) i skattningarna,<br />

d.v.s. systematiska över - eller underskattningar.<br />

Givet en skattnings (åtminstone approximativa) väntevärdesriktighet är nästa princip<br />

att skattnings<strong>för</strong>farandet skall leda till så till<strong>för</strong>litlig statistik som möjligt, mer<br />

25


26<br />

tekniskt uttryckt ha så liten (punkt)estimatorvarians som möjligt. Strävanden efter<br />

till<strong>för</strong>litliga skattningar börjar redan vid valet av urvalsutformning <strong>och</strong> urvalsstorlek(ar).<br />

Härvid är det aktuellt att använda kunskap/antaganden om <strong>för</strong>hållanden i<br />

populationen, bl.a. om hur vissa variablers värden varierar över denna. För att (med<br />

givna undersökningsresurser) uppnå statistik med god till<strong>för</strong>litlighet kan det vara<br />

<strong>för</strong>delaktigt att på lämpligt sätt utnyttja hjälpinformation (som kan avse alla objekt i<br />

populationen eller bara vissa "totaler").<br />

En vanlig struktur i skattnings<strong>för</strong>faranden är att varje svarande objekt tillordnas ett<br />

uppräkningstal, <strong>och</strong> att totaler skattas genom att summera uppräknade observationer<br />

(= observerat värde × uppräkningstal). Uppräkningstal är exempel på härledda<br />

variabler som normalt sparas i det slutliga observationsregistret.<br />

Vid skattningar måste man (explicit eller implicit) ta hänsyn till bortfall, brister i<br />

ramtäckningen samt mätfel, när sådana störningar <strong>för</strong>eligger. Förfaranden med detta<br />

syfte brukar kallas justeringar. De måste baseras på modeller <strong>för</strong> hur störningarna<br />

uppstod. Bortfallsjustering kallas också bortfallskompensation. Ett vanligt<br />

<strong>för</strong>farande är s.k. rak uppräkning, som innebär att man skattar som om de svarande<br />

utgjorde det ursprungliga urvalet.<br />

Beräkningsdelen av skattningarna, vilken numera i stort sett alltid ut<strong>för</strong>s av dator,<br />

kan vålla komplikationer. Felaktiga resultat på grund av otillräcklig numerisk precision<br />

<strong>för</strong>ekommer dock knappast längre. Huvudrisken utgörs av felprogrammering<br />

av skattningsformler. Här <strong>för</strong>eligger ofta <strong>för</strong>hållandet att stora fel avslöjar sig själva<br />

genom att leda till uppenbart orimliga resultat, medan mindre lapsusar kan undgå<br />

upptäckt.<br />

Osäkerhet <strong>och</strong> skattning av sådan<br />

Som redan pekats på flera gånger är ett statistikvärde normalt endast en skattning av<br />

den statistiska målstorheten. Då <strong>för</strong>eligger en avvikelse mellan statistikvärdet <strong>och</strong><br />

målstorheten. Det är naturligtvis önskvärt att kunna ange en begränsning <strong>för</strong> en<br />

avvikelses absoluta värde, vilket dock är inte alldeles enkelt eftersom målstorhetens<br />

värde är okänt. (Kände man det skulle man eliminera avvikelsen.) Uttalanden om<br />

avvikelser faller med nödvändighet under kategorin "utsagor om rådande<br />

osäkerhet", ett begreppsmässigt intrikat område. Som bäst kan man uttala sig om en<br />

avvikelses troliga största absoluta värde, vilket vanligen görs i termer av<br />

osäkerhetsintervall med nedanstående innebörd.<br />

Det är högst troligt att målstorhetens värde ligger i :<br />

osäkerhetsintervall = statistikvärde ± osäkerhetsmarginal.<br />

Tekniskt presenteras osäkerhetsintervall antingen som ("objektiva") konfidensintervall<br />

eller som ("subjektiva") bedömningsintervall. De senare är baserade på<br />

tidigare utvärderingar, ämnes<strong>för</strong>ståelse, undersökningserfarenhet, m.m.<br />

Vad gäller konfidensintervall, anges sådana i officiell statistik oftast som "statistikvärdet<br />

± 2 × estimatorns skattade standardavvikelse", där 2 är en avrundning av<br />

normal<strong>för</strong>delningsvärdet 1,96 , vilket också används. Under allmänna <strong>för</strong>utsättningar<br />

har ett sådant konfidensintervall (approximativt) 95% konfidensnivå/grad.<br />

Statistikvärdens osäkerhet kan också anges med andra osäkerhetsmått. Förekommande<br />

sådana är variationskoefficient (= estimatorns standardavvikelse delad med<br />

statistikvärdet) <strong>och</strong> relativ osäkerhetsmarginal (= 2 [eller 1,96] × variationskoefficienten).<br />

Dessa osäkerhetsmått, liksom konfidensintervall, beräknas genom att man<br />

i ett <strong>för</strong>sta steg skattar (punkt)estimatorns varians. Beräkning av osäkerhetsmått<br />

brukar där<strong>för</strong> också åberopas som variansskattning, <strong>och</strong> en beräkningsprocedur <strong>för</strong><br />

det syftet kallas ett variansskattnings<strong>för</strong>farande.


Idealt skall ett osäkerhetsmått avse den totala avvikelsen mellan statistikvärde <strong>och</strong><br />

målstorhet, men det är ofta svårt att ange sådana totala osäkerhetsmått. Ofta är det<br />

lättare att uttala sig om delavvikelser som relaterar till en eller flera av de osäkerhetskällor<br />

som kan påverka statistiken; ramtäckningsbrister, mätfel, bortfall, bearbetningsfel.<br />

I vissa fall kommer osäkerhet in också där<strong>för</strong> att ett modellberoende<br />

skattnings<strong>för</strong>farande använts <strong>och</strong> att modellantagandena inte varit helt uppfyllda.<br />

Terminologiska kommentarer<br />

Uppräkningstal: Förekommande synonymer är vägningstal <strong>och</strong> (uppräknings)vikt.<br />

Osäkerhetsmått: En estimators skattade standardavvikelse kallas ibland estimatorns medelfel,<br />

<strong>och</strong> variationskoefficienten <strong>för</strong> det relativa medelfelet.<br />

27


Bilaga 2. Summarisk redovisning av osäkerhet<br />

Huvudregeln är att osäkerhetsmått bör presenteras i nära anslutning till de statistikvärden<br />

de avser. I vissa fall kan detta dock vara mindre lämpligt, av utrymmesskäl<br />

eller <strong>för</strong> att osäkerhetsmåtten "tynger" i tabellerna. För att ändå ge information om<br />

osäkerheten i anslutning till statistikvärdena kan det, åtminstone ibland, vara praktiskt<br />

att använda en kort summarisk beskrivning av osäkerheten med hjälp av bokstäver.<br />

I nedanstående tablå anges en standard <strong>för</strong> detta <strong>för</strong>farande. Om det används<br />

i t.ex. ett SM, skall naturligtvis också tablån ingå i SM:et. Först några begrepp.<br />

Relativa medelfelet <strong>för</strong> ett statistikvärde (med möjliga synonymer<br />

relativa standardavvikelsen <strong>och</strong> variationskoefficienten) =<br />

= statistikvärdets (skattade) standardavvikelse<br />

.<br />

statistikvärdet<br />

Med ett statistikvärdes relativa osäkerhetsmarginal (relativa felmarginal) avses<br />

endera av 2 × relativa medelfelet eller 1,96 × relativa medelfelet, beroende på vilket<br />

av normal<strong>för</strong>delningens 1,96 <strong>och</strong> det avrundade värdet 2 som <strong>för</strong>edras.<br />

Under allmänna <strong>för</strong>utsättningar gäller att<br />

statistikvärdet × (1 ± den relativa osäkerhetsmarginalen)<br />

ger ett konfidensintervall <strong>för</strong> målstorheten, med cirka 95% konfidensnivå.<br />

Standard <strong>för</strong> bokstavsbeteckning av<br />

relativa osäkerhetsmarginaler<br />

Relativ osäkerhetsmarginal<br />

Övre gränsen är uteslutande<br />

Bokstavs -<br />

beteckning<br />

0% – 2% A<br />

2% – 5% B<br />

5% – 10% C<br />

10% – 20% D<br />

20% – 50% E<br />

50% – 100% F<br />

100% – G<br />

Kommentar<br />

I termer av relativt medelfel (variationskoefficient) har bokstäverna följande innebörd.<br />

A : Det relativa medelfelet (variationskoefficienten) ligger mellan 0 % <strong>och</strong> 1 %, B : Det relativa<br />

medelfelet (variationskoefficienten) ligger mellan 1 % <strong>och</strong> 2,5 %, o.s.v.<br />

Exempel: Nedanstående tabell ger ett fiktivt exempel på hur osäkerhet<br />

kan anges med bokstäver.<br />

Godsslag<br />

Totalt 300 677 B<br />

Spannmål 3 584 E<br />

Rundvirke 45 321 C<br />

Livsmedel <strong>och</strong> djurfoder 28 432 C<br />

Oljeprodukter 16 420 D<br />

Jord, sten, grus o sand 65 436 D<br />

Natur- <strong>och</strong> konstgödsel 2 803 F<br />

Under 1998 med lastbil transporterad<br />

godsmängd. Sort 1000 ton.<br />

29


Bilaga 3. <strong>Kvalitetsbegrepp</strong>et på engelska<br />

The following is a translation of the material on pages 1-12.<br />

Quality Concept for Official Statistics<br />

1 On quality in general<br />

In everyday language "quality" is about where on a scale bad - good - excellent a<br />

user places a certain product (commodity or service) compared with other similar<br />

products. Often, however, the word "quality" is also given a positive connotation,<br />

as a synonym to "good quality". This possible value judgement makes the notion<br />

somewhat difficult to handle, and it may be defined in different ways.<br />

The views on quality, and ideas about how to develop products with good quality<br />

have varied over time. During recent decades the quality philosophy for producers<br />

of goods and services has gradually come to be dominated by the approach labelled<br />

total quality, with central points as formulated in (i) and (ii) below.<br />

(i) The user shall be in focus. A product's quality is determined by (existing and<br />

potential) users' opinions of the product and its fitness for their poses.<br />

For the above slogan formulation to have practical effects, it must be made operational.<br />

A first step is to formulate a concrete quality concept for the product. With<br />

(i) as background the producer's quality concept may be specified as follows.<br />

(ii) Quality refers to all aspects of a product which are of relevance for how<br />

well it meets users' needs and expectations.<br />

This definition takes into account a user oriented quality concept. For the producer<br />

it has in the first place a descriptive meaning. For him/her the quality concept is<br />

essentially a listing of the aspects of a product, which users consider when judging<br />

how well it satisfies their needs and expectations. In doing so, they consider aspects<br />

of the product's functioning as well as services in conjunction with its acquisition,<br />

use and maintenance. The quality concept does not, however, imply on whether the<br />

product is of good or bad quality in any absolute sense.<br />

For the user "quality" has a more valuing signification. His/her quality assessment<br />

depends not only on the product per se, but also on its intended use. The same<br />

product may be judged to have good quality for one kind of use, but poor for<br />

another. The user is sovereign in knowing about his/her needs and expectations, and<br />

is therefore the one to make quality assessments. For the producer it is of course<br />

highly important to learn about users' opinions on quality, since they provide the<br />

basis for work towards better quality (greater user satisfaction).<br />

The concrete quality concept for a specific product is of importance in at least the<br />

following contexts.<br />

Design of quality declarations : By making a quality declaration the producer can<br />

specify the properties of a product so that it can be used in a proper way, and<br />

inform users about what quality in different respects they can count on.<br />

In quality improvement work : Since user opinions and preferences change over<br />

time, the producer must continuously strive to adapt the product to new needs<br />

and expectations. A user oriented quality concept facilitates communication<br />

between user and producer.<br />

In evaluations of productivity : It is always of importance that production processes<br />

are as efficient as possible. A producer therefore wants to be able to judge<br />

the relative benefits and costs for different parts of the production process. The<br />

quality concept provides one of the instruments for efficiency evaluation and an<br />

optimal allocation of production resources.<br />

31


32<br />

Quality and statistics<br />

The term "statistics" is used with somewhat different meanings. Here its chief<br />

interpretation is "a summarising numerical description of the conditions for a<br />

group". Statistics are produced to provide information which sheds light on subject<br />

matter problems. They often constitute vital basic information in planning and<br />

decision contexts. They also provide information to the general public, investigators,<br />

researchers and others about "the state of affairs".<br />

The basic notion in statistics contexts is statistical characteristic, which is a<br />

numerical value determined as follows. A statistical measure (e.g. "number of",<br />

mean or median) is used to summarise individual variable values for the objects in<br />

a group. The totality of considered objects is called the population.<br />

Examples of statistical characteristics are : (i) Production value for the Swedish<br />

shipbuilding industry during 1998. In this case the population = Swedish shipbuilding<br />

enterprises (during 1998), the variable = production value during 1998, the<br />

statistical measure = sum. (ii) Average disposable income during 1998 for a<br />

Stockholm family with two children. In this case the population = families with two<br />

children who 1998 lived in Stockholm, the variable = disposable income, the<br />

statistical measure = mean.<br />

The purpose of a statistical survey is to acquire information about the value of one<br />

or more statistical characteristics for a population, usually also for various subgroups<br />

of the population. The characteristics with which the survey is concerned are<br />

called the target characteristics. They have "true" but unknown values. A survey<br />

typically comprises two main steps, first the collection of primary data for<br />

individual objects and thereafter the compilation of statistics, which estimate the<br />

target characteristics.<br />

The word "estimate" used above indicates that statistics usually do not provide perfectly<br />

true values of target characteristic, but are subject to some uncertainty. The<br />

"categorical imperative" for a surveyor is to strive for estimates which are unbiased<br />

("on average correct"). There are many potential sources of inaccuracy. For a sample<br />

survey the obvious source of inaccuracy is that perfect information about a<br />

population cannot be gained by observing only a sample of its members. Total<br />

inspection surveys as well as sample surveys are affected also by other kinds of<br />

disturbances, which contribute to the inaccuracy of the final statistics. Sources of<br />

inaccuracy, in addition to sampling, which are discussed in more detail later on are:<br />

frame deficiencies, measurement errors, non - response, processing errors and non -<br />

perfect model assumptions.<br />

When the "total quality" concept formulated in the previous section is applied to the<br />

"product" statistics it leads to the following definition.<br />

(iii) Quality of statistics refers to all aspects of statistics, which are relevant<br />

for how well they meet users' needs for statistical information.<br />

As a background to the quality concept to be formulated below we will comment on<br />

some aspects of statistics, which are important to a majority of users. The subsequent<br />

section "Elaboration on the quality components" contains a more detailed<br />

discussion of the aspects.<br />

Mostly users have a strong desire for timely statistics, meaning (at least ideally) that<br />

they describe the "now" state of affairs. Factors which affect timeliness are<br />

swiftness in data collection and subsequent compilations, and for repeated surveys<br />

how frequently they are executed.<br />

A common and important usage of statistics is for comparisons, over time (via time<br />

series) as well as between groups. Fair comparisons require coherence of the target


characteristics to be compared. This requirements is also important when statistics<br />

from different sources are to be combined.<br />

Statistics are made available to users by different dissemination forms, via different<br />

media (e.g. on paper, on diskettes and other electronic media) and through different<br />

channels (e.g. periodical reports by mail, year books, Reuter, Internet). Statistical<br />

information is presented in different ways, in tables, charts, text, etc.<br />

Some users want statistics other than those published regularly. Sometimes such<br />

statistics, although not published, are available by the producer, in other cases they<br />

can be created by special processing of the primary data. A further alternative,<br />

which is requested by many users, in particular researchers and investigators, is<br />

direct access to (de-identified) primary data, which allows the users to derive statistics<br />

and make analyses themselves according to their own specific interests.<br />

Users' confidence in statistics depends on their beliefs about errors, unintentional as<br />

well as intentional. Not even a very careful statistics producer can avoid some<br />

unintentional uncertainty in the statistics. It is a fact of life, however, that deliberately<br />

false, non-objective, statistics sometimes occur, which of course is a serious<br />

quality deficiency. However, the aspect objectivity is not included in the quality<br />

concept. It is more or less impossible to judge if statistics are objective or not, and<br />

producers of false statistics would not inform their users about it. As regards Sweden,<br />

the law 1992 : 889 states the following. "Official statistics shall be objective<br />

and generally available".<br />

As already said, "user" refers to existing as well as potential users. There will<br />

always be organisations and persons who consider that their needs are not met by<br />

the official statistics, either because the statistics are not produced at all or because<br />

available statistics is not accurate enough. Producers should be keen to take such<br />

requirements into account when evaluating and revising surveys.<br />

Quality concept for official statistics<br />

How a user delimits the portion of statistics, with which his/her quality opinion is<br />

concerned, depends on his/her specific subject matter problem and application<br />

interest. "The statistics" may consist of a single value, of all statistics from a particular<br />

survey or statistics from different surveys to be used together. It may also<br />

concern "flows" (over time) of statistics. It is of course so that the more the concerned<br />

portion of statistics encompasses, the more quality aspects does it have. The<br />

following quality concept is meant to be applicable whatever the statistics extent<br />

may be, but for small "statistics packages" some of the quality components may be<br />

irrelevant.<br />

There is no self-evident division of the total collection of quality aspects for statistics<br />

into main aspects and sub-aspects. The quality concept which is presented<br />

below has the following five main components. (1) Contents, which concerns the<br />

target characteristics. (2) Accuracy, concerning sources of inaccuracy and their<br />

effects on the statistics. (3) Timeliness, concerning time aspects of relevance for<br />

how well the statistics describe the "now" situation. (4) Coherence especially comparability,<br />

concerning possibilities to make comparisons, over time and between<br />

groups, and to use the statistics jointly with statistics from other sources. (5) Availability<br />

and clarity, concerning physical availability of the statistics and their understandability.<br />

It has been emphasised earlier that the quality concept is user oriented. As a consequence,<br />

it should as far as possible be formulated from the users' point of view (not<br />

the producers'). There are exceptions from this principle, however, particularly for<br />

the quality component "accuracy". For the user "overall accuracy" is of chief interest,<br />

while its decomposition into different uncertainty sources, as is made in the<br />

quality is of a technical, producer oriented nature. The reason for specifying "nar-<br />

33


34<br />

row" uncertainty sources is that it is usually difficult to be specific about overall<br />

accuracy, while it may be possible to inform about how and with what effect at least<br />

some of the uncertainty sources affect the statistics.<br />

In the table below, the quality concept is structured by main components and subcomponents.<br />

The components are more elaborately described in next chapter.<br />

Quality concept for official statistics<br />

CONTENTS<br />

• Statistical target characteristics<br />

- Units and population<br />

- Variables<br />

- Statistical measures<br />

- Study domains<br />

- Reference times<br />

• Comprehensiveness<br />

ACCURACY<br />

• Overall accuracy<br />

• Sources of inaccuracy<br />

⋅ Sampling<br />

⋅ Frame coverage<br />

⋅ Measurement<br />

⋅ Non - response<br />

⋅ Data processing<br />

⋅ Model assumptions<br />

• Presentation of accuracy measures<br />

TIMELINESS<br />

• Frequency<br />

• Production time<br />

• Punctuality<br />

COMPARABILITY and COHERENCE<br />

• Comparability over time<br />

• Comparability between domains<br />

• Coherence with other statistics<br />

AVAILABILITY and CLARITY<br />

• Dissemination forms<br />

• Presentation<br />

• Documentation<br />

• Access to micro data<br />

• Information services


Elaboration on the quality components<br />

This chapter specifies and discusses the components of the quality concept, with<br />

emphasis on their descriptive meaning. For some of them comments are made on<br />

users' views. The discussion follows the structure of the quality concept, in particular<br />

for numbering components and sub - components.<br />

A reader who meets technical and/or terminological difficulties in the reading, may<br />

be assisted by the Appendix 1, which treats concepts and terminology in conjunction<br />

with statistical surveys. [The appendix is not translated into English, however.]<br />

CONTENTS of the statistics<br />

concerns the statistical target characteristics<br />

1.1 Statistical target characteristics<br />

A target characteristic (with target parameter as a common synonym) is defined as<br />

follows. A specific statistical measure is used to summarise the individual variable<br />

values for the objects in a group. The totality of objects under consideration is<br />

referred to as the population.<br />

1.1.1 - 1.1.3 Objects and population, variables, and statistical measures<br />

These quality components concern definitions of objects, variables and statistical<br />

measures which are involved in the target characteristics.<br />

1.1.4 Study domains<br />

Most surveys present statistics not only for the entire population, but also for study<br />

domains (subpopulations and (sub)groups are common synonyms). One speaks of<br />

"breaking down" statistics to subgroups. A premise for breaking down is, of course,<br />

that variables which specify subgroups are known (by observations or otherwise).<br />

There are restraining factors, however, for how far statistics may be broken down.<br />

One is simply that the more subgroups one takes into account, the more work and<br />

publication space is required. Another is that integrity may be jeopardised.<br />

Moreover, when statistics from sample surveys are derived for successively smaller<br />

domains, their accuracy deteriorates and ultimately becomes so bad that the<br />

statistics no longer are meaningful. Breaking down has to be terminated at an<br />

appropriate level.<br />

The foremost aspects of this quality component are :<br />

- Specification of what kind of variables are used to form study domains.<br />

- Specification of how far - going the division into study domains is.<br />

Objects and variables have reference times, as is further discussed in point 1.1.5.<br />

Example<br />

SCB conducts each year an Income survey (HINK), which reports on the income<br />

distribution for Sweden's population. Reference period is calendar year.<br />

A central object in the survey is "family", consisting of either<br />

two adults ( ≥ 18 years) living together "as if married" and the children (< 18<br />

years) who might live with them, or<br />

a single adult and the children who might live with him/her.<br />

The population consists of all families who lived in the country during at<br />

least half the calendar year.<br />

Examples of variables for families: Wages during the year, disposable income<br />

during the year, socio - economic group, number of children.<br />

35


36<br />

Examples of study domains : Two - adult families with three or more children,<br />

families of a single adult with children, farmer families.<br />

The dominating types of statistical measure are means and "number of", but<br />

others also occur, e.g. median.<br />

Examples of target characteristics : Average wage during the year for blue<br />

colour worker families, average disposable income during the year for two -<br />

adult families without children, median income for senior - salaried -employee<br />

families, number of farmer families.<br />

Comments on statistical target characteristics<br />

A user's wishes about statistical information depend on his/her subject matter problem.<br />

Of course he/she wants that target characteristics should relate closely to the concrete<br />

problem. The better objects, variables, statistical measures, and reference times agree<br />

with his/her interests, the better the quality is as regards target characteristics.<br />

A user who may participate in the planning of a new survey or in the re - designing of an<br />

existing one has the opportunity to influence the choices of objects, variables, statistical<br />

measures, and reference times. However, since surveys normally have many users, conflicting<br />

wishes often turn up, and compromises have to be made. Even in situations with<br />

consensus about target characteristics, cost and/or timeliness considerations may lead to<br />

target characteristics that differ from the ideal ones.<br />

Comment on study domains<br />

If a user's interest focuses on certain specific groups, he/she of course is keen to have<br />

statistics reported for these groups. If the user's interests are more general, he/she may<br />

pay most regard to a detailed division into study domains.<br />

1.1.5 Reference time<br />

Objects and variables have temporal dimensions. The time may be narrowly<br />

delimited, e.g. be a specific date, which is called the reference time point. A longer<br />

time span, e.g. a calendar year, is referred to as the reference period. Usually reference<br />

times agree for variables and objects in a target characteristic, but they need<br />

not. Several reference times may be involved in a target characteristic, notably in<br />

those which measure changes.<br />

For statistics from recurrent surveys (e.g. about average yearly wages) it is natural<br />

to view population and variables as being the same in each survey round (although<br />

"updated" between rounds), while the reference time changes. For statistics from<br />

one - time surveys it is often more natural to view reference time as part of the definitions<br />

of objects and variables. (Example : Objects may be defined as "women<br />

aged 16 – 50 years who lived in Stockholm July 1st, 1998".) Whether it is most<br />

convenient to regard reference times as "independent" or as "part of the object/variable"<br />

depends on the specific situation.<br />

Example<br />

Object and variable with the same reference time : Average work income<br />

during 1998 for persons who lived in the country during 1998.<br />

Object and variables with different reference times : Salary during 1998 for<br />

persons who graduated as civil engineers in 1988.<br />

Variables with different reference times : That consumer price index for July<br />

1998 was 257 means (somewhat sweepingly) that a specific "commodity bas-<br />

ket" which in the base year 1980 cost 100 SEK, in July 1998 cost 257 SEK.<br />

Here 1998 as well as July 1980 appear as reference times for prices.


1.2 Comprehensiveness<br />

This quality component concerns how well the output from a "statistics system"<br />

describes a subject matter field in its "vital aspects". (For instance, how well the<br />

labour market statistics informs about vital aspects of the labour market.) However,<br />

no statistics system will live up to what all users regard as all the vital aspects of the<br />

subject matter field, but it can do so in a greater or less degree.<br />

2 ACCURACY of the statistics<br />

concerns agreement between statistics and target<br />

characteristics<br />

Usually there are so many disturbances in a statistical survey that the statistics do<br />

not give exact values of the target characteristics, only estimates. Here, the lead star<br />

is unbiased ("correct in average") estimates. Normally there is a discrepancy/deviation<br />

("error") between a statistic and its target value. The smaller the<br />

discrepancy is, the more accurate the statistic is. Of course users want discrepancies<br />

to be small, preferably negligible.<br />

Often, however, deviations are not negligible, and this is partcularly the case for<br />

statistics from sample surveys. Then, at least statistically knowledgeable users want<br />

numerical bounds for the deviations, referred to as accuracy measures or<br />

uncertainty measures. The derivation of such measures is a somewhat intricate<br />

matter, though, since the discrepancies depend on the target values, which are<br />

unknown. (If they were known, a survey would be superfluous.) Statements about<br />

accuracy of statistics inevitably fall in the category "statements concerning prevailing<br />

uncertainty", a conceptually intricate topic. The common way to present<br />

accuracy information is by uncertainty intervals, as indicated below.<br />

It is likely that the value of the target characteristic lies in :<br />

uncertainty interval = statistic ± margin of uncertainty.<br />

Often such an interval is a confidence interval with a specified confidence level. If<br />

this is 95 % , the interval encompasses the target value with a likelihood of 95 %.<br />

Other accuracy measures, in essence equivalent to a confidence interval,. are : standard<br />

deviation, coefficient of variation and relative margin of error. Sometimes<br />

uncertainty intervals are based on special evaluations of the survey, subject matter<br />

knowledge, experience, etc. Then one talks about judgement intervals.<br />

A classification of "errors" which is helpful in some contexts is as random or systematic.<br />

Random errors "fluctuate around 0", while systematic ones tend to "pull in<br />

the same direction" (have the same sign). Systematic errors may lead to biased statistics.<br />

2.1 Overall accuracy<br />

A user is chiefly interested in how well he/she can rely on the statistic from an<br />

overall point of view, i.e. to have a limit for the total deviation between the statistic<br />

and the target value. Sometimes, but as an exception rather than a rule, the producer<br />

can exhibit quantitative overall uncertainty intervals. Mostly, however, precise<br />

information can only be given concerning the extent and consequences of certain<br />

narrower sources of inaccuracy.<br />

A comment on accuracy<br />

Production of statistics can often be speeded up if standards of accuracy are lowered (by<br />

accepting large non - response, incomplete editing, etc.). Production time and accuracy<br />

are in conflict. In cases where fast statistics are judged to be important the dilemma is<br />

often handled by presenting "preliminary" statistics in a first round, and later "definite"<br />

statistics with better accuracy.<br />

37


38<br />

2.2 Sources of inaccuracy<br />

At least as a first approximation, with pedagogical merits, the total deviation may<br />

be seen as a sum of partial deviations emanating from different error sources. It<br />

should be noted, however, that (i) partial errors may cancel one another (by having<br />

different signs) (ii) assigning a particular survey weakness to a specific error<br />

sources is sometimes discretionary.<br />

2.2.1 Sampling<br />

This quality component concerns the part of the total deviation which is due to the<br />

fact that only a sample of objects are observed. Uncertainty intervals can often be<br />

given in the form of confidence interval.<br />

2.2.2 Coverage<br />

This quality component concerns the part of the total deviation which is due to the<br />

fact that the population determined by the survey frame differs from the target<br />

population.<br />

2.2.3 Measurement<br />

This quality component concerns the part of the total deviation which is due to<br />

measurement difficulties.<br />

2.2.4 Non - response<br />

Non - response occurs when values for one or more variables are not obtained. The<br />

term should be interpreted in the wide sense "missing value". (It covers e.g. the<br />

possibility that data are missing because they, for one reason or another, could not<br />

be transferred from an external register.) If no usable data are obtained for an<br />

observation object, one speaks of object non - response. If usable values are collected<br />

for some, but not all, variables, one speaks of partial non - response.<br />

The quality component concerns the part of the total deviation which is due to non -<br />

response.<br />

2.2.5 Data processing<br />

This quality component concerns the part of the total deviation which is due to<br />

imperfection in the data processing, which comprises editing (data entry, coding,<br />

scrutiny/correction) and estimation/aggregation. For a sample survey the estimation<br />

procedure is closely related to the sampling procedure. It is therefore often natural<br />

to merge the two into the combined aspect "sampling and estimation".<br />

2.2.6 Model assumptions<br />

This quality component concerns the part of the total deviation which is due to the<br />

fact that statistics depend on model assumptions which are not perfectly fulfilled.<br />

Choices of sampling and estimation procedures are often based on assumptions,<br />

which matter for the accuracy of the resulting statistics but not for their unbiasedness.<br />

Moreover, adjustments to parry non - response and deficiencies in coverage<br />

and measurement are usually based on model assumptions. The mentioned types of<br />

model assumptions are preferably referred to the specific error source, while the<br />

present quality component concerns model assumptions in addition to those relating<br />

to sampling, frame coverage, measurement and non - response. Examples are :<br />

extrapolation models, models for dividing totals into sub - totals and models for<br />

estimating contributions from non - observed parts of the population.<br />

2.3 Presentation of accuracy measures<br />

This quality component concerns whether or not disseminated statistics are accompanied<br />

by uncertainty measures.


Comments on accuracy measures<br />

In planning and decision contexts statistics are often, at least in a first round, used so that<br />

reasoning is carried out under the premise that the statistics provide correct values.<br />

However, many users are aware that they may come to more or less misleading<br />

conclusions by disregarding the uncertainty. Those who want to judge the consequences<br />

of uncertainty are in markedly different situations if uncertainty measures are presented<br />

or not. With accuracy measures available, users who are knowledgeable in statistics can<br />

make well - founded judgements of the possible consequences of the uncertainty, and<br />

thereby make appropriate adjustments to their preliminary conclusions.<br />

Accuracy measures are of relevance not least for estimates of change.<br />

3 TIMELINESS of the statistics<br />

concerns the relation of statistics to the current state of<br />

affairs<br />

Users normally want statistics that describe the "now" situation, timely statistics.<br />

The time between "now" and the reference time plays the central role. It depends on<br />

production time, publication frequency and punctuality.<br />

Comment on timeliness<br />

Another important aspect when judging timeliness of statistics is how fast reality<br />

changes. When judging whether statistics are sufficiently up - to - date, the user combines<br />

the "age" of the statistics with his/her own views on the pace of change in the real world<br />

phenomenon under consideration.<br />

3.1 Frequency<br />

Statistics from recurrent surveys are usually produced according to a regular timetable<br />

(monthly, quarterly, annually, etc.). It is then natural to speak of frequency (or<br />

periodicity).<br />

- Survey frequency is the periodicity of reference times.<br />

- Data collection frequency is the periodicity of the producer's data collection.<br />

- Dissemination frequency is the periodicity with which statistics are published.<br />

Usually the three frequencies agree, but they may differ. Users normally care most<br />

about reference time and dissemination frequencies.<br />

Example<br />

The SCB Investment survey illustrates that the frequencies mentioned<br />

above may differ. This survey collects primary data and publishes statis-<br />

tics three times a year, while quarters are reference periods.<br />

3.2 Production time<br />

Production time concerns the time lag between reference time (reference time point<br />

or end of reference period) and publication time.<br />

3.3 Punctuality<br />

Punctuality concerns the agreement between promised and factual dissemination<br />

times.<br />

Comments on frequency, production time and punctuality<br />

Statistics users are commonly anxious that statistics should be available at the "right<br />

time" (e.g. to a prescribed date for decision taking). For a one - time survey the crucial<br />

component is the production time. For recurrent surveys publication frequency and<br />

punctuality are also important.<br />

For economical statistics which affect financial markets, requirements on punctuality and<br />

simultaneity can be as high as fractions of a second.<br />

39


40<br />

Survey frequency matters not only for timeliness, a user with "historical" interest<br />

cares as well. The higher this frequency is, the better the details of a development<br />

can be studied.<br />

4 COMPARABILITY and COHERENCE<br />

concerns how well different statistics can be used together<br />

A common and important usage of statistics is for making comparisons, comparisons<br />

over time (time series) and comparisons between groups. The latter often concern<br />

geographical groups, e.g. comparison of conditions in different countries.<br />

However, they may also concern groups of another nature (than geographical), e.g.<br />

comparison of disposable income for two - adults families with 0, 1, 2, 3 and 4+<br />

children respectively.<br />

Comparisons over time and between groups should ideally be made using statistics<br />

with the "same" target characteristic, but for different reference times and for different<br />

groups. How "similar" target characteristics are, depends primarily on their<br />

definition. Another factor may also be important. Generally formulated this concerns<br />

the fact that what one "really" measures depends on how one measures. The<br />

employed survey methodology is often crucial for the comparability of statistics. It<br />

is advantageous if the same kind of observation objects, questionnaire, data collection<br />

method, estimation procedure, etc. have been used.<br />

What is said above is accentuated by the following. Even if biased statistics are an<br />

abomination, the negative effects of bias are mitigated if the statistics to be compared<br />

are "similarly biased". When using a common survey method, the aim is of<br />

course that the method will lead to unbiased statistics. If there is bias, however, it<br />

will be of the same kind, which facilitates comparisons.<br />

This quality component, including also the sub-component "coherence with other<br />

statistics", concerns similarity of the definitions of target characteristics and of<br />

survey methodology.<br />

Comments on comparability<br />

How meaningful conclusions one can draw from comparing statistics depends not only<br />

on how "similar" target values are. Of course, it also depends on the accuracy of the statistics<br />

used for comparison. If they are very inaccurate, differences may stem from casual<br />

"noise" rather than "real" differences.<br />

4.1 Comparability over time<br />

This quality aspect concerns to what extent the target characteristics for a recurrent<br />

survey have been stable or changed over time.<br />

Even for statistics with the same contents and method interesting comparisons<br />

interest may be troublesome to make because of seasonal and/or calendar variations.<br />

(For instance, Easter may fall in different quarters in different years, and the<br />

number of working days may vary between months.) Procedures for seasonal<br />

adjustments facilitate comparisons, in particular for short - term statistics.<br />

Comments on comparability over time<br />

For this quality aspect there are often conflicting interests. A user who is chiefly<br />

interested in the long - term development of a specific phenomenon will want the<br />

statistics with different reference times to tell about "the same thing ", i.e. that target<br />

characteristics, and survey method have been unchanged over time. Users whose main<br />

interest is the "present and future state of affairs" will want reality changes to be<br />

followed by appropriate changes in the statistics, aiming at a good description of present<br />

conditions. Such changes usually deteriorate comparability over time.<br />

Adequate comparisons over time are facilitated if the statistics are accompanied by<br />

information about earlier changes in circumstances which affect the statistics (e.g.<br />

changes in taxation rules), in survey methodology, etc.


4.2 Comparability between domains<br />

This quality component concerns how similar definitions of target characteristics<br />

and survey methods are. When statistics to be used in comparisons come from the<br />

same survey, "full comparability" usually is obtained. When they come from different<br />

producers (different surveys, different statistical offices, etc.) there may be<br />

divergences.<br />

Example<br />

Statistics are often used in international co - operation. An example is the EU<br />

context, where financial dues are based on the member countries' economical<br />

situation. In such a case it is important that the "same" statistics from different<br />

countries tell about "the same thing". As a consequence, there are a multitude<br />

of EU regulations aiming at harmonised statistics.<br />

4.3 Coherence with other statistics<br />

Often subject matter fields are investigated by employing statistics (with different<br />

target characteristics) from different surveys. In that case definitions of objects,<br />

variables, population and reference times, which enter in the different targets should<br />

preferably be the same. The quality aspect concerns to what extent this holds.<br />

Example<br />

If one wants to assess the consequences of certain potential changes in the<br />

rules concerning income taxation and social benefits, it might be of interest to<br />

combine statistics from the SCB surveys as the Income survey (HINK), the<br />

Expenditure survey (HUT) and the Rent survey (BHU). Of course, it is then<br />

highly desirable that e.g. "household" and "disposable income" are defined in<br />

the same way in the three surveys.<br />

Comment on coherence<br />

Sometimes statistics from one survey are adjusted so as to be consistent with statistics<br />

from another survey, thereby facilitating joint use of the statistics. Consistency may be<br />

created by requiring that the adjusted statistics should satisfy relations which are known<br />

to hold for the target characteristics.<br />

Example: Sweden's economical development is followed through "fast" (monthly) statistics<br />

as well as more careful and deep-going yearly statistics, which are produced by different<br />

surveys. In this context a natural consistency requirement is that the twelve (adjusted)<br />

monthly values should add up to the (possibly adjusted) value for the year.<br />

41


42<br />

AVAILABILITY and CLARITY<br />

Concerns physical availability and intellectual clarity of statistics<br />

5.1 Forms of dissemination<br />

This quality component concerns distribution media and distribution channels for<br />

the dissemination of the statistics.<br />

Comments on dissemination forms<br />

Statistics often are just one of many data materials in investigations, research projects,<br />

etc. For a user to be able to easily carry out compilations from the statistics and/or<br />

integrate them with other material, they should preferably be available in "the most<br />

suitable" form. Example : Statistics on diskette or from Internet may allow for simple and<br />

fast own compilation of tables, own derivations, etc.<br />

5.2 Presentation<br />

This quality component concerns how the statistical information is presented as<br />

regards text, charts, pictures, references, etc. Also how particularly interesting<br />

aspects on new statistics are highlighted.<br />

5.3 Documentation<br />

This quality component concerns users' possibilities to find descriptions of the statistics<br />

themselves, and how they were produced. A technical description of the<br />

process which generated the statistics is given in a production documentation, while<br />

the statistics are described in a quality declaration.<br />

Comment on documentation<br />

For users who intend to make their own compilations from primary data (see below) an<br />

informative production documentation is usually a necessary instrument.<br />

5.4 Access to micro data<br />

Here micro data stands for the primary data as they appear in a survey's final<br />

observation register. Certain users are interested in statistics which are not, but<br />

could be derived from the micro data. There are then two chief alternatives.<br />

- The producer makes special derivations, in accordance with the user's requests.<br />

- The user gets access to micro data for his/her own analysis.<br />

Comments on access to micro data<br />

Users with well specified problems usually prefer special derivations made by the<br />

producer. Important aspects are how fast, and to what cost such derivations can be made.<br />

Researchers and investigators are often anxious to get access to micro data for their own<br />

analyses. Thereby they get the opportunity to analyse the material faster (often also<br />

cheaper) and/or in a more flexible way than with the producer as intermediary.<br />

5.5 Information services<br />

This quality component concerns users' possibilities (i) to get answers to questions<br />

concerning specific statistics, (ii) to get assistance in finding their way in the "store"<br />

of official (and other) statistics. Depending on the nature of the wish for assistance,<br />

it may be met by reference to the concerned survey, the central information desk, an<br />

appropriate research institute or to some other relevant office.


Bilaga 4. Exempel på <strong>kvalitets</strong>deklarationer<br />

I detta avsnitt ges fyra exempel på <strong>kvalitets</strong>deklarationer av statistik i SM från återkommande<br />

SCB-undersökningar. Avsikten är att visa hur de olika komponenterna i <strong>kvalitets</strong>redovisningen<br />

kan hanteras <strong>för</strong> några olika typer av statistiska undersökningar.<br />

De två <strong>för</strong>sta exemplen, avseende årlig befolkningsstatistik 1998 respektive arbetskraftsundersökningarna<br />

(AKU) januari 2000, är avsedda att bl.a. illustrera <strong>kvalitets</strong>redovisning<br />

vid de två huvudtyperna av statistiska undersökningar, total- respektive urvalsundersökning<br />

(med sannolikhetsurval). En ytterligare aspekt på befolkningsstatistiken är<br />

att den är s.k. registerbaserad statistik, d.v.s. statistik där hela uppgiftsunderlaget inhämtas<br />

från administrativa register. Det tredje exemplet, prisindex i producent- <strong>och</strong> importled<br />

(PPI) under 2000, illustrerar <strong>kvalitets</strong>redovisning av indextal. En ytterligare aspekt<br />

av intresse är att PPI baseras på subjektiva urval. Det sista exemplet gäller statistik över<br />

gödselmedel i jordbruket 1997. Det illustrerar <strong>kvalitets</strong>redovisning av statistik med rätt<br />

starka inslag av modellantaganden.<br />

Exemplen följer <strong>kvalitets</strong>redovisningsmallen i detta MIS, <strong>och</strong> de har arbetats ut i efterhand<br />

i <strong>för</strong>hållande till de SM vars statistik de <strong>kvalitets</strong>redovisar.<br />

43


Kvalitetsdeklaration av<br />

Årlig befolkningsstatistik 1998<br />

0 INLEDNING<br />

Statistikprogrammet Årlig befolkningsstatistik tar fram totalräknad statistik om Sveriges<br />

befolkning, dels dess antalsmässiga <strong>för</strong>delning efter ett flertal olika aspekter som kön,<br />

ålder, region, medborgarskap, m.fl., dels antalet "demografiska händelser" under senaste<br />

året genom födslar, dödsfall, flyttningar, in - <strong>och</strong> utvandringar, m.fl. Dessutom beräknas<br />

demografiska standardmått som medellivslängd, dödsrisk, m.fl. Resultatredovisning sker<br />

främst i fyra publikationsserier, <strong>för</strong> vilka bidragen med referensår 1998 anges nedan.<br />

Föreliggande <strong>kvalitets</strong>deklaration gäller 1998 års statistik.<br />

Statistiskt meddelande BE 12 SM 9801: Folkmängden i hela riket, länen <strong>och</strong> kommunerna<br />

31 december 1998, snabbstatistik. Preliminära uppgifter.<br />

Befolkningsstatistik 1998 Del 1 - 2 : Folkmängden <strong>och</strong> dess <strong>för</strong>ändringar i<br />

kommuner m.m. Inrikes <strong>och</strong> utrikes flyttningar.<br />

Befolkningsstatistik 1998 Del 3 : Folkmängden efter kön, ålder <strong>och</strong> medbor-<br />

garskap m.m.<br />

Befolkningsstatistik 1998 Del 4 : Födda <strong>och</strong> döda, civilståndsändringar m.m.<br />

Statistiken baseras på uppgifter från landets folkbok<strong>för</strong>ingssystem. Detta sköts sedan<br />

1991 av Skattemyndigheten, <strong>och</strong> grundläggande uppgifter inhämtas av <strong>och</strong> registreras<br />

vid myndighetens lokala kontor. Dessa <strong>för</strong>medlar veckovis nyinkomna uppgifter om<br />

födslar, dödsfall, flyttningar inom landet, in - <strong>och</strong> utvandringar, mm. till landets centrala<br />

befolkningsregister, Registret över totalbefolkningen (RTB), som handhas av <strong>Statistiska</strong><br />

<strong>centralbyrån</strong> (SCB). Uppgifterna i RTB utgör underlaget <strong>för</strong> befolkningsstatistiken.<br />

1 STATISTIKENS INNEHÅLL<br />

1.1 <strong>Statistiska</strong> målstorheter<br />

Målstorheterna <strong>för</strong> 1998 års befolkningsstatistik är av nedanstående tre slag.<br />

• Folkmängdsuppgifter avseende situationen 31 dec 1998. Antal personer efter<br />

ålder, kön, län, kommun, <strong>för</strong>samling, civilstånd, medborgarskap, mm.<br />

• Antal "demografiska händelser" under år 1998, födslar, dödsfall, flyttningar,<br />

civilstånds<strong>för</strong>ändringar, medborgarskaps<strong>för</strong>ändringar mm.<br />

• Olika demografiska standardmått som medellivslängd, dödsrisk, summerad<br />

fruktsamhet, spädbarnsdödlighet, m.fl.<br />

1.1.1 Objekt <strong>och</strong> population<br />

Den totala populationen <strong>för</strong> 1998 års befolkningsstatistik utgjordes av alla personer som<br />

var folkbok<strong>för</strong>da i Sverige någon period under år 1998.<br />

Huvudregeln i folkbok<strong>för</strong>ings<strong>för</strong>ordningen är att en person bok<strong>för</strong>s på den fastighet där<br />

han/hon vistas regelmässigt. Vid tveksamhet om var en person bor fästs avseende vid<br />

främst var personen har sitt arbete <strong>och</strong>/eller sin familj. Nyfödda barn folkbok<strong>för</strong>s där<br />

modern är bok<strong>för</strong>d vid nedkomsten. Om hon då ej är folkbok<strong>för</strong>d, bok<strong>för</strong>s barnet på den<br />

<strong>för</strong>samling där födseln ägde rum.<br />

De viktigaste undantagen från huvudregeln anges nedan.<br />

Personer som är folkbok<strong>för</strong>da i, men inte bor i Sverige<br />

- Svenska medborgare som flyttar utomlands är folkbok<strong>för</strong>da i Sverige om<br />

vistelsen utomlands avses vara kortare än ett år.<br />

- Personer som är anställda utomlands i svenska statens tjänst, huvudsakligen<br />

UD - <strong>och</strong> SIDA - anställda, folkbok<strong>för</strong>s i Sverige. Så även deras familjemed-<br />

lemmar <strong>och</strong> eventuella svenska tjänstefolk.<br />

45


46<br />

- Svenska missionärer <strong>och</strong> präster som är anställda utomlands <strong>och</strong> deras med-<br />

följande familj får vara folkbok<strong>för</strong>da i Sverige.<br />

I ovannämnda fall folkbok<strong>för</strong>s personerna antingen under rubriken "på <strong>för</strong>samlingen<br />

skrivna" eller på en fastighet där man fortfarande disponerar bostad.<br />

Personer som bor i landet, men inte är folkbok<strong>för</strong>da i Sverige<br />

- Personer som vid inflyttningen avser att vistas i Sverige kortare tid än ett år.<br />

- Utomnordiska medborgare måste ha uppehållstillstånd <strong>för</strong> att bli folkbok<strong>för</strong>da.<br />

Normalt tar det cirka fyra månader att få sådant (om man får det).<br />

- Utländska medborgare som tillhör utländsk beskickning / konsulat eller dess<br />

tjänstefolk folkbok<strong>för</strong>s inte i Sverige.<br />

1.1.2 Variabler<br />

En post i Registret över totalbefolkningen (RTB) avser en person. För varje person registreras<br />

värdena på ett stort antal variabler ( = uppgifter om personen). Nedan anges <strong>för</strong><br />

befolkningsstatistiken viktiga variabler. I stort gäller att deras definitioner framgår av<br />

benämningarna, men några kommentarer ges.<br />

Ålder 31 dec 1998 mäts i hela år.<br />

Ålder vid demografiska händelser under 1998 som barnafödande, civilstånds<strong>för</strong>ändring,<br />

flyttning, m.fl.<br />

Civilstånd 31 december 1998 med kategorier ogift, gift, skild, änka/änkling, registrerad<br />

partner, separerad partner, efterlevande partner.<br />

Civilstånds<strong>för</strong>ändring under 1998 med kategorier giftermål, skilsmässa, makes<br />

dödsfall, partnerregistrering, partnerseparation, partners dödsfall.<br />

Flyttning under 1998, flyttningsdatum : "Flyttning" avser flyttning till annan<br />

fastighet, inte inom samma fastighet. Om flyttningen anmäls senast en vecka efter<br />

att den skedde, gäller den nya adressen från <strong>och</strong> med den faktiska flyttningsdagen.<br />

Vid senare anmälan gäller den nya adressen från den dag då anmälan inkom till<br />

Skattemyndigheten.<br />

Folkbok<strong>för</strong>ingslän/<strong>för</strong>samling 31 dec 1998 är det län/<strong>för</strong>samling som inrymmer<br />

den fastighet där personen var folkbok<strong>för</strong>d 31 dec 1998.<br />

Födelselän anges enligt den länsindelning som gällde vid födelsetidpunkten. Uppgiften<br />

ändras ej med anledning av senare <strong>för</strong>ändringar av länsindelning.<br />

Födelseland, <strong>för</strong>äldrars födelseland anges enligt de statsrättsliga <strong>för</strong>hållanden<br />

som gällde vid födelsetidpunkten. Politiska <strong>och</strong> geografiska <strong>för</strong>ändringar därefter<br />

med<strong>för</strong> inte ändring i folkbok<strong>för</strong>ingen.<br />

Utrikes född : Före 1947 räknades alla barn som fötts utan<strong>för</strong> Sverige som "utrikes<br />

födda". Efter 1947 registreras inte ett utomlands fött barn som "utrikes fött" om<br />

modern vid nedkomsten var folkbok<strong>för</strong>d i Sverige.<br />

Invandring/utvandring under 1998 : För att registreras som invandrare (immigrant)<br />

skall personen avse att bo i Sverige minst ett år. Analogt, <strong>för</strong> att registreras<br />

som utvandrare (emigrant) skall personen avse att bo utomlands under minst ett år.<br />

Invandringsår : Om en person invandrat i Sverige flera gånger är invandringsår<br />

året <strong>för</strong> senaste invandring. Personer som invandrade <strong>för</strong>e 1968 saknar uppgift<br />

om invandringsår.<br />

Medborgarskap 31 dec 1998, medborgarskaps<strong>för</strong>ändring under 1998 : Medborgarskap<br />

ska i princip gälla nu existerande statsbildning. Uppgiften uppdateras, så<br />

långt sig göra låter, med hänsyn till bl.a. politiska/geografiska <strong>för</strong>ändringar.<br />

1.1.3 <strong>Statistiska</strong> mått<br />

Lejonparten av befolkningsstatistiken utgörs av värden på statistiska storheter/parametrar<br />

av typerna total (med "antal" som vanligaste variant) <strong>och</strong> medelvärde (med "andel",


"kvot", "intensitet" <strong>och</strong> "risk" som varianter). Vissa storheter av typ fraktil (medianer<br />

<strong>och</strong> kvartiler) redovisas också. De viktigaste storheterna kommenteras nedan.<br />

Storheter av typ total<br />

Folkmängd avser antal folkbok<strong>för</strong>da personer per 31 december 1998. Befolknings-<br />

<strong>för</strong>ändringen är skillnaden mellan folkmängden vid årets början <strong>och</strong> slut.<br />

Antal födda <strong>och</strong> antal döda under 1998 redovisas. Den naturliga folkökningen, även<br />

kallat födelseöverskottet, är skillnaden mellan antal födda <strong>och</strong> döda.<br />

Antal inflyttade <strong>och</strong> antal utflyttade under 1998 i bestämda regioner redovisas.<br />

Flyttningsöverskottet är skillnaden mellan antal in - <strong>och</strong> utflyttade. När "regionen"<br />

är Sverige handlar det om antal invandrare <strong>och</strong> antal utvandrare under 1998.<br />

Skillnader kallas nettoinvandring/utvandring under 1998.<br />

Storheter av typ medelvärde (andel, kvot, risk, mm.)<br />

Medelfolkmängden är genomsnittet av folkmängden i början <strong>och</strong> slutet av året.<br />

Mått avseende födslar <strong>och</strong> fertilitet<br />

Könskvot är antal födda pojkar per 1000 födda flickor<br />

Flerbördskvot är antal flerbördsbarn (tvillingar, trillingar, mm.) per 1000 födda.<br />

Dödföddkvot är antal dödfödda barn per 1000 födda (levande <strong>och</strong> döda).<br />

Spädbarnsdödlighet avser andelen levande födda barn som dör <strong>för</strong>e ett års ålder.<br />

Nettoreproduktionstalet (<strong>för</strong> kvinnor) är kvoten mellan antalen kvinnor i två suc-cessiva<br />

generationer, med hänsyn tagen till såväl fruktsamhet som dödlighet.<br />

Bruttoreproduktionstalet (<strong>för</strong> kvinnor) är kvoten mellan antal kvinnor i två succes-<br />

siva generationer, med bortseende från dödlighet <strong>för</strong>e fruktsamhetsperiodens slut.<br />

Åldersdifferentierade fruktsamhetstal anger antalet barn som 1000 kvinnor får<br />

under sin reproduktionsperiod med antagande om att nu aktuell fruktsamhet fort-<br />

satt gäller <strong>och</strong> att ingen av kvinnorna dör <strong>för</strong>e 50 års ålder.<br />

Den samlade legala abortkvoten anger antalet legala aborter som 1000 kvinnor<br />

genomgår under hela sin reproduktionsperiod, under antagandet att nu aktuell<br />

legal - abort - frekvens forsatt gäller <strong>och</strong> att kvinnorna inte dör <strong>för</strong>e 50 års ålder.<br />

Mått avseende mortalitet<br />

Dödstalet anger kvoten mellan antalet dödsfall under en period <strong>och</strong> den folkmängd,<br />

som under perioden var utsatt <strong>för</strong> risk att dö. Talet uttrycks oftast i promille.<br />

Vid framställning av livslängdstabellerna användes nedanstående formel.<br />

Dödsrisk <strong>för</strong> en x - åring under period t : q x = Dx<br />

/ ( M x + d x ) ,<br />

D x<br />

M x<br />

= antal dödsfall bland x - åringar under period t,<br />

= (totala) risktiden i åldern x år under period t<br />

dx = antal x - åringar som under period t avled samma kalenderår som<br />

de fyllde x år.<br />

Dödsrisk <strong>för</strong> en 0 - åringar beräknades :<br />

= D / F , med F <strong>för</strong> antalet levande födda under period t.<br />

q0 0<br />

I åldrarna 91 år <strong>och</strong> däröver har de i livslängdstabellerna använda dödsriskerna beräknats<br />

genom utjämning av preliminärt beräknade risker. Till <strong>och</strong> med 1986 baserades<br />

denna utjämning på den s.k. Wittsteins formel. Eftersom metoden visade sig överskatta<br />

dödsriskerna i de högsta åldrarna utarbetades en ny utjämningsmetod, vilken används<br />

numera. Den beskrivs i Martinelle, S. (1987): A Generalized Perks Formula for Old Age<br />

Mortality, R&D Report, Statistics Sweden.<br />

Kvarlevande vid ålder x, betecknat lx , avser antalet individer bland 100 000 levande<br />

födda som vid nu aktuella dödsrisker beräknas uppnå åldern x år. Antalet 0 - år-<br />

47


48<br />

ingar är l0 = 100 000 <strong>och</strong> antalet kvarlevande vid övriga åldrar beräknas enligt<br />

nedan där qx är års - dödsrisken <strong>för</strong> en x - åring :<br />

l 1 − q .<br />

( )<br />

1 1 1 x = x−<br />

x−<br />

Återstående medellivslängd <strong>för</strong> en x - åring, betecknad ex ,utgörs av det antal år<br />

som i genomsnitt återstår att leva <strong>för</strong> en x - åring. Återstående medellivslängd vid<br />

födseln kallas kortare <strong>för</strong> bara medellivslängd. Beräknas enligt nedan :<br />

w<br />

ex ∑<br />

i=<br />

x<br />

= L l , där<br />

i<br />

x<br />

w står <strong>för</strong> den högsta ålder (i hela år) som antas kunna uppnås,<br />

L = 1 + 1 +1 / 2 .<br />

Lx = "genomlevda tiden i en åldersklass", som beräknas ( )<br />

x x x<br />

Måttet ifråga är baserat på antagandet att dödsfallen i en åldersklass är jämnt <strong>för</strong>delade<br />

över året. Detta antagande är dock inte tillämpbart under <strong>för</strong>sta levnadsåret. För<br />

det används :<br />

= a ⋅ l + 1− a ⋅ l , där<br />

( ) 1<br />

L0 0 0<br />

0<br />

a0 = medelålder <strong>för</strong> dem som dör under sitt <strong>för</strong>sta levnadsår.<br />

Sannolik medellivslängd är den ålder vid vilken hälften av den ursprungliga födel-<br />

sekullen avlidit.<br />

1.1.4 Redovisningsgrupper<br />

I det följande står SM resp. Befstat <strong>för</strong> publikationerna som nämns i Inledning samt<br />

BEFPAKfm <strong>och</strong> BEFPAKfä <strong>för</strong> tabellpaketen som nämns i Avsnitt 5.1.<br />

SM BE redovisar folkmängd <strong>och</strong> befolknings<strong>för</strong>ändringar i riket, län, kommuner <strong>och</strong><br />

storstadsområden, samt in - <strong>och</strong> utvandrare efter medborgarskap.<br />

I Befstat 1 - 2 görs genomgående indelning efter län, kommun, storstadsområde, riksområde,<br />

landsting <strong>och</strong> landskap. Folkmängdsstatistiken underindelas efter kön, ålder,<br />

civilstånd samt, in- <strong>och</strong> utflyttningsland. För födda indelas efter kön <strong>och</strong> moderns ålder,<br />

<strong>för</strong> döda efter kön, ålder <strong>och</strong> civilstånd. För flyttningar efter kön, ålder <strong>och</strong><br />

medborgarskap. Immigranter <strong>och</strong> emigranter redovisas med indelning efter län, kön,<br />

ålder, medborgarskapsland, in - <strong>och</strong> utvandringsår.<br />

I Befstat 3 indelas efter län, kommun, storstadsområde, A - region, riksområden, kön,<br />

ålder, civilstånd, medborgarskap, födelseort, födelselän, födelseland, invandringsår<br />

samt ursprungsland.<br />

I Befstat del 4 varierar indelningarna mellan de olika kapitlen. För befolkningens<br />

sammansättning indelas efter län, kön, ålder <strong>och</strong> civilstånd <strong>och</strong> <strong>för</strong> befolknings<strong>för</strong>ändringar<br />

efter län <strong>och</strong> civilstånd. För födda indelas efter län, kön, moderns ålder,<br />

moderns födelseort <strong>och</strong> folkbok<strong>för</strong>ingslän, moderns födelseland, moderns medborgarskap,<br />

moderns civilstånd, antal av modern dödfödda respektive levande födda barn,<br />

tidigare födda barn, barnets ordningsnummer, barnets medborgarskap, barnets födelseår,<br />

barnets födelsemånad, <strong>för</strong>äldrarnas ålder, <strong>för</strong>äldrarnas medborgarskap,<br />

<strong>för</strong>äldrarnas vigselår. För döda indelas efter län, kön, ålder, civilstånd <strong>och</strong><br />

medborgarskap. För civilståndsändringar efter län, kommun, kön, ålder,<br />

medborgarskap, födelseland, makarnas ålder, makarnas <strong>för</strong>utvarande civilstånd,<br />

äktenskapets varaktighet, vigselår, antal år sedan vigselåret samt barnantal. För<br />

medborgarskapsbyten indelas efter kön, ålder, civilstånd, tidigare <strong>och</strong> nuvarande<br />

medborgarskap, <strong>för</strong>utvarande medborgarskap samt invandringsår.<br />

I BEFPAKfm indelas efter kön, ålder, civilstånd, medborgarskap, födelseland, utländsk<br />

bakgrund <strong>och</strong> invandringsår, län, kommun, <strong>för</strong>samling samt delområde inom kommun. I<br />

BEFPAKfä indelas efter kön, ålder, medborgarskapsland, in-/utflyttningsområde, inkomst<br />

samt utbildning. De regionala indelningar som görs är län, kommuner, <strong>för</strong>samlingar<br />

<strong>och</strong> delområden inom kommuner.


Kommentar angående regionala indelningar i statistiken <strong>för</strong> 1998<br />

Folkmängdsstatistiken avser <strong>för</strong>hållandena 31 december 1998 med den indelning i<br />

administrativa områden som gäller från 1:a januari 1999. I tabeller som innehåller<br />

uppgifter även <strong>för</strong> andra år än 1998 har justering gjorts endast vid indelningsändringar<br />

av sådan storlek att minst en hel <strong>för</strong>samling över<strong>för</strong>ts till eller slagits samman med<br />

annan <strong>för</strong>samling. Befolknings<strong>för</strong>ändringar under 1998 redovisas enligt den regionala<br />

indelning som gällde 1 januari 1998<br />

1.1.5 Referenstider<br />

I SM <strong>och</strong> Befolkningsstatistik del 1 - 4 (se Inledning) är referenstidpunkten 31 december<br />

1998 <strong>för</strong> statistik som avser folkmängd. För statistik om demografiska händelser<br />

(födslar, dödsfall, flyttningar, mm.) är referensperioden året 1998.<br />

I BEFPAKpaketen (se Avsnitt 5.1) är referensperioderna årets fyra kvartal <strong>och</strong> referenstidpunkterna<br />

de fyra kvartalssluten.<br />

1.2 Fullständighet<br />

Statistiken om befolkningen som individer är mycket fullständig, icke minst i ett<br />

internationellt perspektiv. Det gäller också <strong>för</strong> individers "generationskopplingar".<br />

Statistik om "sammanboendegrupper", familjer <strong>och</strong> hushåll av olika slag, är dock <strong>för</strong><br />

närvarande inte så bra som önskvärt. Som ett exempel kan befolkningsstatistiken inte<br />

redovisa antal "två - vuxen - familjer med tre barn" i landet. Huvudproblemet därvidlag är<br />

att en stor del av dagens familjer/hushåll är baserade på icke-registrerat sammanboende,<br />

medan RTB endast har uppgifter om registrerade sådana, genom vigsel <strong>och</strong> registrerande<br />

av partnerskap. I detta avseende kan dock räknas med avsevärda <strong>för</strong>bättringar i<br />

framtiden, av följande skäl. För närvarande sker folkbok<strong>för</strong>ing på fastighet, <strong>och</strong> i<br />

fastigheter med flera lägenheter vet man inte hur fastighetens individer "hänger ihop".<br />

En genomgripande omläggning av folkbok<strong>för</strong>ingssystemet pågår dock. Steg ett i<br />

omläggningen är att upprätta ett lägenhetsregister där varje lägenhet får unik identitet. I<br />

steg två folkbok<strong>för</strong>s personer på lägenhet, istället <strong>för</strong> som nu på fastighet. Därigenom<br />

<strong>för</strong>bättras möjligheten att ta fram statistik om familjer <strong>och</strong> hushåll avsevärt.<br />

2 STATISTIKENS TILLFÖRLITLIGHET<br />

2.1 Till<strong>för</strong>litlighet totalt<br />

Befolkningsstatistiken baseras, som sagt, på uppgifter i Registret över totalbefolkningen<br />

(RTB). Kontrollundersökningar av RTB : s innehåll som gjorts genom åren har genomgående<br />

visat att registret har mycket god täckning, aktualitet <strong>och</strong> uppgiftsriktighet<br />

åtminstone <strong>för</strong> i Sverige födda personer. I stort bedöms befolkningsstatistiken där<strong>för</strong><br />

vara mycket till<strong>för</strong>litlig.<br />

De till<strong>för</strong>litlighetsproblem som finns gäller fram<strong>för</strong> allt utrikes födda personer. Skälen<br />

anges nedan under osäkerhetskällan "ramtäckning".<br />

2.2 Osäkerhetskällor<br />

För statistik allmänt talas om felkällorna urval, ramtäckning, mätning, svarsbortfall,<br />

bearbetning <strong>och</strong> modellantaganden, vilka var <strong>och</strong> en kommenteras i det följande. För<br />

den slags totalundersökning som befolkningsstatistiken är, kunde sägas att egentligen<br />

bara en felkälla <strong>för</strong>eligger, nämligen "brister i rapporteringen". Dessa beror fram<strong>för</strong> allt<br />

dels på underlåtenhet, senfärdighet, slarv, glömska mm. från rapporteringsskyldigas sida<br />

att anmäla <strong>för</strong>ändringar dels på att de, medvetet eller omedvetet, lämnar felaktiga<br />

uppgifter. Vidare finns möjligheten att de lokala skattekontoren släpar efter i sin<br />

rapportering till SCB. I stort är dock rapporteringsrutinerna mycket snabba.<br />

Hur man klassificerar på ovan nämnda osäkerhetskällor de fel som brister i rapporteringen<br />

leder till är åtskilligt skönsmässigt. I det följande görs uppdelningen att rapporteringsbrister<br />

som leder till att RTB saknar personer som borde vara med i registret eller<br />

omfattar personer som inte borde vara med klassificeras som ramtäckningsbrister. Rap-<br />

49


50<br />

porteringsbrister som leder till felaktiga variabelvärden betraktas som mätfel, medan<br />

svarsbortfall anses inte <strong>för</strong>ekomma.<br />

2.2.1 Urval<br />

Befolkningsstatistiken är totalräknad <strong>och</strong> har därmed ingen urvalsosäkerhet.<br />

2.2.2 Ramtäckning<br />

Täckningsbrister handlar om dels undertäckning, vilket <strong>för</strong>eligger om personer som är<br />

bosatta i landet saknas i RTB, dels övertäckning, vilket <strong>för</strong>eligger om personer i RTB<br />

inte längre ingår i befolkningen (har avlidit eller lämnat landet).<br />

Undertäckning uppstår om födslar <strong>och</strong> invandringar sker utan att komma till RTB:s<br />

kännedom. Den bedöms vara mycket liten av nedanstående huvudskäl.<br />

(i) Att rapportera till folkbok<strong>för</strong>ingssystemet ligger som tjänsteansvar <strong>för</strong> särskilda<br />

professioner (enskilda <strong>för</strong>eträdare eller institutioner), som barnmorskor, vigsel<strong>för</strong>rättare,<br />

läkare, invandrarverk, domstolar, m.fl. Den rapporteringen kan på goda grunder <strong>för</strong>utsättas<br />

vara mycket välskött.<br />

(ii) RTB avvaktades t.o.m. utgången av januari 1999 innan befolkningsstatistiken <strong>för</strong><br />

1998 framtogs. Med de snabba rapporteringsrutinerna bedöms <strong>för</strong> sent inkomna uppgifter<br />

ge upphov till endast <strong>för</strong>sumbar undertäckning.<br />

För nyfödda bedöms undertäckningen med<strong>för</strong>a ett fel om högst 0,1 % i folkmängdsstatistiken<br />

<strong>för</strong> "0 - åringar". Invandringen <strong>för</strong>anleder något större undertäckning, men<br />

även den bedöms vara <strong>för</strong>sumbar. Den främsta orsaken till viss "invandringsundertäckning"<br />

är den <strong>för</strong>hållandevis långa tiden mellan invandring <strong>och</strong> registreringstidpunkten.<br />

(Exempel : För invandrare som fick sina beslut om uppehållstillstånd under<br />

1986 var mediantiden från ansökan till folkbok<strong>för</strong>ing 21 veckor.) Tidsskillnaden ifråga<br />

bedöms ligga avsevärt under genomsnittet <strong>för</strong> nordiska invandrare, eftersom dessa kan<br />

bosätta sig i Sverige utan uppehållstillstånd.<br />

En till det nyssnämnda relaterad problematik om statistikens beskrivning av det "reella"<br />

demografiska skeendet är följande. Många flyktingar som fått uppehållstillstånd måste<br />

av bostadsskäl bo kvar i flykting<strong>för</strong>läggningar i väntan på kommunplacering, <strong>och</strong> folkbok<strong>för</strong>s<br />

då på <strong>för</strong>läggningen. Det med<strong>för</strong> att statistiken <strong>för</strong> kommuner med flykting<strong>för</strong>läggningar<br />

kan uppvisa en skev bild av den mer långsiktiga befolkningsutvecklingen.<br />

Övertäckning i RTB uppstår om dödsfall <strong>och</strong> utvandringar inte kommer till RTB : s kännedom.<br />

Mot bakgrund av det som sägs i (i) ovan, bedöms övertäckning med anledning<br />

av ej rapporterade dödsfall vara mycket liten.<br />

Det som dock vållar en icke <strong>för</strong>sumbar övertäckning är att <strong>för</strong>hållandevis många<br />

utländska medborgare som varit bosatta i Sverige återvänder till sina ursprungsländer<br />

utan att anmäla det till svensk myndighet. Vid kontroll i samband med folk- <strong>och</strong><br />

bostadsräkningen 1985 bedömdes övertäckningen ifråga då uppgå till 0,1 % av hela<br />

befolkningen. I delpopulationen "utländska medborgare" var övertäckningen 1,0 % <strong>för</strong><br />

nordiska medborgare <strong>och</strong> 2,8 % <strong>för</strong> övriga medborgarskap tillsammans. I en studie från<br />

1994 (Nilsson, Brister i folkbok<strong>för</strong>ingen, PM, 1994) fram<strong>för</strong>s hypotesen att övertäckningen<br />

bland "utrikes födda" kunde vara så stor som 10 %. En studie med indirekt skattning<br />

av övertäckningen, baserad på dödlighetsberäkningar, redovisas i "Qvist, J. Täckningsproblem<br />

i Registret över totalbefolkningen RTB. SCB, R&D Report 1999 : 1".<br />

Beräkningarna ger vid handen att övertäckningen bland utomnordiska invandrare torde<br />

ligga i intervallet 25 - 50 000 personer, vilket innebär 4 - 8 % av de utomnordiska invandrarna.<br />

2.2.3 Mätning<br />

Rapporteringen till folkbok<strong>för</strong>ingssystemet enligt punkt (i) i Avsnitt 2.2.2 bedöms ske<br />

mycket omsorgsfullt <strong>och</strong> därmed <strong>för</strong>anleda mycket små mätfel <strong>för</strong> berörda variabler.<br />

Större mätfel befaras <strong>för</strong> variabler som beror av rapporteringar som personerna själva<br />

skall göra, t.ex. om flyttningar. En kontrollmöjlighet i detta avseende ges i anslutning till


myndigheters massutsändning av brev, t.ex. skattsedlar <strong>och</strong> röstkort. På basis av<br />

returnerade <strong>för</strong>sändelser kan kontrolleras bl.a. om flyttning anmälts i rätt tid <strong>och</strong> om<br />

folkbok<strong>för</strong>ingens adress överensstämmer med den faktiska. I anslutning till folk - <strong>och</strong><br />

bostadsräkningarna 1975, 1980 <strong>och</strong> 1985 gjordes sådana kontroller. Från dessa framgick<br />

att brister främst gällde det som diskuteras i Avsnitt 2.2.2, nämligen underlåten<br />

rapportering av utvandring. En mer ingående redogörelse <strong>för</strong> resultaten av kontrollerna<br />

ges i Folkmängd Del 1 - 2 <strong>för</strong> 1988.<br />

2.2.4 Svarsbortfall<br />

Bortfall <strong>för</strong>ekommer inte.<br />

2.2.5 Bearbetning<br />

Dataregistrering sker i <strong>för</strong>sta omgången vid de lokala skattemyndigheterna. Därvid görs<br />

vissa maskinella kontroller <strong>och</strong> rättelser. När aviseringarna sedan kommer till SCB<br />

granskas uppgifterna innan inläggning sker i RTB. Felaktigheter som upptäcks skickas<br />

tillbaka till skattemyndigheten <strong>för</strong> utredning/rättning.<br />

Befolkningsstatistiken framställs via en databas som genereras från RTB. Programvara<br />

<strong>för</strong> framtagning av statistiken är så väl utprovad att beräkningsfel betraktas som i stort<br />

sett obefintliga.<br />

2.2.6 Modellantaganden<br />

Antalsstatistiken är inte baserad på några modellantaganden. De demografiska måtten<br />

däremot vilar på modellantaganden, som till sin övervägande del är allmänt vedertagna<br />

bland befolkningsstatistiker. Ett särfall utgörs dock av den använda metoden <strong>för</strong><br />

beräkning av dödrisker <strong>för</strong> åldrarna 91 år <strong>och</strong> däröver, se Avsnitt 1.1.3, dödsrisker.<br />

2.3 Redovisning av osäkerhetsmått<br />

Befolkningsstatistiken redovisas utan numeriska osäkerhetsmått.<br />

3 STATISTIKENS AKTUALITET<br />

3.1 Frekvens<br />

Statistiken i de publikationer som nämns i Inledning framtas <strong>och</strong> publiceras en gång per<br />

år. Statistiken till BEFPAK - folkmängd (se Avsnitt 5.1) tas fram tre gånger per år, efter<br />

sluten av 2 : a, 3 : e <strong>och</strong> 4 : e kvartalen. Statistiken <strong>för</strong> kommuner <strong>och</strong> <strong>för</strong>samlingar i<br />

BEFPAK - befolknings<strong>för</strong>ändringar produceras varje kvartal. Statistik <strong>för</strong> mindre<br />

områden än <strong>för</strong>samlingar tas fram en gång om året, i anslutning till helårsskiftet.<br />

3.2 Framställningstid<br />

Referenstidpunkt <strong>och</strong> referensperiodens sluttid <strong>för</strong> 1998 års befolkningsstatistik var sista<br />

december. Framställningstiderna, såväl <strong>för</strong> 1998 års statistik (som var sen) som <strong>för</strong><br />

"normala" år, <strong>för</strong> publikationerna i Inledning framgår av det som sägs nedan under<br />

punktlighet. För BEFPAKpaketen är framställningstiden 14 dagar.<br />

3.3 Punktlighet<br />

Den årliga befolkningsstatistiken utkommer normalt mycket punktligt, dvs. publicering<br />

sker i enlighet med tidigare angiven publiceringsplan.<br />

Tyvärr var dock 1998 års statistik <strong>för</strong>hållandevis starkt <strong>för</strong>senad. Orsaken var en<br />

genomgripande omläggning av RTB:s datorsystem, från stordator till PC - miljö.<br />

Huvudpublikationerna utkom enligt följande. SM : et utkom i enlighet med plan 29<br />

december 1998. Befolkningsstatistik 1998 Del 1 - 2 utkom i juli 1999, mot planerat i<br />

juni, Del 3 utkom i november 1999, mot planerat i september, <strong>och</strong> Del 4 utkom i juli<br />

2000, mot planerat i december 1999.<br />

51


52<br />

4 JÄMFÖRBARHET <strong>och</strong> SAMANVÄNDBARHET<br />

4.1 Jäm<strong>för</strong>barhet över tiden<br />

I <strong>och</strong> med att RTB - systemet baseras på folkbok<strong>för</strong>ingssystemet är det beroende av<br />

folkbok<strong>för</strong>ingens definitioner <strong>och</strong> regler. Sedan RTB - systemet upprättades 1968 har<br />

folkbok<strong>för</strong>ingens innehåll varit i stort o<strong>för</strong>ändrat, <strong>och</strong> därmed också RTB : s<br />

variabeluppsättning <strong>och</strong> variabeldefinitioner. Som helhet gäller där<strong>för</strong> att befolkningsstatistik<br />

är mycket väl jäm<strong>för</strong>bar över tiden. Några <strong>för</strong>ändringar bör dock pekas på,<br />

vilket görs nedan.<br />

Folkbok<strong>för</strong>ingens omorganisation<br />

Den 1 juli 1991 övertog de lokala skattekontoren ansvaret från pastorsämbetena <strong>för</strong><br />

folkbok<strong>för</strong>ingen på lokal nivå. I anslutning till omorganisationen ersattes det gamla<br />

regelverket med ny lagtext. I stort sammanfaller dock de nya <strong>och</strong> gamla reglerna.<br />

Ändrade regler <strong>för</strong> studerande<br />

Sedan 1991 gäller att personer som är över 17 år <strong>och</strong> går på postgymnasial utbildning<br />

ska vara folkbok<strong>för</strong>da där de bor. Tidigare var det vanligt att sådana studerande var<br />

folkbok<strong>för</strong>da i <strong>för</strong>äldrahemmet. Kommuner med universitet <strong>och</strong> högskolor har sedan<br />

1991 där<strong>för</strong> fått en registrerad inflyttning som är större än den verkliga. Folkökningen i<br />

dessa kommuner är delvis en effekt av den nya folkbok<strong>för</strong>ingslagen.<br />

Ändrade regler <strong>för</strong> nyfödda<br />

Begreppet född inom respektive utom äktenskapet har efter 1976 utgått ur all lagstiftning.<br />

Från <strong>och</strong> med 1977 redovisas statistik om födda med indelning efter moders<br />

civilstånd, i analogi med tidigare indelning efter inom / utom äktenskap.<br />

Före 1973 angavs nyfött barns ordningsnummer endast <strong>för</strong> barn födda inom bestående<br />

äktenskap ingångna 1950 eller senare. Ordningsnumret avsåg makarnas samtliga<br />

gemensamma barn (födda levande <strong>och</strong> döda). Från mitten av 1973 får RTB istället<br />

uppgift om det antal barn som modern, oavsett civilstånd, tidigare fött (levande <strong>och</strong><br />

döda).<br />

Från 1:a juli 1979 ändrades lagstiftningen om medborgarskap <strong>för</strong> barn vars far har<br />

utländskt <strong>och</strong> mor svenskt medborgarskap. Tidigare fick dessa barn vid födseln enbart<br />

faderns medborgarskap, men numera blir de alltid svenska medborgare. Bestämmelsen<br />

med<strong>för</strong> att barn i större utsträckning än tidigare får dubbelt medborgarskap vid födseln. I<br />

den svenska folkbok<strong>för</strong>ingen registreras dock enbart det svenska medborgarskapet.<br />

Civilstånds<strong>för</strong>ändringar<br />

Lagstiftningen om skilsmässor ändrades 1 januari 1974. Ändringarna innebär bl.a. att<br />

det tidigare hemskillnadsåret ersattes med "en betänketid om sex månader", vilken dock<br />

ej behövs om makarna saknar barn under 16 år <strong>och</strong> är överens om skilsmässan. Den<br />

kraftiga ökningen av skilsmässor under 1974 <strong>och</strong> 1975 skall ses mot nämnda bakgrund.<br />

Fr.o.m. 1995 särredovisas nyregistrerade partnerskap, med indelning efter län, kön <strong>och</strong><br />

ålder. I antalsstatistiken om befolkningen efter civilstånd ingår fr.o.m 1998 nyregistrerade<br />

partnerskap <strong>och</strong> upplösta partnerskap i "gifta" respektive "skilda".


Medborgarskapsbyten<br />

Fr.o.m. 1974 sätts i statistiken året <strong>för</strong> byte till svenskt medborgarskap till året efter<br />

beslutet.<br />

Ändrad beräkning av dödsrisker<br />

Som nämns i Avsnitt 1.1.3 har beräkningen av de i livslängdstabellerna använda<br />

dödsriskerna <strong>för</strong> åldrarna 91 år <strong>och</strong> däröver ändrats, från användning av den s.k.<br />

Wittsteins utjämningsmetod till SCB:s "egen" metod. Den nya metoden användes <strong>för</strong>sta<br />

gången i 1987 års tabeller. Dödsriskerna i åldrarna över 95 år är där<strong>för</strong> numera väsentligt<br />

lägre än tidigare. Därmed har också kvarlevandetal <strong>och</strong> återstående medellivslängder<br />

höjts <strong>för</strong> de allra äldsta. En jäm<strong>för</strong>else mellan metoderna redovisas i Befolknings<strong>för</strong>ändringar<br />

Del 3 <strong>för</strong> åren 1987, 1988 <strong>och</strong> 1989.<br />

4.2 Jäm<strong>för</strong>barhet mellan grupper<br />

Sveriges befolkningsstatistik är anpassad till internationella standarder, <strong>och</strong> är därmed<br />

väl jäm<strong>för</strong>bar med andra länders statistik. Ett (internationellt) önskemål som vi dock inte<br />

kan möta är att redovisa statistik om omfattning av <strong>och</strong> orsaker till s.k. "short - term<br />

migration". Skälet är att i Sverige registreras endast in - <strong>och</strong> utvandringar med avsedd<br />

varaktighet om minst ett år (se Avsnitt 1.1.2).<br />

Även om det inte direkt gäller befolkningsstatistiken bör nämnas att RTB spelar en<br />

viktig allmänt samordnande roll <strong>för</strong> statistik från SCB. Så gott som alla urvalsundersökningar<br />

avseende individer, familjer <strong>och</strong> hushåll använder RTB som urvalsram,<br />

<strong>och</strong> hämtar demografisk bakgrundsinformation därifrån. Statistik från dessa<br />

undersökningar blir därigenom "automatiskt" samordnad.<br />

4.3 Samanvändbarhet med annan statistik<br />

Som nämns ovan, har RTB en "styrande" roll <strong>för</strong> mycken SCB - statistik. Som konsekvens<br />

är befolkningsstatistik <strong>och</strong> annan SCB - statistik väl samanvändbar.<br />

5 TILLGÄNGLIGHET <strong>och</strong> FÖRSTÅELIGHET<br />

5.1 Spridningsformer<br />

De viktigaste utflödena <strong>för</strong> befolkningsstatistik, ingående i Sveriges offentliga statistik<br />

(SOS), är de fyra publikationsserier som anges i Inledning. Den normala gången <strong>för</strong><br />

deras framtagande är följande. Under vecka 52 i referensåret presenteras ett<br />

pressmeddelande med preliminära befolkningssiffror <strong>för</strong> riket, <strong>och</strong> i nära anslutning till<br />

detta ett Statistiskt meddelande (SM) med fylligare regional redovisning. Den<br />

detaljerade, <strong>och</strong> definitiva, statistiken utkommer under efterföljande år i<br />

Befolkningsstatistik Del 1 - 2, 3 <strong>och</strong> 4 (se Inledning).<br />

Stora delar av statistiken görs också tillgänglig i Sveriges statistiska databaser på<br />

Internet samt på SCB:s webbplats www.scb.se. Där finns t.ex. statistik om folkmängd,<br />

födda, döda <strong>och</strong> flyttningar.<br />

Utöver SOS - statistiken framtas, främst <strong>för</strong> användning av länsstyrelser, landsting <strong>och</strong><br />

kommuner, ett stort antal s.k. råtabeller med produktbenämningar :<br />

BEFPAK - folkmängd <strong>och</strong> BEFPAK - befolknings<strong>för</strong>ändringar.<br />

Dessa redovisar löpande under året kvartalsvisa avstämningar av såväl folkmängd som<br />

befolknings<strong>för</strong>ändringar. Enskilda personer kan få tillgång till BEFAK - tabellerna hos<br />

programmet <strong>för</strong> befolkningsstatistik vid SCB i Örebro, länsstyrelsernas regionalekonomiska<br />

enheter, landstingens planeringsavdelningar samt hos kommunerna.<br />

För att peka på intressanta <strong>för</strong>ändringar i befolkningens storlek <strong>och</strong> sammansättning<br />

publiceras emellanåt pressmeddelanden av regional <strong>och</strong>/eller rikstäckande art. Artiklar<br />

<strong>och</strong> demografiska rapporter framställs mer eller mindre kontinuerligt <strong>för</strong> publicering i<br />

tidskrifter, presentation på seminarier <strong>och</strong> konferenser, mm. Vart femte år görs<br />

uppdaterad publicering i serien Demografiska rapporter Livslängdstabeller.<br />

53


54<br />

5.2 Presentation<br />

Statistiken redovisas i form av text, tabeller, diagram.<br />

5.3 Dokumentation<br />

RTB:s fullständiga variabeluppsättning mm. är dokumenterad enligt SCB:s dokumentationssystem<br />

SCBDOK. Dokumentationen finns tillgänglig bl.a. på SCB:s<br />

webbplats.<br />

5.4 Tillgång till primärmaterial<br />

Mikrodatamaterial finns lagrat i olika delregister inom RTB-systemets ram. Årsskiftesversionerna<br />

av RTB finns långtidsarkiverade hos Riksarkivet, <strong>och</strong> detsamma<br />

gäller årsversionerna av <strong>för</strong>ändringsregistren.<br />

Forskare m.fl. kan efter prövning få tillgång till avidentifierat mikromaterial. Möjligheten<br />

används <strong>för</strong> närvarande främst av medicinska forskare.<br />

5.5 Upplysningstjänster<br />

Ytterligare upplysningar om befolkningsstatistiken kan fås på nedanstående ställen:<br />

Befolkningsstatistikens talsvar telefon 019 - 17 - 69 00,<br />

SCB:s webbplats www.scb.se under rubriken Befolkning,<br />

E-mailadress: befolkning@scb.se.


Kvalitetsdeklaration av<br />

Arbetskraftsundersökningarna (AKU) januari 2000<br />

0 INLEDNING<br />

Arbetskraftsundersökningarna (AKU) framställer månatlig statistik om <strong>för</strong>hållandena på<br />

arbetsmarknaden med tonvikt på antal <strong>och</strong> andel sysselsatta <strong>och</strong> arbetslösa. Statistiken<br />

redovisas med en mängd gruppindelningar. AKU är en urvalsundersökning som varje<br />

månad undersöker, medelst telefonintervju, cirka 17 000 personer. Statistik publiceras<br />

cirka två veckor efter månadens utgång, dels i ett Statistiskt Meddelande (SM) med<br />

översiktliga resultat, dels i AKU : Grundtabeller med detaljerade resultat. Månadsundersökningarnas<br />

uppgifter ligger också till grund <strong>för</strong> kvartals - <strong>och</strong> årsstatistik. Föreliggande<br />

<strong>kvalitets</strong>deklaration avser statistiken <strong>för</strong> januari 2000.<br />

1 STATISTIKENS INNEHÅLL<br />

1.1 <strong>Statistiska</strong> målstorheter<br />

De statistiska storheter / parametrar som primärt skattas gäller hur Sveriges befolkning i<br />

arbets<strong>för</strong> ålder <strong>för</strong>delar sig antalsmässigt efter olika aspekter på deras arbetsmarknadssituation.<br />

Ett flertal indelningar görs, bl.a. efter demografi (kön, ålder,<br />

boendeort, civilstånd, barninnehav, nationalitet, mm.). Skattade gruppstorlekar, <strong>och</strong> även<br />

andra grupptotaler, ger underlag <strong>för</strong> att skatta olika medelvärden (inklusive andelar),<br />

t.ex. andelen arbetslösa <strong>och</strong> genomsnittlig arbetstid.<br />

1.1.1 Objekt <strong>och</strong> population<br />

AKU:s målpopulation (undersökningspopulation) utgörs av i Sverige bosatta personer<br />

som fyllt 16 men ej 65 år. Populationen kallas befolkningen, om än litet oegentligt<br />

eftersom den endast utgör ett åldersutsnitt ur landets totala befolkning.<br />

1.1.2 Variabler<br />

De variabler som är av betydelse i AKU kan indelas i bakgrundsvariabler, arbetsmarknadsvariabler<br />

<strong>och</strong> hjälpvariabler, <strong>och</strong> så görs i följande beskrivning.<br />

BAKGRUNDSVARIABLER<br />

Dessa utgörs främst av demografiska variabler som kön, ålder, civilstånd, barninnehav,<br />

boendelän/kommun, nationalitet, mm. Initiala värden (som kontrolleras vid intervjuerna)<br />

hämtas från AKU:s urvalsram, SCB:s Registret över totalbefolkningen (RTB).<br />

ARBETSMARKNADSVARIABLER<br />

En ideal AKU - undersökning skulle gå till så att varje person i befolkningen (16 - 64 år)<br />

efter varje vecka tillfrågades om sin arbetsmarknadssituation under veckan ifråga, kallad<br />

mätveckan. Nedanstående variabler tar fasta på personens situation under mätveckan.<br />

AKU:s målstorheter utgörs dock inte av veckovisa <strong>för</strong>hållanden utan av månadsvisa,<br />

kvartalsvisa <strong>och</strong> årsvisa sådana, som ger genomsnittsvärden över de mätveckor som<br />

ingår i AKU:s "månader", "kvartal" <strong>och</strong> "år", vilka ligger mycket nära motsvarande<br />

kalenderperioder. En "AKU - månad" omfattar 4 eller 5 veckor, ett "kvartal" 13 veckor<br />

<strong>och</strong> ett "år" 52 (undantagsvis 53) veckor. Januari år 2000 bestod av veckorna 1, 2, 3 <strong>och</strong><br />

4.<br />

Arbetskraftsstatus<br />

Figur 1 anger kategorier <strong>för</strong> arbetskraftsstatus, som mer ingående definieras nedan.<br />

55


56<br />

Arbetskraften<br />

Arbetskraften utgörs av personer som antingen är sysselsatta eller arbetslösa enligt<br />

nedanstående definitioner. Övriga klassificeras som ej i arbetskraften (med synonym<br />

utan<strong>för</strong> arbetskraften).<br />

Sysselsatta<br />

En person är sysselsatt under mätveckan om villkoren 1 eller 2 nedan gäller.<br />

1 Personen är sysselsatt <strong>och</strong> i arbete om han/hon under mätveckan ut<strong>för</strong> minst<br />

en timmes arbete som avlönad arbetstagare, som egen <strong>för</strong>etagare (inklusive fri<br />

yrkesutövare) eller som oavlönad medhjälpare i <strong>för</strong>etag som tillhör familjemed-<br />

lem i samma hushåll.<br />

2 Personen är sysselsatt men tillfälligt frånvarande om han/hon normalt är sys-<br />

selsatt enligt 1, men är tillfälligt frånvarande från arbetet under hela mätveckan,<br />

oavsett om frånvaron är betald eller ej. Orsaker till tillfällig frånvaro är bl.a.<br />

sjukdom, semester, tjänstledighet (t.ex. <strong>för</strong> vård av barn), (kortvarig) värnplikt<br />

<strong>och</strong> arbetskonflikt.<br />

Personer som under mätveckan har anställningsstöd, offentligt skyddat arbete, arbete vid<br />

Samhall eller är anställd med lönebidrag klassificeras som sysselsatta.<br />

Undersysselsatta<br />

Person som är sysselsatt men av arbetsmarknadsskäl arbetar mindre än han/hon önskar<br />

sägs vara undersysselsatt.<br />

I arbete<br />

I arbetskraften<br />

Befolkningen<br />

Ej i arbets-<br />

kraften<br />

Sysselsatta Arbetslösa Velat arbeta Ej velat arbeta<br />

Tillfälligt frånvarande<br />

hela mätveckan<br />

Kunde arbeta<br />

(latent arbetssökande)<br />

Förhindrad att<br />

arbeta<br />

Figur 1. Grundläggande klassificering avseende arbetskraftsstatus<br />

Arbetslösa<br />

Huvudregeln är att en person är arbetslös under mätveckan om han/hon inte är sysselsatt<br />

(enligt ovan) <strong>och</strong> dessutom uppfyller (i) - (iii) nedan.<br />

(i) Vill arbeta.<br />

(ii) Kan börja ett arbete inom 14 dagar.<br />

(iii) Har sökt arbete under de senaste fyra veckorna (inkl. mätveckan), eller<br />

inväntar att börja nytt arbete inom kort (inom fyra veckor efter mätveckan).<br />

Från huvudregeln görs följande undantag.<br />

En heltidsstuderande person som ej var sysselsatt (enligt ovan) under mät-veckan <strong>och</strong><br />

dessutom uppfyller (i) - (iii) klassificeras dock ej som arbetslös, utan som tillhörande<br />

"ej i arbetskraften". Här gör AKU avsteg från ILO : s internationella rekommendationer.


Latent arbetssökande<br />

En delgrupp av "ej i arbetskraften" utgörs av de latent arbetssökande, som utgörs av<br />

personer som ville <strong>och</strong> kunde arbeta under mätveckan men ej hade sökt arbete, samt<br />

heltidsstuderande som sökt arbete.<br />

Anknytningsgrad till arbetsmarknaden<br />

Klassificerar befolkningen i kategorierna fast, lös <strong>och</strong> utan anknytning.<br />

Fast anknytning har personer med fast anställning samt <strong>för</strong>etagare <strong>och</strong> deras medhjälpande<br />

familjemedlemmar.<br />

Lös anknytning har personer med tidsbegränsad anställning samt ej sysselsatta personer<br />

som dock arbetat någon gång under det senaste året.<br />

Utan anknytning är ej sysselsatta personer som inte arbetat under det senaste året.<br />

Gruppen inkluderar arbetso<strong>för</strong>mögna <strong>och</strong> personer med arbete/vistelse utomlands.<br />

Studier<br />

Variablerna utgörs av svar på frågor som ställs till alla utom personer som vistas<br />

utomlands, är långvarigt sjuka eller intagna <strong>för</strong> vård, om huruvida man studerade under<br />

mätveckan, <strong>och</strong> om så huruvida studierna var hel - eller deltidsstudier, samt antalet<br />

studietimmar under mätveckan.<br />

YTTERLIGARE ARBETSMARKNADSVARIABLER<br />

De ytterligare arbetsmarknadsvariablerna är mer eller mindre olika beroende på personens<br />

arbetskraftsstatus (sysselsatt, arbetslös eller utan<strong>för</strong> arbetskraften, mm.).<br />

Variabler <strong>för</strong> sysselsatta<br />

Viktiga variabler är yrke, yrkesställning, näringsgren, anställningens art, arbetstid,<br />

fack<strong>för</strong>bundstillhörighet, bisyssla, studier, frånvaro. Flertalet definieras/kommenteras<br />

nedan.<br />

Yrke<br />

Från <strong>och</strong> med 1997 klassas yrke enligt Standard <strong>för</strong> svensk yrkesklassificering (SSYK),<br />

som är den svenska versionen av EU : s yrkesklassificering ISCO 88 COM.<br />

Yrkesställning<br />

Har kategorierna anställda, <strong>för</strong>etagare <strong>och</strong> medhjälpande familjemedlemmar.<br />

Anställda underindelas i fast anställda ( = har tillsvidareanställning) <strong>och</strong> tidsbegränsat<br />

anställda (= personer med anställningsstöd, säsongarbete, provanställning, praktiktjänstgöring,<br />

objekt/projektanställning, mm.).<br />

Näringsgren<br />

Näringsgren bestäms av verksamheten vid det arbetsställe där personen är<br />

(huvud)sysselsatt. Fr.o.m. 1995 klassificerar AKU enligt SNI92 (Standard <strong>för</strong> svensk<br />

näringsgrensindelning 1992), vilken är den svenska versionen av EU:s standard NACE<br />

(Nomenclature Generale des Activités Economiques).<br />

Anställningens art (<strong>för</strong> anställda)<br />

Avser arbetsgivarens sektor enligt SCB:s standard <strong>för</strong> sektorstillhörighet, med kategorier<br />

statlig, affärsdrivande verk, primärkommunal, landstingskommunal, övriga offentliga<br />

institutioner samt enskilt <strong>för</strong>etagande. AKU aggregerar indelningen till statlig ( = statlig<br />

+ affärsdrivande), kommunal ( = primärkommunal + landstingskommunal + övriga<br />

offentliga institutioner) samt enskild.<br />

Arbetstid<br />

Det antal timmar en person arbetar under mätveckan kallas faktiskt arbetad tid medan<br />

vanlig arbetstid avser den arbetstid som personen skall arbeta enligt överenskommelse.<br />

57


58<br />

Frånvaroorsak<br />

Svar på frågor till personer som var tillfälligt frånvarande under mätveckan.<br />

Bisyssla<br />

Sysselsatta personer har en bisyssla om de svarar ja på frågan: "Har Du mer än ett<br />

jobb/arbete, ett extraknäck eller någon (betald) bisyssla?”<br />

Variabler <strong>för</strong> arbetslösa<br />

Yrke, näringsgren fack<strong>för</strong>bundstillhörighet, bisyssla, mm. definieras som <strong>för</strong> sysselsatta,<br />

utifrån <strong>för</strong>hållandena när den arbetslöses senast var sysselsatt. Särskilda variabler är<br />

antal arbetslöshetsveckor, sätt att söka arbete, önskad arbetstid, m.fl.<br />

Variabel <strong>för</strong> personer utan<strong>för</strong> arbetskraften<br />

Gäller huvudsaklig verksamhet, som omfattar hemarbete, pensionerad, studerande,<br />

värnpliktig, långvarigt sjuk, m.fl., enligt personens egen bedömning .<br />

HJÄLPVARIABLER<br />

Bland dessa ingår några uppgifter från registret som ligger till grund <strong>för</strong> SCB:s<br />

Registerbaserade arbetsmarknadsstatistik (RAMS). RAMS tar fram årlig totalräknad<br />

statistik <strong>och</strong> RAMS - registret omfattar (åtminstone i princip) hela befolkningen (t.o.m. i<br />

alla åldrar). Dess variabelinnehåll ansluter till AKU:s, med referenstidpunkt november.<br />

T.ex. avser RAMS - sysselsatt en persons sysselsättningssituation under november.<br />

Jäm<strong>för</strong>t med AKU är uppgifterna i RAMS "dåligt aktuella", registret har en<br />

framställningstid om cirka ett <strong>och</strong> halvt år. För AKU spelar RAMS - uppgifter roll<br />

fram<strong>för</strong> allt som hjälpinformation <strong>för</strong> urval <strong>och</strong> skattning.<br />

Hjälpinformation <strong>för</strong> samma syfte hämtas också från Arbetsmarknadsstyrelsens (AMS)<br />

arbetssökanderegister.<br />

1.1.3 <strong>Statistiska</strong> mått<br />

Merparten av statistiken från AKU utgörs av skattade värden på statistiska storheter/<br />

parametrar av typ totaler <strong>och</strong> medelvärden (med "andel" som vanligt specialfall).<br />

Skattningar redovisas med ett flertal gruppindelningar, vilka beskrivs i Avsnitt 1.1.4.<br />

Dessutom beräknas statistikens osäkerhet med hjälp av skattade standardavvikeser.<br />

Nedan anges de viktigaste målstorheterna.<br />

Storheter av typ total<br />

Huvudstorheter är antal sysselsatta, antal arbetslösa, antal personer i <strong>och</strong> utan<strong>för</strong><br />

arbetskraften. Ytterligare exempel är följande. För sysselsatta : antal personer i arbete,<br />

summa faktiskt arbetade timmar <strong>och</strong> antal undersysselsatta resp. latent arbetslösa. För<br />

sysselsatta, som studerar : antal studietimmar under mätveckan.<br />

Storheter av typ medelvärde<br />

Några exempel ges nedan.<br />

Relativt arbetslöshetstal = andel arbetslösa i arbetskraften.<br />

Relativt arbetskraftstal = arbetskraftens andel av befolkningen (16 - 64 år).<br />

Sysselsättningsintensitet = andel sysselsatta i befolkningen (16 - 64 år).<br />

Relativt frånvarotal = andel tillf. frånvarande under mätveckan bland sysselsatta.<br />

Medelarbetstid (<strong>för</strong> sysselsatta) = genomsnittlig arbetstid under mätveckan.<br />

1.1.4 Redovisningsgrupper<br />

De statistiska målstorheterna skattas <strong>för</strong> en mängd olika redovisningsgrupper ( = delgrupper<br />

av populationen), vilka skapas genom mer eller mindre långtgående korsindelningar<br />

med hjälp av olika "indelningsvariabler", där bakgrundsvariablerna spelar central<br />

roll. I det följande ges exempel på indelningsvariabler. Det skulle dock <strong>för</strong>a <strong>för</strong> långt att


precist beskriva vilka korsindelningar som görs, <strong>för</strong> mer fullständig information hänvisas<br />

till AKU : Grundtabeller. I stort sett alla indelningar tar fasta på kön, ålder (med 5 -<br />

<strong>och</strong> 10 - årsklasser) <strong>och</strong> boendelän. Ytterligare exempel på indelningsvariabler ges<br />

nedan.<br />

För statistik om befolkningen: Arbetskraftsstatus, aspekter på barninnehav (antal barn,<br />

yngsta barnets ålder, <strong>för</strong>ekomst av barn under 17 år), vanligen arbetad tid.<br />

För statistik avseende sysselsatta: Anknytningsgrad till arbetsmarknaden, näringsgren,<br />

yrke, anställningens art, yrkesställning, bisyssla, vanligen arbetad tid.<br />

För statistik avseende sysselsatta <strong>och</strong> anställda: Förutom "gängse" variabler <strong>för</strong> sysselsatta,<br />

hel - resp. deltid, skäl <strong>för</strong> att arbeta mer än vanligt, vanligen arbetad tid, skäl <strong>för</strong> att<br />

arbeta mindre än önskat, genomsnittlig önskad ökad arbetstid.<br />

För statistik avseende sysselsatta i arbete: Faktisk <strong>och</strong> vanlig arbetstid, anknytningsgrad<br />

till arbetsmarknaden, yrke, näringsgren, aspekter på barninnehav, huvud - resp. bisyssla,<br />

anställningens art.<br />

För statistik avseende sysselsatta men tillfälligt frånvarande: Förutom "gängse" variabler<br />

<strong>för</strong> sysselsatta, huvudsaklig frånvaroorsak, aspekter på barninnehav, antal frånvarotimmar,<br />

vanligen arbetad tid, huvud - <strong>och</strong> bisyssla.<br />

För statistik avseende arbetslösa : Arbetslöshetstidens längd, ny - eller återinträde på<br />

arbetsmarknaden, sätt att söka arbete, genomsnittlig arbetslöshetstid, önskad arbetstid,<br />

anledning till att man slutade <strong>för</strong>egående arbete, aspekter på barninnehav.<br />

För statistik avseende personer utan<strong>för</strong> arbetskraften: Huvudsaklig verksamhet, önskemål<br />

om <strong>och</strong> möjlighet till <strong>för</strong>värvsarbete. För latent arbetssökande : önskad arbetstid.<br />

1.1.5 Referenstider<br />

Statistikens referensperiod är veckorna 1, 2, 3 <strong>och</strong> 4 år 2000, 3 - 30 januari.<br />

1.2 Fullständighet<br />

AKU är fram<strong>för</strong> allt en enskild undersökning. Se dock Avsnitt 4.3.<br />

2 STATISTIKENS TILLFÖRLITLIGHET<br />

2.1 Till<strong>för</strong>litlighet totalt<br />

Liksom i stort sett all statistik är även AKU - statistiken behäftade med viss osäkerhet. I<br />

Avsnitt 2.2 görs en genomgång av AKU : s felkällor <strong>och</strong> deras konsekvenser. De fel som<br />

spelar störst roll är urvalsfel (som beror på att endast ett urval undersökts), bortfallsfel<br />

(som beror på att svar saknas helt eller delvis från vissa utvalda) samt mätfel (som<br />

uppkommer främst p.g.a. att frågor eller svar missuppfattas).<br />

Vid bedömning av hur fel påverkar statistiken från en undersökning skiljer man mellan<br />

slumpmässiga fel ( = fel som "fluktuerar kring 0") <strong>och</strong> systematiska fel (fel som till sin<br />

majoritet går åt samma håll). De senare med<strong>för</strong> större eller mindre skevhet i statistiken<br />

(systematisk över- eller underskattning) vilket de slumpmässiga felen inte gör, men<br />

dessa bidrar till statistikens osäkerhet. Med total osäkerhet / fel avses det sammantagna<br />

felet (systematiskt fel + slumpmässigt fel).<br />

För osäkerheten som emanerar från slumpmässiga fel kan felgränser beräknas från de<br />

observerade värdena, i form av konfidensintervall Y $ ± 1.96 × Dˆ , med Y $ <strong>för</strong><br />

punktskattningen ( = statistikvärdet) <strong>och</strong> D <strong>för</strong> skattad standardavvikelse <strong>för</strong><br />

ˆ $ Y . Ett<br />

sådant intervall innehåller med stor trolighet (cirka 95 %) det riktiga värdet på den<br />

statistiska storhet som $ Y skattar. Om skevheten är obetydlig anger ett konfidensintervall<br />

statistikvärdets totala osäkerhet.<br />

Det är avsevärt svårare att ange gränser <strong>för</strong> den osäkerhet som emanerar från eventuella<br />

systematiska fel. Det kräver särskilda, oftast mycket resurskrävande, utvärde-<br />

59


60<br />

ringsinsatser <strong>och</strong> sådana görs där<strong>för</strong> endast intermittent. På basis av gjorda studier<br />

bedöms att den helt övervägande delen av AKU : s statistik har <strong>för</strong>sumbar skevhet, <strong>och</strong><br />

därav följer att konfidensintervallen ger god uppfattning om total till<strong>för</strong>litlighet. Varning<br />

ges dock dels <strong>för</strong> skattningar på riksnivå av antal personer utan<strong>för</strong> arbetskraften samt <strong>för</strong><br />

statistik om utländska medborgare. Den senare frågan diskuteras i Avsnitten 2.2.2 <strong>och</strong><br />

2.2.4.<br />

2.2 Osäkerhetskällor<br />

Allmänt talar man om felkällorna urval, ramtäckning, mätning, svarsbortfall, bearbetning<br />

<strong>och</strong> modellantaganden, vilka alla behandlas i det följande. Men som redan nämnts<br />

är det främst mätning <strong>och</strong> bortfall som vållar problem i AKU.<br />

2.2.1 Urval <strong>och</strong> estimation<br />

Urval<br />

Ett AKU - urval utgörs av ett antal personer ur befolkningen (16 - 64 år). Som urvalsram<br />

används åldersutsnittet ifråga i Registret över totalbefolkningen (RTB). Utsnittet<br />

omfattar cirka 5 500 000 personer. RTB uppdateras veckovis via aviseringar från<br />

folkbok<strong>för</strong>ingsmyndigheten ( = Skattemyndigheten) om födslar, dödsfall, flyttningar<br />

inom landet, in - <strong>och</strong> utvandringar, mm.<br />

RTB innehåller demografiska variabler (kön, ålder, boendeort, mm.) som spelar roll dels<br />

vid urvalsdragningen dels som (initial)värden <strong>för</strong> bakgrundsvariablerna (se Avsnitt<br />

1.1.2). I urvalsramen kompletteras RTB - informationen genom på<strong>för</strong>ande av sysselsättningsstatus<br />

enligt RAMS - registret (se Avsnitt 1.1.2, hjälpvariabler). Den<br />

informationen, som är cirka 2 år gammal, används som hjälpinformation vid urvalsdragningen<br />

<strong>och</strong> efterföljande skattning.<br />

AKU använder ett <strong>för</strong>farande med urvalspaneler, vilket med<strong>för</strong> att en utvald person<br />

intervjuas var tredje månad tills han/hon varit med i undersökningen 8 gånger, dvs.<br />

under cirka två år. Beskrivet i stora drag är urvals<strong>för</strong>farandet stratifierat urval med<br />

systematiskt urval inom stratan. Urvalsstratana skapas genom korsindelning med<br />

avseende på boendelän, kön, medborgarskap (svensk/ej svensk) <strong>och</strong> RAMS – sysselsättningsstatus,<br />

vilket leder till 192 urvalsstratan. Variabeln "ålder" används inte vid<br />

stratumindelningen, men kommer in som "implicit" stratifieringsvariabel genom att de<br />

stratumvisa systematiska urvalen dras med urvalsramen sorterad efter ålder. Urvalsfraktionen<br />

är något högre <strong>för</strong> utländska än <strong>för</strong> svenska medborgare. Skälet är krav på<br />

särskild redovisning <strong>för</strong> utländska medborgare, t.o.m. uppdelade efter nationalitet, varvid<br />

det handlar om, relativt sett, mycket små grupper. Urvalssystemet är utformat så att<br />

ett månadsurval omfattar cirka 17 000 personer.<br />

Estimation<br />

Om svarsbortfall inte <strong>för</strong>elåg, skulle AKU : s estimation göras enligt "läroboken" <strong>för</strong><br />

skattning vid stratifierat urval, men bortfallet <strong>för</strong>anleder justeringar. En "lättvindig"<br />

metod <strong>för</strong> att skatta "trots bortfall" är s.k. (enkel) "rak uppräkning", vilken innebär att<br />

man skattar som om de svarande utgör de ursprungligt utvalda. För att inte leda till skev<br />

statistik <strong>för</strong>utsätter den metoden att "arbetsmarknads<strong>för</strong>hållanden <strong>för</strong> svarande <strong>och</strong><br />

bortfall är i stort sett lika". Den kan dock leda till allvarlig skevhet om det <strong>för</strong>eligger<br />

samspel mellan "svarsbenägenhet" <strong>och</strong> "värdena på arbetsmarknadsvariabler". Härvidlag<br />

vets att personer med lös anknytning till arbetsmarknaden (vilka till stor del utgörs av<br />

arbetslösa) har klart lägre svarsbenägenhet än övriga. Okritisk rak uppräkning skulle<br />

därigenom leda till att bl.a. "antal arbetslösa" underskattas.<br />

Skevheten kan dock reduceras avsevärt genom att i urvalet <strong>och</strong> estimationen beakta s.k.<br />

svarshomogenitetsgrupper, <strong>för</strong>utsatt att hjälpvariabler <strong>för</strong> att kunna identifiera sådana<br />

finns tillgängliga. Tidigare använde AKU en uppräkning efter kön, ålder <strong>och</strong> län, men<br />

1993 in<strong>för</strong>des ett nytt <strong>för</strong>farande. Skattningar avseende hela riket baserades på två<br />

poststratifieringssystem det ena med uppräkning baserad på hjälpvariablerna "ingår i<br />

AMS arbetssökanderegister med uppdelning på kön <strong>och</strong> ålder" <strong>och</strong> det andra, ”sysselsatt<br />

enligt RAMS med uppdelning på näringsgren kön <strong>och</strong> ålder.” Det nya <strong>för</strong>farandet


med<strong>för</strong>de avsevärd reduktion av tidigare skevhet <strong>för</strong> skattningar på riksnivå, men<br />

slopandet av län som hjälpvariabel innebar samtidigt att skattningar avseende län<br />

<strong>för</strong>sämrades. Ett speciellt poststratifieringssystem med befolkningen <strong>för</strong>delad efter kön<br />

ålder <strong>och</strong> region utvecklades där<strong>för</strong> <strong>för</strong> skattningar på länsnivå. En kvarstående brist i<br />

det nya estimationssystemet var emellertid bristande konsistens mellan riksskattningar<br />

<strong>och</strong> regionala skattningar .<br />

Ytterligare modifiering av estimations<strong>för</strong>farandet har gjorts sedan dess.<br />

Senaste omläggningen, som gjordes i oktober 1999, syftar till att integrera riksskattningar<br />

<strong>och</strong> regionala skattningar i ett <strong>och</strong> samma system <strong>för</strong> att undvika den tidigare<br />

nämnda inkonsistensen. Systemet utvecklades också med restriktionen att inga tidsseriebrott<br />

skulle ske <strong>för</strong> skattningarna på riksnivå .<br />

Efter senaste omläggningen vilar estimationen på två delsystem, vilka skiljer sig ifråga<br />

om den hjälpinformation som används <strong>för</strong> bortfallskompensation. Den numera använda<br />

tekniken är hämtad från "generaliserad regressionsestimation".<br />

I det ena delsystemet skattas storlekar/totaler <strong>för</strong> grupper inom delpopulationen "sysselsatta"<br />

(exempel är "antal sysselsatta", "antal i arbete" <strong>och</strong> "antal arbetade timmar").<br />

Här används enbart urvalsstratana som svarshomogenitetsgrupper, men <strong>för</strong> att uppnå bra<br />

bortfallskompensation är därvidlag viktigt att variabeln "RAMS - sysselsatt" ingår som<br />

hjälpvariabel, <strong>för</strong>utom de allmänna bakgrundsvariablerna.<br />

I det andra delsystemet skattas storlekar/totaler <strong>för</strong> grupper inom delpopulationen<br />

"arbetslösa" (exempel är "antal arbetslösa" <strong>och</strong> "totalt antal arbetslöshetsmånader"). Här<br />

görs bortfallskompensationen med användande av, utöver variablerna som genererar<br />

urvalsstratana, den ytterligare hjälpvariabeln "ingår i AMS arbetssökanderegister".<br />

Storlekar / totaler <strong>för</strong> grupper som omfattar såväl sysselsatta som arbetslösa skattas sedan<br />

genom att kombinera skattningar från de två delsystemen. Några exempel :<br />

Antal i arbetskraften = antal sysselsatta + antal arbetslösa<br />

Antal ej i arbetskraften = antal i befolkningen (enligt RTB) - antal i<br />

arbetskraften.<br />

När man har skattningar av gruppstorlekar <strong>och</strong> andra totaler skattas de olika slagen av<br />

medelvärden på naturligt sätt som kvoter mellan skattade totaler.<br />

Som del av skattningsberäkningarna tas också fram skattade standardavvikelser <strong>för</strong><br />

punktskattningarna. Dessa ger underlag <strong>för</strong> beräkning av konfidensintervall som fångar<br />

upp osäkerhetsbidrag från de slumpmässiga felen (slumpurvalet <strong>och</strong> slumpmässiga mät -<br />

<strong>och</strong> bortfallsstörningar).<br />

Ut<strong>för</strong>lig beskrivning av estimations<strong>för</strong>farandet ges i Mirza & Hörngren (2001) : Urvals-<br />

<strong>och</strong> estimations<strong>för</strong>farande i de svenska arbetskraftsundersökningarna.<br />

2.2.2 Ramtäckning<br />

Täckningsbrister handlar om dels undertäckning, som <strong>för</strong>eligger om personer (16 - 64)<br />

som är bosatta i Sverige saknas i urvalsramen (dvs. i RTB) dels övertäckning, som<br />

<strong>för</strong>eligger om personer i urvalsramen inte längre ingår i landets befolkning.<br />

Den undertäckning som finns i AKU hänger främst ihop med att immigranter i landet<br />

("invandrare" + "hemvändare") kommer till RTB:s kännedom med viss "eftersläpning".<br />

Effekten på statistiken bedöms dock vara högst obetydlig. Litet mer komplicerande är att<br />

AKU - urval dras en gång per år, <strong>och</strong> att utvalda personer intervjuas under en<br />

tvåårsperiod. En urvalspanel dragen ett visst år undertäcker där<strong>för</strong> i någon mån<br />

immigranter vid efterföljande års undersökningar. Även detta <strong>för</strong>hållande bedöms ha<br />

marginell effekt på AKU - statistiken.<br />

AKU:s övertäckning beror fram<strong>för</strong> allt på "eftersläpning" i rapporteringen av dödsfall<br />

<strong>och</strong> utvandringar. RTB : s snabba uppdateringsrutiner med<strong>för</strong> att urvalsramen har<br />

obetydlig övertäckning åtminstone vad gäller svenska medborgare, men inte riktigt lika<br />

bra <strong>för</strong> utländska, särskilt utomnordiska, medborgare. Skälet är att vissa utomlands<br />

61


62<br />

födda personer lämnar Sverige utan att anmäla det till svensk myndighet. Sådana<br />

personer skulle helst inte ingå i urvalsramen eftersom de inte längre är bosatta i landet,<br />

<strong>och</strong> "bristen" ifråga uppdagas oftast inte heller eftersom de inte nås <strong>för</strong> intervju.<br />

Därigenom blir de felaktigt klassade som "bortfall" trots att "övertäckning" är det<br />

adekvata, <strong>och</strong> denna felklassning leder till viss skevhet i statistiken. Övertäckningen<br />

ifråga är av storleksordningen 25 000 - 50 000 personer. Frågan diskuteras vidare i<br />

Avsnitt 2.2.4.<br />

Sammanfattningsvis är dock bedömningen att, bortsett från statistik avseende<br />

utomnordiska invandrare, har bristerna i AKU : s urvalsram ingen menlig effekt på<br />

statistiken.<br />

2.2.3 Mätning<br />

Datainsamling<br />

Uppgifter till AKU inhämtas av SCB - intervjuare genom datorstödda telefonintervjuer,<br />

vilka följer en standardiserad blankett. Vid <strong>för</strong>sta intervjutillfället (av de 8) görs<br />

noggrann kartläggning av personens arbetsmarknadssituation, generellt <strong>och</strong> <strong>för</strong><br />

mätveckan. Vid efterföljande tillfällen görs <strong>för</strong> vissa variabler (arbetskraftsstatus, yrke,<br />

arbetsplats, m.fl.) endast uppföljning av om <strong>för</strong>ändring skett. Uppgifter om<br />

arbetssituationen under mätveckan inhämtas dock varje gång. Uppgiftsinsamlingen<br />

illustreras i Figur 2 nedan.<br />

En utvald person informeras per brev, ungefär två veckor i <strong>för</strong>väg, om att hon/han blivit<br />

utvald att delta i AKU, <strong>och</strong> kommer att bli kontaktad <strong>för</strong> telefonintervju. I brevet finns<br />

också en broschyr med information om undersökningen (syfte, uppläggning, mm.). Om<br />

det inte går att nå en utvald person via telefon görs besöksintervju, vilket dock gäller<br />

bara cirka 1/2 % av samtliga intervjuer. I vissa fall, t.ex. vid sjukdom eller språksvårigheter<br />

görs indirekt intervju ( = annan person svarar <strong>för</strong> utvald persons räkning), vilket<br />

<strong>för</strong>ekommer i cirka 3 % av intervjuerna.<br />

Intervjuer avseende en viss mätvecka påbörjas dagen efter veckans utgång. Flertalet av<br />

intervjuerna genom<strong>för</strong>s under loppet av en dryg vecka.


Blankett <strong>för</strong> ny<br />

klassificering<br />

Blankett <strong>för</strong> klassificeringskontroll<br />

Intervju 1<br />

Frågor om urvalspersonensarbetsmarknadssituation<br />

över<strong>för</strong>ing av<br />

uppgifter<strong>för</strong> nästa<br />

intervjutillfälle<br />

Intervju 2-8<br />

Klassificeringskontroll<br />

Uppifterna<br />

avviker<br />

Omklassificering<br />

Uppgifterna<br />

överensstämmer<br />

Figur 2. Flödesschema <strong>för</strong> uppgiftsinsamlingen<br />

Frågor om<br />

mätveckan<br />

Frågor om<br />

mätveckan<br />

Frågor om<br />

mätveckan<br />

Mätfel<br />

AKU har genom<strong>för</strong>t s.k. återintervjustudier <strong>för</strong> att få uppfattning om <strong>för</strong>ekomst av<br />

mätfel <strong>och</strong> dessas eventuella snedvridande konsekvenser. De tre senaste studierna<br />

gjordes 1978, 1989/90 samt 1994/95. Som exempel visas i Tabell 1 några resultat från<br />

studierna, avseende felklassificering av arbetskraftsstatus, med en 5 - kategori - indelning<br />

<strong>och</strong> en "<strong>för</strong>grovning" av denna till 3 kategorier. Nettofel är andel felaktigt medtagna<br />

minus andel felaktigt uteslutna personer. Bruttofel är summan av andelarna felaktigt<br />

medtagna <strong>och</strong> felaktigt uteslutna personer. I tabellen skall " + " <strong>och</strong> " - " tolkas som att<br />

"ordinarie" AKU överskattar respektive underskattar.<br />

Tabell 1. Nettofel (i %)<br />

Variabel Arbetskraftsstatus 1978 89/90 94/95<br />

1 Ej i arbetskraften, exkl.<br />

arb.o<strong>för</strong>mögna<br />

+ 11% + 8 % + 3 %<br />

2 Sysselsatta, i arbete -1% - 1 % 0 %<br />

Arbets- 3 Sysselsatta, tillfälligt frånvarande +19% + 1 % - 4 %<br />

marknads- 4 Arbetslösa -3% - 16 % - 2 %<br />

status 5 Ej i arbetskraften +arbetso<strong>för</strong>mögna -46% 0 % + 2 %<br />

63<br />

Sysselsatta (2 + 3) +1% -1% 0 %<br />

Arbetslösa (4) -3% -16% - 2 %<br />

Ej i arbetskraften (1 + 5) -2% +7% + 3 %


64<br />

Mätfelsstudien 94/95 gav vid handen att bruttofelet <strong>för</strong> "samtliga" vid klassning av<br />

arbetskraftsstatus enligt 3 - kategori - indelningen var 3 % .<br />

Från Tabell 1 framgår att utvecklingen över tiden gått mot det markant bättre, 94/95 års<br />

felprocenter ses som "acceptabla", även om strävan naturligtvis är att eliminera dem helt.<br />

2.2.4 Svarsbortfall<br />

Allmänt om AKU : s bortfall <strong>och</strong> bortfallsklassificering<br />

Om inga uppgifter erhålls <strong>för</strong> en utvald person sägs objektsbortfall <strong>för</strong>eligga.<br />

Huvudorsakerna till sådant är att personen ej anträffas <strong>för</strong> intervju eller vägrar<br />

medverka i undersökningen. Om en utvald person ger frågesvar som räcker <strong>för</strong> att kunna<br />

klassificera med avseende på arbetskraftsstatus, anknytningsgrad till arbetsmarknaden<br />

samt arbetade timmar, men inte på vissa andra frågor, <strong>för</strong>eligger partiellt bortfall <strong>för</strong><br />

variablerna utan värden, men om svar saknas på nyssnämnda "centrala" frågor klassas<br />

personen som objektsbortfall. Klassningen ifråga spelar roll vid estimationen. Figur 3<br />

visar hur AKU : s bortfallsfrekvenser utvecklats sedan 1987.<br />

AKU gör inga substitutioner <strong>för</strong> ej anträffade eller ej spårade personer. Heller görs inga<br />

imputeringar med anledning av svarsbortfall.<br />

I Avsnitt 2.2.1, estimation beskrivs det <strong>för</strong>farande <strong>för</strong> bortfallsjustering som används.<br />

Den senast genom<strong>för</strong>da studien av bortfallsskevhet gjordes i anslutning till 1993 års<br />

omläggning av estimations<strong>för</strong>farandet. På basis av den studien bedöms att "antal<br />

sysselsatta" <strong>och</strong> "antal arbetslösa" i riket skattas med relativ bortfallsskevhet som är<br />

mindre än 1 % respektive 3 %.<br />

En orsak till felaktig bortfallsklassficering<br />

När man söker efter telefonnummer till utvalda personer är <strong>för</strong>sta instans TeleMedias<br />

telefonnummerregister. Genom detta erhålls telefonnummer till cirka 60 % av de<br />

utvalda. Övriga ombeds per post att sända in ett svarskort med uppgift om<br />

telefonnummer <strong>och</strong> lämplig kontakttidpunkt. I (kontaktvägs)spårningen sker dock<br />

misslyckanden. Om telefonnummer eller annan kontaktväg inte kan fås fram, klassas<br />

personen som bortfall. Detta leder i vissa fall till felaktig klassificering som "bortfall"<br />

istället <strong>för</strong> det korrekta "övertäckning", vilket i sin tur leder till viss skevhet i<br />

skattningarna.<br />

Nyssnämnda fel är särskilt frekvent <strong>för</strong> utomnordiska medborgare som lämnat Sverige<br />

utan att anmäla detta till svensk myndighet (se Avsnitt 2.2.2). Någon djupgående<br />

utredning av felets konsekvenser <strong>för</strong> AKU - statistiken har ännu inte gjorts.<br />

procent<br />

Figur 3. Bortfall 1987-1998<br />

16<br />

14<br />

12<br />

10<br />

8<br />

6<br />

4<br />

2<br />

Totalt<br />

Ej anträffade<br />

Vägrare<br />

0<br />

1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998


2.2.5 Bearbetning<br />

Granskning <strong>och</strong> rättning<br />

Granskning <strong>och</strong> rättning sker i huvudsak vid intervjun eftersom de ut<strong>för</strong>s med datorstöd<br />

med inbyggda logiska kontroller <strong>och</strong> värdekontroller. Vid kodningen (se nedan) finns<br />

inbyggd kontroll i form av värdekontroller.<br />

Dataregistrering <strong>och</strong> kodning<br />

I <strong>och</strong> med att telefonintervjuerna är datorstödda sker huvuddelen av dataregistreringen i<br />

direkt anslutning till uppgiftsinsamlingen. Den enda ytterligare registrering som görs<br />

hänger samman med kodningen av variablerna näringsgren, anställningens art, yrke<br />

samt socioekonomisk grupp (enligt SCB : s SEI - klassificering).<br />

2.2.6 Modellantaganden<br />

AKU : s statistik beror inte av andra modellantaganden än de som används <strong>för</strong> bortfallskompensationen.<br />

De handlar fram<strong>för</strong> allt om att svarsbenägenheter verkligen är<br />

homogena inom använda svarshomogenitetsgrupper. Så bedöms vara fallet.<br />

2.3 Redovisning av osäkerhetsmått<br />

Standardavvikelser <strong>för</strong> de mest efterfrågade månads-, kvartals- <strong>och</strong> årsskattningarna<br />

beräknas <strong>och</strong> publiceras löpande i SM. Därmed har användare den information som<br />

behövs <strong>för</strong> enkel beräkning av konfidensintervall. En gång per år (i januari) utkommer<br />

den särskilda publikationen AKU:Standardavvikelser, med standardavvikelser <strong>för</strong><br />

skattningarna i AKU : Grundtabeller. Beräkningen av standardavvikelserna sker dock i<br />

direkt anslutning till framtagandet av grundtabellerna.<br />

3 STATISTIKENS AKTUALITET<br />

3.1 Undersöknings - <strong>och</strong> publiceringsfrekvenser<br />

AKU genom<strong>för</strong>s månatligen <strong>och</strong> statistik <strong>för</strong> varje månad redovisas såväl i SM som i<br />

AKU : Grundtabeller. Baserat på uppgifterna till månadsundersökningarna framtas också<br />

statistik med kvartal <strong>och</strong> år som referensperiod, vilken redovisas i särskilda<br />

publikationer, SM <strong>och</strong> grundtabeller.<br />

3.2 Framställningstid<br />

Uppgiftsinsamlingen avslutas normalt cirka 10 dagar efter utgången av månadens sista<br />

mätvecka. Ytterligare 1 - 2 dagar därefter publiceras ett Pressmeddelande med<br />

översiktliga resultat. SM <strong>och</strong> AKU : Grundtabeller <strong>för</strong> månaden utkommer cirka 2<br />

veckor efter månadens slut. Motsvarande <strong>för</strong> kvartal är cirka 3 veckor efter kvartalets<br />

slut <strong>och</strong> <strong>för</strong> år cirka 1 månad efter årets slut.<br />

3.3 Punktlighet<br />

Pressmeddelandet <strong>för</strong> AKU januari 2000 publicerades den 14 februari, vilket var<br />

planerad publiceringstidpunkt. SM <strong>för</strong> månaden utkom, i enlighet med publiceringsplanen,<br />

den 21 februari.<br />

4 JÄMFÖRBARHET <strong>och</strong> SAMANVÄNDBARHET<br />

4.1 Jäm<strong>för</strong>barhet över tiden<br />

Under drygt 25 år efter starten 1960 genom<strong>för</strong>des AKU utan egentliga <strong>för</strong>ändringar i<br />

vare sig definitioner eller metod (inklusive intervjublankett). För att undersökningen<br />

bättre skulle spegla <strong>för</strong>hållanden <strong>och</strong> bättre fånga upp <strong>för</strong>ändringar på arbetsmarknaden<br />

gjordes en omfattande revision av innehållet (inklusive definitioner), med<br />

implementering fr.o.m. 1987 års undersökning. Möjligheterna till jäm<strong>för</strong>elser bakåt i<br />

tiden <strong>för</strong>svårades därmed. För att inte <strong>för</strong>lora jäm<strong>för</strong>barhet av AKU - resultat <strong>för</strong>e <strong>och</strong><br />

efter 1987 gjordes datainsamling <strong>och</strong> bearbetning <strong>för</strong> år 1986 med såväl gammalt som<br />

65


66<br />

nytt <strong>för</strong>farande. Härigenom erhölls bl.a. kunskap om metodskillnadernas betydelse <strong>för</strong><br />

resultaten.<br />

Ytterligare <strong>för</strong>ändringar har gjorts sedan 1987. Med börja i 1993 undersökningar<br />

in<strong>för</strong>des dels ett nytt estimations<strong>för</strong>farande med ändrad bortfallskompensation, som<br />

modifierades 1999, dels nytt mätveckossystem. Numera är årets alla veckor mätveckor,<br />

mot tidigare endast två av "månadens" 4 eller 5 veckor.<br />

Fr.o.m 1995 använder AKU, liksom hela SCB, standarden SNI92 <strong>för</strong> näringsgrensindelning,<br />

<strong>och</strong> fr.o.m 1997 den nya standarden SSYK <strong>för</strong> yrkesklassificering.<br />

Liksom vid revisionen 1987 med<strong>för</strong>de <strong>för</strong>ändringarna 1993, 1995 <strong>och</strong> 1997 brott i<br />

tidsserierna. För att kunna jäm<strong>för</strong>a AKU - resultat <strong>för</strong>e 1995 med resultat från senare år<br />

har ett omfattande länkningsarbete ut<strong>för</strong>ts, <strong>och</strong> statistiken <strong>för</strong> 1987 - 1994 har justerats<br />

med hänsyn till <strong>för</strong>ändringarna 1993 <strong>och</strong> 1995. Någon länkning mellan gammal <strong>och</strong> ny<br />

yrkesstandard har dock inte gjorts, <strong>och</strong> kommer heller inte att göras, eftersom de två<br />

standarderna bygger på helt olika klassificeringsprinciper.<br />

Säsongsrensning av tidsserier över arbetslöshet <strong>och</strong> sysselsättning görs, i syfte att öka<br />

möjligheten att bedöma kortsiktiga <strong>för</strong>ändringar.<br />

4.2 Jäm<strong>för</strong>barhet mellan grupper<br />

AKU följer internationella rekommendationer <strong>och</strong> standarder <strong>för</strong> klassificeringar (med<br />

undantag <strong>för</strong> det som nämns under "ej i arbetskraften" i Avsnitt 1.1.2). Samanvändbarheten<br />

med andra länders arbetskraftsundersökningar är där<strong>för</strong> mycket god.<br />

AKU deltar i samarbete, lett av EU:s statistikkontor Eurostat, med syfte att uppnå<br />

ytterligare <strong>för</strong>bättring av jäm<strong>för</strong>barheten mellan EU - ländernas arbetskraftsundersökningar.<br />

4.3 Samanvändbarhet med annan statistik<br />

Förutom i AKU tar SCB fram statistik om sysselsättning i vissa andra undersökningar,<br />

särskilt Registerbaserad arbetsmarknadsstatistik (RAMS) <strong>och</strong> Företagsbaserad<br />

sysselsättningsstatistik samt inom Nationalräkenskaperna (NR). Resultaten från dessa<br />

undersökningar är dock inte helt jäm<strong>för</strong>bara med AKU:s, huvudsakligen beroende på<br />

skillnader i definitioner, undersökningsmetod <strong>och</strong> referenstidpunkt.<br />

Nedanstående diagram belyser definitionsskillnader. Där jäm<strong>för</strong>s statistik över "antal<br />

anställda" från AKU <strong>och</strong> Företagsbaserad sysselsättningsstatistik (i diagrammen refererad<br />

till med KS <strong>och</strong> KSP). AKUkv <strong>och</strong> AKUks står <strong>för</strong> AKU:s "vanliga" respektive<br />

säsongrensade kvartalsstatistik.<br />

Tusentals<br />

3900<br />

3800<br />

3700<br />

3600<br />

3500<br />

3400<br />

3300<br />

Totalt antal anställda<br />

KS<br />

AKUkv<br />

AKUks<br />

3200<br />

971 972 973 974 981 982 983 984 991 992 993 994 År/kv


Tusental<br />

Tusentals<br />

1420<br />

1400<br />

1380<br />

1360<br />

1340<br />

1320<br />

1300<br />

1280<br />

1260<br />

1240<br />

1220<br />

Antal anställda i offentlig sektor<br />

1200<br />

971 972 973 974 981 982 983 984 991 992 993 994<br />

2600<br />

2400<br />

2200<br />

2000<br />

971<br />

972<br />

973<br />

974<br />

Antal anställda privat sektor<br />

981<br />

982<br />

LFS<br />

983<br />

Nästa diagram visar utvecklingar av "antal sysselsatta" enligt AKU, angiven med<br />

engelsk akronym LFS (<strong>för</strong> Labour Force Survey), respektive Nationalräkenskaperna<br />

med nya "EU - mallen" ESA. Också det belyser definitionsskillnader, vilka här.<br />

Fram<strong>för</strong> allt beror på följande <strong>för</strong>hållanden. (i) NR klassificerar värnpliktiga som<br />

sysselsatta, medan de enligt AKU inte ingår i arbetskraften. (ii) AKU mäter antal<br />

sysselsatta <strong>för</strong> åldrarna 16 - 64 år, medan NR mäter "oavsett ålder".<br />

4 250<br />

4 200<br />

4 150<br />

4 100<br />

4 050<br />

4 000<br />

3 950<br />

3 900<br />

3 850<br />

3 800<br />

3 750<br />

Sysselsatta (i 1000-tal)<br />

1993 1994 1995 1996 1997 1998 1999<br />

Dessutom publicerar Arbetsmarknadsstyrelsen (AMS) varje månad statistik om "antal<br />

arbetssökande" ( = personer registrerade som arbetssökande vid arbets<strong>för</strong>medlingarna,<br />

<strong>och</strong> som kan ta arbete direkt). AMS : s månadsstatistik är ett bra komplement till AKU,<br />

984<br />

991<br />

992<br />

KS<br />

AKUkv<br />

AKUks<br />

993<br />

AKU<br />

KSP<br />

ESA<br />

LFS<br />

67<br />

994<br />

År/kv<br />

År/kv


68<br />

särskilt genom att den är totalräknad <strong>och</strong> kan brytas ned längre regionalt än AKU:s<br />

urvalbaserade statistik.<br />

Trots de skillnader som <strong>för</strong>eligger mellan statistikkällorna ger de sammantaget en god<br />

bild över sysselsättningen <strong>och</strong> arbetslösheten i landet<br />

5 TILLGÄNGLIGHET <strong>och</strong> FÖRSTÅELIGHET<br />

5.1 Spridningsformer<br />

En <strong>för</strong>sta presentation av de viktigaste månadsresultaten görs i ett pressmeddelande.<br />

Resultat från AKU avseende månad, kvartal <strong>och</strong> år presenteras regelbundet i serien<br />

<strong>Statistiska</strong> meddelanden (SM), undergrupp AM. Med samma periodicitet som SM<br />

publiceras mer detaljerad redovisning i AKU : Grundtabeller, vilka framtas i såväl tryckt<br />

form som på diskett. De kompletteras av de särskilda publikationerna AKU :<br />

Standardavvikelser.<br />

Förutom i tryck finns delar av AKU - statistiken också i SCB : s statistiska databaser<br />

(Tidsseriedatabasen samt Ekonomisk snabbstatistik) samt i Sveriges statistiska<br />

databaser, som (utan kostnad) är åtkomliga via SCB : s hemsida på Internet.<br />

Dessutom framställs på uppdrag s.k. tilläggstabeller, vilka täcker olika användares<br />

speciella behov. Vidare sker redovisning av vissa AKU - resultat SCB - publikationerna<br />

Allmän månadsstatistik, Statistisk årsbok <strong>och</strong> SCB Indikatorer.<br />

<strong>Statistiska</strong> meddelanden (SM) med månadsstatistik utkommer månatligen. Sammanfattande<br />

redovisningar av tidigare års AKU - statistik, med tidsserier <strong>och</strong> redogörelser<br />

<strong>för</strong> definitioner <strong>och</strong> undersökningsmetoder, finns publicerade i SM enligt<br />

följande : För 1961 - 1969 i AM 1969 : 57, <strong>för</strong> 1963 - 1975 i AM 1978 : 32, <strong>för</strong> 1970 - 1980<br />

i AM 1981 : 33, <strong>för</strong> 1976 - 1985 i AM 12 SM 8602, <strong>för</strong> 1980 - 1990 i AM 65 SM 9101,<br />

<strong>för</strong> 1985 - 1994 i AM 65 SM 9501. SM kan beställas från SCB, Publikationstjänsten, 701<br />

89 Örebro, tel : 019 - 176 800, fax: 019 - 176 932. Grundtabeller inkl. standardavvikelser<br />

omfattar cirka 3 000 sidor under ett år. Dessa kan beställas från SCB,<br />

Arbetskraftsundersökningarna (AKU), Box 24 300, 104 51 Stockholm, tel : 08 - 5069<br />

4000, fax : 08 - 5069 4812.<br />

5.2 Presentation<br />

Framgår av detta SM.<br />

5.3 Dokumentation<br />

Nedan anges skrifter, som ger <strong>för</strong>djupad information om AKU. Rapporterna kan erhållas<br />

från SCB, Avdelningen <strong>för</strong> arbetsmarknads- <strong>och</strong> utbildningsstatistik, tel: 08/5069 4000,<br />

fax: 08/5069 4812<br />

Kristiansson K-E (1988): Industrisysselsättningens utveckling. En utredning av skillnaden<br />

mellan AKU <strong>och</strong> NR. Bakgrundsfakta till arbetsmarknadsstatistiken 1988:1.<br />

Wessberg O (1988): Revision av innehåll <strong>och</strong> definitioner i arbetskraftsundersökningarna<br />

(RIDA). Bakgrundsfakta till arbetsmarknadsstatistiken 1988:5.(Finns i engelsk översättning i<br />

Bakgrundsfakta till arbetsmarknadsstatistiken 1989:3.)<br />

Japec L (1992): Förändringar i arbetskraftsundersökningarna. Bakgrundsfakta till arbetsmarknadsstatistiken<br />

1992:1.<br />

Hörngren J (1992): Nytt mätveckssystem i AKU fr o m 1993. PM 1992-04-18.<br />

Hörngren J <strong>och</strong> Larsson M (1992): Bortfallsstudier i AKU. Bakgrundsfakta till arbetsmarknadsstatistiken<br />

1992:7.<br />

Hörngren J (1992): Användning av register som hjälpinformation i arbetskraftsundersökningarna.<br />

PM 1992-10-10. (Finns i engelsk översättning i SCB R&D Report 1992:13).<br />

Larsson M (1994): Studie av centrala intervjuer <strong>och</strong> fältintervjuer i AKU. En jäm<strong>för</strong>else av<br />

bortfall <strong>och</strong> bruttofel. Bakgrundsfakta till arbetsmarknads-<strong>och</strong> utbildningsstatistiken 1994:6.


Henkel M (1994):. Dokument<strong>för</strong>teckning med kommentarer avseende <strong>kvalitets</strong>-<strong>och</strong> utvecklingsarbete<br />

AKU 1970-1992. PM 1994-05-31.<br />

Mirza H (1995): Kvartals-<strong>och</strong> årsskattningar, AKU. PM 1995-10-10.<br />

Mirza H (1995): Volym faktiskt arbetade timmar i AKU. PM 1995-12-08.<br />

Olofsson A. (1996): De svenska arbetskraftsundersökningarna (AKU). Bakgrundsfakta till<br />

arbetsmarknadsstatistiken 1996:2.<br />

Mirza H (1996): En enda uppräkningsvikt i ordinarie AKU. PM 1996-10-07.<br />

Zetterberg J (1997): Flödesstatistik i arbetsmarknadsforskningen. Bakgrundsfakta till<br />

arbetsmarknads- <strong>och</strong> utbildningsstatistiken 1997:2.<br />

Farm A (1997): Arbetslöshet, nyanställningar <strong>och</strong> vakanser i flödesstatistik. Bakgrundsfakta till<br />

arbetsmarknads- <strong>och</strong> utbildningsstatistiken 1997:3. (Finns i engelsk översättning i Bakgrundsfakta<br />

till arbetsmarknads- <strong>och</strong> utbildningsstatistiken 1999:2)<br />

Kristiansson K-E ( 1997): Skattning av brutto<strong>för</strong>ändringar i AKU. PM 1997-04-28 (Finns i engelsk<br />

översättning)<br />

Mirza H <strong>och</strong> Olofsson A: Studie av frågeordningen avseende arbetstider. PM 1997-12-30.<br />

Mirza H, Kristiansson K-E (1999): Skattning av brutto<strong>för</strong>ändringar i AKU. PM 1999-04-27<br />

Andersson C et al: Individ- <strong>och</strong> <strong>för</strong>etagsbaserad sysselsättningsstatistik – en jäm<strong>för</strong>else mellan<br />

AKU <strong>och</strong> KS. PM 2000-10-05.<br />

Mirza H. & Hörngren J. (2001): Urvals- <strong>och</strong> estimations<strong>för</strong>farandet i arbetskraftsundersökningarna<br />

(AKU).<br />

5.4 Tillgång till primärmaterial<br />

Grunduppgifter från AKU lagras i SCB : s gemensamma mikrodatabas, <strong>och</strong> AKU - data<br />

fr.o.m. 1993 finns där. Inläggning av mikrodata sker varje månad, dokumenterade enligt<br />

SCB : s dokumentationssystem SCBDOK.<br />

SCB ut<strong>för</strong> på beställning specialbearbetningar av primärmaterial. Forskare m.fl. kan<br />

efter prövning få tillgång till avidentifierat material <strong>för</strong> egen bearbetning.<br />

5.5 Upplysningstjänster<br />

För ytterligare upplysningar kontakta SCB 08 - 50694000 vx <strong>och</strong> begär AKU eller via e -<br />

post aku@scb.se.<br />

69


Kvalitetsdeklaration av<br />

Prisindex i producent- <strong>och</strong> importled (PPI) år 2000<br />

0 INLEDNING<br />

Prisindex i producent- <strong>och</strong> importled (PPI) mäter <strong>och</strong> redovisar månadsvis den genomsnittliga<br />

prisutvecklingen <strong>för</strong> olika branscher inom jord- <strong>och</strong> skogsbruk, mineralutvinning,<br />

tillverkningsindustrin <strong>och</strong> energiområdet. Priserna avser under månaden genomsnittligt<br />

fakturerade priser på specificerade utvalda varor med konstant kvalitet. Ett urval<br />

om drygt 1 200 <strong>för</strong>etag lämnar uppgifter, som avser det <strong>för</strong>sta distributionsledet, då<br />

varorna levereras från svenska producenter eller kommer in i Sverige. Statistiken<br />

används <strong>för</strong> ekonomisk analys, prisomräkning (deflatering) <strong>och</strong> prisreglering (t.ex.<br />

prisjusteringsklausuler i avtal). – Det finns även årsindextal.<br />

1 STATISTIKENS INNEHÅLL<br />

1.1 <strong>Statistiska</strong> målstorheter<br />

PPI redovisar i indexform prisutveckling i producent- <strong>och</strong> importled med uppdelning på<br />

fem huvudserier.<br />

Varor indelas i tre slag, nämligen<br />

a. inhemskt <strong>för</strong>brukade svensktillverkade varor<br />

b. exporterade varor<br />

c. importerade varor<br />

De fem serierna är<br />

– hemmamarknadsprisindex, som avser a<br />

– exportprisindex, som avser b<br />

– importprisindex, som avser c<br />

– inhemsk produktion, som erhålls genom att sammanväga a <strong>och</strong> b<br />

– prisindex <strong>för</strong> inhemsk tillgång, som erhålls genom att sammanväga a <strong>och</strong> c<br />

(korrigerad med tull- <strong>och</strong> in<strong>för</strong>selavgifter)<br />

Därutöver finns en speciell indexserie <strong>för</strong> petroleumprodukter.<br />

Två klassificeringssystem används. Det ena är en varunomenklatur, benämnd Kombinerad<br />

Nomenklatur (KN), som består av c:a 10 000 varugrupper <strong>och</strong> som är baserad på<br />

en internationell varunomenklatur (Combined Nomenclature, CN). Varje sådan varugrupp<br />

identifieras med ett åttasiffrigt statistiskt nummer (statnr). KN används primärt <strong>för</strong><br />

tulländamål.<br />

Det andra klassificeringssystemet är en näringsgrensindelning <strong>för</strong> klassificering av produktionsenheter,<br />

nämligen 1992 års standard <strong>för</strong> svensk näringsgrensindelning (SNI 92).<br />

Denna svenska indelning har som bas EUs näringsgrensstandard i dess reviderade<br />

version NACE Rev.1, vilken i sin tur är samordnad med FNs näringsgrensstandard ISIC<br />

Rev.3. Indelningen <strong>för</strong> produktionsenheter kan uttryckas i termer av de produkter som<br />

aktivitetsarterna resulterar i, <strong>och</strong> denna produktindelning benämns Prod-SNI. Nedan<br />

används termen bransch, <strong>och</strong> delvis även SNI, rätt fritt, t.ex. utan att strikt skilja på de<br />

båda bemärkelserna (enheter <strong>och</strong> produkter). SNI 92 har fem nivåer som anges med en<br />

sifferkod med en siffra per nivå. I PPI-systemet används en finare indelning med<br />

ytterligare en nivå. Det finns även bokstavskoder <strong>för</strong> högre nivåer. Den översta nivån<br />

kallas avdelning.<br />

Klassificeringssystemen hör ihop genom att varje statnr tillhör en viss bransch. Det finns<br />

dock några kombinationer av KN <strong>och</strong> SNI där denna koppling inte är uppenbar.<br />

71


72<br />

1.1.1 Objekt <strong>och</strong> population<br />

Objekten i PPI är varugrupper. Populationen utgörs av alla varugrupper (statnr) som hör<br />

till följande branscher, uttryckta i produkttermer.<br />

SNI-avdelning Benämning<br />

A produkter från jord- <strong>och</strong> skogsbruk<br />

B fisk<br />

C produkter från utvinning av mineral<br />

D industriprodukter<br />

E el, gas, värme <strong>och</strong> vatten<br />

En varugrupp (ett statnr) kan innehålla många varor. Det är varor som prismäts. Dessa<br />

varor identifieras genom verbala beskrivningar <strong>och</strong> ofta artikelnummer. Se vidare p.<br />

2.2.3.<br />

Ytterligare ett objekt i PPI, vilket används <strong>för</strong> urval <strong>och</strong> insamling av uppgifter, är <strong>för</strong>etag,<br />

se vidare p. 2.2.1.<br />

1.1.2 Variabler<br />

PPI:s huvudvariabel är producentpris (vid import importpris), som är det pris som<br />

producenten erhåller <strong>för</strong> en vara vid <strong>för</strong>säljning i <strong>för</strong>sta ledet. Priset ska avse fritt fabrik<br />

<strong>för</strong> svensk marknad <strong>och</strong> fob (free on board) <strong>för</strong> export. Vid import är priset cif (cost,<br />

insurance, freight). Priset ska vara genomsnittligt fakturerat pris per enhet under<br />

månaden. Mervärdesskatt <strong>och</strong> andra varuskatter ingår ej, dock gäller <strong>för</strong> indexserien <strong>för</strong><br />

petroleumprodukter att miljö- <strong>och</strong> energiskatter adderas till priset.<br />

Utöver det genomsnittliga priset, undersökningens huvudvariabel, ska uppgifter som<br />

gäller export <strong>och</strong> import lämnas om faktureringsvaluta <strong>och</strong> rapporteringsvaluta (priset<br />

kan lämnas i svenska kronor eller utländsk valuta) <strong>och</strong> om importland.<br />

1.1.3 <strong>Statistiska</strong> mått<br />

PPI kan grovt beskrivas som ett kedjat prisindex av typen Laspeyres. Ett okedjat<br />

prisindex av typen Laspeyres kan schematiskt skrivas på nedanstående sätt, där P betecknar<br />

enhetspris, Q betecknar kvantitet <strong>och</strong> summeringen görs över varugrupper (indiceras<br />

med k). Det är en jäm<strong>för</strong>else mellan priser vid tidpunkten t <strong>och</strong> bastidpunkten 0.<br />

Kvantiteterna Q betraktas som kända, medan priserna P mäts.<br />

I<br />

0t<br />

∑ P Q<br />

k =<br />

∑ P Q<br />

k<br />

tk 0k<br />

0k 0k<br />

Dessutom ingår en faktor 100, så att indexvärdet vid bastidpunkten är 100. Ett prisindex<br />

av denna typ kan skrivas som ett vägt medelvärde av prisutvecklingar enligt nedan, där<br />

V är produkten av enhetspris <strong>och</strong> kvantitet; V = P Q, så V är värdet. Vikten W 0k <strong>för</strong> den<br />

k:te varugruppen är dess relativa värde vid bastidpunkten.<br />

tk<br />

I0t W0k k 0k<br />

P<br />

V<br />

= ∑ med W0k<br />

=<br />

P<br />

∑ V<br />

Ovanstående index har en fast bas. Ett kedjeindex med länkning vid tidpunkterna<br />

1, 2, ... , (t-1) kan i sin enklaste form skrivas schematiskt på nedanstående sätt.<br />

t<br />

'<br />

I0t =∏I(s-1)s<br />

s=1<br />

Vikterna ändras successivt, <strong>och</strong> vid tidpunkten s avser de den närmast <strong>för</strong>egående tidpunkten<br />

(s-1). PPI är ett kedjeindex med årslänkar. Vikterna avser år, <strong>och</strong> priser mäts<br />

per månad. I den sista länken i månads-PPI jäm<strong>för</strong>s månaden i fråga med <strong>för</strong>egående<br />

december. Årsindex bildas genom att ta årsmedelvärdet.<br />

k<br />

0k<br />

0k


1.1.4 Redovisningsgrupper<br />

Indexvärden redovisas <strong>för</strong> var <strong>och</strong> en av de fem huvudserierna med <strong>för</strong>delning på<br />

branscher. Detaljeringsgraden i redovisningen i <strong>Statistiska</strong> meddelanden är minst 2siffer-bransch;<br />

flera branscher redovisas dock med finare indelning. I Sveriges<br />

<strong>Statistiska</strong> Databaser redovisas indexserierna t.o.m. nivån 4-siffer-bransch.<br />

De fem huvudserierna redovisas också med uppdelning på konsumtions-, insats-,<br />

investerings- samt energirelaterade varor. Indexserien <strong>för</strong> petroleumprodukter redovisas<br />

med uppdelning på fyra bränsleslag.<br />

1.1.5 Referenstider<br />

Indextalen avser en månad samt år <strong>för</strong> det beräknade årsmedelvärdet, årsindex. Basåret<br />

är 1990 (årsmedelvärdet).<br />

1.2 Fullständighet<br />

Prisindexar <strong>för</strong> ytterligare näringsgrenar (tjänstebranscher) är under uppbyggnad, även<br />

där avseende producentledet.<br />

2 STATISTIKENS TILLFÖRLITLIGHET<br />

2.1 Till<strong>för</strong>litlighet totalt<br />

Det är inte möjligt att ange osäkerhetsmarginaler <strong>för</strong> de beräknade indexvärdena främst<br />

<strong>för</strong> att PPI:s urval är subjektivt <strong>och</strong> inte slumpmässigt.<br />

2.2 Osäkerhetskällor<br />

Bland osäkerhetskällorna som beskrivs nedan torde mätfel <strong>och</strong> urval ge de största bidragen<br />

till osäkerheten.<br />

2.2.1 Urval<br />

Statistiken baseras på ett urval av varugrupper. Urvalet görs i tre steg.<br />

I <strong>för</strong>sta steget väljs de varugrupper (statnr) som ska ingå i undersökningen. Den årliga<br />

statistiken <strong>för</strong> industrins varuproduktion (IVP) <strong>och</strong> utrikeshandelsstatistiken (UHS) ger<br />

tillsammans varuproduktions-, export- <strong>och</strong> importvärden per statnr <strong>och</strong> därmed SNI.<br />

Härur beräknas värden <strong>för</strong> hemmamarknaden, se vidare p. 2.2.2. Alla SNI-grupper på<br />

femsiffernivå som har ett årsvärde på mer än 250 miljoner kronor (mkr) i löpande priser<br />

ingår i princip. På denna SNI-nivå väljs ett antal statnr subjektivt med målsättningen att<br />

de ska ha ett stort värde <strong>och</strong> vara representativa vad gäller prisutveckling <strong>för</strong> den SNIgrupp<br />

de tillhör. Ett statnr med ett årsvärde på mer än 350 mkr ingår i princip alltid i<br />

urvalet. Vid kontakter med <strong>för</strong>etag som säljer skräddarsydda varor kan det dock visa sig<br />

omöjligt att få priser <strong>för</strong> jäm<strong>för</strong>bara produkter. Flera statnr kan <strong>för</strong>as samman till en<br />

grupp.<br />

I andra steget används register från IVP <strong>och</strong> UHS med <strong>för</strong>etag (tillverkare <strong>och</strong><br />

importörer) <strong>för</strong> de i <strong>för</strong>sta steget utvalda varugrupperna. Målsättningen här är att välja<br />

<strong>för</strong>etag med stora värden.<br />

I tredje steget väljs representantvaror, som är väl specificerade varor inom varugrupp.<br />

Det görs efter samråd med uppgiftslämnaren på <strong>för</strong>etaget. Strävan är att varan ska ha en<br />

prisutveckling som är ett genomsnitt <strong>för</strong> varugruppen, ha ett stort värde <strong>och</strong> helst<br />

<strong>för</strong>säljning varje månad. I synnerhet det <strong>för</strong>sta kravet är svårt att bedöma i <strong>för</strong>väg.<br />

In<strong>för</strong> varje kalenderår gås urvalet igenom med bl.a. en översyn av varugrupper där stora<br />

<strong>för</strong>ändringar framkommit. Urvalet modifieras dessutom fortlöpande, främst beroende på<br />

att varor utgår, <strong>och</strong> det kompletteras årligen i synnerhet <strong>för</strong> snabbt expanderande<br />

branscher.<br />

73


74<br />

Antalet insamlade prisuppgifter varje månad är c:a 1 800 <strong>för</strong> svenska marknaden, c:a<br />

1 000 <strong>för</strong> exportmarknaden <strong>och</strong> c:a 1 400 <strong>för</strong> importmarknaden. Drygt 1 200 <strong>för</strong>etag<br />

lämnar uppgifter. För många redovisningsgrupper är antalet prisuppgifter litet <strong>och</strong><br />

publiceras inte på grund av gällande sekretessregler.<br />

Det kan finnas flera prisuppgifter <strong>för</strong> ett statnr genom att flera <strong>för</strong>etag lämnar uppgift<br />

<strong>och</strong>/eller genom att varugruppen representeras av flera varor. Prisutvecklingen <strong>för</strong> en<br />

sådan varugrupp beräknas som ett vägt medelvärde av de enskilda uppgifterna.<br />

Årsvärden <strong>för</strong> valda <strong>för</strong>etag används normalt <strong>för</strong> att bilda vikter (se även p. 2.2.2). Om<br />

ett <strong>för</strong>etag lämnar flera uppgifter, så delas <strong>för</strong>etagets vikt oftast i lika delar.<br />

2.2.2 Ramtäckning<br />

In<strong>för</strong> kalenderårsskifte görs en sambearbetning av flera underlag <strong>för</strong> att få fram såväl en<br />

ram <strong>för</strong> urval som vikter till index. Underlag fås från UHS, från IVP avseende SNIavdelningarna<br />

C <strong>och</strong> D, från den årliga energistatistiken avseende avdelning E samt från<br />

Statens Jordbruksverk avseende avdelningarna A <strong>och</strong> B. Uppgifterna avser året <strong>för</strong>e det<br />

enligt indexkonstruktionen önskvärda året. UHS ger uppgifter om export <strong>och</strong> import,<br />

medan övriga underlag avser produktion, <strong>för</strong>säljning eller liknande. Värden <strong>för</strong><br />

hemmamarknaden måste härledas.<br />

IVP samlar in uppgifter om <strong>för</strong>säljning av egentillverkade varor vid arbetsställen inom<br />

industri<strong>för</strong>etag med minst tjugo anställda <strong>och</strong> industriarbetsställen med minst tjugo<br />

anställda inom andra <strong>för</strong>etag; <strong>för</strong> några enstaka branscher gäller minst tio anställda.<br />

Modellskattningar görs <strong>för</strong> gruppen 10-19 anställda därutöver, likaså <strong>för</strong> svarsbortfall<br />

(men ej mindre <strong>för</strong>etag). Det sker med hjälp av ett administrativt material (standardiserade<br />

räkenskapsutdrag) från Riksskatteverket (RSV). Detta material ger en total <strong>för</strong>säljning<br />

per <strong>för</strong>etag, vilken sedan inom IVP <strong>för</strong>delas till statnr-nivån. – Värdena i IVP ska<br />

avse kalenderår, men räkenskapsår <strong>för</strong>ekommer.<br />

Beträffande UHS täcks all export <strong>och</strong> import med länder utan<strong>för</strong> EU via tulluppgifter.<br />

För handel med länder inom EU insamlas uppgifter blankettvägen från <strong>för</strong>etag med<br />

ut<strong>för</strong>sel- respektive in<strong>för</strong>selvärden om minst 1.5 mkr på tolv månader. Från <strong>för</strong>etag med<br />

värden under 1.5 mkr <strong>och</strong> <strong>för</strong>etag med bortfall skattas uppgifter via RSVs momsregister<br />

<strong>och</strong> modeller <strong>för</strong> varu<strong>för</strong>delning.<br />

En del skillnader i definitioner <strong>och</strong> täckning mellan underlagen framgår av de korta<br />

beskrivningarna ovan. Även om IVP i sig har med t.ex. reparationer <strong>och</strong> installationer,<br />

så har PPI av tradition exkluderat dessa delar utom <strong>för</strong> SNI 22, <strong>för</strong>lagsverksamhet. Om<br />

varuklassificeringen i något underlag är felaktig, så blir det en fortplantning av fel till<br />

PPI. Både vikter <strong>och</strong> urval påverkas. Särskilt differenserna mellan värden i IVP <strong>och</strong><br />

UHS <strong>för</strong> hemmamarknaden är känsliga. Det <strong>för</strong>ekommer att negativa differenser mellan<br />

värden i IVP <strong>och</strong> UHS sätts till noll <strong>och</strong> att klassificeringar korrigeras. Exporterade<br />

varor behöver dock inte vara producerade i landet utan kan vara s.k. reexport. Viss<br />

justering görs <strong>för</strong> detta.<br />

Ytterligare en täckningsbrist i PPI, vilken delvis beror på underlagen, uppkommer<br />

genom eftersläpning i tid i in<strong>för</strong>ande av nya varor <strong>och</strong> borttagande av <strong>för</strong>åldrade.<br />

Kontakter med valda <strong>för</strong>etag kan dock ge uppgifter även om nya varor.<br />

Felkällan ramtäckning torde som helhet ge ett relativt måttligt bidrag till osäkerheten.<br />

2.2.3 Mätning<br />

Det finns flera mätsvårigheter. En sådan gäller att priset i princip ska avse samma vara<br />

över tiden <strong>och</strong> inte inkludera <strong>kvalitets</strong><strong>för</strong>ändringar. Om kvaliteten ändras går det<br />

vanligen inte att få reda på hur priset påverkas <strong>och</strong> på så sätt beräkna prisändringen vid<br />

o<strong>för</strong>ändrad produktionsmetod. I stället används som regel några olika metoder, beroende<br />

på information, <strong>för</strong> att rensa bort effekten på priset. Om det inte är möjligt att få<br />

prisuppgift på både den gamla <strong>och</strong> nya varan under samma period, betraktas varorna<br />

som två olika varor <strong>och</strong> pris<strong>för</strong>ändringen <strong>för</strong> skiftet sätts därmed till noll. I de fall båda


varuvarianterna säljs under samma tid, kan priser <strong>och</strong> prisutveckling länkas samman. –<br />

För persondatorer används <strong>för</strong> <strong>kvalitets</strong>värdering en metod kallad hedonisk regression.<br />

En andra mätsvårighet ligger i att priser ska vara fakturerade priser. I vissa branscher ger<br />

många uppgiftslämnare listpriser. Vidare ska rabatter vara fråndragna men är det inte<br />

alltid. Vid analys av prisutveckling under begränsad tid, 1-3 år, är detta ett problem,<br />

särskilt inom livsmedelsbranschen, där listpriser är vanligt <strong>för</strong>ekommande. I en situation<br />

då t.ex. minskad efterfrågan eller ökad konkurrens leder till ökade inslag av rabatter, så<br />

överskattar ett index baserat på listpriser den verkliga prisutvecklingen.<br />

En tredje mätsvårighet gäller rapportering i utländska valutor. Det ideala vore att räkna<br />

om export- <strong>och</strong> importpriser enligt de kurser som faktiskt tillämpats mellan köpare <strong>och</strong><br />

säljare under mätmånaden. I de fall priser rapporteras i utländsk valuta används<br />

Tullverkets växelkurser <strong>för</strong> valutaomräkningen. Dessa kurser baseras på dagskursen<br />

tredje onsdagen månaden <strong>för</strong>e PPIs mätmånad, med viss korrigering <strong>för</strong> kurser som<br />

avvikit med mer än 5 % under mätmånaden. Anledningen till att denna metod används i<br />

stället <strong>för</strong> t.ex. Riksbankens genomsnittskurser under månaden, är i <strong>för</strong>sta hand att<br />

nationalräkenskaperna (NR) kräver samma omräkningsmetod <strong>för</strong> PPI som utrikeshandelsstatistiken<br />

använder. Totalt lämnas c:a 15 % av samtliga exportuppgifter <strong>och</strong> c:a<br />

25 % av samtliga importuppgifter i utländsk valuta, medan övriga priser är i svenska<br />

kronor. Vidare <strong>för</strong>ekommer i de fall uppgiftslämnaren själv gör valutaomräkningen ofta<br />

att valutasäkringar eller <strong>för</strong>utbestämda kurser o.dyl. används, vilket ej blir korrekt.<br />

Felkällan mätning torde tillsammans med urval ge det största bidraget till osäkerheten.<br />

2.2.4 Svarsbortfall<br />

Det <strong>för</strong>eligger skyldighet enligt lag <strong>för</strong> <strong>för</strong>etagen att lämna prisuppgifter. Svarsbortfallet<br />

<strong>för</strong> en normal månad brukar vara 1-2 % av prisuppgifterna. Bortfallet beror i regel inte<br />

på vägran, utan på att kontaktpersonen inte är anträffbar. Detta gör att bortfallet är större<br />

<strong>för</strong> mätmånaderna juni <strong>och</strong> juli än <strong>för</strong> andra månader. Den låga bortfallsandelen beror<br />

delvis på att i urvals<strong>för</strong>farandet ingår en telefonkontakt <strong>för</strong> att precisera vara;<br />

uppgiftslämnandet motiveras.<br />

Vid bortfall används (imputeras) <strong>för</strong>egående månads prisuppgift. Detta gäller även i de<br />

fall ingen <strong>för</strong>säljning eller import <strong>för</strong>ekommit under månaden. Detta kan med<strong>för</strong>a en<br />

olycklig eftersläpning, <strong>och</strong> det finns planer på att ändra <strong>för</strong>farandet till att använda<br />

”besläktade” inkomna uppgifter om prisuveckling <strong>för</strong> samma månad.<br />

Denna felkälla torde ge ett relativt måttligt bidrag till osäkerheten.<br />

2.2.5 Bearbetning<br />

De insamlade prisuppgifterna granskas dels enskilt, dels på aggregerad nivå. Vid<br />

insamling via TDE (touchtone data entry; knapptelefon) finns också en speciell kontroll<br />

inbyggd i dialogen. Denna gör uppgiftslämnaren medveten om när priserna <strong>för</strong>ändrats<br />

mer än 5 % från <strong>för</strong>ra månaden, <strong>och</strong> då ges möjlighet att korrigera priset eller tala in<br />

anledningen till pris<strong>för</strong>ändringen. Vid oklarheter tas kontakt med uppgiftslämnaren.<br />

Denna felkälla torde ge ett relativt litet bidrag till osäkerheten.<br />

2.2.6 Modellantaganden<br />

De vikter som används i indexberäkningen ska idealt vara relativa värden <strong>för</strong>egående år.<br />

Det finns ej så aktuella värden i IVP <strong>och</strong> UHS, utan endast årsvärden avseende året<br />

dess<strong>för</strong>innan. Dessa värden skrivs fram med prisutvecklingen enligt PPI inom<br />

varugruppen det senaste året. I detta <strong>för</strong>farande ligger ett modellantagande om att<br />

kvantiteterna har <strong>för</strong>ändrats med samma faktor <strong>för</strong> alla varor. Den beräknade<br />

prisutvecklingen beaktar ej säsongvariationer i kvantiteter.<br />

Om det saknas representantvaror <strong>för</strong> en bransch med årsvärdet över 250 mkr eller en<br />

varugrupp (statnr) med årsvärdet över 350 mkr, så läggs i allmänhet en ”vara” in i<br />

observationsregistret med tillhörande vikt. En form av modellberoende skattning görs<br />

75


76<br />

<strong>för</strong> denna ”vara” genom att priserna får följa en annan utvald prisutveckling. Därvid<br />

väljs en annan bransch (eller samma bransch på en annan marknad), den bransch som<br />

<strong>för</strong>väntas ha den mest likartade prisutvecklingen som den saknade branschens eller<br />

varugruppens.<br />

Denna felkälla torde ge ett visst bidrag till osäkerheten.<br />

2.3 Redovisning av osäkerhetsmått<br />

Ingen redovisning.<br />

3 STATISTIKENS AKTUALITET<br />

3.1 Frekvens<br />

Både undersökning <strong>och</strong> publicering är månatliga. Dessutom publiceras årligen<br />

indextal avseende kalenderår.<br />

3.2 Framställningstid<br />

Statistiken publiceras kl. 10.00 c:a 25 dagar efter månadens slut, dock något senare <strong>för</strong><br />

januari på grund av urvalsbyte. Årsindex publiceras efter ungefär 1½ månad.<br />

3.3 Punktlighet<br />

Publiceringen följer publiceringsplanen; bara något mycket enstaka undantag har<br />

funnits.<br />

4 JÄMFÖRBARHET <strong>och</strong> SAMANVÄNDBARHET<br />

4.1 Jäm<strong>för</strong>barhet över tiden<br />

En väsentlig definitions<strong>för</strong>ändring har gjorts genom att index ändrats från fastbasindex,<br />

som användes under perioden 1968-1979, till kedjeindex fr.o.m. 1980.<br />

Den tidigare branschindelningen SNI 69 användes <strong>för</strong> PPI t.o.m. 1994. Index med<br />

branschindelning enligt SNI 92 finns fr.o.m. 1990. I denna serie har index <strong>för</strong> perioden<br />

1990-1994 åstadkommits med tillbakaräkning. Den som vill ha en sammanhängande indexserie<br />

gör <strong>för</strong> månadsindex lämpligast länkningen vid december 1994 <strong>och</strong> <strong>för</strong> årsmedelvärdena<br />

vid året 1994.<br />

Byte av varunomenklatur har gjorts dels <strong>för</strong> mätåret 1988, från CCCN- till HS-nomenklaturen,<br />

dels <strong>för</strong> mätåret 1998 från HS- till KN-nomenklaturen. Dessa <strong>för</strong>ändringar<br />

påverkar inte den publicerade indelningen, men de har <strong>för</strong>svårat viktberäkningarna.<br />

4.2 Jäm<strong>för</strong>barhet mellan grupper<br />

Behovet av samordnade definitioner <strong>för</strong> PPI inom medlemsländerna i EU finns fastlagda<br />

i <strong>för</strong>ordning om konjunkturstatistik antagen av EU:s råd (<strong>för</strong>ordning 1164/98, maj<br />

1998). Samordningen behövs bl.a. <strong>för</strong> att på ett jäm<strong>för</strong>ande sätt kunna bedöma <strong>och</strong><br />

redovisa den ekonomiska utvecklingen i länderna.<br />

I utrikeshandelsstatistiken publiceras kvartalsvisa prisindexar <strong>för</strong> export- <strong>och</strong><br />

importvaror, vilka bygger på beräkningar av dels enhetspriser <strong>för</strong> homogena varor ur<br />

UHS, dels uppgifter från PPI-systemet (export- <strong>och</strong> importprisindex) <strong>för</strong> övriga<br />

varuområden. Dessa prisindexar är av typen Paasche (kvantiteterna avser den aktuella<br />

tidpunkten) <strong>och</strong> redovisas med uppdelning enligt varunomenklaturen SITC Rev.3<br />

(Standard International Trade Classification).<br />

4.3 Samanvändbarhet med annan statistik<br />

PPI används <strong>för</strong> deflatering (fastprisberäkning) i NR, UHS <strong>och</strong> i annan kortperiodisk<br />

<strong>och</strong> årlig ekonomisk statistik. Indelningar <strong>och</strong> standarder överensstämmer, med vissa<br />

mindre undantag, av vilka de viktigaste angetts ovan.


PPI – eller snarare gruppen konsumtionsvaror inom serien <strong>för</strong> inhemsk tillgång – tas<br />

ibland som en prognos på prisutvecklingen av konsumentprisindex (KPI). Jäm<strong>för</strong>elser<br />

av PPI <strong>och</strong> KPI är dock vanskliga att göra till följd av skillnaderna dem emellan. Det<br />

<strong>för</strong>eligger en tids<strong>för</strong>dröjning från produktion till <strong>för</strong>säljning i detaljhandel, <strong>och</strong> den kan<br />

variera mellan varugrupper. De konsumtionsvaror som prismäts i PPI går inte enbart till<br />

detaljhandeln, som mäts av KPI, utan även till exempelvis storhushåll. Dessutom<br />

används olika modeller i beräkningarna. Detta ger en systematisk skillnad: indextalet<br />

enligt KPI blir lägre.<br />

5 TILLGÄNGLIGHET <strong>och</strong> FÖRSTÅELIGHET<br />

5.1 Spridningsformer<br />

Statistiken görs tillgänglig via pressmeddelande, Statistiskt meddelande (månad <strong>och</strong> år)<br />

med beteckningen P 10 SM, Allmän månadsstatistik, SCB-Indikatorer, tidningen<br />

Byggindex, SCB:s webbsida <strong>och</strong> Sveriges <strong>Statistiska</strong> Databaser (SSD). Vissa <strong>för</strong>ändringstal<br />

(avseende export-, import- <strong>och</strong> producentprisindex) läggs ut elektroniskt i Ekonomisk<br />

snabbstatistik i samband med publiceringen. Den mest ut<strong>för</strong>liga publiceringen<br />

görs i SSD, indexserier på minst nivån 4-siffer-bransch. Ytterligare indexserier, på 5-<br />

<strong>och</strong> 6-siffer-bransch, så långt sekretesskraven tillåter, hålls tillgängliga på datalistor<br />

inom SCB <strong>och</strong> kan erhållas genom kontakt med programmet Priser.<br />

5.2 Presentation<br />

Framgår av publiceringen.<br />

5.3 Dokumentation<br />

Det finns en speciell, av International Monetary Fund (IMF) standardiserad dokumentation,<br />

över PPI. Den är tillgänglig på IMFs hemsida under adress<br />

http://dsbb.imf.org/country<br />

Prisindex i producent- <strong>och</strong> importled, version 1, januari 1991, SCB. Översiktlig<br />

beskrivning av statistikproduktionen.<br />

Prisindex i producent- <strong>och</strong> importled, innehålls- <strong>och</strong> metodbeskrivning, augusti 1991,<br />

SCB. Beskriver bl.a. indexsystemets uppbyggnad <strong>och</strong> redovisar vägningstal.<br />

Using Hedonic Regression for Computer Equipment in the Producer Price Index, R & D<br />

Report 1989:25, SCB. Beskrivning på engelska av användningen av s.k. hedonisk<br />

regression <strong>för</strong> <strong>kvalitets</strong>värdering av persondatorer.<br />

5.4 Tillgång till primärmaterial<br />

Det finns möjligheter <strong>för</strong> användare att enligt en särskild prislista få specialbearbetningar<br />

gjorda i form av aggregeringar till bransch- <strong>och</strong> varugruppsnivåer.<br />

Primärmaterial hålls tillgängliga <strong>för</strong> forskare efter särskilt tillstånd.<br />

5.5 Upplysningstjänster<br />

Upplysningar om <strong>och</strong> frågor rörande PPI kan fås genom att ta kontakt med prisprogrammets<br />

jourtelefon 08-506 944 68 eller via e-mail med adress priser@scb.se. Även<br />

den centrala informationsservicen vid SCB kan kontaktas.<br />

77


78<br />

Kvalitetsdeklaration av<br />

Gödselmedel i jordbruket 1997<br />

Förbrukningsstatistik genom intervjuer<br />

0 INLEDNING<br />

SCB:s Gödselmedelsundersökningar (GU) inleddes 1988 med syfte att få fram kunskap<br />

om användningen av handels- <strong>och</strong> stallgödsel regionalt <strong>och</strong> <strong>för</strong> enskilda grödor. Sådan<br />

kunskap behövs i <strong>för</strong>sta hand <strong>för</strong> uppföljning av uppsatta miljömål, som underlag <strong>för</strong><br />

näringsläckageberäkningar till luft <strong>och</strong> vatten <strong>och</strong> <strong>för</strong> rådgivning inom växtnäringsområdet.<br />

Ur miljösynpunkt är <strong>för</strong>lusterna av kväve <strong>och</strong> fosfor av störst betydelse. För att få till<br />

stånd en minskning av <strong>för</strong>lusterna omfattas svenskt jordbruk av flera miljöpolitiska<br />

beslut.<br />

GU följde från början de objektiva skördeuppskattningarna, <strong>och</strong> därtill hörande urval.<br />

Från 1995 har ett helt eget urval dragits. In<strong>för</strong> 1997 års undersökning gjordes en översyn<br />

i samråd med bl.a. Jordbruksverket, Lantbruksuniversitetet, Jordbrukstekniska institutet<br />

<strong>och</strong> Naturvårdsverket. Syftet med översynen var främst att <strong>för</strong>bättra statistiken över<br />

stallgödselhanteringen, som bl.a. har relevans <strong>för</strong> ammoniakavgång till luft <strong>och</strong><br />

näringsläckage.<br />

1 STATISTIKENS INNEHÅLL<br />

1.1 <strong>Statistiska</strong> målstorheter<br />

Det finns två huvudgrupper av statistiska målstorheter. Den ena gäller de kvantiteter av<br />

olika näringsämnen som till<strong>för</strong>s åker- <strong>och</strong> betesmark genom handels- <strong>och</strong> stallgödsel.<br />

Två exempel i denna grupp är total mängd till<strong>för</strong>d växttillgängligt kväve till åkermarken<br />

inom ett område <strong>och</strong> hektargivan <strong>för</strong> kalium på endast handelsgödslad areal. Den andra<br />

huvudgruppen gäller olika aspekter på stallgödsel: hanteringssätt, lagringskapacitet,<br />

spridningsteknik <strong>och</strong> -intensitet, anskaffning/leverans, stallperiodens längd <strong>för</strong><br />

nötkreatur. Ett exempel här är andel stallgödslad areal.<br />

1.1.1 Objekt <strong>och</strong> population<br />

Objekten är av två typer: lantbruks<strong>för</strong>etag <strong>och</strong> fält hos lantbruks<strong>för</strong>etag. Ett fält är<br />

antingen åkermark eller betesmark. Företagen tilldelas ett storleksmått, som kallas<br />

standardarbetstid <strong>och</strong> beräknas från arbetskraftsbehov. Den ena målpopulationen utgörs<br />

av alla lantbruks<strong>för</strong>etag med en standardarbetstid om minst 150 timmar, <strong>och</strong> den andra<br />

målpopulationen är all åker- <strong>och</strong> betesmark hos dessa <strong>för</strong>etag.<br />

1.1.2 Variabler<br />

• Mängd använd handelsgödsel av olika sorter på åkermark <strong>och</strong> betesmark utan<strong>för</strong><br />

åkermark<br />

• Mängd använd stallgödsel på åkermark <strong>och</strong> betesmark<br />

• Mängd kväve, fosfor, kalium resp. svavel som sprids på åker- <strong>och</strong> betesmark<br />

• Spridningstekniker <strong>för</strong> stallgödsel<br />

• Grödarealer <strong>för</strong> cirka 25 olika grödslag<br />

• Lagringskapacitet <strong>och</strong> hanteringssätt <strong>för</strong> stallgödsel från olika djurslag<br />

• Anskaffning/leverans av stallgödsel, användning av avloppsslam <strong>och</strong> andra organiska<br />

produkter<br />

• Typ av gödselhanteringsanläggning <strong>för</strong> olika djurslag


• Stallperiodens längd <strong>för</strong> nötkreatur<br />

• Spridningsintervall <strong>för</strong> stallgödsel<br />

1.1.3 <strong>Statistiska</strong> mått<br />

<strong>Statistiska</strong> mått är dels summor <strong>och</strong> medelvärden, dels andelar, se exempel ovan.<br />

1.1.4 Redovisningsgrupper<br />

Den finaste geografiska redovisningen i SM:et är län, i övriga fall sker redovisning <strong>för</strong><br />

produktionsområden eller <strong>för</strong> hela riket. För grödor sker redovisningen antingen uppdelat<br />

på enskilda grödor enligt indelningen hos LBR, eller på fyra ackumulerade grödgrupper<br />

(samtliga åkergrödor, spannmål, slåttervall <strong>och</strong> övriga åkergrödor).<br />

Redovisning sker, när så är relevant, <strong>för</strong> olika slag av husdjur, såsom mjölkkor, övriga<br />

nötkreatur, suggor <strong>och</strong> galtar, slaktsvin samt fjäderfä.<br />

Andra indelningar är efter näringsämnen (kväve, fosfor, kalium, svavel) <strong>och</strong> storleksgrupper<br />

(ha åker).<br />

1.1.5 Referenstider<br />

Statistik om gödselanvändning avser ett gödselår, här 1996-97. Detta gödselår börjar<br />

1996 i <strong>och</strong> med gödslingen in<strong>för</strong> höstsådden <strong>och</strong> avslutas med skörden på sommaren/<br />

hösten 1997. Tidsperioden innefattar all gödsling <strong>för</strong> de grödor som skördas under denna<br />

säsong.<br />

För hanteringssätt <strong>och</strong> lagringskapacitet gäller uppgifterna den 10 juni.<br />

Referenstiden <strong>för</strong> stallperiod är 1 juli 1996 – 30 juni 1997.<br />

1.2 Fullständighet<br />

Undersökningen täcker <strong>och</strong> beskriver gödselmedelsanvändning <strong>och</strong> -hantering. Om man<br />

vill beskriva växtnäring i ett vidare miljöperspektiv, är statistiken i behov av komplettering.<br />

Exempelvis behövs <strong>för</strong> gårdarna i populationen bättre uppgifter om jordarter, samt<br />

mer kunskap om utfodring av husdjuren.<br />

2 STATISTIKENS TILLFÖRLITLIGHET<br />

2.1 Till<strong>för</strong>litlighet totalt<br />

Statistiken om handelsgödsel får anses tämligen säker. Större osäkerhet råder i statistiken<br />

om stallgödsel, då stallgödselgivor är svårare <strong>för</strong> lantbrukarna att kvantifiera, samtidigt<br />

som omräkningsfaktorerna <strong>för</strong> olika näringsämnen är mer osäkra.<br />

2.2 Osäkerhetskällor<br />

2.2.1 Urval<br />

Urvalsram är Lantbruksregistret, LBR, (med totalt cirka 90 000 lantbruks<strong>för</strong>etag) exklusive<br />

<strong>för</strong>etag med en standardarbetstid mindre än 150 timmar per år. Ramen stratifieras<br />

i 8 strata per län efter driftsinriktning, totalt 192 strata. Urvalsmetoden avseende<br />

lantbruks<strong>för</strong>etag är ett stratifierat urval med pps inom strata: urvalssannolikheten är<br />

inom varje stratum proportionell mot storleken, <strong>för</strong>etagets standardarbetstid. Inom varje<br />

lantbruks<strong>för</strong>etag väljs sedan <strong>för</strong> varje gröda det största fältet ut. Det <strong>för</strong>stnämnda urvalet<br />

bestod av cirka 3 950 <strong>för</strong>etag.<br />

Skattnings<strong>för</strong>farandet använder gängse formler <strong>för</strong> urvalsmetoden, där urvalssannolikheterna<br />

beror av stratum <strong>och</strong> storlek inom stratum. Justering görs <strong>för</strong> bortfall men inte<br />

<strong>för</strong> täckningsbrister, se nedan.<br />

Tidigare har urvalsfel redovisats <strong>för</strong> hektargivorna. Typiska medelfel var då 1-5 % på<br />

riksnivå, på länsnivå cirka 2-3 gånger större. Detta avser svarande <strong>för</strong>etag efter justering<br />

<strong>för</strong> bortfall.<br />

79


80<br />

2.2.2 Ramtäckning<br />

LBR, som används som ram efter att små <strong>för</strong>etag tagits bort, beräknas ha ytterst små<br />

täckningsfel. I <strong>och</strong> med att urvalet till GU dras från <strong>för</strong>egående års register kan lantbruks<strong>för</strong>etag<br />

ha <strong>för</strong>ändrats i <strong>för</strong>hållande till uppgifterna i LBR. Detta bedöms mestadels<br />

ha endast liten betydelse <strong>för</strong> skattningarna.<br />

Det finns en undertäckning genom nystartade lantbruks<strong>för</strong>etag. Dessa uppskattas utgöra<br />

högst 3 % av <strong>för</strong>etagspopulationen antalsmässigt. I skattnings<strong>för</strong>farandet görs ingen<br />

kompensation <strong>för</strong> denna undertäckning Den övertäckning i urvalet som utgörs av nedlagda<br />

lantbruks<strong>för</strong>etag ges nollvärden i skattnings<strong>för</strong>farandet. Den population som<br />

skattningarna avser är därmed något mindre än målpopulationen. Se även Svarsbortfall<br />

nedan.<br />

2.2.3 Mätning<br />

Undersökningsresultaten grundar sig på jordbrukarnas uppgifter, <strong>för</strong>medlade av telefonintervjuare.<br />

Protokollet som telefonintervjuarna fyller i finns som bilaga sist i SM:et.<br />

De mätfel som uppkommer <strong>och</strong> som exempelvis beror på glömska, miss<strong>för</strong>stånd, hörfel<br />

med mera är mycket svårbedömt, men kan troligen i enskilda fall vara stort. Dessutom<br />

kan osäkerheten i uppgifter om gödselgivornas storlek vara betydande. Detta gäller speciellt<br />

<strong>för</strong> stallgödsel.<br />

Hänsyn till osäkerhet i mätningen tas genom att redovisningen begränsats till resultat<br />

som grundas på minst 30 observationer.<br />

2.2.4 Svarsbortfall<br />

Objektbortfallet i undersökningen uppgick antalsmässigt till ca 11 %, varav ca 8 % berodde<br />

på vägran från jordbrukarnas sida att medverka i undersökningen. I bortfallet ingår<br />

dessutom ett antal ofullständiga protokoll samt <strong>för</strong>etag som <strong>för</strong>ändrats så mycket<br />

jäm<strong>för</strong>t med LBR-uppgifterna (t.ex. genom köp) att de ej kunnat nyttjas i undersökningen.<br />

Utöver bortfallet av hela <strong>för</strong>etag tillkommer ett partiellt bortfall av enstaka<br />

uppgifter i varierande omfattning.<br />

I skattnings<strong>för</strong>farandet behandlades de svarande som om de varit det ursprungliga urvalet.<br />

Bakom detta ligger ett antagande om att <strong>för</strong>etag som är bortfall inte skiljer sig från<br />

svarande <strong>för</strong>etag i samma stratum.<br />

2.2.5 Bearbetning<br />

Blanketten skannades <strong>och</strong> granskades genom avstämningar med LBR-uppgifter <strong>och</strong> med<br />

rimlighetskontroller <strong>för</strong> gödselgivor. Bearbetningarna ligger i ett PC-baserat<br />

client/serversystem.<br />

2.2.6 Modellantaganden<br />

GU:s skattningar av hur mycket kväve, fosfor <strong>och</strong> kalium som sprids på åkermark <strong>och</strong><br />

betesmark är modellberoende. Skattningarna går till så att lantbrukarna <strong>för</strong>st svarar på<br />

intervjufrågor om använda kvantiteter handels- <strong>och</strong> stallgödsel av olika slag. På dessa<br />

uppgifter läggs sedan omräkningsfaktorer <strong>för</strong> att erhålla skattade kvantiteter av olika<br />

näringsämnen, enligt formeln (per gödselmedel):<br />

Mängd spridd näring (av typ N från gödselmedel G) =<br />

= mängd spridd gödsel (av typ G) x näringsinnehåll (andel av N i G)<br />

Uppgifter om näringsinnehåll i handelsgödsel av olika sorter kommer från tillverkarnas<br />

innehållsdeklarationer, <strong>och</strong> här är uppgifterna tämligen säkra. För stallgödsel av olika<br />

typer har tillämpats omräkningsfaktorer enligt Jordbruksverkets STANK-modell. Dessa<br />

omräkningsfaktorer anses mer osäkra, eftersom de bygger på <strong>för</strong>söksdata <strong>och</strong> bl.a. <strong>för</strong>utsätter<br />

vissa foderstater <strong>och</strong> viss gödselhantering. Någon felskattning finns inte <strong>för</strong> omräkningsfaktorerna.


2.3 Redovisning av osäkerhetsmått<br />

Inga osäkerhetsmått beräknas <strong>för</strong> 1997 års undersökning.<br />

3 STATISTIKENS AKTUALITET<br />

3.1 Frekvens<br />

Undersökningen genom<strong>för</strong>s <strong>och</strong> publiceras vartannat år. Nästa undersökning gäller gödselåret<br />

1998-99.<br />

3.2 Framställningstid<br />

Framställningstiden var 6 månader.<br />

3.3 Punktlighet<br />

Resultaten publicerades enligt plan i maj månad 1998.<br />

4 JÄMFÖRBARHET <strong>och</strong> SAMANVÄNDBARHET<br />

4.1 Jäm<strong>för</strong>barhet över tiden<br />

Vissa metod<strong>för</strong>ändringar har skett sedan GU inleddes 1988, av både urval <strong>och</strong> beräkningsmodeller.<br />

Dessutom har storleken på urvalet varierats.<br />

En stor <strong>för</strong>ändring ägde rum från <strong>och</strong> med 1995 års undersökning, när urvalsmetod byttes<br />

<strong>och</strong> gårdarna tilldelats urvalssannolikhet i relation till beräknat antal standardarbetstimmar<br />

på <strong>för</strong>etaget. Tidigare har urvalssannolikheten bestämts utifrån ett arealmått,<br />

beräknat med något olika vikt <strong>för</strong> olika grödor.<br />

En annan stor <strong>för</strong>ändring genom<strong>för</strong>des efter en översyn in<strong>för</strong> 1997 års undersökning,<br />

vilken resulterade i att Jordbruksverkets STANK-modell in<strong>för</strong>des <strong>för</strong> skattning av<br />

näringsinnehåll i stallgödsel. Dessutom tillkom fler <strong>och</strong> mer detaljerade frågor om gödselhantering.<br />

I 1988 <strong>och</strong> 1997 års undersökningar ingick lantbruks<strong>för</strong>etag med mer än 2,0 hektar<br />

åkerareal, medan i de tre mellanliggande undersökningarna endast ingått <strong>för</strong>etag med<br />

mer än 5,0 hektar. Företag mellan 2,1 <strong>och</strong> 5,0 hektar svarar <strong>för</strong> ca 2 % av åkerarealen<br />

<strong>och</strong> 15 % av antalet <strong>för</strong>etag <strong>och</strong> torde ha en gödsel<strong>för</strong>brukning per hektar under genomsnittet.<br />

4.2 Jäm<strong>för</strong>barhet mellan grupper<br />

I Sverige finns ingen annan statistik om gödselmedelsanvändning med samma detaljeringsgrad.<br />

Redovisningen <strong>för</strong> grödor/grödgrupper är unik, liksom uppgifterna om stallgödselanvändningen.<br />

Möjligheter till internationella jäm<strong>för</strong>elser saknas i stor utsträckning.<br />

På vissa håll finns dock en bra uppfattning om gödselhanteringen, exempelvis i<br />

Nederländerna.<br />

Det ligger nära till hands att jäm<strong>för</strong>a den i GU uppmätta användningen av handelsgödsel<br />

med <strong>för</strong>säljningsstatistiken, som redovisas årligen av SCB. Under gödselåret 1996-97<br />

var <strong>för</strong>säljningen av kväve i medeltal <strong>för</strong> riket 7 % högre än den uppgivna användningen<br />

till åkermark exklusive betesmark enligt GU, medan fosfor<strong>för</strong>säljningen visade sig 3 %<br />

lägre än användningen. Före jäm<strong>för</strong>elsen har <strong>för</strong>säljningssiffrorna reducerats med beräknad<br />

användning utan<strong>för</strong> åkermarken, d.v.s. gödsling av betesmark, grönytor, golfbanor,<br />

handelsträdgårdar <strong>och</strong> privata trädgårdar. Skillnaden mellan <strong>för</strong>säljning <strong>och</strong> användning<br />

är olika stor i olika län, enligt ett mönster som är likartat mellan åren.<br />

Ett annat fall där man med hjälp av andra undersökningar får fram en skattning som kan<br />

jäm<strong>för</strong>as med GU gäller kvävet i stallgödsel. Med hjälp av SM-rapporterna över Handelsgödsel,<br />

stallgödsel <strong>och</strong> kalk i jordbruket <strong>och</strong> Utsläpp till luft av ammoniak i Sverige<br />

kan man, genom att subtrahera den totala kväve<strong>för</strong>lusten i form av ammoniakavgång<br />

81


82<br />

från producerad mängd stallgödsel, beräkna mängden totalkväve i stallgödsel som till<strong>för</strong>ts<br />

åkermarken. Denna kvantitet borde motsvara den gödsel som lantbrukarna spridit<br />

ut på åkrarna enligt Gödselundersökningen, inklusive marginell användning av stallgödsel<br />

utan<strong>för</strong> jordbrukssektorn. Samstämmigheten beror på schablontalen <strong>för</strong> gödselproduktion<br />

hos olika djursorter, skattningen i GU av använd gödsel, <strong>och</strong> dessutom vilka<br />

omräkningstal som används <strong>för</strong> näringsinnehållet i producerad respektive använd gödsel.<br />

Enligt beräkningarna <strong>för</strong> gödselåret 1996-97, blir mängden kväve i producerad stallgödsel<br />

(efter ammoniak<strong>för</strong>luster) i medeltal på riksnivå 5 % lägre än användningen, medan<br />

mängden fosfor i producerad stallgödsel blev 10 % högre än beräknad användning.<br />

Även denna skillnad är olika stor i olika län. Urvalsosäkerheten kan <strong>för</strong>klara en del av<br />

men inte hela dessa skillnader, som behöver analyseras vidare.<br />

4.3 Samanvändbarhet med annan statistik<br />

Urvalsramen LBR används också <strong>för</strong> ett flertal andra undersökningar. Definitionen av<br />

jordbruks<strong>för</strong>etag är gängse, liksom indelningarna i grödor, djurgrupper <strong>och</strong> regioner.<br />

God samanvändbarhet med annan jordbruksstatistik torde <strong>för</strong>eligga.<br />

5 TILLGÄNGLIGHET <strong>och</strong> FÖRSTÅELIGHET<br />

5.1 Spridningsformer<br />

GU publiceras vartannat år i <strong>Statistiska</strong> meddelanden (Mi 30 SM). I samma serie redovisades<br />

också separat fram till 1995 näringsämneskvantiteterna enligt GU, nedbrutna på<br />

avrinningsområden. 1995 utgavs en sammanställning av långa regionala tidsserier över<br />

<strong>för</strong>säljningen av handelsgödsel <strong>och</strong> kalk, samt produktionen av stallgödsel. På SCB:s<br />

hemsida finns pressmeddelanden, en kort presentation av undersökningen, samt även ett<br />

par tabeller <strong>och</strong> diagram. I samlingspublikationen Naturmiljön i siffror finns en sammanställning<br />

av resultaten.<br />

I SM:ets tabellavdelning redovisas endast resultat <strong>för</strong> samtliga åkergrödor, spannmål,<br />

slåttervall <strong>och</strong> summan av övriga åkergrödor. En tabellbilaga med mer detaljerad redovisning<br />

kan beställas från SCB.<br />

5.2 Presentation<br />

Presentation framgår av SM.<br />

5.3 Dokumentation<br />

Det finns ingen lättillgänglig dokumentation utöver SM.<br />

5.4 Tillgång till primärmaterial<br />

Primärdata <strong>för</strong> enskilda <strong>för</strong>etag finns sparade <strong>för</strong> alla undersökningsår från <strong>och</strong> med<br />

1988. Specialbearbetningar ut<strong>för</strong>s på uppdragsbasis. Forskare, utredare, m.fl. kan få<br />

tillgång till avidentifierat material efter särskild prövning.<br />

5.5 Upplysningstjänster<br />

Vid frågor om statistiken kontakta Sven Strömberg vid SCB, telefon: 08-506 947 45,<br />

telefax 08-506 947 63, e-post: sven.strömberg@scb.se. För upplysningar om emissionsfaktorer<br />

enligt STANK-modellen, rörande näringsinnehåll i stallgödsel kontakta Jordbruksverket,<br />

551 82 Jönköping, telefon 036-15 50 00.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!