Introduktion Till Statistiken

The Title 

The Author 

The Date

ii 

c Mikael Möller

Innehåll 

1 Vad statistik handlar om 1 

1.1 Modeller . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 

1.2 Tre typer av medelvärden . . . . . . . . . . . . . . . . . . 4 

1.2.1 Median . . . . . . . . . . . . . . . . . . . . . . . . 5 

1.2.2 Typvärde . . . . . . . . . . . . . . . . . . . . . . . 5 

1.2.3 Aritmetiskt medelvärde . . . . . . . . . . . . . . . 6 

1.3 Tre typer av avvikelser . . . . . . . . . . . . . . . . . . . . 10 

1.3.1 Varians –standardavvikelse . . . . . . . . . . . . . 11 

1.3.2 Skevhet . . . . . . . . . . . . . . . . . . . . . . . . 13 

1.3.3 Toppighet . . . . . . . . . . . . . . . . . . . . . . . 14 

1.4 Tre typer av gram . . . . . . . . . . . . . . . . . . . . . . 16 

1.4.1 Stolpdiagram och kumulerat stolpdiagram . . . . . 16 

1.4.2 Histogram och kumulerat histogram . . . . . . . . 19 

2 Stokastiska variabler, väntevärden och sannolikheter 23 

2.1 Diskret och kontinuerlig . . . . . . . . . . . . . . . . . . . 23 

2.2 Väntevärden . . . . . . . . . . . . . . . . . . . . . . . . . . 25 

2.3 Sannolikhet . . . . . . . . . . . . . . . . . . . . . . . . . . 27 

2.4 Mera om sannolikheter . . . . . . . . . . . . . . . . . . . . 32 

2.5 Betingade sannolikheter . . . . . . . . . . . . . . . . . . . 35 

2.6 Betingade väntevärden . . . . . . . . . . . . . . . . . . . . 41 

2.7 Betingade varianser . . . . . . . . . . . . . . . . . . . . . . 43 

2.8 Oberoende . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 

3 Diskreta modeller 49 

3.1 Betygssättning . . . . . . . . . . . . . . . . . . . . . . . . 49 

3.2 Optionsmodell . . . . . . . . . . . . . . . . . . . . . . . . 55 

3.2.1 Binomial optionsmodell –ett tidssteg . . . . . . . 56 

3.2.2 Binomial optionsmodell –‡era tidssteg . . . . . . . 59 

3.3 Epostmodell . . . . . . . . . . . . . . . . . . . . . . . . . . 65 

iii

iv INNEHÅLL 

3.4 Spelmodeller . . . . . . . . . . . . . . . . . . . . . . . . . 71 

3.5 Kvalitetskontroll . . . . . . . . . . . . . . . . . . . . . . . 75 

3.6 Sammanfattning . . . . . . . . . . . . . . . . . . . . . . . 80 

3.7 Lösningar till uppgifter . . . . . . . . . . . . . . . . . . . . 81 

4 Kontinuerliga modeller 87 

4.1 Bussmodell . . . . . . . . . . . . . . . . . . . . . . . . . . 87 

4.2 Försäkringsmodell . . . . . . . . . . . . . . . . . . . . . . 90 

4.2.1 Fördelning för antal skador . . . . . . . . . . . . . 95 

4.2.2 En försäkrings premie . . . . . . . . . . . . . . . . 96 

4.3 Normalfördelningen . . . . . . . . . . . . . . . . . . . . . . 97 

4.3.1 Centrala gränsvärdessatsen . . . . . . . . . . . . . 101 


5 Stickprov och skattningar 111 

5.1 Stickprov . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 

5.1.1 Vad ett stickprov kan ge . . . . . . . . . . . . . . . 112 

5.2 Skattningar . . . . . . . . . . . . . . . . . . . . . . . . . . 115 

5.2.1 Önskade egenskaper hos skattningar . . . . . . . . 116 

5.3 Metoder för att …nna skattningar . . . . . . . . . . . . . . 124 

5.3.1 Momentmetoden . . . . . . . . . . . . . . . . . . . 124 

5.3.2 Minsta kvadrat metoden . . . . . . . . . . . . . . . 126 

5.3.3 Maximum likelihood metoden . . . . . . . . . . . . 130 

5.4 Tankeväckande exempel . . . . . . . . . . . . . . . . . . . 135 


6 Passar vår fördelning 141 

6.1 Funktionen ^ F . . . . . . . . . . . . . . . . . . . . . . . . . 143 

6.2 Fördelningsdiagram . . . . . . . . . . . . . . . . . . . . . 143 

6.2.1 P-P diagram . . . . . . . . . . . . . . . . . . . . . 144 

6.2.2 K-K diagram . . . . . . . . . . . . . . . . . . . . . 146 

6.2.3 Exempel . . . . . . . . . . . . . . . . . . . . . . . . 147 

6.3 Rörvik Timber B . . . . . . . . . . . . . . . . . . . . . . . 157 


7 Trovärdiga intervall 163 

7.1 Normalfördelningen . . . . . . . . . . . . . . . . . . . . . . 164 

7.1.1 Fall 1: Kon…densintervall för när är känt . . . 165 

7.1.2 Fall 2: Kon…densintervall för med okänt väntevärde 

. . . . . . . . . . . . . . . . . . . . . . . 167 

7.1.3 Fall 3: Kon…densintervall för när är okänt . . . 168 

7.2 Kon…densintervall vid normalapproximation . . . . . . . . 170 

c Mikael Möller

INNEHÅLL v 

7.2.1 Kon…densintervall vid Poissonfördelning . . . . . . 170 

7.2.2 Kon…densintervall vid binomialfördelning . . . . . 171 


8 Prövning av antaganden 177 

8.1 Introduktion . . . . . . . . . . . . . . . . . . . . . . . . . 177 

8.2 Test av vid normalfördelning . . . . . . . . . . . . . . . 177 

8.2.1 Steg 1: Formulera lämplig hypotes . . . . . . . . . 178 

8.2.2 Steg 2: Bestäm en testvariabel . . . . . . . . . . . 179 

8.2.3 Steg 3: Bestäm en beslutsregel . . . . . . . . . . . 180 

8.2.4 Steg 4: Besluta . . . . . . . . . . . . . . . . . . . . 181 

8.2.5 Jämförelse mellan kon…densintervall och test . . . 184 

8.3 Test av 1 2 vid normalfördelning . . . . . . . . . . . . 184 

8.4 Test av p . . . . . . . . . . . . . . . . . . . . . . . . . . . 190 

8.5 Test av vid normalfördelning . . . . . . . . . . . . . . . 195 

8.6 Olika typer av fel . . . . . . . . . . . . . . . . . . . . . . . 198 

8.6.1 Styrkefunktion . . . . . . . . . . . . . . . . . . . . 198 

8.7 p-värden . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199 

8.8 Test av fördelningar . . . . . . . . . . . . . . . . . . . . . 201 

8.8.1 2-testet . . . . . . . . . . . . . . . . . . . . . . . . 201 

8.8.2 Ett enklare exempel . . . . . . . . . . . . . . . . . 202 

8.8.3 Fördelningar –diskreta . . . . . . . . . . . . . . . 206 

8.8.4 Fördelningar –kontinuerliga . . . . . . . . . . . . . 208 

8.8.5 Test av oberoende . . . . . . . . . . . . . . . . . . 210 

8.9 Övningar och Problem . . . . . . . . . . . . . . . . . . . . 214 


9 Linjär regression –enkel 217 

10 Linjär regression –multipel 219 

11 Icke linjär regresion 221 

12 Logistisk regression 223 

12.1 När är logistisk regression användbart . . . . . . . . . . . 223 

12.2 Hur ser p(x1; : : : ; xm) ut . . . . . . . . . . . . . . . . . . . 228 

12.2.1 Logistisk regressionsmodell via odds . . . . . . . . 228 

12.2.2 Logistisk regressionsmodell via tillväxtmodell . . . 231 

12.3 Hur bestäms parametrarna 0 och 1 . . . . . . . . . . . . 233 

12.3.1 För att summera och generalisera . . . . . . . . . . 235 

12.4 Tillbaks till exemplen . . . . . . . . . . . . . . . . . . . . 236 

12.5 Hur man tolkar parametrar . . . . . . . . . . . . . . . . . 240 

c Mikael Möller

vi INNEHÅLL 

12.6 Övningar . . . . . . . . . . . . . . . . . . . . . . . . . . . 242 


13 Tidsserier 251 

13.1 Introduktion . . . . . . . . . . . . . . . . . . . . . . . . . 251 

13.2 Glidande medelvärden . . . . . . . . . . . . . . . . . . . . 252 

13.3 Komponentmodeller . . . . . . . . . . . . . . . . . . . . . 255 

13.3.1 Modell . . . . . . . . . . . . . . . . . . . . . . . . . 255 

13.3.2 Konstruktion av en tidsserie . . . . . . . . . . . . . 257 

13.3.3 Analys av tidsserien ovan . . . . . . . . . . . . . . 259 

13.3.4 Enkel exponentiell utjämning . . . . . . . . . . . . 264 

13.3.5 Dubbel exponentiell utjämning à la Holt . . . . . . 267 

13.4 ARMA-modeller . . . . . . . . . . . . . . . . . . . . . . . 269 

13.4.1 Introduktion . . . . . . . . . . . . . . . . . . . . . 269 

13.4.2 Hur ser en stationär tidsserie ut . . . . . . . . . . 271 

13.4.3 Autokorrelationsfunktionen . . . . . . . . . . . . . 274 

13.4.4 Partiella autokorrelationsfunktionen . . . . . . . . 275 

13.4.5 Modellen AR(1) . . . . . . . . . . . . . . . . . . . 277 

13.4.6 Modellen MA(1) . . . . . . . . . . . . . . . . . . . 278 


14 ARMA processer 287 

15 Beslutsteori 289 

15.1 Beslutsprocessen . . . . . . . . . . . . . . . . . . . . . . . 290 

15.2 Enkla beslutsproblem . . . . . . . . . . . . . . . . . . . . 292 

15.2.1 Minimax . . . . . . . . . . . . . . . . . . . . . . . . 293 

15.2.2 Maximax . . . . . . . . . . . . . . . . . . . . . . . 293 

15.2.3 Förlorade möjligheter . . . . . . . . . . . . . . . . 294 

15.3 Enkla beslut baserade på väntevärden . . . . . . . . . . . 296 

15.4 Enkla beslutsträd . . . . . . . . . . . . . . . . . . . . . . . 299 

15.5 Aposteriorisannolikheter . . . . . . . . . . . . . . . . . . . 301 

15.6 Allmäna beslutsträd . . . . . . . . . . . . . . . . . . . . . 303 

c Mikael Möller

1. Vad statistik handlar 

om 

Människans ojämförligt största upp…nning är språket och därefter kommer 

matematik och statistik. Utan det förra skulle vi inte kunna utväxla 

ideer och utan det senare skulle våra ideer vara fördunklade av allehanda 

övernaturligt tankebråte. Ett samhälle utan matematik kan förvisso existera 

men dömer sig självt till evigt stillastående. Matematiken och i 

dess förlängning statistiken är två speciella universiella språk som hjälper 

oss att reda ut vad som är sant och vad som är tro. Matematiken gör 

modeller som utgår från "odelbara sanningar" och härleder därur statiska 

beskrivningar av verkligheten. Det statistiska språket lägger till 

en osäkerhetsaspekt till det matematiska språket, slumpen, som gör det 

möjligt att även ge beskrivningar av en kaotisk, dynamisk, verklighet. 

Statistik har gett uphov till och/eller understött utvecklingen av 

många intressanta verksamheter som nationalekonomi, sociologi, marknadsföring, 

fysik, …nans, medicin, farmakologi, psykologi, dataalgoritmer 

o s v. 

Statistik har även använts för att förklara hur slumpen kan skapa 

mönster där inga …nnes. I bästsäljaren Bibelkoden presenterar författaren 

[7, Michael Drosnin] följande resultat: Tag bibelns text och skriv 

ned den med exakt lika många bokstäver i varje rad. I den så erhållna 

textmassan kan man nu, vertikalt eller diagonalt, hitta en mängd intressanta 

saker. Vid ett sådant försök lyckades man para ihop 34 rabbiners 

namn med deras födelsedata. Något så märkligt kan inte vara en slump 

utan måste vara ett hemligt meddelande från Gud. Alltså …nns Gud 

(vilka dumheter man får höra). Nu kan man med statistiska metoder 

bevisa att slumpen faktiskt ger dylika e¤ekter (se [8, Qvartilen Vol 19- 

3, Olle Häggström]). Statistik kan därför även användas för att avslöja 

direkt felaktiga påståenden och blir därmed ett utmärkt verktyg för att 

hålla ’koll’på medvetet/omedvetet ’ljug’från både politiker, astrologer 

och andra. 

För att kunna fungera som ett verktyg för utveckling och renhållning 

behöver statistiken matematiken ty med matematikens hjälp kan en statistiker 

visa att t ex aritmetiska medelvärden uppträder på ett speciellt 

sätt när antalet mätningar ökar. Detta betyder att den som vill stud- 

1

2 

era statistik måste, för att få verklig behållning av och självständigt 

kunna använda de statistiska verktygen, börja med att studera matematik. 

Har man inte elementa inom matematik klart för sig så blir 

statistiken knastertorr (utantillärning) och, utanför den deskriptiva statistikens 

värld, totalt obegriplig. Av denna anledning …nns till denna bok 

en nätbok, Introduktion till matematik för ekonomer, som innehåller det 

minimum av kunskaper i matematik som behövs för att med god behållning 

kunna tillägna sig denna bok. 

Jaha vad handlar nu statistik om? Tillspetsat kan man säga att 

statistik handlar om två saker 1) Hur man beräknar medelvärden och 

2) begreppet oberoende händelser. Sannolikt får jag en massa belackare 

som hävdar annat så jag får likt biskop Brask skriva en liten lapp: 

Hur man sedan använder dessa kunskaper är fram till var och en. 

Olle Sjöström påminner om statistikens tre ben (se [9, Qvartilen Vol 

20-2, Olle Sjöström]) 

Svårigheterna att svara på frågan ”Vad är statistik?”beror 

inte minst på att statistikens idéhistoriska framväxt är komplex 

och svårfångad. Ett sätt att söka beskriva denna utveckling 

är att skilja på tre olika linjer. 

1) Statistik som kritisk samhällslära med rötter i Upplysningen. 

2) Statistik som generell metod, i dagens statistiska språkbruk 

en metod för surveyundersökningar, i allmänt språkbruk 

”statistisk undersökning”. En teori formulerades i slutet av 

1800-talet. 

3) Statistik som tillämpning av sannolikhetsmodeller, som 

har haft en stark utveckling under 1900-talet. Det är fråga 

om en mer utbyggd statistiskt orienterad matematik, även 

kallad ”matematisk statistik”. 

Dessa tre traditioner lever kvar i dag. Alla tre …nns med 

i statistikens olika tillämpningar, den tredje dominerar undervisning 

och forskning inom universitet och högskolor nästan 

helt. Även i det samhällsvetenskapliga ämnet statistik 

c Mikael Möller

1. Vad statistik handlar om 3 

har denna uppfattning fått insteg och intresset har glidit mer 

mot andra tillämpningar än de samhällsvetenskapliga. I det 

följande vill jag söka visa, att alla dessa tre traditioner är 

relevanta . . . . 

Ovanstående beskrivning stämmer bra med de faktiska förhållandena 

och det är onekligen så att det första benet har haft en tendens till att bli 

bortglömt och det andra har den statliga myndigheten SCB tagit hand 

om. Men både det första och andra benet behöver det tredje för att få 

hjälp att undvika fällor och fel. 

1.1 Modeller 

Innan vi börjar räkna på medelvärden måste vi göra mätningar och dessa 

mätningar måste ha någon form av relevans för oss. Detta betyder att 

innan vi börjar mäta måste vi bestämma varför vi skall mäta, vad vi 

skall mäta och hur vi skall mäta. För att bli lite mer konkret tänker 

vi oss ett företag som sysslar med guldprospektering. Den första frågan 

’varför’får då svaret: För att hitta lönsam guldmalm. Vi kommer sedan 

över på frågan vad vi skall mäta – guld så klart! Ja men hur? Så 

hamnade vi på den sista frågan ’hur’ innan vi besvarat ’vad’. Detta 

är egentligen inget att förundras över – de två frågorna hänger intimt 

samman. Hur prospekterar man guld? Min naiva tanke är att man 

i lämpligt område utför borrningar som ger borrkärnor. På lämpliga 

ställen på dessa borrkärnor gör man analyser av guldförekomsten hos, 

säg, en kubikcentimeter. Nu börjar det bli komplicerat ty vad du just 

läst innebär dels en metod för att välja borrhål och dels en metod för att 

välja ut de delar av borrkärnan som skall analyseras. Men vi har i varje 

fall kommit fram till svaret på frågan ’vad’och det blev: Guldhalten i 

en (sammanhängande) kubikcentimeter borrkärna. Detta leder mig till 

att skapa följande storhet 

X = guldhalten i en cm 3 borrkärna. 

Eftersom vi kommer att analysera ‡er prov, säg n, så erhåller vi n stycken 

guldhalter X1; X2; : : : ; Xn. När vi så har erhållit dessa n guldhalter så 

måste vi fatta beslut om brytning eller ej och det är självklart så att om 

alla prov innehåller 100% guld så tar vi fram spaden och börjar gräva 

och om inget prov innehåller guld packar vi ihop vår utrustning för att 

pröva vår lycka annorstädes. Någonstans däremellan …nns gänsen för 

brytvärd respektive ej brytvärd malm. 

c Mikael Möller

4 1.2. Tre typer av medelvärden 

Vad vi nu har gjort är att skapa början till en modell av det som vi 

är intresserade av, i detta fall guldhalten, och vi har infört beteckningen 

X för att beteckna guldhalten hos en cm3 malm innan vi ens har mätt 

denna halt. En naturlig beteckning för den faktiska uppmätta halten 

blir x så vi …nner alltså de faktiska procentvärdena x1; x2; : : : ; xn t ex 

0:001; 0:002; : : : ; 0:000. Nästa fråga är hur vi på bästa sätt skall hantera 

denna information för att avgöra om det …nns brytvärt guld eller ej när 

vi tagit säg n = 1000 prov. Detta blir för många värden för hjärnan 

att överblicka och vi behöver någon form av samlingsmått. Här skall 

vi endast ange ett (man kan tänka sig hur många som helst) som har 

blivit mycket grundligt studerat under århundrandenas lopp nämligen 

det aritmetiska medelvärdet 

X = 1 

n 

och dess observerade motsvarighet 

x = 1 

n 

nX 

i=1 

Xi 

nX 

xi. 

Vårt beslut att bryta eller ej kommer således att basera sig på talet x 

men hur beslutet skall fattas blir en senare historia. 

Vi skall nu gå över till att studera det aritmetiska medelvärdet och 

dess egenskaper men innan vi börjar med denna studie noterar vi ytterligare 

en sak om vårt exempel, nämligen: De värden som är möjliga att 

observera ligger alla mellan 0 och 100. Mängden av dessa tal betecknar 

vi med X och det gäller 

i=1 

X = fx j 0 x 100g . 

Detta utläses "mängden omega-X där X antar alla reella tal mellan 0 

och 100". Mängden X kallas X:s utfallsrum och anger precis de värden 

som är möjliga att erhålla vid en mätning av X. 

Sammanfattning Vi har infört beteckningen stor bokstav för det 

som vi skall mäta och liten bokstav för det som är uppmätt. De 

möjliga mätvärdena, utfallsrummet, betecknas med X eller alternativt 

(X). 

1.2 Tre typer av medelvärden 

Ovan nämnde vi att det …nns en uppsjö av samlingsmått men namngav 

bara ett –det aritmetiska medelvärdet. Här skall vi börja med att kort 

c Mikael Möller


ta upp ytterligare två samlingsmått –median och typvärde –för att 

därefter ta itu med analysen av det aritmetiska medelvärdet. 

1.2.1 Median 

Om vi ordnar alla värden i växande storleksordning och sedan tar det 

mittersta värdet (om antalet mätningar är jämnt tar vi summan av de två 

mittersta värdena och delar med 2) så får vi ett medelvärde som kallas 

median. Denna storhet har egenskapen att precis hälften av guldhalterna 

understiger medianen och den resterande hälften är större än medianen. 

Medianen är därför, för oss, en bra kandidat till ett medelvärde. 

Ovan har vi betecknat våra mätvärden med x1; x2; : : : ; xn och om vi 

ordnar dessa i växande storleksordning och inför beteckningen (i) för 

att beteckna det storleksmässigt i:te mätvärdet har vi för den ordnade 

mätmängden följande beteckning 

där det gäller att 

x (1); x (2); : : : ; x (n) 

x (1) x (2) x (n). 

Med detta skrivsätt de…nerar vi nu medianen enligt 

De…nition 1 (Median) Med medianen, M (x), till mängden av mätvärden 

fx1; x2; : : : ; xng menas talet 

8 

< 

M (x) = 

: 

x (k) 

x (k) + x (k+1) 

2 

n = 2k + 1 

n = 2k 

Medianen är således ett bra förslag på medelvärde och det är ett uppriktigt 

värde ty det är just det mittersta värdet av de givna värdena. 

1.2.2 Typvärde 

Ett annat uppriktigt värde är det så kallade typvärdet, T (x), som helt 

enkelt är det vanligast förekommande värdet. Detta värde kan dock vara 

svårt att de…niera för många typer av mätvärden. Tag t ex längder av 

män och antag att vi mäter längden, i cm, hos 10 män och att vi då får 

längderna 

173; 165; 178; 151; 173; 173; 179; 169; 189; 173. 

c Mikael Möller


Vi ser direkt att fyra av dem är 173 cm långa. Typvärdet skulle i detta 

fall bli just 173 cm. Men om vi nu tar och mäter längden av dessa 4 i mm 

så skulle vi troligtvis få att alla fyra har olika längd och typvärdet blir 

då ode…nierat. Typvärdet är således inget bra mått för genomsnittligt 

värde eftersom det blir beroende av sorten. Ibland kan det dock ge en 

viss information. 

1.2.3 Aritmetiskt medelvärde 

Det artitmetiska medelvärdet är grundbulten inom statistik och denna 

bok. För att se detta måste vi ha ett ‡exibelt exempel (eller snarare 

‡era) där vi kan exempli…era olika egenskaper på sätt som är lätta att 

förstå. Eftersom detta är en bok i statistik, för ekonomer, med en speciell 

inriktning mot grunderna inom …nansiell statistik så skall vi som utfallsrum 

betrakta Den Nordiska Börsen 1 under 100 dagar. Detta utfallsrum 

är ändligt om än mycket stort och ändligheten behövs för att enkelt 

införa vissa storheter och begrepp. Bilda nu följande storheter 

X1 = Broström B, slutkurs mätt i ören, 

X2 = Atlas Copco B, slutkurs mätt i ören, 

X3 = Rörvik Timber B, slutkurs mätt i ören. 

Observera här min petighet med angivande av mått och tidpunkt (statistiker 

blir lätt lite petiga eftersom de lärt sig att ’skit in blir skit ut’, 

ursäkta svenskan). Den i:te dagens slutkurser ger vi beteckningarna X1i, 

X2i och X3i där i = 1; 2; : : : ; 100. 

Statistiker har ett speciellt sätt att kalla sådana storheter: stokastiska 

variabler. Stokastisk betyder slumpmässig, så vi har slumpmässiga 

variabler eller kort och gott slumpvariabler. Ett alternativt sätt att 

uttrycka sig blir då: X1, X2 och X3 är tre stokastiska variabler. Detta 

uttryckssätt kommer att spara en hel del trycksvärta framöver samt underlätta 

införandet av nya begrepp, men visst blir det mer abstrakt. Men 

med abstraktionen följer å andra sidan en betydligt ökad tillämplighet 

ty jag behöver inte nämna några aktier – dessa ingår som specialfall. 

Vårt exempel med en aktieportfölj kan då innefattas i de tre stokastiska 

variablerna X1, X2 och X3 på det ändliga utfallsrummet 2 

(X) = fx j x 2 f0; 0:01; 0:02; : : : ; 300:00gg 

= f0; 0:01; 0:02; : : : ; 300:00g . 

1 Den Nordiska Börsen …nns på adressen http://www.omxgroup.com/omxcorp/ 

(20070116). 

2 Atlas Copco B kostade i skrivande stund mest ca 245 kronor. 

c Mikael Möller


Med detta exempel i bakhuvudet betraktar vi nu det abstrakta men 

ändliga utfallsrummet 

(X) = fx1; x2; : : : ; xNg 

av storlek N. Det aritmetiska medelvärdet, A (X), de…nieras av att man 

summerar alla mätvärden och dividerar med antalet summerade värden 

d v s man bildar 

A (X) = x1 + x2 + + xN 

N 

och vi skall närmast undersöka vilka egenskaper denna storhet har. 

Balanseringspunkt 

Antag att vi har två lika vikter om v kg utplacerade på en homogen 

planka. Den första vikten be…nner sig på avståndet x1 från plankans 

vänstra ändpunkt och den andra på avståndet x2 från samma punkt. 

Hur kan vi nu bestämma den punkt (jämviktspunkt, balanseringspunkt) 

på plankan där de två vikternas inverkan tar ut varandra d v s där vi 

skall placera en bock för att erhålla balans. 

v 

(a) 

v1 

v2 

(c) 

x1 

x1 

x 

? 

x 

? 

x2 

x2 

v 

(b) 

v3 

v1 

v2 

(d) 

x 

? 

x1 x2 x3 

Figur 1.1: Balanseringspunkter i fyra olika typfall 

x1 

x 

? 

x2 

x3 

c Mikael Möller


Beteckna denna balanspunkt med x. Vi vet enligt fysikens lagar 

(eller om man så vill enligt lekparkens) att följande jämviktsekvation 

(…gur 1.1a) måste gälla 

(x x1) v = (x2 x) v. 

Ur denna ekvation är det lätt att lösa ut den sökta punkten, 

x = x1 + x2 

. 

2 

Men vi skall också skriva jämviktsekvationen på ett annat sätt nämligen 

(x1 x) v + (x2 x) v = 0 

ty denna form låter sig lätt generaliseras både till ett godtyckligt antal 

vikter och godtyckliga vikter. Antag först att vikterna är v1 och v2 

istället för v (…gur 1.1c). För att jämvikt skall gälla måste fortfarande 

(x x1) v1 = (x2 x) v2 , (x1 x) v1 + (x2 x) v2 = 0 

och ur denna ekvation erhålls 

x = v1x1 + v2x2 

. 

v1 + v2 

Antag nu att vi har tre lika vikter v på avstånden x1, x2 och x3 och 

söker jämviktspunkten för dessa tre vikter (…gur 1.1b). Vi konstaterar 

då först att de två första vikterna kan ersättas med vikten 2v i x2 (där 

vi lagt till index 2 i x för att markera två vikter). Därefter har vi ånyo 

två vikter men denna gång med vikterna 2v på avståndet x2 respektive 

v på avståndet x3. Detta ger jämviktsekvationen 

varur vi erhåller 

(x2 x3) 2v + (x3 x3) v = 0 

x3 = 2vx2 + vx3 

3v 

= v (x1 + x2) + vx3 

3v 

= x1 + x2 + x3 

. 

3 

Man övertygar sig lätt (?) om att jämviktsekvationen i detta senare fall 

kan skrivas 

(x1 x) v + (x2 x) v + (x3 x) v = 0. 

c Mikael Möller


Den allmäna jämviktsekvationen med tre olika vikter v1, v2 och v3 på 

avstånden x1, x2 och x3 blir analogt 

varur vi erhåller 

(x1 x3) v1 + (x2 x3) v2 + (x3 x3) v3 = 0 

x3 = v1x1 + v2x2 + v3x3 

v1 + v2 + v3 

= 

3X 

vi 

xi P3 i=1 j=1 vj 

Medelst ett enkelt induktionsbevis (se Introduktion till den ekonomiska 

matematiken) kan man nu visa (för dem som inte tror på sanningshalten) 

att det allmänt gäller 

nX 

vi 

xn = xi Pn i=1 j=1 vj 

= 

. 

nX 

i=1 

xipi 

för n olika vikter på olika avstånd. Den införda storheten pi kommer vi 

behandla utförligt längre fram. 

Storheten xn kallas det aritmetiska medelvärdet och för specialfallet 

vi = v erhålls, som ett specialfall, den storhet som vanligtvis 

förknippas med A (x), det aritmetiska medelvärdet baserat på n mätvärden. 

Tre egenskaper 

Funktionen A (X) har tre viktiga egenskaper som alla synes vara självklara 

men som inte desto mindre är av stor betydelse. För den vidare 

framställningen behöver vi 

De…nition 2 Med X avses följden av tal fx1; x2; : : : ; xN g = fxig N 

i=1 . 

Vi skriver nu 

X 0 när alla Xi 0. 

X = 1 när alla Xi = 1. 

Den första egenskapen hos funktionen A (X) kan nu skrivas: 1) om 

X 0 så gäller att A (X) 0. Trivialt sant ty summerar man positiva 

tal så blir summan positiv. Den andra egenskapen är 2) om X1 och X2 

är två stokastiska variabler och c1 och c2 är två rella tal så gäller att 

A (c1X1 + c2X2) = c1A (X1) + c2A (X2) . 

c Mikael Möller

10 1.3. Tre typer av avvikelser 

Tänk bara på en portfölj som består av två aktier. Oavsett om vi betraktar 

protföljen som helhet eller varje aktie för sig så skall ju slutresultatet 

bli detsamma. Den tredje och sista egenskapen är 3) Om X = 1 så gäller 

att A (1) = 1. Sätt Xi = 1 i uttrycket för A (X) varvid påståendet följer 

direkt. 

Funktionen A (X) kallas inom matematiken, en normaliserad linjär 

operator och till dessa har vi anledning att återkomma många 

gånger. Vidare noterar vi att alla resonemang går igenom även om utfallsrummet 

är oändligt. 

Ofta har vi inte tillgång till hela utfallsrummet utan endast en del av 

det, säg n värden, d v s vi har ett urval. Vi kan då inte beräkna A (X) 

men väl A (x) där 

Här gäller för subindex Ii att 

x = fxIi gn 

i=1 . 

Ii = 1 om det i:e värdet i X är med i urvalet, 

0 annars. 

Detta senare värde A (x) används sedan som en approximation av det 

förra A (X). Det gäller naturligtvis att för olika urval x erhålls olika 

värden på A (x) och dessa är med säkerhet skilda från det sanna värdet 

A (X). Då uppstår två naturliga frågor: 1) hur utspridda är de olika 

värdena på A (x) och 2) hur nära kan A (x) tänkas vara det sanna värdet 

A (X). 

1.3 Tre typer av avvikelser 

Under denna rubrik kommer vi uteslutande betrakta det aritmetiska medelvärdet 

och lämnar de två andra medelvärdena median och typvärde åt 

sitt öde. I och med detta kan vi också kalla det aritmetiska medelvärdet 

för medelvärdet kort och gott. 

Medelvärdet ger oss en balanseringspunkt för vikter på en planka. 

Denna bild förs nu enkelt över till ett två-dimensionellt koordinatsystem 

där vikterna symboliseras av pinnar, med olika höjd, utplacerade på xaxeln. 

Pinne nummer i be…nner sig på avstånd xi från origo (Detta har 

vi egentligen redan gjort i …gur 1.1). För att vara helt generella från 

början räknar vi avstånd med tecken. Om vi nu normerar pinnarnas 

sammanlagda höjd, pi, till 1 d v s så att PN till att jag införde beteckningen pi för 

c Mikael Möller 

vi 

P N 

j=1 vj 

i=1 pi = 1 så ser vi ett skäl 

(p för ’normerad pinne’)


ovan ty för vikterna gäller att 

NX 

i=1 

vi 

P N 

j=1 vj 

= 

P N 

i=1 vi 

P N 

j=1 vj 

= 1. 

De…nition 3 (Aritmetiskt medelvärde) Med det aritmetiska medelvärdet 

förstås den storhet (operator) som beskrivs av uttrycket 

där pi = 

vi 

P N 

j=1 vj 

A (X) = 

och fxig N 

i=1 = X. 

NX 

i=1 

xipi 

Det är nu klart att två olika uppsättningar pinnar kan ha samma balanseringspunkt 

men till sin struktur vara helt olika. Vi skall därför 

införa tre olika mått (varians, skevhet och toppighet), som beskriver tre 

ytterligare egenskaper, för en uppsättning pinnar. 

1.3.1 Varians –standardavvikelse 

I nedanstående …gur ser vi dels två lika stora pinnar nära varandra och 

dels samma pinnar långt ifrån varandra (pinnen i mitten är inte en pinne 

utan en pil –y-axeln). 

(a) 

x1 = 1 x2 = +1 

x1 = 100 x2 = +100 

(b) 

Figur 1.2: Variansen i två olika typfall 

Vi …nner lätt de två …gurernas medelvärden till 

x1 = 

2X 

i=1 

xipi = x1 + x2 

2 

respektive x2 = 

4X 

i=3 

xipi = x3 + x4 

2 

c Mikael Möller


och dessa medelvärden hamnar båda mittemellan de två positionerna, x1 

och x2 respektive x3 och x4, men ändock ger …gurerna helt olika intryck. 

Ett mått som mäter detta intryck är variansen (standardavvikelse) som 

för dessa två fall de…nieras av 

2 

1 = 

2X 

i=1 

(xi x1) 2 pi respektive 

2 

2 = 

4X 

(xi x2) 2 pi. 

För att övertyga oss om att variansen är ett mått på den visuella skillnaden 

i …gurerna 1.2a och 1.2b beräknar vi varianserna för de storheter 

som ingår i respektive …gur (med de angivna valen blir x1 = 0 och x2 = 0) 

och erhåller 

2 

1 = 

2 

2 = 

2X 

i=1 

4X 

i=3 

(xi) 2 1 

2 = ( 1)2 + (1) 2 

= 1 

2 

i=3 

(xi) 2 1 

2 = ( 100)2 + (100) 2 

= 10 000 

2 

En tydligare skillnad än den mellan 1 och 10 000, kan vi inte önska oss. 

För att få samma sort som för medelvärdet brukar man dra roten ur 

variansen och får då standardavvikelsen. Man erhåller vårt exempels 

standardavvikelser till 1 respektive 100. 

Allmänt gör vi följande de…nition 

De…nition 4 (Varians) Variansen för den stokastiska variabeln X med 

utfallsrummet X, med N element, de…nieras av 

där X = A (X). 

2 = 

NX 

i=1 

xi X 2 pi 

Med den ovan införda linjära operatorn A (X) kan variansen även skrivas 

3 

2 = A X X 2 = A X X 2 

och vi …nner följande identitet 

A X X 2 = A X 2 

= A X 2 

2XX + X 2 = A X 2 

A 2 (X) 

3 Det är lite otympligt att skriva A (X c) 2 

2XA (X) + X 2 A (1) 

så det …nns en oskriven överenskom- 

melse att man istället skriver A (X c) 2 vidare skriver man A 2 (X) för att beteckna 

A (X) A (X). 

c Mikael Möller


ty A (X) = X. 

1.3.2 Skevhet 

Nästa steg är att beskriva begreppet skevhet och i …gur 1.3 sid 13 är 

a) skev åt vänster, b) symmetrisk och c) skev åt höger. 

1 

3 

(a) 

p 

1 2 9 

1 

3 

(c) 

p 

1 

3 

(b) 

p 

1 2 9 

3 4 5 

Figur 1.3: Skevheten i tre olika typfall 

Liksom ovan betraktar vi avståndet till medelvärdet och den allmäna 

de…nitionen av skevhet i utfallsrummet X är talet A X X 3 . För 

detta tal kan vi visa följande identitet 

A X X 3 = A X 3 

= A X 3 

För alla tre …gurer ovan gäller att pi = 1 

3 

tre fallen i …gur 1.3 till: 

3XA X 2 + 3X 2 A (X) X 3 

3XA X 2 + 2X 3 . 

. Vi …nner nu skevheten i de 

c Mikael Möller


a) x1 = 1, x2 = 2 och x3 = 9 vilket ger x = 4 och skevhetens värde 

blir 

(1 4) 3 1 

3 + (2 4)3 1 

3 + (9 4)3 1 

= 30, 

3 

b) x1 = 3, x2 = 4 och x3 = 5 vilket ger x = 4 och skevhetens värde 

blir 

(3 4) 3 1 

3 + (4 4)3 1 

3 + (5 4)3 1 

= 0, 

3 

c) x1 = 1, x2 = 8 och x3 = 9 vilket ger x = 6 och skevhetens värde 

blir 

(1 6) 3 1 

3 + (8 6)3 1 

3 + (9 6)3 1 

= 30. 

3 

Det gäller således att om den största tyngden …nns till vänster om 

medelvärdet så erhåller vi en positiv skevhet, om tyngden är jämnt utspridd, 

d v s vi har symmetri, så erhåller vi skevheten 0 och slutligen om 

den största delen av tyngden ligger till höger om medelvärdet så har vi 

en negativ skevhet. 

För att få en dimensionslös storhet på skevheten används vanligen 

följande de…nition på skevhet: 

De…nition 5 (Skevhet) Skevheten för den stokastiska variabeln X med 

utfallsrummet X, med N element, de…nieras av 

1.3.3 Toppighet 

3 

A X X 

1 = . 

Sista steget är att beskriva begreppet toppighet och om vi fortsätter 

på den inslagna vägen med högre potenser så de…nerar vi toppigheten i 

utfallsrummet X som talet A X X 4 . 

För toppigheten gäller följande identitet 

A X X 4 = A X 4 

= A X 4 

3 

4XA X 3 + 6X 2 A X 2 

4XA X 3 + 6X 2 A X 2 

4X 3 A (X) + X 4 

3X 4 . 

För alla fyra del…gurer i …gur 1.4 sid 15 gäller att x1 = 1; x2 = 2 och 

x3 = 3 vilket, tillsammans med värdena på p1, p2 och p3, ger x = 2 i 

samtliga fall. Vi …nner nu toppigheten i de fyra fallen till: 

c Mikael Möller


6 

8 

1 

8 

(a) 

1 

3 

(c) 

p 

p 

1 2 3 

1 2 3 

2 

4 

1 

4 

(b) 

2 

5 

1 

5 

(d) 

p 

p 

1 2 3 

1 2 3 

Figur 1.4: Toppigheten för fyra olika typfall 

a) p1 = 1 

8 , p2 = 3 

4 och p3 = 1 

8 

ger värdet 

(1 2) 4 1 

8 + (2 2)4 3 

4 + (3 2)4 1 

= 0:25, 

8 

b) p1 = 1 

4 , p2 = 2 

4 och p3 = 1 

4 

ger värdet 

(1 2) 4 1 

4 + (2 2)4 1 

8 + (3 2)4 1 

= 0:5, 

4 

c) p1 = 1 

3 , p2 = 1 

3 och p3 = 1 

3 

ger värdet4 

(1 2) 4 1 

3 + (2 2)4 1 

3 + (3 2)4 1 

= 0:666, 

3 

d) p1 = 3 

8 , p2 = 2 

8 och p3 = 3 

8 

ger värdet 

(1 2) 4 3 

8 + (2 2)4 2 

8 + (3 2)4 3 

= 0:75. 

8 

4 ett streck över talet, som i 6, betyder att 6 skall upprepas i all oändlighet. 

c Mikael Möller

16 1.4. Tre typer av gram 

Figur a) ger ett spetsigare intryck än …gur b) och har även ett mindre 

värde på toppigheten. Figur b) är i sin tur spetsigare än …gur c) som i 

sin tur är spetsigare än d) (som är urgröpt) och vi får hela tiden störra 

värden. Toppighet mäter således en …gurs spetsighet. 

För att få en dimensionslös storhet på toppigheten används vanligen 

följande de…nition på toppighet 

De…nition 6 (Toppighet) Toppigheten för den stokastiska variabeln 

X med utfallsrummet X, med N element, de…nieras av 

4 

A X X 

2 = 

där trean inte kan förklaras på nuvarande stadium (egentligen är den helt 

onödig) utan vi får återkomma till den längre fram. 

1.4 Tre typer av gram 

Vi skall nu undersöka den information som …nns i pi:na i operatorn 

A (X). Låt oss göra det utifrån exemplet med 100 dagars slutkurser i 

aktien Rörvik Timber B (period 0102-0601 år 2006). För denna har vi 

modellen 

X3 = Rörvik Timber B, slutkurs mätt i 10-ören. 

där utfallsrummet är en uppräkning av de kurser som faktiskt noterats 

(X) = f16:8; 16:9; 17:1; 17:2; 17:3; 17:4; 17:5; 17:8; 17:9; 21:8; 22; : : : ; 

4 

22:2; 22:4; 22:5; 22:6; 23:5; 23:6; 23:7; 23:8; 23:9; 24; 24:4; 24:5g 

Slutkurserna i tidsordning kan ses i tabellen nedan (vilken skall läsas 

från vänster till höger, uppifrån och ned) 

1.4.1 Stolpdiagram och kumulerat stolpdiagram 

Om vi beräknar medelvärdet av dessa slutkurser så erhålls 

A (X) = x1 + x2 + + x100 

100 

3 

= 20:869. 

Nu är det väl inte så intelligent att räkna ut medelvärdet av aktiekurser 5 

men i detta läge är vi ute efter något annat. Vi vet nämligen också att 

5 Aktiekurser vandrar och man är mer intresserad av vart de är på väg. 

c Mikael Möller


Tabell 1.1: Slutkurser Rörvik Timber B, 2006-01-02–2006-05-29 

18:0 17:3 18:0 17:5 17:3 17:2 17:1 16:8 17:1 17:1 

16:9 17:4 17:2 17:1 17:3 17:2 17:8 17:5 18:7 18:4 

18:0 18:2 17:9 19:5 19:3 19:4 20:8 20:7 21:2 21:3 

21:2 21:0 20:6 20:9 21:3 21:3 20:8 22:4 22:2 22:5 

21:8 20:7 20:5 20:7 21 21:2 20:5 20:1 20:3 20:0 

20:6 20:8 20:6 21:1 21:3 21:1 20:7 20:5 21:0 21:8 

21:3 21:5 21:8 21:3 20:9 20:5 20:5 21:3 22:4 22:4 

22:4 22:6 22:8 23:0 23:1 24:0 23:5 23:8 23:9 23:6 

23:6 23:0 22:0 22:4 22:9 23:0 24:0 23:7 24:0 24:4 

24:5 23:5 23:8 22:7 23:0 21:2 22:7 23:0 24:0 23:2 

vårt medelvärde kan skrivas 

X100 

A (X) = 

vi 

xi PN i=1 j=1 vj 

X100 

= 

i=1 

xipi 

där talen vi står för vikter. Genom att sortera ovanstående slutkurser i 

stigande ordning och därefter räkna antalet gånger en kurs inträ¤ar kan 

vi bilda paren (xi; vi) och medelst ett stolpdiagram beskriva hur ofta 

t ex kursen 18 förekommer. Vi ser i …gur 1.5 att detta värde förekommer 

precis 3 gånger. Detta betyder att att värdet 18 förekommer 3 gånger 

bland de 100 värdena d v s att chansen för att få 18 vid lottdragning 

bland de 100 slutkurserna är 3 på 100 eller som vi också säger 3%. Nu 

kan vi resonera på samma sätt för vart och ett av de i (X) ingående 

talen och erhåller då en följd av procentsi¤ror: p1 = 1%, p2 = 1%, 

p3 = 4%, o s v speciellt ser vi att p28 = 7%. 

Om vi nu istället för Antal på y-axeln inför Procent, eller helt enkelt 

bara talet p, så erhåller vi vad vi skall kalla det relativa stolpdiagrammet 

och det är detta diagram som kommer att användas framöver. Givet 

detta diagram kan vi snabbt utläsa påståenden av typen 

Sannolikheten för att X3 = 20:9 är 0:02. 6 

Vi ritar inte om det relativa stolpdiagrammet utan nöjer oss med att 

konstatera att de ändringar som behöver göras är att byta ut si¤rorna 

på y-axeln (t ex 7 ! 0:7) samt skriva p istället för Antal. 

Ett annat viktigt diagram som i sig innehåller materialet till ett 

mycket viktigt verktyg, som vi har anledning att återkomma till längre 

0:02. 

6 I matematiken lär vi oss att procent kan skrivas som hundradelar d v s att 2% = 

c Mikael Möller


Antal 

7 

6 

5 

4 

3 

2 

1 

17 18 19 20 21 22 23 24 25 

Rörvik 

Timber 

Figur 1.5: Stolpdiagram över slutkurser i Rörvik Timber B, 

period 2006-01-02–2006-05-29 

fram, är det relativa kumulerade stolpdiagrammet. Detta diagram 

bestäms av punkterna 

nX 

! 

xn; ; n = 1; 2; 3; : : : ; 100. 

i=1 

xipi 

Vi skriver inte upp dess matematiska de…nition, som bara blir krånglig, 

utan nöjer oss med …gur 1.6. 

1.0 

0.8 

0.6 

0.4 

0.2 

p 

17 18 19 20 21 22 23 24 25 

Rörvik 

Timber 

Figur 1.6: Kumulerat stolpdiagram över slutkurser i Rörvik Timber B, 

period 2006-01-02–2006-05-29 

Observera att det kumulativa relativa stolpdiagrammet alltid är växande 

och går från 0 till 1. 

c Mikael Möller


Exempel 1 (SQL-anrop) Till en resebyrås databasserver inkommer 

SQL-anrop och den dataansvarige har under dagens brådaste timme noterat 

hur många anrop som anländer varje minut (och varje anrops 

svarstid) och därvid erhållit bland annat följande tabell över anropen 

3 5 7 7 8 6 12 8 7 4 2 9 

4 9 3 9 8 9 9 5 10 5 9 2 

4 6 6 5 4 7 5 7 6 8 5 5 

6 5 8 5 2 2 2 6 7 2 5 8 

6 4 4 7 9 7 6 6 4 2 5 8 

Materialet är tänkt att användas för att söka svar på frågor som: Klarar 

servern alltid av att besvara frågorna inom rimlig tid? Hur stor andel av 

tiden har servern inga frågor att besvara? Finns det risk för att servern 

kan bli överbelastad, så att svarstiderna blir orimliga, och i så fall hur 

stor är denna risk? Vi har ännu inte alla de verktyg som behövs för 

att kunna besvara dylika frågor men för en första analys kan vi alltid 

uttnyttja de vi har. Till att börja med beräknar vi de fyra måtten 

x s 2 g1 g2 

Medelvärde Varians Skevhet Toppighet 

5:90 5:41 0:08 0:39 

Vidare …nner vi materialets relativa stolpdiagram och relativa kumulerade 

stolpdiagram –se …gur 1.7a och 1.7b. 

0 .2 

0 .1 

p 

1 2 3 4 5 6 7 8 9 1 0 1 1 1 2 

(a) Stolpdiagram 

A n r o p 

1 .0 

0 .8 

0 .6 

0 .4 

0 .2 

p 

1 2 3 4 5 6 7 8 9 1 0 1 1 1 2 

(b) Kumulerat stolpdiagram 

Figur 1.7: SQL-anrop till en server 

1.4.2 Histogram och kumulerat histogram 

A n r o p 

Hitills har vi betraktat de möjliga slutkurserna för Rörvik Timber B 

som varande ett ändligt antal men en stunds eftertanke ger att detta 

c Mikael Möller


utfallsrum bara är en approximation av alla de möjligheter som …nns. 

Det skulle därför inte vara helt fel att för Rörvik Timber B tänka sig ett 

utfallsrum av typen 

X = fx j 16:8 x 24:5g . 

Detta utfallsrum består då av oändligt många punkter och idén med 

stolpdiagram fungerar inte längre. Vad vi då kan göra är att fösa ihop 

alla observationer i ett intervall t ex kan vi notera antalet observationer 

mellan 16:8 x < 16:9, mellan 16:9 x < 17 o s v. Den uppmärksamme 

ser nu att vi i princip är tillbaks till stolpdiagrammet men nu från en 

annan utgångspunkt. Vidare är valet av intervall godtyckligt ty jag 

kunde lika gärna ha valt intervallen 16:8 x < 17, 17 x < 17:2 o s v 

eller varför inte olika intervalllängder 16:7 x < 17:3, 17:3 x < 17:7 

o s v. Alla varianter kan förekomma och vissa av dem är bättre på att 

avslöja inneboende strukturer hos data än andra. För att komma fram 

till en avslöjande intervallindelning …nns ingen annan metod än att göra 

intelligenta prövningar. 

Till varje indelning hör ett histogram och dess kumulerade histogram 

och vi skall för vår illustration välja indelningen 16 x < 17, 17 x < 

18 o s v –se …gur 1.8a och b. 

Exempel 2 (Skogsområde) Vid försäljning av ett skogsområde skall 

områdets värde i form av avverkningsbart timmer uppmätas. För att göra 

detta indelades området i ett rutnät om N rutor ur vilka 49 rutor togs 

slumpmässigt. I varje utvald ruta uppmättes därefter volymen timmer 

varvid följande avrundade värden, i något mått, erhölls 

0:7 0:9 1:0 1:3 1:9 2:7 3:2 

3:4 3:4 3:5 3:5 4:3 5:2 5:9 

6:0 6:3 6:5 6:6 7:1 7:4 7:6 

7:9 8:3 8:3 8:3 8:3 8:7 10:0 

10:0 10:3 12:0 13:4 14:1 14:8 16:7 

16:8 17:1 17:7 18:9 19:0 19:4 19:7 

24:3 26:2 26:2 28:3 31:7 39:3 44:8 

Analysera materialet och skatta den totala mängden timmer i skogsområdet. 

Data är de…nierat på ett sådant sätt, volymmått, att det kan 

betraktas som kontinuerligt. De fyra måtten blir 


x s 2 g1 g2 

Medelvärde Varians Skevhet Toppighet 

12:0 100:0 1339:5 45121


0.5 

0.4 

0.3 

0.2 

0.1 

p 

(a) Histogram 

1.0 

0.8 

0.6 

0.4 

0.2 

p 

17 18 19 20 21 22 23 24 25 

17 18 19 20 21 22 23 24 25 

(b) Kumulerat histogram 

Rörvik 

Timber 

Rörvik 

Timber 

Figur 1.8: Två typer av …gurer över slutkurser i Rörvik Timber, 

period 2006-01-02–2006-05-29 

Vi ser att standardavvikelsen (roten ur variansen) är stor jämfört med 

medelvärdet och det är därför av vikt att …nna data:s underliggande struktur. 

Skevheten säger oss att det mesta av data ligger till vänster om 

medelvärdet. Vårt nästa steg blir att rita några lämpliga histogram – se 

…gur 1.9 på sid 22. Observera att data självt informerar oss om att en 

symmetrisk fördelning inte kan föreligga. I det vänstra histogrammet har 

vi lika stor bas på alla rektanglar (vilket är olämpligt vid skeva fördelningar) 

och i det högra histogrammet gäller istället att varje rektangel 

har lika stor yta.Det vänstra diagrammet är förvisso skevt men alltför 

grovt för att ge en bra bild över data. I det högra diagrammet ger vi 

varje rektangel en lika stor yta och detta ger en bättre bild över hur data 

fördelar sig på ytor med lite respektive mycket timmer. De två första 

diagrammen bekräftar således den skevhet som anges av talet g1. Vårt 

nästa steg blir att pröva med en …nare indelning som tar hänsyn till att 

det …nns mer data i början. Därvid erhålls digram (c) som, av ännu ej 

diskuterade skäl, ger en bra beskrivning av data. 

c Mikael Möller


0.06 

0.05 

0.04 

0.03 

0.02 

0.01 

0.00 

5 10 15 20 25 30 35 40 45 

(a) Lika intervall, total yta=1 


0.06 

0.05 

0.04 

0.03 

0.02 

0.01 

0.00 

0 10 20 30 40 50 

(c) Olika intervall, total yta=1 

0.07 

0.06 

0.05 

0.04 

0.03 

0.02 

0.01 

0.00 

5 10 15 20 25 30 35 40 45 

(b) Lika ytor, total yta=1 

Figur 1.9: Försäljning av ett markområde

2. Stokastiska variabler, 

väntevärden och 

sannolikheter 

I avsnittet om Vad statistik handlar om infördes en mängd nya begrepp 

på intuitiv grund och vi skall nu ägna ett par kapitel åt att formalisera 

och exakt de…niera vad vi menar med begrepp som stokastisk 

variabel, väntevärde (synonym till vårt aritmetiska medelvärde), sannolikhet 

(våra pinnar) och fördelningsfunktion (våra diagram). Observera 

att om man inte är noggrann inom statistik så kan man bevisa vad som 

helst t ex att gud …nns eller att medlemmarna i Stockholms Kooperativa 

Hyresförening vill ha höga hyror och många andra tokigheter. I detta 

kapitel börjar vi med att diskutera begreppet stokastisk variabel. 

2.1 Diskret och kontinuerlig 

Trot det eller ej men en stokastisk variabel är faktiskt en funktion så 

egentligen verkar benämningen variabel helt korkad. Men för er som 

läst lite matematik och speciellt då funktionslära vet att man kan skapa 

en funktion av en funktion och då är den ena funktionen en variabel till 

den andra (i matematisk formalism blir det att funktionerna f(x) och 

g(x) båda med variabeln x ger upphov till funktionen f(g(x)) och g(x) 

som faktiskt är en funktion blir en variabel till f(x)). För att erhålla en 

intuitiv förståelse för detta tänker vi på situationen kast med en tärning 

där vi intresserar oss för antalet prickar som kommer upp d v s vi bildar 

den stokastiska variabeln 

X = antal prickar som erhålls vid kast med en tärning. 

Vad vi oftast tänker på i denna situation är antalet prickar men det 

egentliga utfallsrummet innehåller sådana händelser som att tärningen 

hamnar på kanten eller hörnet. Även hur tärningen är vriden i förhållande 

till något godtyckligt koordinatsystem kommer in. Vår hjärna 

applicerar dock en funktion som bortser från dessa möjligheter, den …lterar 

bort dem, och det enda som återstår är "antalet prickar". En mer 

23

24 2.1. Diskret och kontinuerlig 

korrekt beskrivning av vår variabel X är därför 

X (!) = antal prickar som erhålls vid kast med en tärning. 

för alla ! i mängden av alla möjliga utfall. 

Detta ger oss nu en anledning att ta upp skillnaden mellan utfallsrummen 

och X. Med utfallsrummet menar vi de…nitionsmängden 

till den stokastiska variabeln X och med X avses X:s värdemängd. 

Om t ex = f!1; !2; : : :g så blir X = fX (!1) ; X (!2) ; : : :g och om 

är uppräkneligt så blir också X det. Vidare …nns inget slumpmässigt 

i talet X (!k) och vi betcknar det därför med xk och har därför att 

X = fx1; x2; : : :g. Observera att mycket väl kan vara större än X 

ty det kan t ex gälla att X (!i) = X (!j). Om vi t ex intresserar oss 

för familjer så består dessa ofta av ‡er än en person men varje person 

i familjen är en representant för familjen. Detta resonemang är även 

giltigt för icke-uppräkneliga utfallsrum t ex kan sex, vid kast med tärning, 

komma upp på ett oändligt antal sätt om man beaktar vridningar i 

förhållande till något …xerat koordinatsystem. 

Stokastiska variabler delar naturligt in sig i två grupper – dels de 

som är diskreta och dels de som är kontinuerliga. 1 Vårt nästa steg är 

att de…niera vad vi menar med de två orden diskret och kontinuerlig och 

för att de…niera dem använder vi oss av utfallsrummets struktur. 

Om utfallsrummet för den stokastiska variabeln X kan skrivas 

X = fxi j i 2 N \ Bg 

där N är de naturliga talen (de positiva heltalen) d v s 1; 2; 3; : : : och B 

någon form av begränsning säges utfallsrummet vara diskret (uppräkneligt). 

Till denna typ av utfallsrum hör mängden av de naturliga talen, 

de hela talen, de rationella talen och många ‡er mängder. Mängderna 

behöver inte ens bestå av tal utan kan vara alla pilsnerkorvar i ett snabbköp. 

Det enda kravet är att elementen (talen, pilsnerkorvarna m m) 

i vårt utfallsrum inte får vara ‡er än de naturliga talen (märkligt men 

sannt men de hela talen är lika många som den naturliga talen). 

Med en diskret stokastisk variabel avses sålunda den funktion som har 

ett diskret utfallsrum (X). 2 Med begränsningen B = f1; 2; 3; 4; 5; 6g 

svarar vårt (X) ovan de…nitivt mot en diskret stokastisk variabel. 

Om utfallsrummet kan skrivas 

X = fx j x 2 R \ Bg 

1 Detta är vid en noggrannare analys inte helt korrekt men synsättet duger mer 

än väl. 

2 I löpande text skriver vi (X) och i formelområden X om vi nu överhuvudtaget 

bryr oss om att ange X. 

c Mikael Möller

2. Stokastiska variabler, väntevärden och sannolikheter 25 

där R är de reella talen och B någon form av begränsning säges utfallsrummet 

vara kontinuerligt (icke-uppräkneligt). Ett exempel på en 

stokastisk variabel som ger upphov till ett kontinuerligt utfallsrum är 

X = längden hos en homo sapiens. 

Här är en möjlig begränsning på längden 1 cm till 400 cm (även om 

längden 1 cm måste vara en kort rackare) ty längden måste vara positiv 

och människan kan inte bli hur lång som helst. Vi har således 

X = fx j x 2 R \ (1; 400)g 

där begränsningen B är intervallet 1 cm till 400 cm. Detta utfallsrum 

kan även skrivas 

X = fx j 1 x 400g 

och det behövs mycken eftertanke för att visa att punkterna i denna 

mängd ej är möjlig att räkna upp. Än mer märkligt är att antalet punkter 

i intervallet (1; 400) är lika många som antalet punkter i intervallet 

(0; 1). 3 

De…nition 7 En stokastisk variabel säges vara diskret om dess utfallsrum 

är uppräkneligt och kontinuerlig om dess utfallsrum är ickeuppräkneligt. 

2.2 Väntevärden 

I vår de…nition av A (X) utgick vi ifrån ett ändligt utfallsrum och kunde 

visa att funktionen A (X) uppfyller följande tre egenskaper 

1. Om X 0 ) A (X) 0 

2. Om X1 och X2 är två stokastiska variabler och c1; c2 2 R så gäller 

att 

A (c1X1 + c2X2) = c1A (X1) + c2A (X2) . 

3. A (1) = 1. 

Vi skall nu utvidga storheten A (X) till att gälla för godtyckliga 

diskreta (d v s även sådana med uppräkneligt oändliga utfallsrum) och 

kontinuerliga stokastiska variabler och vi gör detta axiomatiskt (med 

icke bevisbara påståenden som vi tror på) genom att stipulera att väntevärdet 

(ett generaliserat medelvärde, även kallat det förväntade värdet) 

E (X) är en storhet som uppfyller följande 

3 Beviset för detta påstående är dock helt elementärt bara man skapar rätt 

geometrisk bild. 

c Mikael Möller

26 2.2. Väntevärden 

Axiom 8 (Väntevärde) För en godtycklig stokastisk variabel X gäller 

1. Om X 0 ) E (X) 0. 

2. Om X1 och X2 är två stokastiska variabler och c1; c2 2 R så gäller 

att 

E (c1X1 + c2X2) = c1E (X1) + c2E (X2) . 

3. E (1) = 1. 

Detta betyder att även E (X) är en normaliserad positiv linjär operator 

(på samma sätt som A (X)). 

Eftersom vi nu tillåter oändliga utfallsrum behöver vi ytterligare ett 

"axiom" 

4. Givet stokastiska variabler fXig som växer monotont (Xi Xi+1) 

mot en …x gräns X då gäller för dessa stokastiska variabler att 

lim 

i!1 E (Xi) = E lim Xi = E (X) 

i!1 

d v s att vi kan låta symbolerna E och lim byta plats. 

Nu behövs egentligen inte detta fjärde axiom ty det går att visa att 

det, under vissa förutsättningar, gäller och därmed är det inte ett axiom 

utan ett bevisbart påstående. 

Axiomen ger oss direkt följande viktiga samband. 

Theorem 9 För väntevärdesoperatorn E har vi att 

1. för godtyckliga Xi 2 (X) och ci 2 R så gäller 

E 

nX 

! 

nX 

= ciE (Xi) . 

i=1 

ciXi 

i=1 

2. om X1 Y X2 så gäller E (X1) E (Y ) E (X2). 

Bevis 1 1) Axiom 2 och induktionsbevis ger påståendet. 2) Den första 

olikheten följer av axiom 1 och 2 eftersom 

varav det följer 

Y X1 0 ) E (Y X1) 0 ) E (Y ) E (X1) 0 

E (Y ) E (X1) . 

Den andra olikheten följer på samma sätt. 

c Mikael Möller


Ibland kan det inträ¤a att E (X1) = +1 och E (X2) = 1 så att 

E (X1 + X2) = +1 1. 

Detta är ett obestämt tal. Vi löser detta problem genom att helt enkelt 

inskränka oss till de variabler där detta inte kan inträ¤a (prata om 

gordisk lösning) genom att kräva att 

2.3 Sannolikhet 

E (jXj) < +1. 

Hitills har vi undvikit begreppet sannolikhet även om vi pratat om chans 

och ’pinnar’vilka båda i princip är synonyma med detta begrepp. Detta 

beror på att vi vill sätta den sannolikhet vi skall prata om på en objektiv 

och matematiskt formell grund. 

Låt vara ett utfallsrum och tag en delmängd A . 4 Bilda nu 

den stokastiska variabeln (en s k indikatorvariabel) 

IA (!) = 

1 ! 2 A 

0 ! =2 A 

som indikerar om ! …nns i mängden A eller ej. De…niera sedan sannolikheten 

för A genom relationen 

P (A) = E IA (!) . (2.1) 

Notera att P –sannolikheten –i sig är en funktion vars de…nitionsområde 

är alla (ja de viktigaste i varje fall) delmängder i utfallsrummet . 

En indikatorfunktion har ett par trevliga egenskaper. Om A och B 

är två delmängder i så ger …gur 2.1 på sid 28 och en stunds eftertanke 

att 

1. IA[B (!) = IA (!) + IB (!) om A och B är disjunkta, 

2. IA\B (!) = IA (!) IB (!). 

Dessa egenskaper låter sig lätt utvidgas, med hjälp av induktion, till att 

gälla för n disjunkta mängder. 

I följande exempel, baserat på ett diskret utfallsrum, skall ordet ’symmetri’tolkas 

som att ’ha identiska egenskaper’. 

4 Läsaren må se upp här därför att beteckningen A, nu och framledes, står för två 

olika saker. Sammanhanget avgör om vi betraktar en delmängd eller ett medelvärde. 

c Mikael Möller

28 2.3. Sannolikhet 

A B 

(a) Union A [ B 

A B 

(b) Snitt A \ B 

Figur 2.1: Illustration av union och snitt 

Exempel 3 Bilda den stokastiska variabeln 

X = antalet prickar vid kast med en symmetrisk tärning. 

Det gäller då att 

X = f1; 2; 3; 4; 5; 6g 

ty det är endast dessa tal vi intresserar oss för. Eftersom X kan delas 

upp i sex disjunkta delmängder 

X = f1g [ f2g [ f3g [ f4g [ f5g [ f6g 

erhålls med upprepad användning av 1. ovan och axiom 2 för väntevärdet 

att 

6X 

! 

P ( X) = E (I (!)) = E I X fig (!) 

= 

= 

6X 

E Ifig (!) = 

i=1 

6X 

pi. 

i=1 

i=1 

6X 

P (fig) 

Att tärningen är symmetrisk betyder att varje möjligt utfall har samma 

sannolikhet (identisk egenskap) d v s pi = p och detta tillsammans med 

axiom 3 för väntevärdet ger oss 


1 = E (I X (!)) = P ( X) = 

i=1 

6X 

pi = 

i=1 

6X 

p = 6p 

i=1


varför sannolikheten p erhålls till (förvånad?) 

p = 1 

6 . 

I detta exempel har vi att elementarmängden 5 ! är en av mängderna 

fig, för något i. Observera att det är skillnad på fig och i –den första 

storheten är en mängd och den andra ett tal. 

Detta gör att vi kan ställa och besvara frågor av typen ’vad är sannolikheten 

att få mer än tre prickar vid kast med en symmetrisk tärning’. 


X = antal prickar vid kast med en symmetrisk tärning 

där X = f1; 2; 3; 4; 5; 6g. Vi har nu att den efterfrågade sannolikheten 

kan skrivas 

P (X > 3) = P (f4g [ f5g [ f6g) 

6X 

! 

= E Ifig (!) 

= 

i=4 

6X 

E Ifig (!) 

i=4 

= P (f4g) + P (f5g) + P (f6g) 

= 3 

= 0:5. 

6 

Nåväl, inte orkar man skriva hela uppsatser för de enklaste problem så 

istället skriver man kortare 

P (X > 3) = 

gynnsamma utfall för fX > 3g 

möjliga utfall 

= 3 

6 . 

Med hjälp av de fyra axiomen, för väntevärdet, kan vi nu generellt 

ange sannolikheterna för alla delmängder A, på det diskreta utfallsrummet 

= f!kg k2N , till 

P (A) = E IA (!) = X 

!k2A 

P (!k) . (2.2) 

5 En av de minsta möjliga delmängderna d v s den innehåller ingen annan delmängd 

än sig själv. 

c Mikael Möller

30 2.3. Sannolikhet 

Sannolikheten pk = P (!k) är sannolikheten för en av de ömsesidigt uteslutande 

händelserna (kallade elementarhändelser 6 , t ex att få en sexa) 

och denna sannolikhet kan vara godtycklig så länge som axiomen ovan 

är uppfyllda d v s den behöver inte anta ett och samma värde för alla k. 

Ovanstående ger oss följande alternativa, komplementära, sätt att 

beräkna sannolikheter som vi kommer ha stor nytta av framöver. 

Theorem 10 För varje utfallsrum 

= f!1; !2; : : : ; !Ng 

där de tillhörande sannolikheterna p1; p2; : : : ; pN alla är rationella tal så 

gäller för en godycklig delmängd A i att 

P (A) = 

gynnsamma utfall för A 


Bevis 2 Vi kan i ett första steg betrakta utfallsrummet 

0 = !1; f!2; : : : ; !Ng = f!1; ! 0 2g 

med sannolikheterna p1 och p 0 2. Det gäller nu att kvoten 

p1 

p0 2 

är ett rationellt tal och det …nns därför tal k och l sådana att i utfallsrummet 

00 

= f!11; : : : ; !1k; ! 0 21; : : : ; ! 0 2lg , 

där !11 = = !1k och ! 0 21 = = ! 0 2l , har alla elementarhändelser 

samma sannolikheter – p00 = 1 

k+l . Sålunda inses att varje utfallsrum 

= f!1; !2; : : : ; !Ng kan utvidgas till ett nytt och större utfallsrum 0 = 

f! 0 1; ! 0 2; : : : ; ! 0 N 0g där varje elementarhändelse har samma sannolikhet 

p = 1 

N 0 . Det gäller därför att 

P (A) = X 

E I (! 0 i) = X 

p = 

= gynnsamma utfall för A 

i2A 

i2A 


antal elemtarhändelser i A 

N 0 

6 Händelse och mängd är synonyma ord för samma sak. Händelse är vardagsspråk 

och mängd matematikspråk. 

c Mikael Möller


Låt nu X vara en godtycklig stokastisk variabel på utfallsrummet 

och If!kg (!) vara indikatorfunktionen för elementarhändelsen !k. Observera 

att X är en funktion på utfallsrummet varav följer att uttrycket 

X (!) = X 

I (!k) X (!k) för ! 2 

!k2 

är välde…nierat för diskreta utfallsrum. Om vi nu använder förväntningsoperatorn 

E på detta uttryck så erhålls 

E X (!) = X 

E If!kg (!) X (!k) = X 

E If!kg (!) X (!k) 

!k2 

= X 

!k2 

X (!k) pk 

ty X (!k) är ett …xt reellt tal. Detta innebär att vi nu har en metod för 

att räkna ut väntevärdet för en diskret stokastisk variabel om vi känner 

till de enskilda sannolikheterna pk. 


!k2 

X = antal prickar vid kast med en symmetrisk tärning 

där X = f1; 2; 3; 4; 5; 6g. För denna variabel gäller att 

pk = P (X = k) = 1 

6 ; k 2 X 

och vi …nner det förväntade antalet prickar till 

E (X) = 

6X 

x 

x=1 

1 

= 3:5. 

6 

Ett resultat som vi intuitivt känner för ty det är inget annat än balanseringspunkten 

för talen 1; 2; 3; 4; 5; 6 – alla med lika sannolikhet (vikt). 

Vi har nu ett uttryck för sannolikheten av en mängd A i ett diskret 

utfallsrum men vi saknar motsvarande uttryck för de kontinuerliga 

utfallsrummen. När det gäller diskreta utfallsrum så är dessa hanterbara 

på en elementär nivå ty vi kan alla räkna 1; 2; 3; : : : och det är allt som 

behövs. Men de kontinuerliga utfallsrummen skapar problem av en helt 

annan dimension (vi behöver t ex måtteori – en av många grenar på 

matematikens träd) och vi skall därför nöja oss med att de…niera denna 

sannolikhet. 

c Mikael Möller

32 2.4. Mera om sannolikheter 

De…nition 11 Låt A där är ett kontinuerligt utfallsrum. Det 

…nns då en funktion f sådan att 

Z 

P (A) = E IA (!) = f (!) d!. (2.3) 

Funktionen f kallas täthetsfunktion. 

Nu säger den matematiska teorin att integraler uppfyller axiom 1 och 2 

(de är linjära operatorer). Axiom 3 begränsar valet av möjliga funktioner 

f och man kan bevisa "axiom 4" med ytterligare begränsningar på f. 

Detta är dock knepigt. 

2.4 Mera om sannolikheter 

Vi skall nu titta på en del kända satser, som vi kommer ha stor användning 

av framöver, vilka gäller oavsett om vi har ett diskret eller 

kontinuerligt utfallsrum. I det följande utgår vi ifrån ett utfallsrum 

och tre delmängder i detta: A, B och C d v s A; B; C . Till varje 

delmängd hör dess komplementmängd, som också är en delmängd i , 

och denna tecknas med tecknet { framför mängdsymbolen, t ex tecknas 

komplementmängden till A som {A och dessa två mängder har egenskapen 

att de uttömmer d v s att de tillsammans ger hela 

A [ {A = . 

Vår framställningen kommer att vara helt algebraisk men på sid 35 …nns 

de …gurer som brukar användas för en geometrisk framställning av bevisen. 

Vår första sats handlar om komplementet: 

Theorem 12 (Komplementsatsen) Om det gäller att A [ {A = så 

gäller P {A = 1 P (A). 

Bevis 3 Det …nns en stokastisk variabel (indikatorvariabel) sådan att 

och för denna gäller att 


IA (!) = 

A 

1 ! 2 A 

0 ! =2 A 

P (A) = E IA (!) .


Nu gäller, som man lätt övertygar sig om, att 

I (!) = I A[{A (!) = IA (!) + I {A (!) 

ty A och {A har per de…nition inget gemensamt och eftersom 

följer påståendet omedelbart. 

P ( ) = E I (!) = 1 

Om vi som specialfall tar A = så erhålls att 

P { = 1 P ( ) = 0. 

För komplementet till inför vi den speciella mängdsymbolen ; = { 

och detta är en mängd som inte innehåller någonting, den är tom och 

kallas därför för den tomma mängden. För den tomma mängden gäller 

P (;) = 0 och för våra två mängder A och {A gäller 

A \ {A = ;. 

Om det gäller för två mängder A och B att A \ B = ; säger vi att 

mängderna är disjunkta. 

Den andra satsen studerar unioner av mängder: 

Theorem 13 (Additionssatsen) Om det gäller att A; B så gäller 

att P (A [ B) = P (A) + P (B) P (A \ B). 

Bevis 4 Vi kan antingen angripa problemet direkt eller utnyttja Komplementsatsen. 

Det direkta angrepssättet konstaterar att det …nns två indikatorvariabler 

IA (!) och IB (!) sådana att 

varav följer att 

IA[B (!) = IA (!) + IB (!) IA (!) IB (!) 

= IA (!) + IB (!) IA\B (!) 

E (IA[B (!)) = E (IA (!)) + E (IB (!)) E (IA\B (!)) 

vilket är ekvivalent med påståendet att 

P (A [ B) = P (A) + P (B) P (A \ B) . 

Detta sätt är ej enkelt att generalisera till unioner av ‡era mängder. 

c Mikael Möller

34 2.4. Mera om sannolikheter 

Det indirekta angrepssättet konstater att enligt Komplementsatsen 

gäller 

Härav följer att 

Resten är som ovan. 

1 IA[B (!) = I {(A[B) (!) = I {A\{B (!) 

= I {A (!) I {B (!) 

= 1 IA (!) 1 IB (!) . 

IA[B (!) = 1 1 IA (!) 1 IB (!) 

= IA (!) + IB (!) IA\B (!) . 

I det specialfall då mängderna A och B inte har en enda gemensam 

punkt måste det gälla att 

P (A \ B) = E IA\B (!) = E (0) = E (0 1) = 0 E (1) = 0 

och vi har då den speciella additionssatsen 

P (A [ B) = P (A) + P (B) . 

Det indirekta angreppssättet är enkelt att generalisera till en union 

av ett godtyckligt antal mängder och vi illustrerar nedan med unionen 

av tre mängder A, B och C. För dessa erhålls (för att inte tynga texten 

skriver vi inte ut variabeln (!)) liksom ovan att 

och härav följer att 

varför 

1 IA[B[C = (1 IA) (1 IB) (1 IC) 

IA[B[C = 1 (1 IA) (1 IB) (1 IC) 

= IA + IB + IC IA\B IA\C IB\C + IA\B\C 

P (A [ B [ C) = P (A) + P (B) + P (C) 

P (A \ B) P (A \ C) P (B \ C) 

+ P (A \ B \ C) . 

Att generalisera detta till ett godtyckligt antal mängder är med denna 

metod en trivialitet –ren algebra. 

Vår tredje sats studerar skillnaden mellan två mängder: 

c Mikael Möller


Theorem 14 (Di¤erenssatsen) Om det gäller att A; B så gäller 

att 

P (A n B) = P (A) P (A \ B) . 7 

Bevis 5 Av additionssatsen följer att 

P (A) = P (A n B) [ (A \ B) = P (A n B) + P (A \ B) 

varav påståendet följer. 

A B 

(a) Union A [ B 

A 

(c) Komplement {A 

{A 

A B 

(b) Snitt A \ B 

A B 

(d) Di¤erens A n B 

Figur 2.2: Illustration av union och snitt 

2.5 Betingade sannolikheter 

Mycket ofta har man en del förhandskunskap om den situation man betraktar. 

Denna kunskap kan utnyttjas för att beräkna den sannolikhet 

7 Tecknet n skall läsas ’tag bort alla elementarhändelser i A som också …nns i B’ 

eller kort och gott ’A minus B’. 

c Mikael Möller

36 2.5. Betingade sannolikheter 

man söker. Ett mycket enkelt exempel är att fråga sig vad är sannolikheten 

för att få en sexa, vid kast med en symmetrisk tärning, när man 

vet att resultatet är större än tre. Bilda följande mängder 

A = sex prickar erhålls, 

B = antalet prickar är ‡er än 3. 

Först en beteckning för sannolikheten för A när man vet att B inträ¤at 

P (A j B) = P (för A när man vet att B inträ¤at) . 

Det statistiska sättet att uttrycka sig är att man söker sannolikheten för 

A betingat B och vi skall här …nna en formel för detta uttryck. 

Vi resonerar på följande sätt: Eftersom B har inträ¤at så är alla 

andra utfall än B ointressanta. Vi vet också att A har inträ¤at och 

båda dessa villkor kan bara vara uppfyllda i A\B så det sökta uttrycket 

på sannolikheten P (A j B) måste innehålla P (A \ B). Om nu A av 

en ren händelse skulle vara B så söker vi sannolikheten att B inträ¤ar 

när B inträ¤at och kan den vara annat än 1. Vidare erhålls då att 

P (A \ B) = P (B \ B) = P (B) varav följer att en rimlig de…nition av 

betingad sannolikhet är 

De…nition 15 (Betingad sannolikhet) 

P (A j B) = 

P (A \ B) 

P (B) 

ty detta utryck har just egenskapen att bli 1 när A = B. Speciellt ger 

det att 

P (A j ) = P (A) . 

Eftersom att betinga är att begränsa utfallsrummet, d v s att ta ett nytt 

och mindre utfallsrum, och räkna utifrån detta accepterar vi på intuitiv 

grund ovanstående de…nition. 

Det …nns nu två användbara satser för betingade sannolikheter varav 

den första är 

Theorem 16 (Lagen om total sannolikhet) Om utfallsrummet, , 

kan delas upp i n ömsesidigt uteslutande mängder Ai, i = 1; 2; : : : ; n, 

som tillsammans utgör hela så gäller att sannolikheten för en mängd 

B kan skrivas 

nX 

P (B) = P (B j Ai) P (Ai) . 


i=1


Bevis 6 Eftersom mängderna B \ A1; : : : ; B \ An är disjunkta gäller 

följande likheter 

P (B) = P (B \ ) = P B \ ([ n i=1Ai) = P [ n i=1 (B \ Ai) 

= 

nX 

P (B \ Ai) = 

i=1 

nX 

P (B j Ai) P (Ai) 

i=1 

där den sista likheten följer av de…nitionen av betingning. Denna algebraiska 

härledning blir uppenbar om man betraktar …guren nedan 

A3 

A2 

A4 

B 

A1 

: : : 

An 1 

An 

Figur 2.3: Lagen om total sannolikhet 

Den andra satsen som rör betingning är egentligen ‡era men de är alla 

endast omskrivningar av de…nitionen på betingad sannolikhet. Därför 

överlåtes bevisen åt läsaren. 

Theorem 17 (Bayes sats) Låt A och B vara två delmängder i då 

gäller: 

1) Om P (B) > 0 så 

så 

P (A j B) = 

P (B j A) P (A) 

P (B) 

2) Om [ n i=1 Ai = och P (Ai \ Aj) = ; för i 6= j och om P (B) > 0 

P (A j B) = 

P (B j A) P (A) 

P n 

i=1 P (B j Ai) P (Ai) 

3) Om P (B) > 0 och P (B j A) > 0 så 

P (A j B) P (A) 

= 

P (B j A) P (B) 

c Mikael Möller


Det som gör Bayes sats så viktig är att den ger en metod att ska¤a sig 

ny kunskap baserad på gammal kunskap enligt följande algoritm 

Gammal 

Ny 

+ 

+ Bayes Ny 

! 

sannolikhet information sats sannolikhet 

För att bara nämna ett modernt exempel på när denna gamla sats från 

1763 behövs; Skräp…lter. Vår tids gissel är den skräppost som skickas 

till alla som har en epostadress. Moderna epostprogram hjälper användarna 

att ta bort denna post automatiskt och för att avgöra om ett ebrev 

är skräp eller ej används just Bayes sats. 

Här skall vi inte ange hur algoritmen för att ta bort skräpost fungerar 

utan vara lite mer pedagogiska d v s ge några exempel på när Bayes sats 

är användbar. 

Exempel 6 ett 

Begreppet betingning infördes här på sannolikheter eftersom jag personligen 

tycker det faller sig mest naturligt. Nu skall vi överföra begreppet 

betingning till väntevärden. 

Theorem 18 (Betingat väntevärde, introduktion) Givet en mängd 

A i det diskreta utfallsrummet och en stokastiska variabel X på detta 

utfallsrum. Det gäller då 

E (X) = E (X j A) P (A) + E X j {A P {A 

Bevis 7 Enligt tidigare kan vi skriva 

X (!) = X 

!k2 

I f!kg (!) X (!k) 

och om vi nu vill infoga kunskapen A så gör vi det med en indikatorvariabel 

för A. Därvid erhålls uppdelningen 

X (!) = X 

!k2 

= X 

!k2 


I f!kg (!) IA (!) X (!k) + X 

I f!kg\A (!) X (!k) + X 

!k2 

!k2 

I f!kg (!) I {A (!) X (!k) 

I f!kg\{A (!) X (!k) .


För väntevärdet erhålls nu, eftersom X (!k) är …xa tal, att 

E (X (!)) = X 

!k2 

+ X 

!k2 

= X 

!k2 

+ X 

!k2 

= X 

!k2 

+ X 

!k2 

fxk = X (!k)g = X 

!k2 

E I f!kg\A (!) X (!k) 

E I f!kg\{A (!) X (!k) 

P (f!kg \ A) X (!k) 

P f!kg \ {A X (!k) 

P (f!kg j A) P (A) X (!k) 

P f!kg j {A P {A X (!k) 

xkP (f!kg j A) 

| {z } 

E(X(!)jA) 

+ X 

xkP f!kg j {A 

!k2 

| {z } 

E(X(!)j{A) 

Nyttan av denna sats följer av följande 

P (A) 

P {A 

= E (X (!) j A) P (A) + E X (!) j {A P {A 

Exempel 7 En säljare av dagstidningar har sin kiosk i Humlegården. 

Varje dag köper han n stycken för b kronor stycket och antalet kunder 

som under dagen köper sin tidning hos honom betecknar vi med X d v s 

X = antalet sålda tidningar under en dag 

och (X) = f0; 1; 2; 3; : : : ; ng. Tidningen säljs för a kronor och om han 

har slut på tidningar när en kund efterfrågar en gör han en förlust om 

c kronor (kostnaden för förlorad förtjänst och förlorad ’goodwill’). Hur 

skall säljaren välja n för att maximera sin vinst? För att bestämma n 

c Mikael Möller


sätter vi först upp följande tabell: 

Tidningar Vinst 

X n X > n 

Sålda aX an 

Osålda b (n X) 0 

Missade 0 c (X n) 

Denna tabell ger oss följande vinstfunktion 

v (n; X) = 

(a + b) X bn X n 

(a + c) n cX X > n 

men eftersom antalet sålda exemplar X är okänt fram till dagens slut 

skall vi betrakta denna funktions förväntade värde och utnyttjar då satsen 

om betingat väntevärde med avseende på mängderna fX ng och 

fX > ng. Vi erhåller 

V (n) = E v (X; n) 

= E v (X; n) j X n P (X n) 

+ E v (X; n) j X > n P (X > n) 

= (a + b) E (X j X n) bn P (X n) 

+ (a + c) n cE (X j X > n) P (X > n) . 

Bilda nu den förväntade marginalvinsten för en ytterligare såld tidning 

d v s beräkna 

V (n + 1) V (n) = = b + bP (X > n) + (a + c) P (X > n) 

= b + (a + b + c) P (X > n) . 

Om nu n är stort så blir P (X > n) liten och vice versa och detta tillsammans 

med ett studium av marginalvinsten medför att för något n så 

bör det gälla 

V (n + 1) V (n) 0. 

Detta ger att vi skall välja n så att 

b 

P (X > n) 

a + b + c . 

Via ett relativt elementärt resonemang har vi således kommit fram till 

ett tröskelvärde och genom att approximera 

f 

P (X > n) 

m 

där f = antal gånger av m där efterfrågan översteg tillgången n så kan 

vi genom att testa olika värden på n komma fram till ett optimalt val. 

c Mikael Möller


2.6 Betingade väntevärden 

I satsen om Betingat väntevärde, introduktion gjorde vi en uppdelning 

av utfallsrummet i två disjunkta delmängder, A och {A, och vi skall 

nu föra denna idé vidare till ett resultat som har stor betydelse när det 

gäller att förenkla räkningar. Antag att vi har två stokastiska variabler 

(X och Y ) som är relaterade till varandra i den meningen att kunskap 

om den ena är värdefull vid uttalande om den andra. Vi har då följande 

Theorem 19 (Betingat väntevärde) Om X och Y är två diskreta 

stokastiska variabler med utfallsrummen 

X = f!1; !2; : : :g och Y = f 1; 2; : : :g 

där Y är en grövre indelning av X, d v s varje i innehåller minst en 

av elementarhändelserna !j, så gäller att 

E (X) = E E (X j Y ) . 

Bevis 8 Eftersom Y är en grövre indelning av X gäller att fX = kg 

i för något i. Härav följer den andra likheten nedan. Det följande är 

direkta omskrivningar. 

E (X) = X 

kP (X = k) = X 

kP (fX = kg \ Y ) 

k2 X 

= X 

k2 X 

= X 

k2 X 

= X 

k2 X 

l2 Y 

k2 X 

kP fX = kg \ f[l2 fY = lgg 

Y 

kP [l2 Y fX = kg \ fY = lg 

k X 

P fX = kg \ fY = lg 

l2 Y 

= X 

" # 

X 

kP (X = k j Y = l) P (Y = l) 

k2 X 

och därmed har vi visat att 

| {z } 

E(XjY ) 

E (X) = E E (X j Y ) . 

Vad satsen säger är att om vi har ett uttryck som innehåller två beroende 

stokastiska variabler och vi skall bestämma väntevärdet för detta uttryck 

c Mikael Möller

42 2.6. Betingade väntevärden 

så kan vi i ett första steg tänka oss att den ena stokastiska variabeln är 

en konstant. I det följande steget tar vi så väntevärdet över denna andra 

stokastiska variabel och resultatet blir detsamma som om vi beräknade 

väntevärdet för hela utrycket på en gång. 

Exempel 8 (Försäkring) Ett försäkringsbolag i Sverige har sålt bilförsäkringar 

(personbilar) under en mycket lång tid och har en stor portfölj 

av sådana. Försäkringsköparna kommer från hela landet och alla 

sociala skikt. Denna portfölj drabbas då och då av skador vilka genererar 

kostnader för bolaget. Dessa kostnader (tillsammans med administrationskostnader) 

måste på lång sikt täckas av intäkterna och med lång 

sikt förstås att den förväntade kostnaden skall vara minst lika stor som 

den förväntade intäkten. Bolaget vill nu i ett första steg få en uppskattning 

av den totala årliga förväntade kostnaden. 

Lösning 1 Börja med att bilda följande två stokastiska variabler för 

försäkringsportföljen 

Ci = kostnad skada i, 

N = antal skador under året. 

Om dessa skadekostnader antar vi att de ej påverkar varandra samt alla 

har samma väntevärde c och varians 2 C . Det förväntade antalet skador 

sätts till n och deras varians till 2 N . Den totala kostnaden för årets 

försäkringsfall kan skrivas 

C = 

NX 

i=1 

och med hjälp av betingad förväntan erhålls den förväntade kostnaden 

till 

E (C) = E E (C j N) . 

Eftersom E (Ci) = c och E (N) = n samt att antalet skador är oberoende 

av skadekostnadernas storlek erhålls 

NX 

! 

E (C) = E E (C j N) = E E (Ci j N) 

fCi och N oberoendeg = E 


= E 

Ci 

NX 

! 

E (Ci) 

i=1 

i=1 

NX 

! 

c = cE (N) = cn. 

i=1


Vi ser således att om storleken på alla skador följer en och samma fördelning 

samt om det totala antalet skador är oberoende av skadestorleken 

så erhålls den förväntade totala kostnaden under ett år till 

E (C) = cn. 

Är dessa antaganden rimliga? Ja det är sådana frågor som aktuarier 

arbetar med. 

Exempel 9 Betrakta kast med ett symmetriskt mynt. Sätt 

N = antal kast till och med klave 

vad blir då det förväntade antalet kast? 

Lösning 2 Sätt (detta är ett trick) för det första kastet 

Y = 

där p = P (Y = 1). Vi …nner nu att 

E (N) = E E (N j Y ) 

1 om klave 

0 annars 

= E (N j Y = 1) P (Y = 1) + E (N j Y = 0) P (Y = 0) 

= 1 p + (1 + E (N)) (1 p) 

ty i det första fallet får vi en klave redan i första kastet och i det andra 

har vi gjort ett kast men sedan är situationen exakt likadan som före 

kastet. Detta är en ekvation med den sökta storheten i både vänster och 

högerled och den ger ekvationen 

E (N) (1 1 + p) = p + 1 p 

varav det förväntade antalet kast till och med klave blir 

E (N) = 1 

p . 

2.7 Betingade varianser 

Med hjälp av avsnittet om betingade väntevärden kan vi med elementära 

metoder visa hur vi beräknar betingade varianser eftersom en varians är 

skillnaden mellan två väntevärden. Allmänt gäller följande sats. 

c Mikael Möller

44 2.7. Betingade varianser 

Theorem 20 (Betingad varians) För två godtyckliga stokastiska variabler 

X och Y gäller 

V (X) = V E (X j Y ) + E V (X j Y ) 

Bevis 9 Vi ger ett generellt bevis baserat på satsen om betingade väntevärden. 

Beviset är därför allmängiltigt bara om vi tror på att satsen om 

betingade väntevärden gäller för alla stokastiska variabler. Vi noterar 

först att 

V (X) = E X 2 

E (X) E (X) 

och därefter tillämpar vi satsen om betingat väntevärde på de två termerna 

till höger om likheten vilket ger oss första raden nedan 

V (X) = E E X 2 j Y E E (X j Y ) E E (X j Y ) 

= E E X 2 j Y E 2 E (X j Y ) 

E E 2 (X j Y ) + E E 2 (X j Y ) 

= E E X 2 j Y E E 2 (X j Y ) 

+ E E 2 (X j Y ) E 2 E (X j Y ) 

= E V (X j Y ) + V E (X j Y ) 

Exempel 10 (Försäkring (forts)) Bestäm skadekostnadens variation 

i försäkringsexemplet ovan 

Lösning 3 Variationen hos den totala skadekostnaden kan skrivas 

V (C) = V E (C j N) + E V (C j N) . 

Vi beräknar de ingående termerna var för sig. För term 1 erhålls 

varför 

E (C j N) = 

NX 

E (Ci j N) = cN 

i=1 

V E (C j N) = V (cN) = c 2 V (N) . 

För term 2 erhålls om skadestorlekarna kan anses vara oberoende att 

NX 

! 

NX 

V (C j N) = V Ci j N = V (Ci j N) . 


i=1 

i=1


Eftersom den enskilda skadestorleken och det totala antalet skador kan 

anses vara oberoende så gäller om alla enskilda skador har samma varians 

(t ex vid likafördelning) att 

varför 

V (C j N) = V (Ci) N 

E V (C j N) = E V (Ci) N = V (Ci) E (N) . 

Det gäller således att den totala skadekostnaden har väntevärdet cn och 

variansen 

V (C) = c 2 2 N + 2 Cn. 

2.8 Oberoende 

Betingning har en mycket viktig roll när det gäller att förstå hur begreppet 

oberoende skall de…nieras. Intuitivt är det så att två mängder 

(händelser) är oberoende av varandra om kunskap om den ena inte påverkar 

vår kunskap om den andra d v s om 

P (A j B) = P (A) . 

Av detta samband och de…nitionen av betingad sannolikhet följer att två 

mängder A och B är oberoende om 

P (A \ B) = P (A) P (B) 

och det är just denna relation som man utgår ifrån när man talar om 

oberoende ty den kan ’enkelt’generaliseras till ‡era oberoende mängder. 

De…nition 21 (Oberoende mängder) Två mängder A och B säges 

vara oberoende om och endast om 

P (A \ B) = P (A) P (B) . 

Tre mängder A, B och C säges vara oberoende om och endast om det 

samtidigt gäller 

P (A \ B) = P (A) P (B) , 

P (A \ C) = P (A) P (C) , 

P (B \ C) = P (B) P (C) , 

P (A \ B \ C) = P (A) P (B) P (C) . 

c Mikael Möller

46 2.8. Oberoende 

Det …nns tyvärr ingen intuitiv bild av vad oberoende är utan man får 

lita till ovanstående de…nition. Begreppet oberoende är centralt inom 

statistiken och utan detta begrepp funnes icke statistik, som vi känner 

den. 

Exempel 11 I en vanlig kortlek med 52 kort och fyra färger drar man 

på måfå ett kort. 

1. Är händelserna "det dragna kortet är hjärter" och "det dragna 

kortet är ett ess" oberoende? 

2. Tag nu bort följande spader kort –f2; 3; 4; 5g. Är händelserna ovan 

oberoende? 

Lösning 4 Vi börjar med att beräkna sannolikheterna för den fullständiga 

kortleken 

P (A) = P (det dragna kortet är hjärter) = 13 

52 

P (B) = P (det dragna kortet är ett ess) = 4 

52 

Snitthändelsen är nu "det dragna kortet är hjärter ess" som har sannolikheten 

P (A [ B) = 1 13 4 

= = P (A) P (B) 

52 52 52 

och således är de…nitionen för oberoende uppfylld. För den ofullständiga 

kortleken …nner vi 

P (det dragna kortet är hjärter) = 13 

48 

P (det dragna kortet är ett ess) = 4 

48 

Snitthändelsen är nu "det dragna kortet är hjärter ess" som har sannolikheten 

1 13 4 

6= 

48 48 48 

och således är de…nitionen för oberoende ej uppfylld. Märkligt! Strider 

inte detta mot sunt förnuft? 

Vi har tidigare angett två additionssatser för sannolikheter – den 

allmäna och den speciella. Vi skall nu formulera två multiplikationssatser 

för sannolikheter –den allmäna och den speciella. 

c Mikael Möller


Theorem 22 (Multiplikationssatsen) Om det gäller att A; B 

så gäller 

1. P (A \ B) = P (A j B) P (B). 

2. om dessutom A och B är oberoende mängder så gäller 

P (A \ B) = P (A) P (B) . 

Bevis 10 Punkt 1 gäller per de…nition och punkt 2 följer av att P (A j B) = 

P (A) eftersom A och B är oberoende. 

Med hjälp av förväntningsoperatorn …nner vi för indikatorvariablerna 

för två oberoende mängder att 

E IA\B (!) = P (A \ B) = P (A) P (B) 

= E IA (!) IB (!) = E IA (!) E IB (!) 

och denna relation kommer att vara av betydelse längre fram. 

c Mikael Möller

48 2.8. Oberoende 

c Mikael Möller

3. Diskreta modeller 

I föregående kapitel har vi infört ‡era olika begrepp och vi skall här 

använda oss av dessa för att dels lösa ett rätt så knepigt problem och 

dels under lösandets gång skapa ytterligare, allmänt användbara, statistiska 

verktyg. Med hjälp av dessa nya verktyg skall vi sedan ge en 

första elementär lösning på hur man i det diskreta fallet kan prissätta 

en köpoption –en föregångare till Black-Scholes formel. 

Därefter tar vi itu med några andra problem – epost, försäkring, 

spel och kvalitetskontroll –vilka alla kan ges lösningar inom de diskreta 

modellernas ram. 

3.1 Betygssättning 

Vårt första exempel tar upp hur man kan sätta betyg på en 5-veckors 

kurs i t ex statistik (ja egentligen vilken kurs som helst) genom att ge 

ett antal, i vårt fall 5, småskrivningar allteftersom kursen går igenom 

avsnitt för avsnitt. Vi utgår ifrån att varje skrivning skall ha totalt 

10 frågor och detta antal skall vi dela upp på ett par olika sätt. I det 

första fallet har vi helt enkelt 10 frågor och i det andra fallet har vi två 

grupper om 5 frågor vardera. I båda fallen är gränsen för godkänt 6 

rätt av 10. Därefter tillåter vi en omtentamen på de skrivningar som 

ej blev godkända vid första tillfället. Frågan vi nu ställer oss är: Vad 

är sannolikheten att, om vi svarar helt slumpmässigt på varje fråga, bli 

godkänd på kursen med denna examinationsform? 

Exempel 12 (10 frågor) En skrivning består av 10 frågor och det …nns 

4 möjliga svar per fråga – men bara ett svar är rätt. Bestäm sannolikheterna 

för 0; 1; 2; 3; 4; 5; 6, 7; 8; 9 och 10 rätt om man för varje fråga 

väljer svar helt slumpmässigt. 

Lösning 5 Först skapar vi en modell över situationen d v s vi sätter 

Xi = 

X = 

10X 

i=1 

1 om rätt svar fråga i 

0 annars 

Xi = antal rätta svar 

49 

i = 1; 2; : : : ; 10

50 3.1. Betygssättning 

där (X) = f0; 1; 2; 3; 4; 5; 6; 7; 8; 9; 10g. Eftersom svaren väljs slumpmässigt 

följer att fråga 1 har sannolikheten 0:25 att bli rätt och 0:75 

att bli fel. Av slumpmässigheten följer även att resultatet på fråga 2 ej 

påverkas av svaret på fråga 1. Med andra ord så föreligger oberoende 

resultat för de olika frågorna. I det statistiska språkbruket har vi därför 

för händelsen 

fXi = 1; Xj = 0g = ffråga i besvaras rätt och fråga j felg 

att dess sannolikhet blir 

P (Xi = 1; Xj = 0) = P (Xi = 1 j Xj = 0) P (Xj = 0) 

Med hjälp av induktion följer nu att 

= P (Xi = 1) P (Xj = 0) i 6= j. 

P (X1 = i1; X2 = i2; : : : ; X10 = i10) = 

10Y 

j=1 

P (Xj = ij) 

där ij är antingen 0 eller 1. För denna modell skall vi nu bestämma 

sannolikheterna att få totalt k rätt på en skrivning d v s P (X = k) för 

k 2 (X). Det är nu helt trivialt att beräkna P (X = 0) och P (X = 10) 

ty i det första fallet måste alla frågor vara fel och i det andra fallet måste 

alla frågor vara rätt. Vi har därför 

P (X = 0) = 

P (X = 10) = 

10Y 

j=1 

10Y 

j=1 

P (Xj = 0) = 3 

4 

P (Xj = 1) = 1 

4 

Det blir dock problem vid beräknande av P (X = 1) ty vi kan få ett rätt på 

10 olika sätt: den första är rätt eller den andra är rätt eller eller den 

tionde är rätt. Nåväl detta går att hålla reda på och det blir 10 stycken. 

Lösningen inses nu lättast genom att helt enkelt räkna upp de möjliga 


10 

, 

10 

.

3. Diskreta modeller 51 

fallen i en matris 

Antal rätt=1 

1 2 3 4 5 6 7 8 9 10 

1 1 0 0 0 0 0 0 0 0 0 

2 0 1 0 0 0 0 0 0 0 0 

U 3 0 0 1 0 0 0 0 0 0 0 

t 4 0 0 0 1 0 0 0 0 0 0 

f 5 0 0 0 0 1 0 0 0 0 0 

a 6 0 0 0 0 0 1 0 0 0 0 

l 7 0 0 0 0 0 0 1 0 0 0 

l 8 0 0 0 0 0 0 0 1 0 0 

9 0 0 0 0 0 0 0 0 1 0 

10 0 0 0 0 0 0 0 0 0 1 

och för vart och ett av fallen har vi sannolikheten 

1 

4 

3 

4 

Vi har att addera 10 sådana sannolikheter varför den sökta sannolikheten 

blir 

P (X = 1) = 10 1 

4 

3 

4 

9 

. 

Genom att låta 0 och 1 byta plats i schemat ovan så ser vi att 

P (X = 9) = 10 

9 

. 

1 

4 

9 3 

4 . 

Nästa steg är att söka sannolikheten för två rätt men eftersom vi då 

behöver ett schema med 45 rader ger vi upp denna metod (vi måste ju 

även ta hand om tre rätt, fyra rätt o s v). Vårt problem här är att ange 

på hur många olika sätt vi kan välja säg 2 platser bland de 10 som står 

till förfogande. Nu …nns det en allmän metod för att …nna antalet delmängder 

av storlek k i en mängd om n element ([5]) och denna metod 

anger antalet till 

n 

k = 

n! 

k! (n k)! . 

Sannolikheten för två rätt, två ettor och åtta nollor, blir då 

P (X = 2) = 10 

2 

1 

4 

2 

3 

4 

8 

= 45 

1 

4 

2 

3 

4 

8 

. 

c Mikael Möller


Allmänt gäller att sannolikheten för k rätt bland de 10 uppgifterna blir 

P (X = k) = 10 

k 

1 

4 

k 

3 

4 

10 k 

, k 2 X. 

Ovanstående exempel kan enkelt generaliseras. Om sannolikheten för 

en etta är p och sannolikheten för en nolla är q, där p + q = 1, så blir 

sannolikheten att få k ettor bland n möjliga densamma som 

P (X = k) = n 

k pk q n k , k 2 X. 

De…nition 23 (Binomialfördelning) När sannolikhetsfunktionen för 

den stokastiska variabeln X kan skrivas 

P (X = k) = n 

k pk q n k , k 2 X 

där (X) = f0; 1; 2; : : : ; ng så säges den vara binomialfördelad med parametrarna 

n och p. Vi skriver 

X 2 Bin (n; p) . 

Uppgift 1 Visa att för en binomialfördelad variabel så gäller 

1. Pn i=0 P (X = k) = 1, 

2. E (X) = np, 

3. V (X) = npq. 

Eftersom vi kräver att man skall ha minst 6 rätt för att få godkänt så 

…nner vi, med hjälp av komplementsatsen, att sannolikheten för godkänt 

blir 

P (godkänt) = P (X 6) = 

10X 

k=6 

= 1 P (X 5) = 1 

10 

k 

5X 

k=0 

1 

4 

k 

10 

k 

3 

4 

1 

4 

10 k 

k 

3 

4 

10 k 

= 1 (0:056 + 0:188 + 0:282 + 0:250 + 0:146 + 0:058) 

= 0:02. 

Det är således en ganska stor chans att få godkänt även om slumpen får 

1 

bestämma. Det förväntade antalet rätt blir 10 4 = 2:5 med varians 

1 3 10 4 4 = 1:875. Detta ser betryggande ut, men är det inte, och vi 

skall utveckla examinationsmetoden lite mer. 

c Mikael Möller


Exempel 13 (Teori och Problem) En skrivning om 10 ‡ervalsfrågor 

delas upp i två delar – en teoridel om 5 frågor och en problemdel om 5 

frågor. För att få godkänt på skrivningen krävs minst 3 rätt på varje 

del och varje fråga har 4 möjliga svar varav endast ett är rätt. Om en 

tentand låter kast med två mynt besvara frågorna vad är då sannolikheten 

att denne får skrivningen godkänd. 

Lösning 6 Sätt 

då gäller att 

XT = antal rätta svar på teoridelen 

XP = antal rätta svar på problemdelen 

XT 2 Bin(5; 0:25), 

XP 2 Bin(5; 0:25). 

Sannolikheten för att få skrivningen godkänd kan skrivas 

P (godkänd) = P fXT 3g \ fXP 3g 

fty oberoendeg = P (XT 3) P (XP 3) 

och vi har därför att bestämma P (XT 3) och P (XP 3). Sannolikheten 

för godkänt på teoridelen är 

P (XT 3) = 1 P (XT 2) 

= 1 

2X 

k=0 

= 1 0:89648 

= 0:10352 

och på samma sätt för problemdelen 

P (XP 3) = 0:10352. 

5 

k 0:25k 5 k 

0:75 

Sannolikheten att få en skrivning godkänd är därför 

P fXT 3g \ fXP 3g = P (XT 3) P (XP 3) 

= 

5X 

k=3 

= 0:0107. 

Denna sannolikhet är ungefär hälften av den förra. 

5 

k 0:25k !2 

5 k 

0:75 

c Mikael Möller


Uppgift 2 Bestäm väntevärde och varians för denna nya modell. 

I exemplet skärpte vi kravet på godkänt genom att införa två delar 

men metoden kan utvecklas ytterligare. Antag att en 5 veckors kurs 

naturligen delas in i 5 moment. 

Exempel 14 (5 skrivningar) En kurs examineras genom att ge 5 skrivningar 

av tidigare beskriven typ. För godkänt på kursen krävs nu att alla 

5 skrivningar blir godkända. För de skrivningar som blivit underkända 

erhålls en ytterligare möjlighet (i samband med den sista skrivningen) 

att försöka en gång till. Vad är sannolikheten att bli godkänd på kursen 

om slumpen får avgöra? Observera att den sista skrivningen ej kan omtenteras. 


då gäller att 

för något p samt 

Vi söker nu 

X4 = antal godkända skrivningar bland de 4 första 

X5 = sista skrivningen godkänd 

X5 = 

X4 2 Bin (4; p) 

1 om godkänd, 

0 annars. 

P (godkänd kurs) = P (X4 = 4; X5 = 1) 

fty oberoendeg = P (X4 = 4)P (X5 = 1) 

= 4 

4 p4 4 4 

(1 p) 

= p 4 

0:0107 

0:0107 

Här bestäms p av möjligheten att få skrivningen godkänd ’direkt’ eller 

vid ’omtentamen’till 

p = P (direkt [ omtentamen) 

fty disjunkta mängderg = P (direkt) + P (omtentamen) 


fbetingningg = 0:0107 + P ( godkänd j första ej godkänd ) 

P ( första ej godkänd ) 

= 0:0107 + 0:0107 (1 0:0107) 

= 0:021286


Sannolikheten att få 5 godkända skrivningar medelst rena chansningar 

blir nu 

P (godkänd kurs) = 0:02129 4 

En försvinnande liten sannolikhet. 

0:0107 = 0:000 000 002. 

Med hjälp av enkla metoder har vi nu kunnat lösa ett relativt komplicerat 

problem och när vi gjort det har vi introducerat en hel del nya 

storheter och begrepp: 

1. Binomialfördelningen. 

2. För första gången fördelningen –ja åtminstone dess början. 

3. Sannolikhetsfunktionen P (X = k). 

4. Fördelningsfunktionen P (X k). 

3.2 Optionsmodell 

En option är ett kontrakt där utställaren av optionen förbinder sig att 

utföra någon speciell handling vid optionens lösendag. Dylika kontrakt 

förekommer i två olika varianter, här exempli…erade med köp respektive 

försäljning av en aktie. 

Köpoption: Utställaren förbinder sig att sälja en aktie till angivet 

pris. Den som köper köpoptionen behöver dock ej köpa utan har 

valfrihet att avstå –köparen (köparen av aktien) har köpt rätten 

att köpa till angivet pris. 

Säljoption: Utställaren förbinder sig att köpa en aktie till angivet 

pris. Den som köper en säljoption behöver dock ej sälja utan har 

valfrihet att avstå –köparen (säljaren av aktien) har köpt rätten 

att sälja till angivet pris. 

Vi börjar vår analys av optioner med att först dela in tiden i diskreta 

tidssteg (inte någon större approximation eftersom vi ändock delar in 

tiden i dagar, veckor m m) och vid varje sådant tidssteg har vår aktie ett 

marknadspris, 

Xt = aktiens marknadspris vid tidpunkt t, t = 0; 1; 2; : : : ; n. 

Här svarar tidpunkt 0 mot värdet just nu och eftersom detta värde är 

känt tecknar vi det x0 istället för X0. För aktier …nns det som bekant 

c Mikael Möller

56 3.2. Optionsmodell 

två möjligheter att utvecklas – antingen går de upp eller så går de ner 

(att aktiens pris ligger stilla räknar vi som att den går ner). Denna 

iakttagelse ger följande stokastiska modell för en akties pris vid tidpunkt 

t givet aktiens pris vid närmast föregående tidpunkt (t 1): 

Xt = utXt 1 med sannolikheten pt 

dtXt 1 med sannolikheten 1 pt 

där ut 1 (upp) och 0 dt 1 (ned, negativa aktievärden förekommer 

ej – därför är dt 0). Denna modell är dock för generell för att vara 

hanterbar och vi inför därför följande förenklingar: I varje tidssteg antages 

pt = p, ut = u och dt = d. Detta betyder att aktien anses be…nna 

sig i en oföränderlig värld där den underliggande sannolikhetsstrukturen 

liksom värdestrukturen är en och densamma hela tiden. Sannolikheten 

för att en aktie skall gå upp är p hela tiden och den går alltid upp med 

proportionen u respektive ned med proportionen d. Dessa antaganden 

gör att vi kan behandla optioner med hjälp av standard binomialresonemang. 

3.2.1 Binomial optionsmodell –ett tidssteg 

Vi börjar med att bestämma en options pris när vi endast betraktar det 

första tidssteget. I detta fall har vi modellen 

X1 = ux0 med sannolikheten p, 

dx0 med sannolikheten 1 p. 

Nu erbjuds vi rätten att i morgon köpa en aktie, som idag är värd x0 

kronor, för priset (lösenpriset). Om vi köper denna rätt idag så vet 

vi imorgon om vi tjänade på a¤ären eller ej. Om vi låter Y1 beteckna 

morgondagens förtjänst så gäller att förtjänsten kan skrivas 

Alternativa beteckningar för Y1 är 

Y1 = 0 om X1 , 

X1 om X1 > . 

Y1 = max(0; X1 ) = (X1 ) + . 

Hur skall vi nu bestämma priset för rätten att i morgon köpa aktien till 

priset ? På något sätt skall vi välja det pris som känns rättvist för båda 

parter, för annars blir det ingen a¤är, och det naturliga valet är att välja 

ett pris c1 sådant att om a¤ären görs många gånger så skall ingen tjäna 

c Mikael Möller


på a¤ären. Men eftersom n a¤ärer ger vinsten Pn i=1 y1i så bör priset för 

optionen vid varje a¤är vara 1 Pn n i=1 y1i (observera att det verkligen är 

fråga om en vinst ty y1i 0 per de…nition). Eftersom det aritmetiska 

medelvärdet är en approximation av det underliggande förväntade värdet 

har vi följande preliminära de…nition. 

De…nition 24 En options rättvisa pris efter ett tidssteg är 

c 0 1 = E(Y1) = E max(0; X1 

Om vi utvecklar väntevärdet ovan kan köpoptionens pris skrivas om 

på följande sätt 

c 0 1 = E(Y1) = E max(0; X1 

) 

) . 

= max(0; ux0 )p + max(0; dx0 )(1 p) 

= c u 1p + c d 1(1 p). 

Där vi för optionens sanna pris infört beteckningen 

c u 1 = max (0; ux0 

om värdet går upp och beteckningen 

c d 1 = max (0; dx0 

om värdet går ned –båda beräknade vid tidpunkt 1. 

Antag nu att det även …nns möjlighet att under perioden köpa ett 

riskfritt värdepapper (t ex en ränteobligation) till räntan r. Detta betyder 

att om vi för c 0 1 kronor köper detta papper så har vi säkert c 0 1(1 + r) 

kronor efter ett tidssteg. För att vi skall köpa en option måste därför 

dess förväntade vinst åtminstone vara minst lika stor som den riskfria 

investeringen. 1 Ekvationen ovan måste därför korrigeras så att hänsyn 

till detta tas och det görs enligt nuvärdesprincipen. Korrigering enligt 

denna princip ger nu upphov till följande korrigerade de…nition av en 

options rättvisa pris 

De…nition 25 En options rättvisa pris efter ett tidssteg, korrigerat för 

den riskfria räntan r, är 

c1 = E(Y1) 

1 + r 

) 

) 

E max (0; X1 ) 

= 

1 + r 

1 Det som gör att man väljer att köpa en option är att den slänger betydligt mer 

– chansen till en betydande avkastning är stor – d v s man är en spelare. 

. 

c Mikael Möller


För en options rättvisa nuvärdespris gäller således 

c1 = c0 1 

1 + r = cu1p + cd 1(1 p) 

. (3.1) 

1 + r 

Observera att storheterna u; d och p är för oss okända men däremot 

förutsätts vi känna till den riskfria räntan r. 

De tre okända storheterna måste skattas 2 men medelst en enkel observation 

kan en av dem uttryckas i de andra två. Vi har nämligen 

följande resonemang: Under förutsättning att vi erhåller samma förväntade 

ersättning genom att köpa en aktie till priset x0 som om vi sätter 

x0 kronor på banken, till ränta r, så gäller, efter ett tidssteg, likheten 

(1 + r)x0 = E(X1) 

= ux0p + dx0(1 p) 

= p(u d) + d x0. 

Om vi nu förkortar med x0 och löser ut p så erhålls följande samband 

mellan 3 p; u; d och r 

p = p(u; d; r) = 

1 + r d 

. (3.2) 

u d 

Eftersom storheterna u och d kan skattas med hjälp av historiskt material 

kan även sannolikheten p skattas. Denna skattning tar hänsyn till 

storleken på r, u och d. 

Exempel 15 Antag att det gäller 

x0 = 100 = 100 

u = 1:1 d = 0:9 

r = 0:07 

2 Det enklaste sättet att skatta p torde vara med 

antal uppgångar under n dagar 

^pobs = 

n 

och för u och d har man skattningarna 

P 

i procentuell uppgång i:s storlek 

^uobs = 1 + 

n 

samt 

P 

^dobs 

i procentuell nedgång i:s storlek 

= 1 + 

. 

n 

3 Här förutsätts u > 1 + r ty annars ger den riskfria räntan en större förväntad 

avkastning än aktien. 

c Mikael Möller


då erhålls köpoptionens pris enligt ekvation 3.1 till 

max (0; 110 100) 1 + 0:07 0:9 

c1 = 

1 + 0:07 1:1 0:9 

+ max (0; 90 100) 

1 + 0:07 

1 

1 + 0:07 0:9 

1:1 0:9 

= 7:94 

3.2.2 Binomial optionsmodell –‡era tidssteg 

För att få en indikation på vart det bär hän med våra formler, när vi 

tillåter ett godtyckligt antal tidssteg, n, så skall vi börja med att betrakta 

fallet med två tidssteg d v s vi skall beräkna c2. Under två tidssteg kan en 

aktie gå upp två gånger, gå ned två gånger eller gå upp en gång och ned 

en gång detta ger oss följande möjliga värden på aktien efter 2 tidssteg 

8 

< 

X2 = 

: 

u 2 x0 med sannolikhet p 2 , 

udx0 med sannolikhet 2p (1 p) , 

d 2 x0 med sannolikhet (1 p) 2 . 

Uppgift 3 Visa att P (X2 = udx0) = 2p(1 p). 

Om vi låter Y2 beteckna övermorgondagens förtjänst på optionen, 

efter två tidssteg, så gäller att 

Y2 = 

0 om X2 

X2 om X2 > 

eller med de alternativa beteckningarna 

Y2 = max (0; X2 ) = (X2 ) + . 

Värdet på en köpoption vid 2 tidssteg blir därför 

c 0 2 = E(Y2) = E max (0; X2 

= max 0; u 2 x0 p 2 + max (0; udx0 ) 2p (1 p) 

+ max 0; d 2 x0 (1 p) 2 . 

) 

c Mikael Möller


Genom att para ihop exponenterna och använda oss av binomialkoe¢ - 

cienter kan c 0 2 skrivas om på följande sätt 

c 0 2 = max 0; u 2 x0 

+ max 0; d 2 x0 

= 

2X 

k=0 

max 0; u k d 2 k x0 

2 

2 p2 + max (0; udx0 ) 2 

1 

2 

0 

(1 p)2 

2 

k pk (1 p) 2 k . 

p(1 p) 

Vi ser att det …nns en formel för att beräkna c 0 2, optionens pris vid lösen 

2 tidssteg framåt. 

Genom att helt enkelt byta ut alla 2:or mot n bör denna formel kunna 

generaliseras till ett godtyckligt antal tidssteg, n, . För att visa detta 

resonerar vi på följande sätt. Efter n steg har vi haft k uppgångar och 

n k nedgångar och vid varje steg ökar eller minskar aktien i värde med 

proportionen u eller d. De möjliga vinsterna efter n tidssteg kan därför 

skrivas 

max 0; u k d n k x0 , k = 0; 1; : : : ; n 

där vi multiplicerar aktiens ursprungliga pris x0 med k stycken u för de 

k uppgångarna och med n k stycken d för de n k nedgångarna. Dessa 

vinster är de möjliga utfallen av den stokastiska variabeln 

Yn = 

0 Xn 

Xn 

Xn > 

= max(0; Xn 

För att hitta sannolikheten för det k:te utfallet 

ynk = max 0; u k d n k x0 

har vi därför att bestämma P(Yn = ynk). Men denna sannolikhet är 

densamma som sannolikheten att erhålla k uppgångar bland n möjliga 

när sannolikheten för en uppgång är p d v s 

P(Yn = ynk) = n 

k pk (1 p) n k . 

Den förväntade vinsten efter n tidssteg (köpoptionens pris) kan därför 

skrivas 

nX 

E(Yn) = ynkP (Yn = ynk) 


= 

k=0 

nX 

k=0 

max 0; u k d n k x0 

). 

n 

k pk n k 

(1 p)


och köpoptionens nuvärde för n tidssteg blir, om den riskfria räntan är 

r, 

cn = 

1 

(1 + r) n 

nX 

k=0 


n 

k pk (1 p) n k . 

Ovanstående uttryck är rätt ogenomskinligt och komplicerat. Vi skall 

därför först skriva om det till ett mer hanterbart uttryck. 

För ynk = max 0; u k d n k x0 gäller att det …nns ett tal m sådant 

att för alla k m så gäller att ynk > 0. Detta måste gälla ty annars 

vore förtjänsten alltid 0 och vi skulle knappast gå in i en dylik a¤är. 

Ett annat sätt att se på m är att m är det minsta antal uppgångar som 

krävs för att optionen skall ge vinst. Talet m kommer naturligtvis bero 

på optionens lösenpris och vi borde därför skriva m eller m( ) men detta 

blir så otympligt så vi skriver rätt och slätt m. Det statistiska sättet att 

uttrycka detta påstående på är 

ynk = 

0 om k m, 

u k d n k x0 om k > m. 

Uppgift 4 Visa att det för något heltal m gäller att 

0 < ynk < y n(k+1) 

för alla k m d v s visa att vinsten är strikt växande. 

För att beräkna talet m har vi att lösa ut det minsta k sådant att 

u k d n k x0 > 0. 

Enkla omskrivningar ger (observera att alla storheter är positiva samt 

att u antages vara större än d) 

n u 

d 

d 

u 

d 

k 

> 

x0 

k 

> 

dnx0 k ln u 

d > ln d n x0 

c Mikael Möller


varför4 l 

m = ln u 

m 

1 

d ln dn är det värde på k som för första gången 

x0 

uppfyller olikheten. För detta värde m gäller nu följande likheter5 cn = 

fynk = 0 för k < mg = 

= 

1 

(1 + r) n 

1 

(1 + r) n 

x0 

(1 + r) n 

= x0 

(1 + r) n 

nX 

k=m 

nX 

k=0 

nX 

k=m 

nX 

k=m 

n 

k 

(1 + r) n 

Nu gäller det (se uppgift 5) att 

nX 

k=m 

nX 

k=m 

n 

k pk (1 p) n k ynk 

n 

k pk (1 p) n k u k d n k x0 

n 

k (up)k d (1 p) 

up 

1 + r 

up d (1 p) 

+ = 1 

1 + r 1 + r 

n 

k pk n k 

(1 p) 

k 

d (1 p) 

1 + r 

n 

k pk (1 p) n k . 

d v s att up 

1+r kan tolkas som en sannolikhet. Härav följer att köpoptionens 

nuvärdespris cn kan skrivas om till 

cn = x0P (B1 m) 

(1 + r) n P (B2 m) 

där de två stokastiska variablerna B1 och B2 båda kan tolkas som två 

binomialfördelade stokastiska variabler men med olika parametrar 

B1 2 Bin n; up 

1 + r 

B2 2 Bin(n; p) . 

Båda variablerna mäter antalet uppgångar och speciellt mäter B1 antal 

uppgångar under förutsättningen att sannolikheten för en uppgång är 

4 Beteckningen d e betyder det närmaste högre heltalet, t ex gäller d3:14e = 4 och 

för negativa tal gäller d 2:9e = 2. 

5 Observera att papper och penna förenklar när man följer de olika stegen. 


, 

n k 

n k


up 

1+r > p och B2 är antal uppgångar där sannolikheten för uppgång är p. 

Det är intuitivt självklart att P (B1 m) > P (B2 m) när u > 1 + r. 

Uppgift 5 Visa att 

Exempel 16 Antag att det gäller 

up d (1 p) 

+ = 1 

1 + r 1 + r 

x0 = 100 = 100 

u = 1:1 d = 0:9 

r = 0:07 

samt att lösen sker efter 100 tidssteg. Vad är det förväntade nuvärdespriset 

av en köpoption. 

Lösning 8 Vi bestämmer först hur stort k behöver vara för att 


skall vara större än 0. Det gäller att 

För p …nner vi 

m = ln u 

d 

& 

= ln 1:1 

0:9 

= 53. 

p = 

1 

ln d n x0 

1 

100 

ln 

0:9100100 1 + 0:07 0:9 

1:1 0:9 

= 0:85. 

' 

c Mikael Möller


Det sökta optionspriset kan på grund av ovanstående nu skrivas 

1 

c100 = 

(1 + r) n 

nX 

k=0 

max(0; u k d n k x0 ) n 

k pk n k 

(1 p) 

= obs max(0; u k d n k x0 ) = 0 när 0 k 52 

= 

1 

(1 + 0:07) 100 

100 

k 

= 99:885 

X100 

k=53 

0:85 k 100 k 

(1 0:85) 

max(0; 1:1 k 100 k 

0:9 

100 100) 

Låt oss nu uppfylla det outtalade löftet att förklara uppbyggnaden av 

köpoptionens pris i lite mer detalj. Det gäller att optionens förväntade 

pris vid n tidssteg är 

cn = x0P (B1 m) 

och vi noterar att faktorn 

(1 + r) n P (B2 m) 

(1 + r) n 

är en diskontering av lösenpriset till nu och detta pris blir därför direkt 

jämförbart med kapitalet x0. 

Om vi först antar att uppgången u exakt svarar mot den riskfria 

räntan, d v s att u = 1 + r, då erhålls att 


när u = 1 + r. 

P (B1 m) = P (B2 m). 

P (B1 m) = P (B2 m) 

Under ovanstående antagande kan därför köpoptionens pris skrivas 

cn = x0 

(1 + r) n P (B1 m) 

och vi ser att detta pris är skillnaden mellan ursprungskapitalet x0 och 

det diskonterade lösenpriset viktat med sannolikheten för att aktien 

skall gå upp. Denna senare sannolikhet blir 1 ty (se ekvation 3.2 sid 58) 


p = p(1 + r; d; r) = 

1 + r d 

= 1 

1 + r d


varför det gäller att P (B1 m) = 1 varav följer att optionens pris blir 

cn = x0 

. 

(1 + r) n 

Antag nu att u > 1 + r, d v s att uppgångarna är större än bankräntan, 

då erhålls att 

P (B1 m) > P (B2 m). 

I detta fall har kapitalet större chans att förränta sig vid köp av aktier 

än vid köp av ränteobligationer eftersom sannolikheten för uppgång då 

blir större än p. Lösenpriset däremot 

(1 + r) n 

ligger fortfarande fast eftersom sannolikheten för uppgång fortfarande 

är p. Vi ser således att det är sannolikheten P (B1 m) som korrigerar 

köpoptionens pris. Endast denna faktor innehåller direkt det aktiespeci- 

…ka värdet u. 


om u = 1 + r. 


om u > 1 + r. 

3.3 Epostmodell 

P (B1 m) = 1 

P (B1 m) > P (B2 m) 

Av våra diskussioner ovan framgår klart att modellen som baseras på 

binomialfördelningen är en mycket viktig och användbar modell och vi 

skall nu titta på ett exempel som inte har ett dugg med ekonomi eller 

…nansiella transaktioner att göra. Anledningen till det är att jag ytterligare 

vill poängtera modellens användbarhet samt att detta exempel 

låter oss införa ytterligare två fördelningar, ’för första gången’och ’negativ 

binomial’, på ett naturligt sätt. 

I detta exempel betraktar vi internet och frågar oss hur många sändningsförsök 

som behövs för att ett typiskt ebrev skall bli korrekt överfört. 

Brevets minsta beståndsdel är ett tecken och varje tecken beskrivs av 8 

c Mikael Möller

66 3.3. Epostmodell 

bitar men det blir inte svårare att betrakta ett tecken om n bitar så det 

är vad vi kommer att göra. Den som så önskar kan överallt ersätta n 

med 8. 

Exempel 17 (Kommunikationsmodell) Kommunikation över internet 

sker i form av paket med n ettor och nollor (bit) per paket. Bestäm 

sannolikheten för att ett paket om n bitar skall bli felaktigt överfört. 

Beteckna sannolikheten för att en bit blir felaktigt överförd med q1. 

Lösning 9 De…niera de stokastiska variablerna 

Xi = 

X = 

1 

0 

om bit i blev fel överförd 

annars 

q1 

p1 

i = 1; 2; : : : ; n 

nX 

Xi = antal felaktigt överförda bitar av n 

i=1 

Händelsen ”Det mottagna paketet är felaktigt överfört” är nu ekvivalent 

med händelsen fX > 0g. Vi antager nu att den slumpmekanism som gör 

att den mottagna biten blir felaktigt överförd fungerar på samma slumpmässiga 

sätt för alla bitarna –detta antagande är ett likafördelnings- och 

oberoendeantagande. Vi har nu att söka P (X > 0) men redan i exemplet 

om Betygssättning har vi noterat att omskrivningen 

P (X > 0) = 1 P (X = 0) 

är mycket användbar. Vi bestämmer därför först 

P (X = 0) = P (X1 = 0; : : : ; Xn = 0) 

= P fX1 = 0g \ \ fXn = 0g 

fty oberoendeg = P fX1 = 0g P fXn = 0g 

= P (X1 = 0) P (Xn = 0) 

fty likafördelningg = (1 q1) (1 q1) 

= (1 q1) n 

Sannolikheten för att vårt paket skall vara felaktigt överfört kan därför 

skrivas 

P (X > 0) = 1 (1 q1) n . 

Detta var den enkla biten och den kunde modelleras med hjälp av 

modellen för en binomialfördelning. I …gur 3.1 ser vi hur sannolikheten 

qn för ett felaktigt överfört paket om n bitar beror på felsannolikheten 

c Mikael Möller


1.0 

0.8 

0.6 

0.4 

0.2 

n=32 

n=16 

n=8 

0.0 

0.0 0.1 0.2 0.3 

Figur 3.1: Sannolikheten P (X > 0) som funktion av p. 

q1 vid tre olika paketstorlekar –n = 8; 16; 32. Vi ser att felsannolikheten 

måste vara mycket liten för att ett paket skall överföras korrekt. 

Låt oss nu för…na modellen genom att antaga att det …nns en kontrollmekanism 

som kan avgöra om ett mottaget paket är fel eller rätt 

överfört. Om det klassas som felaktigt så genomförs en omsändning av 

hela paketet.. 

Exempel 18 (För första gången modell) Ett meddelande över internet 

delas upp i paket av storlek n och varje paket har en viss sannolikhet 

pn att komma fram felfritt. Om paketet ej kommer fram felfritt 

begär mottagaren omsändning. Denna begäran sker automatiskt av mottagande 

epostdator när den upptäcker ett fel. Vad är sannolikheten för 

att ett paket måste sändas k gånger? 

Lösning 10 Sannolikheten för att ett paket skall komma fram felfritt 

första gången är pn. För att paketet skall komma fram felfritt den 

andra gången krävs att det ej kom fram felfritt första gången men väl 

i andra och vi erhåller sannolikheten (1 pn) pn för denna händelse. 

För att paketet skall komma fram felfritt den tredje gången krävs att det 

ej kom fram felfritt första och andra gången och vi erhåller sannolikheten 

(1 pn) 2 pn. Det gäller således med 

X = antal sändningar 

att sannolikhetsfunktionen för X blir 

P (X = 1) = pn 

P (X = 2) = (1 pn) pn 

P (X = 3) = (1 pn) 2 pn; : : : . 

q 

c Mikael Möller


Om vi nu skriver om sannolikhetsfunktionen för 3 sändningar till 

P (X = 3) = (1 pn) 3 1 pn 

så ger en stunds begrundan (induktion) att sannolikheten för k sändningar 

blir 

P (X = k) = (1 pn) k 1 pn; k = 1; 2; : : : 

Denna sannolikhetsfunktion kallas för första gången fördelningen och 

och den de…nieras enligt 

De…nition 26 (För första gången fördelning) En stokastisk variabel 

X som uppfyller 

P (X = k) = (1 p) k 1 p, k 2 X 

där X = f1; 2; : : :g säges vara för första gången fördelad med parametern 

p. Vi skriver 

X 2 F fg(p) . 

Uppgift 9 Visa att det för F fg(p) gäller 

1. P 1 

k=1 (1 p)k 1 p = 1. 

2. E (X) = 1 

p . 

3. V (X) = 

1 p 

p 2 

Vi har nu verktygen för att bestämma sannolikheten att, över internet, 

överföra ett paket korrekt i mindre än säg k steg. Självklart är 

det även mycket intressant att bestämma hur många steg, eller snarare 

det förväntade antalet steg, som måste ske för att ett epostbrev skall bli 

korrekt överfört. Vi börjar med att bestämma sannolikhetsfunktionen 

för att ett epostbrev om exakt l paket skall bli korrekt överfört. 

Exempel 19 (Negativ binomialmodell) Epostbrev som skickas över 

internet delas upp i ett antal paket av …x längd vilka sedan skickas till 

adressaten. Om ett epostbrev består av l paket vad blir då sannolikhetsfunktionen 

för det antal sändningar som behövs för att hela brevet skall 

komma fram felfritt. Sannolikheten för att ett paket skall bli felfritt överfört 

är pn. 

c Mikael Möller


Lösning 11 Vi börjar med att bygga modellen d v s att först de…niera 

den stokastiska variabeln 

X = antalet sändningar som behövs för att överföra l paket felfritt. 

Om vi betecknar att paketet är korrekt överfört med c och felaktigt överfört 

med f så kan en möjlig sändning av l = 5 paket beskrivas av 

fcffcfcfffcffc = fcffcfcfffcffjc 

vilket svarar mot 14 paketsändningar. Den sista sändningen måste vara 

korrekt och det är den med sannolikheten pn. Bland de övriga 13 sändningarna 

skall det …nnas 4 korrekta och 9 felaktiga och detta kan erhållas 

på 13 

4 olika sätt där varje sätt har sannolikheten p4n (1 p) 9 

n att inträ¤a. 

Härav följer, eftersom oberoende förutsätts, 

P (X = 14) = 13 

4 p4 n (1 pn) 9 

= 13 

4 p5 n (1 pn) 9 

Observera att det sista paketet måste behandlas för sig och att man inte 

kan föra resonemanget för alla 14 på en gång ty då skulle även fall som 

fcffcfcffcfcff 

beaktas. Men detta är inte en möjlig händelse ty efter 5 lyckade överföringar 

avslutas sändningen. Sannolikheten för 5 korrekta och 9 felaktiga 

överföringar kan skrivas om på följande sätt 

P (X = 5 + 9) = 

= l + r 1 

= l + r 1 

5 + 9 1 

5 1 

l 1 

l 1 

pn 

p 5 5+9 5 

n (1 pn) 

p l l+r l 

n (1 pn) 

p l n (1 pn) r 

där l = 5 är antalet paket och r = 9 är antalet felsändningar. Sannolikheten 

för att antalet sända paket skall vara k = l + r kan därför 

skrivas 

P (X = k) = 

k 1 

l 1 pl k l 

(1 p) 

k = l; l + 1; : : : 

c Mikael Möller


Och därmed har vi funnit ytterligare en ny sannolikhetsfunktion och 

liksom tidigare beskriver vi den i en de…nition. 

De…nition 27 (Negativ binomial fördelning) En stokastisk variabel 


P (X = k) = 

k 1 

l 1 pl k l 

(1 p) 

k 2 X; k l 

där X = fl; l + 1; : : :g säges vara negativt binomialfördelad med parametrarna 

l och p. Vi skriver 

X 2 Neg(l; p) . 

Med hjälp av denna fördelning kan vi bestämma det förväntade antalet 

sändningar för att korrekt överföra ett epost-meddelande med felsannolikheten 

q, för en enstaka bit. Se vidare uppgift nedan. 

Uppgift 10 Visa att för Neg(l; p) gäller 

1. (svår) P 1 

k=l 

2. E(X) = l 

p . 

3. V (X) = 

l(1 p) 

p 2 

k 1 

l 1 pl (1 p) k l = 1. 

Uppgift 11 (Svår) Bestäm väntevärde och varians för Neg(l; p) utgående 

från sannolikhetsfunktionen. 

Exempel 20 En tidningsartikel består utav 817 tecken (n = 8) och 

denna vill vi skicka till en tidning. Hur många sändningsförsök kan vi 

förvänta oss innan denna artikel …nns hos tidningen i oförvanskat skick? 

Felsannolikheten på bitnivå är q1 = 0:001. 

Lösning 12 Sannolikheten för ett korrekt överfört tecken blir 

p8 = (1 0:001) 8 = 0:99203. 

Antalet förväntade paketsändningar blir 

817 

0:99203 

= 824 

d v s vi kan förvänta oss att behöva sända om upp till 8 tecken. 6 

6 d e betyder närmast högre heltal. 

c Mikael Möller


Innan vi lämnar epostmodellen bör vi kanske ge ett skäl till namnet 

negativ binomialfördelning ty det …nns inget negativt i den. Däremot 

innehåller den samma komponenter som binomialfördelningen. Ordet 

negativt kommer sig av identiteten 

k 1 

l 1 pl (1 p) k l = 

där r = k l och q = 1 p. 

3.4 Spelmodeller 

l + r 1 

l 1 

p l (1 p) r = 

r 

l 

p l ( q) r 

Nästa exempel handlar om kortspel. Då dessa nu ‡orerar på nätet kan 

det vara bra att känna till lite om sannolikheterna att vinna i dessa spel. 

Exempel 21 (Black Jack) Dagens Black jack, eller 21 som vi säger 

i Sverige, är en vidareutveckling av det black jack som sedan länge har 

varit ett av de populäraste casinospelen. Black jack betraktas som ett 

amerikanskt kortspel men är egentligen ett franskt hasardspel från mitten 

av 1700-talet, vingt-et-un (”tjugoett”), som uppnådde stjärnstatus vid 

Ludvig XV:s hov i Versailles. Under 1800-talet spred sig tjugoett, i ‡era 

snarlika varianter, över västvärlden inklusive Sverige och kom att utövas 

‡itigt inte bara på spelhus och casinon utan även i privata spelpartier 

om pengar. Varianten Black Jack uppstod i USA på 1910-talet, enligt 

trovärdiga källor år 1912 i staden Evanstown i Illinois där man bland 

annat införde nymodigheten att ett svart ess och en svart knekt (”Black 

Jack”) i given gav spelaren en extra vinstbonus. Sedan andra världskriget 

har Black Jack blivit världens vanligaste kortspel på casinon och dess 

popularitet ökar i lavinartad form på internet. Reglerna är mycket enkla: 

Black Jack spelas oftast med sex kortlekar innehållande 52 kort var och 

varje spelare får två kort vilka värdesätts på följande sätt 

1. Korten 2 till och med 10 är värda det poängtal som står angivet på 

spelkorten. 

2. Kung, dam och knekt är värda tio poäng. 

3. Ess är värt antingen ett poäng eller elva. 

Du spelar Black Jack, med en kortlek om 52 kort, och får två kort. 

Bestäm sannolikheterna för följande händelser: 

1. Båda korten är värda 10 eller 11 poäng. 

c Mikael Möller

72 3.4. Spelmodeller 

2. Båda korten är Ess. 

3. Båda korten är värda 10 poäng. 

4. Vad är sannolikheten för en Black Jack d v s 21 poäng. 

Lösning 13 För att lösa dessa frågeställningar bildar vi den stokastiska 

modellen 

Xi = kort i:s värde i = 1; 2 xi 2 X 

där utfallsrummet är X = f1; 2; : : : ; 11g. 

1. Denna sannolikhet kan erhållas medelst två metoder där den första 

betraktar båda korten på en gång. Den andra metoden utnyttjar 

betingning och betraktar ett kort i taget. Sätt 

varvid har 

p = P (10 X1 11; 10 X2 11) 

båda på en gång metoden 

p = 

20 

2 

52 

2 

0:14 

ty det …nns 16 kort värda 10 och 4 värda 11 poäng. 

ett i taget metoden 

p = P (10 X1 11 j 10 X2 11) P (10 X1 11) 

= 19 20 

51 52 

0:14. 

2. Den sökta sannolikheten blir (’ett i taget’) 

P (X1 = 11; X2 = 11) = 3 4 

51 52 

3. Den sökta sannolikheten blir (’båda på en gång’) 


P (X1 = 10; X2 = 10) = 

16 

2 

52 

2 

0:005 

0:09


4. Här använder vi oss av betingat väntevärde 

P (X1 + X2 = 21) = E P (X1 + X2 = 21 j X1) 

= P (X2 = 11 j X1 = 10) P (X1 = 10) 

+ P (X2 = 10 j X1 = 11) P (X1 = 11) 

= 4 

51 

16 16 

+ 

52 51 

4 

52 

0:048 

Exempel 22 (Poker) I poker används en kortlek om 52 kort uppdelade 

på 4 färger. Varje färg innehåller kort av valörerna Ess (1 eller 

14),2,. . . ,10, knekt (11), dam (12) och kung (13). Man delar vanligen 

ut 5 kort per spelare och därefter värderas händerna på följande sätt 

Kunglig Färgstege (ess, kung, dam, knekt och tio ur en och samma färg). 

Färgstege (fem kort i samma färg i fallande ordning). Fyrtal (Fyra kort 

av samma valör). Kåk (En triss och ett par. Trissen räknas först). Färg 

(Fem kort i samma färg). Stege (Fem kort från olika färger i fallande 

ordning). Triss (Tre kort av samma valör). Två par (Två uppsättningar 

par). Ett par (Två kort av samma valör). Bestäm sannolikheterna för 

ovanstående pokerhänder. 

Lösning 14 Dessa sannolikheter erhålls medelst direkt räkning på följande 

sätt 

Färgstege Möjliga händer med färgstege är 

(E; 2; 3; 4; 5) ; (2; 3; 4; 5; 6) ; : : : ; (10; Kn; D; K; E) 

och de är sammanlagt 10 stycken och eftersom vi har 4 färger blir 

sannolikheten 

P (Färgstege) = 

10 4 

52 

5 

= 40 

52 

5 

= 0:0000154. 

Eftersom det bara …nns 4 av en Kunglig Färgstege erhålls 

P (Kunglig Färgstege) = 4 

52 

5 

= 0:00000154. 

Flertal Eftersom Fyrtal, Triss och Ett Par beräknas på samma sätt tar 

vi fram en allmän formel för dem. Sätt 

X = antal kort av samma valör, k = 2; 3; 4 

c Mikael Möller

74 3.4. Spelmodeller 

varvid 

P (X = k) = 

13 

1 

4 

k 

12 

5 k 

52 

5 

4 

1 

5 k 

; k = 2; 3; 4 

ty först väljer vi valör för k-talet, sedan väljer vi vilka färger som 

skall förekomma i k-talet, sedan väljer vi valörer för de återstående 

korten och avslutar med att välja färg för vart och ett av dem. 

Numeriskt erhålls 

P (X = 2) = 

P (X = 3) = 

P (X = 4) = 

13 

1 

13 

1 

13 

1 

4 

2 

4 

3 

4 

4 

12 

5 2 

52 

5 

12 

5 3 

52 

5 

12 

5 4 

52 

5 

4 

1 

4 

1 

4 

1 

5 2 

5 3 

5 4 

Kåk En kåk består av en triss och ett par varför 

P (Kåk) = 

13 

1 

4 

3 

52 

5 

12 

1 

4 

2 

= 0:42 

= 0:021 

= 0:00024 

= 0:0014 

Färg En färg består av en och endast en färg men är ej färgstege varför 

P (Färg) = 

4 

1 

13 

5 

52 

5 

40 

= 0:002 

Stege En stege beräknas på samma sätt som en färgstege men varje 

kort kan ha en av 4 färger dock skall vi undanta färgstege varför 

4 

10 1 

P (Stege) = 

5 

52 

5 

40 

= 0:004 

Två Par Två par består av två valörer och dessa kan ha vilken färg 

som helst. Det återstående kortets valör skall skilja sig från det 

två men får ha valfri färg varför 


P (Två Par) = 

13 

2 

4 

2 

2 11 

1 

52 

5 

4 

1 

= 0:048


Lank I en värdelös hand har alla kort olika valörer och bildar ej en stege. 

Korten kan bestå av alla färger men ej de som ger färg. Detta ger 

P (Lank) = 

13 

5 

10 

52 

5 

4 

1 

5 

4 

= 0:50 

Vi ser att det är nästan lika stor sannolikhet att få ett par som att 

inte få något överhuvudtaget. Å det är bra ty det håller hoppet och 

spänningen uppe. 

3.5 Kvalitetskontroll 

Inom all a¤ärsverksamhet förekommer, åtminstone ibland, att man köper 

in stora partier av någon vara. Dessa varor kan vara en del av någon 

produkt som man själv tillverkar (t ex kullager till motorer) eller en 

slutprodukt (t ex kramdjur från Kina). Om felsannolikheten är hög i det 

parti man mottager så drabbas man av reklamationer ja det kan till och 

med gå så långt att det egna varumärket lider skada. Tänka bara om ett 

kramdjurs öga lossnar och hamnar i halsen på en två-åring som kvävs 

till döds. 

Statistiker har under årens lopp tagit fram en mängd olika metoder 

för att förhindra acceptans av felaktiga partier (man har naturligtvis 

även utarbetat metoder för att en produktion skall fungera optimalt 

men den frågan skall vi inte ta upp här) och vi skall beskriva en av dessa 

–kvalitetskontroll med hjälp av felantalsmetoden. 

Exempel 23 (Kvalitetskontroll) Verkstadsföretaget Morphic har utvecklat 

en teknik som gör det möjligt att tillverka ‡ödesplattor (en del 

av en bränslecell) avsevärt billigare, snabbare och med högre kvalitet är 

vad som tidigare varit möjligt. Istället för att fräsa ut spår i plattorna, 

skapas ett mönster genom att plattorna utsätts för ett mycket högt, dynamiskt, 

tryck under bråkdelen av en sekund. Tekniken medför en rad 

fördelar; produktionstiden per platta förkortas drastiskt samtidigt som 

möjligheten att åstadkomma avsevärt …nare detaljer i plattans mönster 

medför ett e¤ektivare bränsle‡öde. En godkänd platta skall ge ett visst 

minimi‡öde och om detta värde ej erhålls räknas plattan som defekt och 

byts ut. Ett företag inom fordonsindustrin har nu erhållit en större sändning 

om N = 10 000 plattor för utvärdering. Men först skall kvaliten på 

de levererade plattorna undersökas. Självklart kan man inte undersöka 

varje platta för sig ty därtill är antalet för stort och man vill också ha 

en metod som kan användas i framtiden då det blir fråga om inköp av 

c Mikael Möller

76 3.5. Kvalitetskontroll 

miljontals plattor. Företaget bestämmer sig därför för att på ett slumpmässigt 

sätt plocka ut n plattor och undersöka dessa. Resultatet av denna 

undersökning appliceras sedan på hela partiet. Vilken sannolikhetsmodell 

är lämplig för denna situation? 

Lösning 15 Varje platta, bland de N, kan klassas som antingen defekt 

eller icke-defekt. Självklart …nns här en gråzon men vi utgår ifrån att 

den inte existerar. Tag nu ett stickprov av storlek n ur dessa N plattor 

och bilda de stokastiska variablerna 

Xi = 

Xn = 

1 

0 

om platta i är defekt 

annars 

i = 1; : : : ; n, 

nX 

Xi = antal defekta plattor i urvalet. 

i=1 

Så här långt liknar situationen mycket den binomialmodell som vi tidigare 

skapat men det föreligger här en väsentlig skillnad. Det som gör 

att vi kommer att …nna en annan modell än binomialmodellen är ändligheten 

hos N. Denna ändlighet ändrar på sannolikheten, att få en 

felaktig platta, allteftersom vi plockar plattor bland de N. Detta inses 

enklast på följande sätt. Om felsannolikheten för partiet är p (bestämd 

som kvoten mellan antalet felaktiga plattor och N) så har vi Np felaktiga 

plattor och N (1 p) korrekta plattor. Antag nu att den första plattan vi 

tog var felaktig (vilket den är med sannolikheten p) då blir sannolikheten 

för att också den andra plattan är felaktig 

Np 1 

N 1 

vilket är skilt från p! Det är klart att om N är väldigt stort så blir det 

ändock samma resultat ty denna kvot närmar sig p när N växer över 

alla gränser. Den modell vi kommer fram till kan således betraktas som 

en generalisering av binomialmodellen ty dess gräns, när N ! 1, blir 

just denna binomialmodell. För att få k felaktiga plattor i urvalet om 

n plattor måste vi ta k plattor från de Np och detta kan vi göra på 

Np 

k olika sätt (eftersom ordningen är ointressant) de resterande n k 

plattorna måste tas från de N (1 p) korrekta plattorna och detta kan 

N(1 p) 

vi göra på n k sätt. Härav följer att det totala antalet möjligheter 

att få k defekta och n k korrekta, i ett urval om n plattor, är 


Np 

k 

N (1 p) 

n k 

.


Till detta kommer att antalet sätt att ta n plattor ur N är N 

n 

nolikheten att få k defekta bland n blir 

P (Xn = k) = 

Np 

k 

N(1 p) 

n k 

N 

n 

. 

så san- 

Man får här vara lite försiktig med de tillåtna värdena på k ty k kan 

aldrig bli större än Np (det totala antalet defekta plattor). Härav följer 

att X = f0; 1; : : : ; min (Np; n)g. 

Denna fördelning kallas den hypergeometriska fördelningen och för 

den gäller följande de…nition. 

De…nition 28 (Hypergeometrisk fördelning) En stokastisk variabel 


P (X = k) = 

Np 

k 

N(1 p) 

n k 

N 

n 

där X = f0; 1; : : : ; min (Np; n)g säges vara hypergeometriskt fördelad 

med parametrarna N, n och p. Vi skriver 

X 2 Hyp(N; n; p) . 

Uppgift 12 Visa att om Np > n så gäller för Hyp (N; n; p) att 

1. (svår) Pn ( 

k=0 

Np N(1 p) 

k )( n k ) 

( N = 1. 

n) 

2. E (X) = np. 

3. V (X) = np (1 p) 

N n 

N 1 

Nästa steg blir att givet denna hypergeometriska modell skapa en 

kostnadse¤ektiv metod för att acceptera eller förkasta hela partiet. Den 

metod vi här skall beskriva ger en försmak till kapitlet om Prövning av 

antaganden. 

Köparen vill endast acceptera partier som klart uppfyller att felsannolikheten 

p pk, där pk är den högsta felsannolikhet som köparen 

kan acceptera. 7 

7 Observera att i allmänhet kan man inte kräva en felsannolikhet på 0 ty det skulle 

kosta allt för mycket för att uppnå detta. Man skulle vara tvungen att kontrollera 

varje platta och byta ut de defekta mot korrekta. 

c Mikael Möller

78 3.5. Kvalitetskontroll 

Säljaren vill endast förkasta partier som klart uppfyller att felsannolikheten 

p ps där ps är den lägsta felsannolikhet som säljaren 

kan acceptera. 

Vid sin första förhandling måste säljaren och köparen komma överens 

om en och samma felsannolikhet d v s bestämma ett p0 sådant att 

pk = ps = p0. Därefter måste de komma överens om en metod för att 

testa om ett parti har en felkvot som överensstämmer med den si¤ra de 

kommit överens om. Det …nns bara ett sätt: plocka plattor och undersök 

dem. Eftersom det kostar att undersöka plattor kan inte alla plattor undersökas. 

Med ett lämpligt urvalsförfarande undersöks därför n stycken 

och av dessa får högst c vara felaktiga. 

Vi måste nu sätta oss in i köparens respektive säljarens situation och 

resonera som de d v s på två olika sätt: 

Köparen vill de…nitivt inte betala för ett parti som innehåller många 

felaktiga enheter och sätter därför upp hypotesen 8 

H0: p p0. 

Om partiet är dåligt skall sannolikheten ( ) för att förkasta denna 

hypotes vara liten. Detta ger oss den första ekvationen 

P (förkasta H0 givet H0 sann) = . (3.3) 

Säljaren vill de…nitivt inte förkasta ett parti som uppfyller köparens 

krav på felsannolikhet och sätter därför upp hypotesen 

H1: p p0. 

Om partiet är bra skall sannolikheten ( ) för att förkasta denna 

hypotes vara liten. Detta ger oss den andra ekvationen 

P (förkasta H1 givet H1 sann) = . (3.4) 

Båda sätten att tänka är rimliga ty all a¤ärsverksamhet baserar sig 

på både förtroende och misstänksamhet. Utan det första skulle man 

inte ens tänka sig att göra a¤är och utan det senare är man snabbt satt 

i konkurs. 

De…niera nu funktionen 

L(p) = P (Xn c; p) = P (acceptera ett parti med felsannolikhet p) 

c Mikael Möller


L(0.05) 

L(p) 

0.05 

Figur 3.2: L (p) = P (Xn c; p) 

och rita L(p) för p 2 [0; 1]. Om vi också markerar felsannolikheten 

0:05 så erhålls …gur 3.2. 9 Det framgår tydligt att sannolikheten för att 

acceptera partiet blir större för alla de felsannolikheter som ligger till 

vänster om 0:05. D v s att en mindre felsannolikhet ger en större chans att 

acceptera partiet. Gränsen L(0:05) är därför den minsta sannolikheten 

att acceptera partiet som kan inträ¤a för alla felsannolikheter p 0:05. 

Låt oss se om ekvationerna 3.3 och 3.4 kan ge oss en urvalsplan (n; c) 

som kan accepteras av både köparen och säljaren. Med detta avses att 

både köparen och säljaren skall acceptera en och samma urvalsstorlek n 

och en och samma gräns c på antalet felaktiga. Det enda som de väljer 

självständigt är sannolikheterna och . 

Med beteckningen 

så gäller 

Xn = antal felaktiga bland de n 

P (Xn c j p p0) = och P (Xn > c j p p0) = 

ty köparen förkastar sin hypotes om Xn är litet och säljaren sin om Xn 

är stort. Dessa ekvationer kan förenklas ytterligare. Först noterar vi att 

L (p0) L (p1) för alla p1 p0 

och detta inses enklast genom att rita …guren nedan och då erhålls att 

8 Hypotes är det statistiska språkbruket för ordet antag. 

9 Figuren indikerar endast det principiella utseendet och den är ej skalenlig. 

p 

c Mikael Möller

80 3.6. Sammanfattning 

L(p_0) 

L(p_1) 

p_0 

L(p) 

p_1 

om = L (p0) så gäller att L (p1) för alla p1 p0. Detta betyder 

att om vi har kontroll på p0 så har vi också kontroll på alla p > p0 varav 

följer att 

P (Xn c j p = p0) = . 

På samma sätt erhålls ekvationen 

P (Xn > c j p = p0) = . 

Detta ger oss nu två ekvationer för att lösa de två obekanta n och c i 

urvalsplanen. 

Exempel 24 Kund till Morphic 

3.6 Sammanfattning 

I kapitlet Diskreta modeller har vi infört följande diskreta fördelningar 

1. Bin (n; p), E (X) = np och V (X) = np (1 p) 

2. F fg (p), E (X) = 1 

p 

3. Neg (l; p), E (X) = l 

p 

och V (X) = 1 p 

p 2 

och V (X) = l(1 p) 

p 2 

I lösandet av exemplen har funktionerna P (X = k), sannolikhetsfunktionen, 

och P (X k), fördelningsfunktionen, tagit en central plats. 


p


3.7 Lösningar till uppgifter 

1 Vi börjar med att visa att sannolikheterna över utfallsrummet summerar 

sig till 1. Detta följer av binomialsatsen som säger att 

(a + b) n = 

nX 

i=0 

n 

k ak n k 

b 

varav påståendet följer om vi sätter a = p, b = q och noterar att enligt 

förutsättningarna är a + b = p + q = 1. Bestämning av väntevärde och 

varians kan lösas med två metoder: de…nition av storheterna direkt och 

indirekt. Vi väljer det senare och överlåter den förra på läsaren. Först 

har vi att 

nX 

X = 

k=1 

där Xk 2 Bin (1; p) och vidare är X1; : : : ; Xn oberoende. Detta ger 

enligt satserna x och x att 

E (X) = E 

= np 

och oberoendet ger 

nX 

k=1 

Xk 

! 

V (X) = V 

= 

= 

nX 

k=1 

Xk 

nX 

E (Xk) = 

k=1 

nX 

k=1 

1 2 

Xk 

= np (1 p) . 

! 

= 

p + 0 2 

nX 

k=1 

nX 

V (Xk) 

k=1 

1 p + 0 (1 p) 

(1 p) p 2 

2 Den stokastiska variabel som vi betraktat i exemplet ovan är 

och vi skall söka. 

E (Y ) = 

Y = min (XT ; XP ) 

5X 

yP (Y = y) och V (Y ) = E Y 2 

i=0 

E (Y ) 2 . 

c Mikael Möller

82 3.7. Lösningar till uppgifter 

Sannolikheten P (Y = y) kan skrivas 

P (Y = y) = 

5X 

i=0 j=0 

y=min(i;j) 

5X 

P (XT = i; XP = j) 

n 

= gör nu uppdelningen P5 i=j+1 + P5 j=i+1 + P o 

5 

i=j=0 

5X 

= 2 P (XT = i; XP = j) P (XT = j; XP = j) 

0 

i=j 

= @2 

1 

5X 

P (XT = i) P (XT = j) A P (XP = j) 

i=j 

och en del omfattande beräkningar ger nu att 

E (Y ) = 0:72749, 

V (Y ) = 0:51224. 

3 Händelsen X2 = udx0 betyder att av totalt två steg skall exakt en 

uppgång inträ¤a. Antalet möjligheter att ta ut en uppgång ur två steg 

2 

är 1 = 2. De två möjliga uppgångarna är (u; d) och (d; u) och de har 

sannolikheten p(1 p) respektive (1 p)p att inträ¤a. Härav följer att 

P (X2 = udx0) = 2 

1 

4 Vi har att ynm > 0 och kan därför skriva 

och eftersom 

ynm = u 

d 

u 

> 1 

d 

p(1 p) = 2p(1 p). 

m 

d n x0 

följer att ynk > 0 för alla k > m. Härav följer att för alla k m så gäller 

y n(k+1) ynk = u k+1 d n k 1 x0 u k d n k x0 

= u k d n k 1 x0 (u d) > 0 

ty u d > 0 per de…nition varav det följer att ynk < y n(k+1). 

c Mikael Möller


5 Det gäller enligt tidigare att 

p = 

1 + r d 

u d 

och detta ger följande uttryck för vänstra ledet, VL, 

VL = up d (1 p) 

+ 

1 + r 1 + r 

= u 

1 + r 

1 + r d 

u d 

= 

(u 

1 

d) (1 + r) 

= 

(u 

1 

d) (1 + r) 

= 

= 1. 

6 Det gäller att 

+ d 

1 + r 

1 

1 + r d 

u d 

u + ru ud + du d2 

(u d + ru rd) 

1 

(u d) (1 + r) 

(u d) (1 + r) 

varför påståendet gäller. 

B1 2 Bin n; up 

1 + r 

fu = 1 + rg = Bin 

(1 + r)p 

n; 

1 + r 

= Bin(n; p) 

7 Det gäller enligt föregående uppgift att 

nX 

P (B1 m) = 

k=m 

n 

k pk n k 

(1 p) 

= n 

m pm (1 p) n m + 

+ 

Men p = 1 varför det gäller 

P (B1 m) = n 

m 

n 

n 1 pn 1 (1 p) + n 

n pn . 

= 1 

0 + + 

d rd + d 2 

n 

m + 1 pm+1 (1 p) n m 1 + 

n 

n 1 

0 + n 

n 

1 

c Mikael Möller


8 Om u > 1 + r så gäller att 

up 

> p 

1 + r 

d v s att den stokastiska variabeln B1 har större chans än B2 att bli stor. 

Man kan även visa påståendet med samma teknik som i uppgift ??. 

9 Vi visar påståendenna i ordning som ovan. 

1. Vad vi har att visa är att P ( ) = 1 vilket följer av 

1X 

k=1 

(1 p) k 1 = 

1X 

k=0 

q k = 1 1 

= 

1 q p 

2. Väntevärdet beräknar vi direkt ur de…nition för sannolikhetsfunktionen 

1X 

E (X) = k (1 p) k 1 p = 

k=1 

= p d 

dq 

1X 

k=0 

q k = p d 

dq 

1 1 

= p 2 = 

(1 q) p 

3. Variansen tar vi ur sambandet 

där 


E X 2 = 

= p 

1X 

k=1 

V (X) = E X 2 

k 2 (1 p) k 1 p = p 

q 

= pq d2 

dq 2 

1X 

k=2 

k (k 1) q k 2 + 

1X 

k=0 

E 2 (X) 

1X 

k=1 

q k + 1 d 

= pq 

p2 dq 

1 

1 q 

k 1 

(k (k 1) + k) q 

1X 

k=1 

= pq 

(1 

2 1 2 

3 + = 

q) p2 2p + p 

p2 = 2 p 

p2 k 1 

kq 

! 

1 1 

2 + 

(1 q) p2


Varav följer att 

V (X) = 

2 p 

p 2 

10 Vi visar påståendena i ordning som ovan 

1. Överlåtes på läsaren - svårt 

2. De…nition av Neg(l; p) ger 

Neg(l; p) = 

varav väntevärdet erhålls till 

E Neg(l; p) = 

lX 

i=1 

1 1 p 

= 

p2 p2 lX 

F fg(p) 

i=1 

3. Variansen blir på grund av oberoendet 

V (Neg(l; p)) = 

E F fg(p) = l 

p . 

lX 

V (F fg(p)) = 

i=1 

l (1 p) 

p 2 

12 Punkt 2 är enklast ty den följer direkt av att den hypergeometriska 

variabel X de…nierades som en summa av n stycken 0-1 variabler och 

för väntevärdet av en summa krävs ej oberoende. Punkt 3 kan även 

den använda sig av summationen tillsammans med lagen om betingad 

varians. Sätt 

och 

Det gäller nu 

In = 

1 om n:te OK 

0 annars 

Xn = 

nX 

In. 

i=1 

V (Xn) = V E(Xn j Xn 1) + E V (Xn j Xn 1) 

E(Xn j Xn 1) = E(Xn 1 + In j Xn 1) = Xn 1 + E(In j Xn 1) 

= Xn 1 + Np Xn 1 

N n + 1 

V (Xn j Xn 1) = V (Xn 1 + In j Xn 1) = V (In j Xn 1) 

= Np Xn 1 

N n + 1 

Np Xn 1 

N n + 1 

2 

c Mikael Möller


V (Xn) = V Xn 1 + Np Xn 1 

N n + 1 

= V 

Antag nu att 

Np 

+ 1 

N n + 1 

2 

+ E 

Np Xn 1 

N n + 1 

Np Xn 1 

N n + 1 

1 

N n + 1 Xn 1 + E Np Xn 1 

N n + 1 

E Np Xn 

N 

1 

n + 1 

= V 1 

N 

1 

n + 1 Xn + E Np Xn 

N 

1 

n + 1 

V Np Xn 1 

N n + 1 

E 2 Np Xn 1 

N n + 1 

= 1 

N 

2 

n + 1 V (Xn 1) + p (1 p) 

= N n 1 

N n + 1 V (Xn 1) + p (1 p) 

det gäller då att 

V (Xn) = 

V (Xn 1) = (n 1) p (1 p) 

N n 1 

N n + 1 

(n 1) p (1 p) 

N n + 1 

N 1 

N n + 1 

N 1 

= p (1 

(N 

p) 

n 1) (n 

N 

1) + N 

1 

1 

= np (1 

N 

p) 

N 

n 

1 

Induktionsaxiomet ger nu påståendet. 


+ p (1 p) 

2 !

4. Kontinuerliga 

modeller 

Vi har i introduktionen till begreppet stokastiska variabler de…nierat 

en kontinuerlig stokastisk variabel som den variabel som har ett kontinuerligt 

utfallsrum. Här skall vi nu närmare studera denna typ av 

variabler och deras användningsområden. 

4.1 Bussmodell 

Exempel 25 Din arbetsplats är belägen i Frihamnen och buss nummer 

1 avgår därifrån var 10:e minut. På grund av den täta turlistan bryr du 

dig, vid arbetsdagens slut, inte om att planera din ankomst till hållplatsen. 

Hur kan denna situation modelleras och vad blir sannolikheten att 

du får vänta på bussen i högst 5 minuter, med den av dig givna modellen? 

Lösning 16 Vår intuition säger oss att chansen för att vänta i högst 5 

minuter är 5 av 10. Men vad är sannolikheten att vi får vänta i exakt 

5 minuter? Svaret på denna fråga är inte så självklart som man vid ett 

första påseende skulle kunna tro. 

För att kunna ge en statistisk beskrivning av ovanstående frågor behöver 

vi uttala oss om den stokastiska variabeln 

X = väntetid till nästa buss 

Eftersom bussarna går med 10-minuters intervall består vårt utfallsrum, 

den stokastiska variabeln X:s de…nitionsmängd, av alla punkter i intervallet 

[0; 10] och utfallsrummet kan därför skrivas 

= fx 2 R : 0 x 10g 

Eftersom ett utfallsrum för kontinuerliga variabler inte är ändligt uppräkneligt 

kan vi inte för dessa de…niera en sannolikhetsfunktion ty antag 

att detta vore möjligt – då är en naturlig de…nition av denna funktion 

antal punkter där X = x 

P (X = x) = 

totalt antal punkter i intervallet (0; 10) 

= 1 

= 0 

1 

87

88 4.1. Bussmodell 

och således: För en kontinuerlig variabel är sannolikheten för att få exakt 

värdet x alltid lika med noll. Sannolikhetsfunktionen för kontinuerliga 

variabler saknar därför mening. 

Däremot kan fördelningsfunktionen F (x) = P (X x), som är sannolikheten 

att personen ifråga får vänta i högst x minuter, ges en mening. 

Först noterar vi med hjälp av …gur 4.1 att, något förvånande, det 

…nns exakt lika många punkter på en kort linje som på en lång! Detta 

följer av att när strålen från triangels spets skär den korta linjen i en 

punkt så skärs också den långa linjen i en punkt och vice versa. 

Av detta följer att 

P (X x) = 

Figur 4.1: En speciell sorts oändlighet 

antal punkter där X x 

= 1 

totalt antal punkter i intervallet (0; 10) 

Konklusionen av denna betraktelse är att det inte är meningsfullt att betrakta 

punkter i det kontinuerliga fallet ty alla sannolikheter blir antingen 

0 eller 1. 

Vad vi kan betrakta, och som är en naturlig utvidgning samt appellerar 

till vår intuition, är intervallängder och då erhålls 

FX(x) = P (X x) = 

l(0; x) x 

= 

l(0; 10) 10 

där l(A) står för intervallet A:s längd. Begreppet fördelningsfunktion blir 

med detta betraktelsesätt välde…nierat i det kontinuerliga fallet. Frågan 

är nu: Hur skall vi i det kontinuerliga fallet de…niera en motsvarighet 

till sannolikhetsfunktionen P (X = x)? 

c Mikael Möller

4. Kontinuerliga modeller 89 

Observera först att i det diskreta fallet gäller 

P (xk 1 < X xk) = P (X xk) P (X xk 1) 

= P (X = xk) 1 

ty fxk 1 < X xkg = fX xkg n fX xk 1g. Betrakta sedan, i det 

kontinuerliga fallet, ett mycket litet intervall (x; x + dx). För detta intervall 

gäller 

P (x < X x + dx) = P (X x + dx) P (X x) 

= FX(x + dx) FX(x) 

Men vi vet från den matematiska analysen att om dx är tillräckligt litet 

och funktionen FX är ”snäll” så gäller 

FX(x + dx) FX(x) 

dx 

F 0 X(x) 

Vi leds härav till att allmänt de…niera en täthetsfunktion fX(x) = 

F 0 X (x) som uppfyller 

P (x < X x + dx) fX(x) dx 

Täthetsfunktionen tar vi som det kontinuerliga fallets motsvarighet till 

sannolikhetsfunktionen och den de…nieras som derivatan av fördelningsfunktionen 

FX(x). 

I vårt bussexempel gäller 

FX(x + dx) FX(x) = 

x + dx 

10 

x 1 

= 

10 10 dx 

varför täthetsfunktionen där blir fX(x) = 1 

10 . 

För att slutligen besvara vår ursprungliga fråga, om sannolikheten att 

vi får vänta högst 5 minuter, har vi att beräkna 

P (X 5) = 5 

= 0:5 

10 

Ett resultat som stämmer bra med vårt tidigare angivna intuitiva resultat. 

Om vi i exemplet ovan ersätter 0 med a och 10 med b så erhåller vi 

vår första kontinuerliga fördelning. 

De…nition 29 (Rektangelfördelning) En stokastisk variabel X som 

uppfyller 

fX(x) = 1 

b a ; x 2 X 

c Mikael Möller

90 4.2. Försäkringsmodell 

där X = fx 2 R : a x bg säges vara rektangelfördelad med parametrarna 

a och b. Vi skriver 

X 2 R(a; b) . 

Uppgift 13 Visa att för en R(a; b) fördelning så gäller att 

1. R f(x) dx = 1 

2. E(X) = a+b 

2 

3. V (X) = 

(a b)2 

12 

Denna mycket enkla fördelning är av mycket stor betydelse för att 

kunna generera slumptal 1 (egentligen pseudoslumptal ty det är inte äkta 

slumptal man får) något som för oss, här, är rätt ointressant. Men den är 

grundbulten vid alla simuleringar. Att vi ändock låter den komma som 

första kontinuerliga fördelning beror på att den låter oss införa begreppet 

täthetsfunktion på ett någorlunda intuitivt sätt. 

4.2 Försäkringsmodell 

Vi övergår nu till en annan fördelning som bland annat är användbar i 

t ex försäkringssammanhang. 

Exempel 26 (Försäkring) Ett försäkringsbolag i Sverige har sålt bilförsäkringar 

(personbilar) under en mycket lång tid och har en stor portfölj 

av sådana. Försäkringsköparna kommer från hela landet och alla 

sociala skikt. Denna portfölj drabbas då och då av skador vilka genererar 

kostnader för bolaget. Dessa kostnader (tillsammans med administrationskostnader) 

måste på lång sikt täckas av intäkterna och med lång 

sikt förstås att den förväntade kostnaden skall vara minst lika stor som 

den förväntade intäkten. Bolaget vill nu i ett första steg få en uppskattning 

av fördelningen för tiden mellan två på varandra följande skador. 

Lösning 17 Ovanstående beskrivning ger att de enskilda försäkringsbreven 

drabbas av skador oberoende av varandra ty en skada i Södermanland 

känner knappast till en skada i Västmanland (obs detta är endast 

en hyfsad approximation) samt att om vi betraktar försäkringsportföljen 

som helhet så bör tiden mellan två på varandra följande skador vara 

likafördelad. Vidare kan en skada idag knappast känna till en skada igår 

1 I min bok Statistiska modeller inom datateknik beskrivs hur detta görs. 

c Mikael Möller


så det kan inte …nnas något minne i skadeprocessen (detta är nu inte 

helt sant men duger även det som en första approximation). 

Bilda den stokastiska variabeln 

T = tiden mellan två på varandra följande skador 

vars utfallsrum kan skrivas T = ft j t 0g. Att skadeprocessen saknar 

minne innebär att vi kan uttrycka nedanstående betingade sannolikhet på 

två sätt 

P (T > t + s j T > s) = 

P (T > t + s; T > s) 

P (T > s) 

P (T > t + s j T > s) = P (T > t) . 

= P (T > t + s) 

, 

P (T > s) 

Den första likheten följer av att om tiden mellan skador är större än 5 

dagar så är den de…nitivt större än 3 dagar (mer matematiskt skriver vi 

fT > sg fT > t + sg). Den andra likheten följer av att om vi studerat 

processen i s tidsenheter så kan vi glömma bort våra erfarenheter från 

denna tid när studiet av de följande t tidsenheterna börjar. Det är ju det 

som sakna minne innebär. Första och andra raden ger nu tillsammans 

att 

P (T > t + s) = P (T > t) P (T > s) 

Tag den naturliga logaritmen av båda leden och de…niera funktionen 

f(t) = ln P (T > t). Vi erhåller då relationen 

f(t + s) = f(t) + f(s) 

och denna matematiska ekvation har som enda lösning 2 

f(t) = t. 

och den ger vår sökta sannolikhet till 

P (T > t) = e t . 

Om är positiv så blir P (T > 1) = e > 1. Konstanten måste därför 

vara negativ eftersom sannolikheter alltid ligger i intervallet [0; 1]. Den 

sökta fördelningen för tiden mellan skador kan nu skrivas P (T t) = 

1 e t där > 0 och t > 0 och vi har följande de…nition. 

2 Se Introduktion till den ekonomiska matematiken. 

c Mikael Möller


De…nition 30 (Exponentialfördelning) En stokastisk variabel T som 

uppfyller 

f(t) = e 

där, > 0 och t 2 T = ft j t 0g säges vara exponentiellt fördelad 

med parametern . Vi skriver 

t 

T 2 Exp( ) . 

Uppgift 14 Visa att för en Exp( ) fördelning så gäller att 

1. R f(x) dx = 1 

2. E(X) = 1 

3. V (X) = 1 2 

Det är egentligen rätt märkligt att så enkla och, i detta fall, naturliga 

antaganden kan ge upphov till en sluten matematisk formel. Dessutom 

har vi faktiskt inte använt oss av att skadorna är oberoende så detta 

antagande behövs inte för ovanstående resultat. 

Vi kan nu fråga oss hur lång tid det tar innan vi har två eller tre 

skador eller mera allmänt hur lång tid det tar att få n skador. Om 

vi hittar svaret på den frågan kan vi också hitta svaret på hur antalet 

skador under en viss tidsperiod –säg ett år –är fördelad. 

Om vi bildar följande följd (sekvens) av stokastiska variabler 

Ti = tidpunkten för skada nummer i; i = 1; 2; : : : ; n, 

T0 = 0. 

så gäller att tiden till den n:te skadan kan skrivas 

Tn = T1 T0 + T2 T1 + + Tn Tn 1. 

Fördelningen för den stokastiska variabeln Tn är således en summa av 

exponentialfördelade variabler. 

Om vi nu de…nierar de stokastiska variablerna 

Xi = Ti Ti 1; i = 1; 2; : : : ; n och X = Tn 

så gäller följande sats för den stokastiska summavariabeln X. 

c Mikael Möller


Theorem 31 Om variablerna X1; : : : ; Xn är oberoende och exponentialfördelade 

alla med samma parameter så gäller att summavariabeln 

X = P n 

i=1 Xi har en fördelning som kan skrivas 

F (x) = P (X x) = 1 

och dess täthetsfunktion blir 

nX 1 

i=0 

f(x) = 

(n 1)! xn 1 e 

n 

( x) i 

e 

i! 

Bevis 11 Vi skall visa satsens påstående med hjälp av induktion. Enligt 

de…nition gäller 

P (X x) = P (X1 x) = 1 e 

när n = 1. För n = 2 noterar vi först att 

P (X x) = P (X1 + X2 x) = 1 P (X1 + X2 > x) 

och använder sedan satsen om betingat väntevärde (se sid 41) 

P (X1 + X2 > x) = E P (X1 + X2 > x j X1) 

= E P (X2 > x X1 j X1) 

= E e 

= 

Z x 

0 

= xe 

e 

(x X1) 

(x s) e 

x + e 

x 

x 

x 

Z 1 

s 

ds + 

x 

Observera att värdet på X1 aldrig kan vara större än x eftersom vi i 

intervallet (0; x) även skall klämma in X2. Det gäller således för n = 2 

att 

F (x) = P (X x) = 1 e 

f(x) = x 2 e 

x . 

Antag nu att påståendet är sant för n = k. Vi skall då visa att under 

detta antagande är påståendet även sant för n = k + 1. Induktionsaxiomet 

ger sedan att satsen är sann för godtyckligt n. En upprepning av 

argumentationen för fallet n = 2 ger nu 

P (X x) = P Xk+1 

x 

x 

xe 

x , 

i=1 Xi x = 1 P Xk+1 

e 

s ds 

i=1 Xi > x 

c Mikael Möller


varav följer 

P Xk+1 

Xk 

i=1 Xi > x = E P Xk+1 

i=1 Xi = s = 

i=1 Xi > x j Xk 

= E P Xk+1 > x Xk 

= E e (x Pk i=1 Xi) 

Z x 

(x s) sk 

1 k 

+ 

= e 

e 

0 

Z 1 

k 1 k s 

(k 1)! e 

(k 1)! e 

s ds 

i=1 Xi 

i=1 Xi j Xk 

s ds 

i=1 Xi 

x 

Z x k 1 k Z 1 k 1 k 

x s s 

ds + 

0 (k 1)! x (k 1)! e s ds 

Den sista integralen beräknas med hjälp av partiell integration och dess 

första steg ger 

Z 1 

x 

k 1 k s 

(k 1)! e s 1 

( x)k 

ds = 

(k 1)! e 

Upprepad partiell integration ger således 

Z 1 

x 

k 1 k s 

(k 1)! e s kX 1 

ds = 

i=0 

Z 1 

x 

+ 

x 

och eftersom den första integralen trivialt blir 

erhålls att 

e 

( x) i 

e 

i! 

Z x k 1 k 

x s ( x)k 

ds = 

0 (k 1)! k! e 

P Xk+1 

i=1 Xi > x = 

kX ( x) i 

e 

i! 

i=0 

k 2 k 1 s 

(k 2)! e s ds. 

varför vårt antagande ger att även det följande steget gäller. 

Resten av beviset är bara enkla omskrivningar. 

I och med denna sats har vi tagit ett stort steg mot att lösa ett 

försäkringsbolags grundläggande problem nämligen att bestämma en 

försäkrings premie. 


x 

x 

x


4.2.1 Fördelning för antal skador 

För att bestämma årspremien adderar vi exponentialfördelade tider tills 

vi erhållit ett år. Därmed får vi indirekt antalet skador under ett år. 

Allmänt har vi att bestämma antalet skador i ett tidsintervall av längd 

t. Detta gör vi enklast genom att bilda de stokastiska variablerna 

och 

Tn = tiden till den n:te skadan 

Nt = antalet skador i tidsintervallet (0; t) . 

Vi konstaterar sedan att följande relation gäller mellan dessa två stokastiska 

variabler 

fTn tg = fNt ng 

ty om tiden till den n:te skadan är mindre än eller lika med t så måste 

antalet skador i tidsintervallet (0; t) vara större än eller lika med n. Men 

detta ger oss relationen 

och denna ger i sin tur att 

P (Nt n) = P (Tn t) = 1 

nX 1 

i=0 

( t) i 

i! e 

P (Nt = n) = P (Nt n) P (Nt n + 1) 

= 1 

nX 1 

( t) i 

i! e 

t 

nX ( t) 

1 + 

i 

i! e 

= ( t)n 

i=0 

n! e 

i=0 

t ; n = 0; 1; 2; : : : . 

Den här erhållna fördelningen, för antalet skador, är en välkänd diskret 

fördelning som kallas Poissonfördelningen. Den är bland annat känd 

för att den ger en bra beskrivning av antalet kavallerister som årligen 

sparkas ihjäl av sina hästar. Hur nu hästarna vet när det är dags att 

sätta in en välriktad spark är dock fortfarande en gåta. 

De…nition 32 (Poissonfördelning) En stokastisk variabel Nt som uppfyller 

( t)n 

P (Nt = n) = 

n! e 

t 

; n 2 N 

där N = fk j k = 0; 1; 2; : : :g säges vara poisson-fördelad med parametern 

. Vi skriver 

Nt 2 P o( t) . 

t 

t 

c Mikael Möller


Uppgift 15 Visa att för en P o( t) fördelning så gäller att 

1. P P (Nt = n) = 1 

2. E(Nt) = t 

3. V (Nt) = t 

4.2.2 En försäkrings premie 

Försäkringsbolaget har nu de första verktygen för att bestämma en 

försäkrings premie. Under året har de haft säg N skador och storleken 

på skadorna följer någon fördelning med E (Ci) = c. Bolagets totala 

skadekostnad, som skall täckas av premierna, kan nu skrivas 

C = 

NX 

i=1 

och en första approximation av premiens storlek blir 

Pn = C 

n 

Ci 

där n är antalet försäkrade. Vi …nner nu att 

där 

E (Pn) = 1 

E (C) 

n 

E (C) = E E (C j N) 

NX 

!! 

= E E Ci j N = E 

= E 

= c 

i=1 

NX 

! 

E (Ci j N) 

i=1 

NX 

! 

E (Ci) = E (Nc) = E (N) c 

i=1 

och den sökta storleken på premien blir således c 

n . 

c Mikael Möller


4.3 Normalfördelningen 

Ovanstående försäkringsexempel ger oss ytterligare en intressant fördelning 

nämligen att en summa av n exponentiellt fördelade variabler alla 

med samma parameter är gamma-fördelad med parametrarna n och 

. 

De…nition 33 (Gammafördelning) En stokastisk variabel Tn som uppfyller 

F (t) = 1 

f(t) = 

nX 1 

i=0 

( t) i 

i! e 

1 n 

tn t 

e 

(n 1)! 

där n = 0; 1; 2; : : : och > 0 säges vara gamma fördelad med parametrarna 

n och . Vi skriver 

Tn 2 (n; ) . 

I den generella de…nitionen av en gammafördelning ersätts n med 

där villkoret är > 0. 

Uppgift 16 Visa att för en (n; ) fördelning så gäller att 

1. R f(x) dx = 1, 

2. E(X) = n , 

3. V (X) = n 2 . 

I kapitlet Diskreta modeller betraktade vi summor av F fg(p)-fördelningar 

vilka gav oss en Negativ binomialfördelning och här har vi betraktat 

summor av Exp( )-fördelningar vilka ger oss Gamma-fördelningen. 

Låt oss studera detta sista exempel lite närmare och rita upp täthetsfunktionen 

för en (n; ) för några olika värden på n, säg n = 5; 20; 50. 

Vi erhåller då …gur 4.2 

Av …guren följer att täthetsfunktionen vandrar åt höger helt i enlighet 

med att gammafördelningens väntevärde kan skrivas 3 n och eftersom vi 

3 Detta följer direkt av att 

(n; ) = 

nX 

Exp( ) . 

k=1 

t 

c Mikael Möller

98 4.3. Normalfördelningen 

0.20 

0.15 

0.10 

0.05 

0.00 

0 10 20 30 40 50 60 70 80 90 100 

Figur 4.2: Tre gamma fördelningar 

valt = 1 ser vi att kurvans topp inträ¤ar för x = n. Vi ser också 

att kurvan tenderar att bli mer symmetrisk när n växer men det blir 

svårt att se eftersom den kommer att vandra ut ur bild. Detta kan vi 

korrigera med att dra ifrån väntevärdet från den stokastiska variabeln 

n 

Tn och istället betrakta Xn = Tn . Denna transformation ger att vi 

istället skall betrakta funktionen f (x) nedan. 

Theorem 34 Om Tn 2 (n; ) så gäller att täthetsfunktionen för Xn = 

n kan skrivas 

Tn 

f(x) = (n 1)! ( x + n) n 1 e 

Bevis 12 Betrakta fördelningsfunktionen 

P (Xn x) = P Tn 

= 1 

nX 1 

i=0 

n 

( x + n) i 

e 

i! 

( x+n) 

x = P Tn x + n 

( x+n) 

och derivera denna funktion för att erhålla täthetsfunktionen till Xn. 

Man …nner 

f(x) = (n 1)! ( x + n) n 1 e ( x+n) . 

Liksom ovan ritar vi denna nya täthetsfunktion för värdena n = 

5; 20; 50 och får då …gur 4.3. 


x


Figur 4.3: Tre gamma fördelningar korrigerade för väntevärdet 

Av denna …gur framgår tydligt att vi lyckats hindra täthetsfunktionen 

från att springa iväg med växande n men egenskapen att den bli allt 

plattare, d v s mera utspridd, kvarstår. Så vem pratar om spridning? 

Om vi går tillbaks till kapitlet Vad statistik handlar om så införde vi 

där begreppet varians som ett mått på spridning i allmänhet och detta 

mått går enkelt att överföra till vårt axiomatiska system där vi utgår 

från förväntningsvärdet. Vi har nämligen att storheten 

V (X) = E X E(X) 2 = E X 2 

E(X) 2 

har precis samma funktion för ett allmänt utfallsrum som 

2 = A X X 2 = A X X 2 

har för ett uppräkneligt utfallsrum. Idén är nu att eftersom vi hindrade 

täthetsfunktionen från att springa iväg, genom att dra bort väntevärdet, 

så kanske vi kan hindra täthetsfunktionen från att plattas ut genom att 

dividera med variansen. Nu visar det sig att variansen inte duger men 

väl så roten ur variansen (standardavvikelsen). För att se detta börjar vi 

med att beräkna V (X) när X 2 (n; ) och eftersom vi redan beräknat 

x 

c Mikael Möller


E(X) till n så återstår endast att beräkna E X 2 . 

E X 2 = 

= 

= n (n + 1) 

varav vi erhåller att 

Z 1 

0 

Z 1 

0 

x 2 f(x) dx = 

2 

V (X) = 

Vi erhåller nu följande sats 

n (n + 1) 

2 

n (n + 1) 

2 

Z 1 

2 xn 

x 

0 (n 

1 n 

1)! e x dx 

n+1 n+2 

x 

(n + 1)! e x dx 

n 2 

= n 

2 . 

Theorem 35 Om Tn 2 (n; ) så gäller att täthetsfunktionen för 

kan skrivas 

f(x) = 

p n 

(n 1)! 

Bevis 13 Betrakta 

P (Xn x) = P 

= 1 

Xn = Tn 

n 

p 

n 

p nx + n n 1 e ( p nx+n) ; x 

n 

Tn 

p 

n 

nX 1 

i=0 

i 

i! 

x 

! 

= 1 e (p nX 1 

nx+n) 

= P Tn 

p nx + n i 

e 

i=0 

1 

i! 

p nx + n i 

p n . 

p nx + n 

p n x+ n 

och derivera denna funktion för att erhålla täthetsfunktionen till Xn. 

Efter en del arbete …nner man att 

f(x) = 


p n 

(n 1)! 

p nx + n n 1 e ( p nx+n) ; x 

p n .


0.5 

0.4 

0.3 

0.2 

0.1 

4 3 2 1 0 1 2 3 4 

Figur 4.4: Tre normaliserade gamma fördelningar 

Liksom ovan ritar vi denna nya täthetsfunktion för värdena n = 

5; 20; 50 (se …gur 4.4) men lägger nu också in en normalfördelningskurva 

(se de…nition 37 på sid 103). Denna senare åtgärd eftersom täthetsfunktionen 

verkar närma sig en gränsfunktion när n växer mot allt större 

tal. Med lite matematik går det att visa att denna gränsfunktion blir 

täthetsfunktionen för normal-fördelningen. 

Gammafördelningen kännetecknas av att den är en summa av exponentialfördelade 

variabler och vi har tidigare mött fördelningar som 

konstruerats via summor. T ex så erhålls den negativa binomialfördelningen 

som en summa av för första gången fördelningar och vi …nner 

stolpdiagrammen i …gur 4.5 för Neg(n; 0:3) när n = 5; 25; 60. 

Vi ser att den negativa binomialfördelningen uppträder på samma sätt 

som gammafördelningen när n växer (vi måste självklart även i detta 

fall dra ifrån väntevärdet och dividera med standardavvikelse för att 

vara helt säkra). En diskret fördelning som är en summa av F fg(p) och 

en kontinuerlig fördelning som är en summa av Exp( ) uppträder båda 

på samma sätt. Mycket märkligt! men om detta kan generaliseras har 

vi gjort en mycket stor upptäckt ty aritmetiska medelvärden bildas av 

summor av stokastiska variabler och dessa medelvärden spelar en mycket 

stor roll inom statistiken. De är approximationer av väntevärden. 

4.3.1 Centrala gränsvärdessatsen 

Detta avsnitt är vårt första rent teoretiska avsnitt ty jag känner inget 

enkelt exempel (annat än ovanstående resonemang) som ger upphov till 

x 

c Mikael Möller


0.07 

0.06 

0.05 

0.04 

0.03 

0.02 

0.01 

0.00 

20 40 60 80 100 120 140 160 180 200 220 240 260 

Figur 4.5: Tre negativt binomial fördelade sannolikhetsfunktioner 

normalfördelningen, kronjuvelen, utan den dyker upp indirekt via summor. 

Faktum är att om vi tar ett stort 4 antal godtyckliga oberoende 

stokastiska variabler och summerar dem så gäller nästan alltid att summafördelningen 

är approximativt normalfördelad. Närmare bestämt gäller 

följande sats 

Theorem 36 (Centrala gränsvärdessatsen) Låt X1; X2; : : : ; Xn vara 

oberoende stokastiska variabler med ändliga väntevärden (mk) och ändliga 

standardavvikelser ( k). Bilda det absoluta 3:e momentet 

Om det nu gäller att 

där 2 n = P n 

k=1 

k = E jXk mkj 3 

Pn lim k=1 k 

n!1 n 

2 

k så gäller att 

Pn k=1 Xk mn 

n 

= 0 

. 

D 

! N(0; 1) 

där mn = P n 

k=1 mk och D betyder att konvergensen är i fördelning. 

Bevis 14 Se t ex Cramér, Mathematical methods of statistics 

4 Stort kan variera från ett till ‡era hundra. 

c Mikael Möller


Detta är en remarkabel sats och kallas inte oförskylt statistikens 

Kronjuvel. Faktum är att utan den skulle statistiken vara mycket svårare. 

Observera att fördelningarna inte behöver vara lika utan det går bra att 

blanda fritt. Det går även att rucka lite på kravet om oberoende men 

det går vi inte in på här. 

Men normalfördelningen kommer inte bara in via direkta summor 

utan det visar sig att mycket i livet följer denna fördelning. För att 

bara nämna några exempel: skenbenets längd, individers vikter (det 

må vara människor eller sandödlor), individers längder, vikten av 1 kg:s 

förpackningar av ka¤e (som självklart inte innehåller 1 kg), uppmätning 

av sträckor o s v. Ja i alla situationer där vi kan tänka oss ha många 

oberoende mätningar av en och samma storhet så är normalfördelningen 

användbar. 

Så låt oss nu de…niera denna underbara fördelning 

De…nition 37 (Normalfördelning) En stokastisk variabel X vars täthetsfunktion 

kan skrivas 

f(x) = 

1 

(x )2 

p e 2 

2 2 2 

där talet är positivt och är ett godtyckligt tal samt 

x 2 X = fx 2 R : 1 < x < 1g 

säges vara normalfördelad med väntevärdet och standardavvikelsen . 

Vi skriver 

X 2 N( ; ) . 

Om väntevärdet är 0 och standardavvikelsen är 1 så betecknas täthetsfunktionen 

respektive fördelningsfunktionen med respektive (detta av 

historiska skäl). 

I …gur 4.6 ges några grafer av denna variabels täthetsfunktion och av 

dessa kan vi dra några slutsatser om när fördelningen är användbar. 

Täthetsfunktionen ser symmetrisk ut (vilket också bekräftas av de…nitionen) 

varav följer att den kan vara tillämplig i symmetriska situationer 

speciellt där observationerna klumpar sig mot mitten (kring symmetrilinjen). 

Vidare gäller att om vi tar n normalfördelade variabler och adderar 

dem så får vi ånyo en normalfördelning. Det …nurliga med normalfördelningen 

är att dessa normalfördelade variabler inte behöver vara oberoende 

för att summan skall bli normalfördelad. Vi skall även visa att är väntevärdet 

och att 2 är variansen. 

c Mikael Möller


0.8 

0.6 

0.4 

0.2 

4 2 0 2 4 6 8 

Figur 4.6: Från vänster: N( 2; 0:5), N(0; 1) och N(2; 2). 

Men innan vi tar itu med dessa teoretiska, men ack så viktiga, frågor 

ger vi ett enkelt exempel. 

Exempel 27 I ett lager av ka¤esäckar vilkas innehåll i kg kan anses 

vara N(35; 0:5) (d v s säcken har en medelvikt om 35 kg med en standardavvikelse 

på 0:5 kg) tar man ut en säck på måfå och portionerar ut 

innehållet i burkar så att varje burk innehåller i det närmaste exakt 1 

kg. 

1. Hur stor är sannolikheten att säcken räcker till minst 36 burkar? 

2. Hur stor är sannolikheten att säcken räcker till 34 men inte 36 

burkar? 

Lösning 18 De…niera den stokastiska variabeln 

där X 2 N(35; 0:5). 5 

X = ka¤esäckens vikt 

1. Sannolikheten att säcken räcker till minst 36 burkar kan skrivas 

P (X > 36) = 1 P (X 36) 

5 I lösningen har vi använt oss av SWP för att beräkna integralerna. De traditionella 

metoderna som excercerar i tabellslagning är numer ett passerat stadium. 

På samma sätt som att man inte behöver ha mekaniska kunskaper för att köra bil. 

Det går självklar att använda sig av andra program med motsvarande matematiska 

färdigheter. 

c Mikael Möller


där 

varför 

P (X 36) = 

Z 36 

1 

1 

p 2 0:25 e 

P (X > 36) = 1 P (X 36) 

= 0:02275 

(x 35)2 

2 0:25 dx 0:97725 

2. Sannolikheten att säcken räcker till 34 men inte 36 burkar kan 

skrivas 

P (34 X < 36) = P (X 36) P (X 34) 

= 

Z 36 

34 

= 0:9545 

1 

p 2 0:25 e 

(x 35)2 

2 0:25 dx 

Så är det dags att studera normalfördelningen och dess egenskaper 

från en mer allmängiltig utgångspunkt. Vi börjar med den enklaste 

egenskapen nämligen den att funktionen f är symmetrisk kring x = . 

Theorem 38 Funktionen 

f(x) = 

1 

(x )2 

p e 2 

2 2 2 

är symmetrisk kring x = d v s det gäller att 

f( x) = f( + x) . 

Bevis 15 Sättet att visa detta på är att räkna ut vänster och höger led 

samt konstatera att de är lika. 

f( x) = 

f( + x) = 

1 

( x )2 

p e 2 

2 2 2 1 

( x)2 

= p e 2 

2 2 2 

1 

( +x )2 

p e 2 

2 2 2 1 

(x)2 

= p e 2 

2 2 2 

Därefter tar vi fram relationen mellan parametrarna och och 

väntevärdena E (X) och V (X) (= E X 2 E 2 (X)). 

Theorem 39 För en normalfördelning N( ; ) gäller att är väntevärdet 

och 2 är variansen. 

c Mikael Möller


Bevis 16 Det gäller 

E(X) = 

Z 1 

1 

1 

xp 

2 2 

e (x )2 

2 2 dx 

Gör variabeltransformationen x x + då erhålls 

E(X) = 

Z 1 

1 

= + 

(x + ) 

1 

p 2 2 

den senare integralen har nu lösningen 

2 e x 2 

2 2 

1 

x2 

p e 2 

2 2 2 dx 

Z 1 

x=1 

1 

x= 1 

xe x2 

2 2 dx 

= 0. 

För att beräkna variansen har vi som vanligt att först beräkna 

E X 2 = 

Z 1 

1 

x 2 1 

p 

2 2 

e (x )2 

2 2 dx. 

Denna gång gör vi variabeltransformationen x x+ , ty det förenklar 

räknandet betydligt, då erhålls 

E X 2 = 

Z 1 

( x + ) 

1 

2 1 

x2 

p e 2 dx 

2 2 

Z 1 

2 1 

x p e 

1 2 x2 

Z 1 

2 dx + 2 

1 

= 2 

För den första integralen gäller 

Z 1 

1 

2 1 

x p e 

2 x2 

2 dx = 

x 

p e 

2 x2 

2 

x=1 

x= 1 

| {z } 

0 

Z 1 

+ 

x 1 

p 2 e x2 

2 dx + 2 . 

1 

1 

p 2 e x2 

2 dx 

| {z } 

1 

= 1. 

Den andra integralen räknades ut tidigare och blev då 0. Sammantaget 

ger detta att 

E X 2 = 2 + 2 . 

Varav följer att 


V (X) = E X 2 

E 2 (X) = 2 + 2 2 = 2 .


Corollary 40 För en normalfördelad stokastisk variabel med = 0 och 

= 1 gäller 6 

E X k = 

0 k = 2n + 1, 

(2n 1)!! k = 2n. 

Återstår således att diskutera vilken fördelning en summa av normalfördelade 

variabler har. Dock anger vi här endast resultatet när de är 

oberoende. Redan att visa detta resultat är rätt tekniskt och det mer 

allmänna resultatet då variablerna är beroende kräver matristeori. 

Theorem 41 Om X1 2 N( 1; 1) och X2 2 N( 2; 2) samt oberoende 

så gäller att X1 + X2 2 N 1 + 2; p 2 1 + 2 2 . 

Bevis 17 Satsens bevis är rätt tekniskt och hör hemma i högre kurser. 

Där visas även en motsvarighet för beroende normalfördelade variabler. 

6 De två utropstecknen, !!, i formeln nedan skall tolkas enligt 

k!! = k (k 2) (k 4) . 

c Mikael Möller



13 Följande gäller 

1. R f(x) dx = R b 

a 

2. E(X) = R b 

a 

3. E X 2 = R b 

a 


1 

b a dx = 1 

x 

1 

b a dx = b a 

x 2 

1 

b a dx = b a 

V (X) = E X 2 

= 1 

b a 

b 2 a 2 

2 

b 3 a 3 

3 

= a+b 

2 

varför 

E 2 (X) 

b 3 a 3 

3 

= b2 + ab + a2 3 

= b2 2ab + a2 12 

= (a b)2 

a + b 

2 

a 2 + 2ab + b 2 

4 

. 

12 

1. R f(x) dx = R 1 x x e dx = e 0 x=1 

= 1 

x=0 

2. E(X) = R 1 

0 xe x dx = fy = xg = 1 R 1 

0 e y dy = 1 

3. E X 2 = R 1 

0 x 2 e x dx = x 2 e x x=1 

x=0 + R 1 

0 2xe x dx = 2 2 

varför 


V (X) = 2 

2 

1 1 

= 2 2 

1. P1 n=0 P (Nt 

t = n) = e P1 ( t) 

n=0 

n 

n! = e t e t = 1 

2. Följande omskrivningar ger resultatet 


E(Nt) = 

= e 

1X 

n=0 

= te 

( t)n 

n 

n! e 

t 

1X 

n=1 

n 1 

( t) 

t = e 

t 

1X 

n=0 

t 

= te 

(n 1)! 

t e t = t 

( t)n 

n 

n! 

1X 

t 

n 1=0 

2 

n 

( t) 

1 

(n 1)!



varför 

E N 2 t = 


1. Sätt 

1X 

2 ( t)n 

n 

n! 

n=0 

e 

1X 

t t ( t)n 

= e n 

(n 1)! 

n=1 

1X 

t 

( t) 

= e (n 1) 

n=1 

n 

(n 1)! + 

1X ( t) 

n=1 

n 

! 

(n 1)! 

1X 

t ( t) 

= e 

n 2 ( t) 2 

(n 2)! + 

1X 

! 

n 1 

( t) t 

(n 1)! 

= e 

n=2 

t ( t) 2 e t + e 

= ( t) 2 + t 

V (Nt) = E N 2 t 

In = 

t te t 

n=1 

E 2 (Nt) 

= ( t) 2 + t ( t) 2 

= t. 

Z 1 

0 

n 1 n x 

(n 1)! e 

x dx 

vi erhåller då medelst partiell integration att 

In = 

1 

xn 

(n 

n 1 

1)! e 

1 Z 1 

x 

+ 

x=0 0 

Z 1 

= In 1 = = I1 = e 

0 

= e 

x 1 

= 1 x=0 


En(X) = 

Z 1 

0 

n n x 

(n 1)! e 

In = x n n 1 e 

= nIn 1 = = n! 

n 2 n 1 x 

(n 2)! e 

x dx 

x 1 

dx = 

(n 1)! In 

x 1 

x=0 

Z 1 

0 

+ n 

e 

Z 1 

x 

0 

n 1 n 1 e 

x dx = n! 

x dx 

x dx 

c Mikael Möller


varav 

En(X) = n . 


E X 2 = 

varav 

Z 1 

0 

n+1 n x 

(n 1)! e 

In = x n+1 n 1 e 

x 1 

dx = 

(n 1)! In 

x 1 

Z 1 

+ (n + 1) 

x=0 

0 

Z 1 

= (n + 1) In 1 = = (n + 1)! 

E X 2 = 

och slutligen…nner vi variansen 


V (X) = 

(n + 1) n 

2 

0 

(n + 1) n 

2 

n 2 

x n n 1 e 

x e 

dx = 

= n 

2 . 

x dx 

(n + 1)! 

2

5. Stickprov och 

skattningar 

I början pratade vi om konkreta mätningar av guldhalt, börskurser m m 

och vi bestämde aritmetiska medelvärden och avvikelser från dem. Allt 

i form av konkreta uppmätta värden. Rätt snabbt så axiomatiserade vi 

de aritmetiska medelvärdena och kallade dem då för väntevärden. Dessa 

väntevärden är funktioner av det som vi kallar för stokastiska variabler 

och vips så verkar vi ha lämnat all praktisk tillämpning och hamnat i den 

teoretiska världen. Men alla nya begrepp och exempel som vi tagit fram 

har haft en praktisk bakgrund även om vi istället för konkreta si¤ermätningar 

har haft stokastiska variabler. Vad vi skall göra nu är att knyta 

ihop de konkreta mätningarna med parametrarna hos fördelningarna för 

de stokastiska variablerna samt ange hur mätningar skall utföras för att 

det vi hitills sagt skall bli användbart för att beskriva vår verklighet. 

5.1 Stickprov 

Vi börjar med att ange det beteckningssystem som kommer att användas 

framgent genom att ge en de…nition, i vardagsspråk, för en stokastisk 

variabel och dess observation. 

De…nition 42 (Stokastisk variabel och dess observation) Med en 

stokastisk variabel avses en framtida mätning av någon mätbar storhet. 

Vi betecknar denna framtida mätning med en stor bokstav t ex X. När 

så mätningen utförts och vi står där med en konkret observation t ex 3:14 

så betecknar vi den allmänt med en liten bokstav t ex x. 

När vi tidigare studerat de stokastiska variablerna X1; : : : ; Xn så 

har vi alltid i bakhuvudet haft att dessa skall ersättas med de observerade 

mätvärdena x1; : : : ; xn och allt vårt resonerande har haft som mål 

att hitta egenskaper hos dessa observerade mätvärden. Egenskaper som 

vi skall utnyttja för våra speciella syften. 

När vi nu vet vad en stokastisk variabel är så kan vi de…niera begreppet 

stickprov (i vardagligt tal så är det det som erhålls när vi tar ett 

111

112 5.1. Stickprov 

antal observationer på något objekt t ex börskurser under 10 dagar). Ett 

stickprov skall för oss vara ett antal stokastiska variabler som uppfyller 

följande de…nition. 

De…nition 43 (Stickprov) Med ett stickprov avses ett antal stokastiska 

variabler X1; : : : ; Xn som är oberoende och likafördelade, F . Ett 

kortfattat sätt att uttrycka detta på är 

Xi 2 OF ( ) ; i = 1; 2; : : : ; n. 

Här står O för oberoende, F för likafördelade och är en eller ‡era 

obekanta parameter som kan variera med variabeln. 

Med ett observerat stickprov avses mätvärden x1; : : : ; xn som är 

observationer på ett stickprov. 

Det verkar ju enkelt men det är faktiskt mycket komplicerat att 

plocka ut stokastiska variabler som dels är oberoende och dels har samma 

fördelning och det på ett sätt så att pengarna räcker. 

5.1.1 Vad ett stickprov kan ge 

I avsnittet Vad statistik handlar om skrev jag 

. . . statistik handlar om två saker 1) Hur man beräknar 

medelvärden och 2) begreppet oberoende händelser. 

Där de…nierades mätvärdenas aritmetiska medelvärde A(X) samt 

mätvärdenas varians A X X 2 

och vi angav hur dessa var upp- 

byggda (skulle beräknas). I det följande kapitlet axiomatiserade vi begreppet 

aritmetiskt medelvärde till förväntat värde E(X). Denna axiomatisering 

gav oss sedan det allmäna begreppet för en sannolikhet av 

en indikatorfunktion. 

I de därpå följande kapitlen tittade vi på två speciallfall av sannolikheter, 

de diskreta och de kontinuerliga, vilka faktiskt kan visas vara 

de enda typerna av intresse. (För att visa detta behövs en del avancerad 

matematik och det är tur att sådan …nns ty annars skulle många ägna år 

att söka efter ytterligare typer av sannolikheter. Tack vare matematiken 

kan nu dessa individer göra något nyttigt istället.) 

I studiet av de diskreta/kontinuerliga variablerna dyker det upp två 

saker: dels fördelningsfunktioner och dels okända konstanter som fördelningsfunktionerna 

beror av. Dessa konstanter behöver antingen bestämmas 

teoretiskt eller beräknas. Under resans gång gav vi de teoretiska 

c Mikael Möller

5. Stickprov och skattningar 113 

beräkningarna för konstanterna och det visade sig att de alla kunde uttryckas 

med hjälp av någon form av det förväntade värdet E( ). Så 

för att kunna beräkna konstanterna behöver vi kunna beräkna generella 

väntevärden (vanligtvis räcker det med E(X) och E X 2 ) och det kommer 

väl knappast som en överaskning att följande approximationer är 

lämpliga 

E(X) A(x) = x och V (X) A (x x) 2 

bara n är tillräckligt stort. För den vidare analysen behövs följande sats 

vars första del är densamma som första delen i sats 9 på sid 26. 

Theorem 44 För ett stickprov X från en fördelning F ( ; ), där = 

E(Xi) och 2 = V (Xi), gäller att 

1. E X = 

2. V X = 2 

n 

Bevis 18 Satsens första del är som sagt en upprepning av en tidigare 

sats och det återstår för oss att visa denna sats andra del. 

För n = 1 är påståendet trivialt eftersom det då överensstämmer 

med de…nitionen. I nästa steg betraktar vi fallet med n = 2 men använder 

de mer generella konstanterna c1 och c2 istället för 1 

2 (konstigt nog 

underlättar denna abstraktion förståelsen). Betrakta således 

V (c1X1 + c2X2) = E(c1X1 + c2X2) 2 E 2 (c1X1 + c2X2) 

varvid den första delen kan skrivas 

E(c1X1 + c2X2) 2 = E c 2 1X 2 1 + 2c1c2X1X2 + c 2 2X 2 2 

= E c 2 1X 2 1 + E(2c1c2X1X2) + E c 2 2X 2 2 

= c 2 1E X 2 1 + 2c1c2E(X1X2) + c 2 2E X 2 2 . 

Därefter skriver vi om den andra delen på motsvarande sätt 

E 2 (c1X1 + c2X2) = E(c1X1) + E(c2X2) 2 

= (c1 1 + c2 2) 2 

= c 2 1 2 1 + 2c1c2 1 2 + c 2 2 2 2. 

c Mikael Möller

114 5.1. Stickprov 

Para ihop dessa två delar och vi får 

V (c1X1 + c2X2) = c 2 1 E X 2 1 E 2 (X1) 

+ c 2 2 E X 2 2 E 2 (X2) 

+ 2c1c2 E(X1X2) E(X1) E(X2) . 

Betrakta nu den sista termen i detta uttryck samt tillämpa tekniken med 

betingat väntevärde (sid 41). Då erhålls 

E(X1X2) = E E(X1X2 j X2) 

= E X2E(X1 j X2) 

men eftersom X1 och X2 är oberoende stokastiska variabler (ty stickprov) 

följer att E(X1 j X2) = E(X1) och denna storhet är en konstant varför 

E X2E(X1 j X2) = E(X1) E(X2) . 

Vårt antagande om oberoende ger således att den tredje termen är noll. 

Härav följer att 

och om vi väljer c1 = c2 = 1 

2 

V (c1X1 + c2X2) = c 2 1V (X1) + c 2 2V (X2) 

så …nner vi 

V X = 

2 

2 . 

Resten av beviset är bara ett sedvanligt induktionsbevis – n = k ) n = 

k + 1 o s v – och överlåtes på dig käre läsare. 

Vad blir så implikationerna av denna sats. Den första är att det 

aritmetiska medelvärdet som approximation av det förväntade värdet 

inte blir sämre om man lägger till mätvärden enligt regeln för aritmetiskt 

medelvärde. Det är även intuitivt klart att approximationen bör bli 

bättre eftersom varje nytt mätvärde ger lite mer information. Den andra 

implikationen är att det aritmetiska medelvärdets variation kring det 

sanna värdet, , blir mindre desto ‡er observationer som läggs till och i 

gräns är variationen noll d v s vi har, i någon mening, att 

lim x = . 

n!1 

Till detta kommer så informationen från centrala gränsvärdessatsen (sats 

36 på sid 102) som säger att för ett givet stickprov X av storlek n så blir 

c Mikael Möller


2 

X N ; n . Ett observerat stickprov är således mycket användbart 

ty med dess hjälp kan vi inte bara …nna en approximation av utan 

också, via variationen 2 , få en känsla för hur bra denna approximation 

är. Om vi dessutom beräknar skevheten och toppigheten får vi en ganska 

bra bild över den underliggande fördelningen. 

Uppgift 17 Visa att för en normalfördelning N( ; ) så gäller att 

1. skevheten är noll, 

2. toppigheten är noll 

och jämför detta resultat med de…nitionen av toppighet på sid 16. 

5.2 Skattningar 

Ovan konstaterade vi att x kan användas som en approximation av parametern 

och vi skall i det följande hitta approximationer på alla de 

övriga parametrar som vi hitills infört. Men innan vi börjar med att ange 

metoder som hjälper oss att göra detta skall vi betrakta vilka egenskaper 

som dylika approximationer kan/bör ha när vi utgår från ett stickprov 

X1; X2; : : : ; Xn. 

De…nition 45 (Skattning) En skattning av en okänd parameter är 

en funktion av ett stickprov som i någon mening beskriver den okända 

parametern. Skattningen för parametern betecknar vi med ^ . 

Genom att studera den stokastiska variabeln ^ (X1; X2; : : : ; Xn) kan 

vi uttala oss om skattningens närhet till den okända parametern och 

vi skall närmast diskutera några närhetsbegrepp inom statistik. 

Det vore helt suveränt om varje nytt mätvärde gjorde att vi kom 

närmare det sanna men okända värdet men en stunds kontemplation 

ger att detta inte är möjligt. Det går inte eftersom vi använder oss 

av observerade stickprov d v s vi har ingen kontroll på det kommande 

mätvärdet. Har vi riktigt rejäl otur så kan t ex de följande 10 värden 

som vi plockar vara ytterligheter och därmed kommer den observerade 

punktskattningen, som innehåller även dessa värden, bli sämre än den 

där de inte …nns med. En rent matematisk de…nition av begreppet närhet 

är således inte möjlig att göra. 1 

Istället får vi tänka som en statistiker (d v s ge utrymme för slumpen) 

och som sådan skall vi framhäva tre (av många) möjliga egenskaper som 

är trevliga och som uttrycker närhet. 

1 Typ Bolzano-Weierstrass sats. 

c Mikael Möller

116 5.2. Skattningar 

5.2.1 Önskade egenskaper hos skattningar 

Den första egenskapen är att skattningen, betraktad som en stokastisk 

variabel, har som väntevärde den ursprungliga underliggande parametern 

d v s vi skall ställa följande krav på vår skattning: 

E ^ (X1; : : : ; Xn) = . 

Skattningar som har denna egenskap säges vara väntevärdesriktiga. 

Den andra egenskapen är lite åt det matematiska hållet. Den 

försöker fånga upp att ‡er observationer är bättre än färre men vi kan 

inte uttrycka oss matematiskt utan måste uttrycka oss statistiskt: 

P ^ (X1; : : : ; Xn) > ! 0 när n ! 1. 

Skattningar som har denna egenskap säges vara konsistenta. Detta 

begrepp liknar det vanliga matematiska gränsvärdesbegreppet, lim, men 

appliceras inte på skattningen (X1; : : : ; Xn) som sådan utan indirekt 

via sannolikheten för en speciell händelse för denna skattning. Ovanstående 

gränsuttryck kan också skrivas 

lim 

n!1 P ^ (X1; : : : ; Xn) > = 0 

och för de i detta uttryck ingående sannolikheterna är vi tillbaks i det 

rent matematiska betraktelsesättet. Vad betyder nu detta uttryck, går 

det att förstå eller är det bara ytterligare en av alla dessa matematiska 

obegripligheter? Låt oss försöka förstå. 

Att vi har dragit ifrån är inget annat än samma normalisering 

vi gjorde för att erhålla …gur 4.3 på sid 99 (en …gur som 

är bra att ha i åtanke) även om vårt här inte behöver fån- 

gas in. Så då övergår vi till att betrakta fallet ^ n (X) > 

(d v s vi sätter = 0) och för att få en liten känsla för vad 

som händer föreslår jag att du ritar två linjer parallella med 

y-axeln i …gur 4.3 (t ex genom där är den första mark- 

eringen på x-axeln). Nu beskriver området ^ 5 (X) > allt 

till vänster om plus allt till höger om : Sannolikheten 

P ^ 5 (X) > blir nu den streckade ytan i …gur 5.1 på sid 

117 och den är som synes ganska stor. Gör nu om samma 

förfarande för P ^ 20 (X) > och jämför den nu streckade 

c Mikael Möller


Figur 5.1: Tre sannolikheter P ^ 5 (X) > , P ^ 20 (X) > och 

P ^ 50 (X) > . 

ytan med den föregående. Det framgår ganska tydligt att 

den är mindre d v s att P (j 20 (X)j > ) ). 

För den tredje täthetsfunktionen är det nu självklart att vi 

får något som är ännu mindre och det gäller därför att 

P ^ 50 (X) > . 

Tag nu en kopp ka¤e och fundera över om detta alltid gäller 

eller om det kan …nnas undantag från denna strikta avtagande 

följd av sannolikheter. Om det …nns undantag hur ser 

då dessa ut? Går samma resonemang att utföra även för de 

diskreta modellerna? 

Konsistens är således också ett sätt att fånga in innebörden av närhet. 

Att en parameters observerade skattning i sannolikhet närmar sig det 

sanna värdet på parametern allteftersom antalet observationer ökar. 

Den tredje egenskapen som vi vill att vår skattning skall ha är 

ett erkännande om att det till varje parameter …nns en mängd olika 

skattningar som uppfyller båda första och andra egenskapen ovan. Vi 

måste därför ha en ytterligare egenskap som diskriminerar mellan alla de 

olika skattningar som tänkas kan. Den egenskap som vi skall kräva av den 

valda skattningen är att den skall ge upphov till minsta möjliga variation 

d v s om ^ 1 (X1; : : : ; Xn) och ^ 2 (X1; : : : ; Xn) båda är väntevärdesriktiga 

x 

c Mikael Möller


skattningar och det gäller 

V ^ 1 (X1; : : : ; Xn) V ^ 2 (X1; : : : ; Xn) 

så föredrar vi ^ 1 (X1; : : : ; Xn). Vi säger att skattningen ^ 1 (X1; : : : ; Xn) 

är e¤ektivare än skattningen ^ 2 (X1; : : : ; Xn). 

Självklart är detta ett annat sätt att uttrycka närhet ty vad vi egentligen 

säger är att våra data skall vara så lite utspridda kring det sanna 

värdet som möjligt. Variationen handlar ju om utspridning se t ex …gur 

1.2 på sid 11. 

Exempel 28 (Väntevärdesriktig) För att illustrera att det aritmetiska 

medelvärdet är en väntevärdesriktig punktskattning, vilket vi visade teoretiskt 

i sats 44 på sid 113, skall vi betrakta en stokastisk variabel som 

är normalfördelad med väntevärdet = 5 och standardavvikelsen = 2. 

I …gur 5.2 på sid 119 illustrerar vi att det aritmetiska medelvärdet i det 

långa loppet närmar sig 5 när antalet observationer växer. 

Lösning 19 I den refererade …guren har vi gjort tre oberoende simuleringar 

av det aritmetiska medelvärdet som funktion av antalet observationer. 

Varje simulering består av ett stickprov, x1; x2; : : : ; x100, om 

100 mätvärden. För varje simulering har vi beräknat det aritmetiska 

medelvärdet 

xk = 1 

kX 

xi, k = 1; 2; : : : ; 100 

k 

i=1 

som en funktion av k och därefter ritat räta linjer mellan punkterna 

(k; xk) och (k + 1; xk+1). 

För var och en av simuleringarna gäller att de i början slänger rätt så 

mycket men ganska fort stabiliserar sig kring det sanna värdet 5. Det tar 

dock lång tid innan de kommer mycket nära. För två av simuleringarna 

gäller att de är nära först efter 70 observationer och för den tredje behövs 

mer än 100 värden. Det gäller alltså att ’grovkonvergens’ sker snabbt 

men ’…nkonvergens’sker långsamt. 

Exempel 29 (Konsistens) För att illustrera att det aritmetiska medelvärdet 

även är en konsistent punktskattning betraktar vi återigen ett 

stickprov på en N (5; 2) och för detta stickprov beräknar vi teoretiskt de 

angivna sannolikheterna P Xn > för olika val på n. I …gur 5.3 

på sid 120 har vi ritat P Xn > som funktion av n. Denna …gur 

visar tydligt att ovanstående sannolikhet närmar sig 0 när antalet observationer 

växer. 

c Mikael Möller


7 

6 

5 

4 

3 

2 

0 20 40 60 80 100 

Figur 5.2: Väntevärdesriktighet 

Lösning 20 Först noterar vi att :s punktskattning är 

^n = 1 

n 

nX 

i=1 

Xi = Xn 

och för denna skattning gäller, enligt sats 44 på sid 113, att 

E(^n) = , 

V (^n) = 

2 

n . 

Vidare gäller att en summa av normalfördelade variabler är i sin tur 

normalfördelad och vi har därför att 

^n 2 N 5; 2 

p n . 

Sannolikheten att ^n skiljer sig från det sanna värdet 5 kan nu skrivas 

P j^n 5j > = 1 P ( < ^n 5 < ) 

p p 

n 

n 

= 1 

+ 

2 

2 

p 

n 

= 2 2 

2 

c Mikael Möller


Välj nu något …xt värde på , säg 0:1, och rita sannolikheten 

pn = P j^n 5j > 

som funktion av n – d v s rita punkterna (n; pn), n = 1; 2; 3; : : : i ett 

koordinatsystem. Vi erhåller då …gur 5.3. Det framgår med önskvärd 

1 

0.8 

0.6 

0.4 

0.2 

0 

500 1000 1500 2000 2500 3000 

Figur 5.3: Konsistens 

tydlighet att sannolikheten närmar sig 0 när antalet observationer ökar. 

Dock går den mycket långsamt mot noll så långsamt att närhetsbegreppet 

konsistens faktiskt är mer av teoretisk betydelse än praktisk. 

Den tredje egenskapen gäller huruvida skattningen är e¤ektiv eller ej. 

Denna fråga kan vi dock ej ge något svar på ty den är ej välde…nierad. 

Svaret beror på vilken klass av skattningar vi tittar på. Tag t ex 

klassen av linjära skattningar, till vilken det aritmetiska medelvärdet hör, 

och klassen av konstanta skattningar till vilken ^ = 3 hör. Självklart 

är den sista klassen e¤ektivare än den första ty den har variansen 0. 

Däremot är denna skattning inte speciellt meningsfull –om nu inte = 3. 

Om vi därför begränsar oss till klassen av linjära väntevärdesriktiga 

skattningar av typen 

^(X) = 

nX 

aiXi ai 2 R; i = 1; 2; : : : ; n, 

i=1 

så visar det sig att det aritmetiska medelvärdet är den e¤ektivaste av 

är det optimala valet 

alla skattningar i denna klass. D v s att ai = 1 

n 

c Mikael Möller


Theorem 46 Det aritmetiska medelvärdet 

^(X) = 1 

nX 

n 

är den e¤ektivaste skattningen i klassen av linjära väntevärdesriktiga 

skattningar. 

Bevis 19 För att visa ovanstående påstående har vi att söka minimum 

av variansen för en godtycklig skattning i denna klass. Vi beräknar därför 

först variansen för en godtycklig medlem i klassen 

V ^(X) = 

nX 

i=1 

i=1 

Xi 

a 2 i V (Xi) = 2 

nX 

a 2 i . 

Att skattningarna är väntevärdesriktig ger oss sedan relationen 

E ^(X) = 

nX 

aiE(Xi) = 

i=1 

i=1 

nX 

ai = . 

Vi har därför att minimera variansen under bivillkoret att Pn i=1 ai = 1. 

Dylika problem låter sig lösas med hjälp av Lagranges multiplikatormetod 

som ger att vi skall minimera funktionen 

nX 

f(a1; : : : ; an; ) = a 2 nX 

! 

i + ai 1 

i=1 

med avseende på parametrarna a1; : : : ; an och parametern . 

Lagranges multiplikatormetod innebär att man först beräknar de partiella 

derivatorna och dessa erhålls till 

i=1 

i=1 

@f 

@ai 

= 2ai + i = 1; 2; : : : ; n, 

@f 

@ = 

nX 

ai 1. 

i=1 

För att bestämma minimum har vi att lösa de ekvationer som erhålls 

när man sätter dessa partiella derivator lika med 0 d v s för att hitta 

minimum har vi att lösa ekvationssystemet 

2ai + = 0 i = 1; 2; : : : ; n, 

nX 

ai 1 = 0. 

i=1 

c Mikael Möller


Den första ekvationen ger att 

ai = 2 

i = 1; 2; : : : ; n. 

Dessa lösningar insätts i den andra ekvationen som ger att 

Det gäller därför att 

ai = 1 

n 

= 2 

n . 

i = 1; 2; : : : ; n. 

Därmed är det visat att variansen blir minst 2 när alla ai = 1 

n och 

den e¤ektivaste skattningen bland de linjära och väntevärdesriktiga skattningarna 

är därför det aritmetiska medelvärdet. 

För att illustrera att ovanstående resultat är sant skall vi ge ett exempel 

med två skattningar ur den betraktade klassen av skattningar. 

Exempel 30 Välj följande två skattningar av det förväntade värdet (båda 

används inom statistiken fast i olika sammanhang) 

och 

^1 = 1 

4 

4X 

i=1 

Xi 

^2 = 1 

8 X1 + 3 

8 X2 + 3 

8 X3 + 1 

8 X4 

där Xi 2 N(5; 2), i = 1; 2; 3; 4. Båda skattningarna är väntevärdesriktiga 

(behöver vi visa det?) men en är e¤ektivare än den andra. 

Lösning 21 Att den första skattningen är e¤ektivare än den andra följer 

direkt via ett par enkla beräkningar. Vi har 

V (^1) = 1 

4 2 

4X 

i=1 

V (Xi) = 1 

4 2 4 2 2 = 1 

2 Ja egentligen har vi inte visat minimum bara extremum. Dock syns det direkt 

på funktionen f att det är frågan om ett minimum eller kan den möjligen ge ett 

maximum? 

c Mikael Möller


samt 

V (^2) = 1 

8 2 

2 2 + 32 

8 2 

2 2 + 32 

8 2 

= 22 

5 

(1 + 9 + 9 + 1) = 

82 4 . 

2 2 + 1 

8 2 

Självklart är 1 < 5 

4 varför punktskattningen ^1 är e¤ektivare än ^2. 

Låt oss nu göra en simulering med 100 simulerade observationer i 

varje punktskattning. Sätt 

och 

1 X100 

s1 (k) = 

(xi ^1) 

100 1 

2 ; k = 1; 2; : : : ; 100 

i=1 

1 X100 

s2 (k) = 

(xi ^2) 

100 1 

2 ; k = 1; 2; : : : ; 100 

i=1 

Sammanför talparen (k; s1 (k)) och (k + 1; s1 (k + 1)) med en tunn rät 

linje samt talparen (k; s2 (k)) och (k + 1; s2 (k + 1)) med en tjock rät 

linje. 

1.4 

1.3 

1.2 

1.1 

1 

0.9 

0.8 

0.7 

0 20 40 60 80 100 

Figur 5.4: E¤ektivitet 

Resultatet syns i …gur 5.4 på sid 123. Det framgår tydligt att standardavvikelsen 

för ^1 (den tunna linjen) för det mesta ligger under standardavvikelsen 

för ^2 (den tjocka linjen) och detta är precis en illustration 

av att ^1 är e¤ektivare än ^2. 

2 2 

c Mikael Möller

124 5.3. Metoder för att finna skattningar 

5.3 Metoder för att …nna skattningar 

Vi har hitills ägnat oss åt att beskriva önskade egenskaper hos ett stickprov 

(oberoende, likafördelade) och önskade egenskaper hos skattningar 

(väntevärdesriktig, konsistent , e¤ektiv). Men hur hittar vi lämpliga 

skattningar? Allt vårt prat runt det aritmetiska medelvärdet är i och 

för sig viktigt men den skattningsfunktion som det aritmetiska medelvärdet 

beskriver ger ofta inte hela sanningen – ja inte ens en del. Det 

…nns, som vi skall se, massor av parametrar där det aritmetiska medelvärdet 

inte ger hela sanningen. Så i detta avsnitt skall vi ägna oss åt 

att ta fram tre allmäna metoder för att hitta skattningar av parametrar. 

Metoder som ger oss funktioner, eller om man så vill regler, för hur vi 

skall behandla vårt stickprov för att få veta så mycket som möjligt om 

vår okända parameter. 

5.3.1 Momentmetoden 

Eftersom denna bok utgår från förväntade värden, E (X) och därmed 

E X k , vilka även kallas moment (vilket är det fysikaliska namnet för 

samma sak) så börjar vi med momentmetod. 

Momentmetodens idé är att beräkna de skattade momenten och 

sätta dem lika med de teoretiska momenten, de senare uttryckta i de 

obekanta parametrarna. På så sätt skapas lika många ekvationer som 

parametrar. Jag ger först ett par exempel, en diskret fördelning och en 

kontinuerlig fördelning, för att ge en insikt i hur metoden fungerar. 

Exempel 31 I de…nition av en poissonfördelning på sid 95 angavs dess 

sannolikhetsfunktion till 

P (X = k) = 

k 

e , k = 0; 1; 2; : : : . 

k! 

Bestäm momentskattningen av om vi har ett stickprov X1; X2; : : : ; Xn. 

Lösning 22 Det första stickprovsmomentet till denna fördelning är 

och dess förväntade värde blir 


X = 1 

n 

E X = 1 

n 

nX 

i=1 

Xi 

nX 

E (Xi) . 

i=1


I den obligatoriska uppgiften som följde på de…nition av poissonfördelningen 

visades att E (Xi) = och vi erhåller därför ekvationen 

Detta ger oss momentskattningen 

x = E X = . 

^ = X. 

Exempel 32 I de…nition av en normalfördelning på sid 103 angavs täthetsfunktionen 

till 

f(x) = 

1 

(x )2 

p e 2 

2 2 2 . 

Bestäm för ett givet stickprov X1; X2; : : : ; Xn momentskattningarna av 

och 2 . 

Lösning 23 Första och andra stickprovsmomentet är 

X1 = 1 

n 

nX 

i=1 

I sats 39 på sid 105 visades att 

Xi och X2 = 1 

n 

nX 

X 2 i . 

i=1 

= E (X) och E X 2 = 2 + 2 

och vi har därför följande två ekvationer för och 2 

vilka har lösningen 

x1 = , 

x2 = 2 + 2 . 

= x1, 

Detta ger oss momentskattningarna 

2 = x2 x 2 1. 

^ = X1, 

c2 = X2 X 2 1. 

c Mikael Möller


För att vi lättare skall känna igen dessa skattningar gör vi följande omskrivningar 

^ = 1 

n 

c2 = 1 

n 

= 1 

n 

nX 

Xi, 

i=1 

nX 

i=1 

nX 

i=1 

X 2 i 

1 

n 

Xi X 2 . 

Den enda egentliga svårighet som föreligger vid beräkning av momentskattningar 

är att man måste kunna beräkna E X k för ett tillräckligt 

stort antal k. Av detta följer direkt att man måste känna stickprovsfördelningen. 

Dock är kravet på oberoende inte nödvändigt men det 

behövs för att visa följande trevliga egenskaper: 1) De är asymptotiskt 

normalfördelade. 2) De är asymptotiskt väntevärdesriktiga. 3) De är asymptotiskt 

e¤ektiva men baserade på ett ändligt stickprov är de ofta inte 

e¤ektiva. D v s det …nns bättre skattningar än momentskattningarna. Nu 

…nns det bättre metoder för att ta fram parameterskattningar men man 

skall inte underskatta betydelsen av att momentskattningarna är mycket 

enkla att ta fram –när man väl har bestämt de nödvändiga momenten. 

5.3.2 Minsta kvadrat metoden 

Minsta kvadratmetoden utgår från ett observerat stickprov x1; : : : ; xn på 

en stokastisk variabel X som antages ha det allmäna förväntade värdet 

g ( ) där g skall vara en känd funktion av den okända parametern . 

Bilda den stokastiska modellen 

nX 

i=1 

Xi = g ( ) + i, E ( i) = 0; V ( i) = 2 ; i = 1; 2; : : : ; n 

där allt stokastiskt har överförts på variabeln . En enkel och trivial 

omskrivning ger oss 

Xi 

! 2 

i = Xi g ( ) , i = 1; 2; : : : ; n 

och eftersom X1; X2; : : : ; Xn är oberoende och likafördelade stokastiska 

variabler så blir också 1; 2; : : : ; n oberoende och likafördelade variabler. 

De stokastiska variablerna i kallas mätfel ty de mäter det fel man gör 

när man använder Xi som en approximation av g ( ). 

c Mikael Möller


Om vi kvadrerar och summerar dessa mätfel så erhålls en positiv 

kvadratsumma 

nX 

i=1 

2 

i 

och det minsta värde en sådan summa kan anta är 0. Men eftersom detta 

skulle kräva att Xi = g ( ) för alla i inser vi att kvadratsumman aldrig 

kan anta värdet 0. Det näst bästa är att försöka minimera kvadratsumman 

d v s att minimera funktionen 

Q ( ) = 

nX 

i=1 

2 

i = 

nX 

i=1 

0 

Xi g ( ) 2 

som funktion av . Det värde på man då erhåller kallas Minsta 

Kvadratskattningen av . Det …nurliga med denna metod är att den 

ej kräver kunskap om fördelningen för den stokastiska variabeln X. 3 

Ovanstående låter sig lätt generaliseras till en parametervektor med 

m parametrar d v s att = ( 1; 2; : : : ; m) är en vektor av m parametrar 

och/eller att vi har ‡era mätserier med olika egenskaper men baserade 

på samma parameter . 

Exempel 33 Föreningen Stora Skuggan är en liten odlarförening där 

odlarlotterna är kvadratiska. Arrendeavgiften för en lott är k kronor per 

kvadratmeter och man behöver för faktureringen mäta varje lotts yta. 

Man vill nu bestämma arean av en kvadrat genom att utan systematiskt 

fel mäta kvadratens sida. Varje lott:s sida mäts av 10 olika personer och 

detta ger oss totalt 10 mätvärden xi, i = 1; 2; : : : ; 10, vilka kan betraktas 

som oberoende och likafördelade stokastiska variabler (olika personer men 

samma mätmetod). Hur ser minsta kvadratmetodens skattning av ytan 

ut? 

Lösning 24 Den beskrivna situationen ger oss följande statistiska modell 

4 

X = längden av lottens sida 

där X 2 F p ; V (X) och fördelningen F är okänd. De 10 mätningarna 

ger nu upphov till 10 ekvationer 

Xi = E (X) + i = p + i, i = 1; 2; : : : ; 10. 

3 Det viktiga här är att summan är positiv och därmed har ett minimum. Vi 

kunde lika gärna ha tagit absolutbeloppet, eller fjärdekvadraten, för felen men detta 

ger en mycket svårare matematik. Dessutom passar kvadratsumman mycket bättre in 

i den övergripande statistiska modell vi skapat samt i den underliggande matematiska 

begreppssfären. 

4 Kan man tänka sig en annan modell? 

c Mikael Möller


Minsta kvadratsumman kan nu skrivas 

Q ( ) = 

10X 

i=1 

xi 

p 2 

vilket är en snäll funktion i en variabel vars minimum låter sig beräknas 

med enkla analytiska metoder. Först beräknar vi första derivatan 

dQ 

d 

= 2 1 

2 

1 

p 

och sätter denna lika med 0 för att erhålla extremvärdet. Denna procedur 

ger oss följande observerade skattning av ytan 

= 

1 

n 

10X 

i=1 

xi 

!2 

10X 

xi 

Minsta kvadratskattningen som stokastisk variabel blir därför 

^ (X) = 

1 

n 

i=1 

!2 

10X 

Xi 

i=1 

. 

p 

= X 2 

och denna minsta kvadratskattning har inte egenskapen att vara väntevärdesriktig 

ty 

E ^ = E X 2 = V X + E 2 X = V X + . 

Således gäller att E ^ > såvida inte variansen är 0 5 . 

Detta exempel ger oss således två viktiga kunskaper. Den första är att 

minsta kvadratskattningen ej behöver vara ett enkelt linjärt uttryck i X 

(vi …ck ett kvadratiskt) och den andra är att minsta kvadratskattningen 

ej behöver vara väntevärdesriktig. 

Vårt nästa exempel illustrerar hur vi hanterar fallen med ‡era okända 

parametrar. 

Exempel 34 Man har gjort tre oberoende mätningar av vinkeln AOC 

( 1 + 2) och två oberoende mätningar av vinkeln AOB ( 1). Bestäm 

minsta kvadratmetodens skattningar av 1 och 2. (lägg in bild) 

5 För att variansen skall vara 0 så måste alla mätningar vara lika och detta är 

knappast troligt. 

c Mikael Möller


Lösning 25 Den beskrivna situationen ger oss följande statistiska modell 

X1 = 1 + 2 + 1, 

X2 = 1 + 2. 

Minsta kvadratsumman med två parametrar kan nu skrivas 

Q ( ) = Q ( 1; 2) = 

3X 

i=1 

x1i ( 1 + 2) 2 + 

2X 

(x2i 1) 2 . 

Detta följer av att de fem mätningarna kan betraktas som erhållna från 

en stokastisk variabel Y där 

Y = X1 mätning 1,2,3, 

X2 mätning 1,2. 

I nästa steg beräkna vi de första partiella 6 derivatorna och …nner 

@Q 

@ 1 

@Q 

@ 2 

= 2 ( 1) 

= 2 ( 1) 

3X 

i=1 

3X 

i=1 

i=1 

x1i ( 1 + 2) + 2 ( 1) 

x1i ( 1 + 2) . 

2X 

(x2i 1) , 

Sätt dessa lika med 0 och lös det så uppkomna ekvationssystemet varvid 

följande lösning erhålls 

1 = 

2 = 

2X 

i=1 

3X 

i=1 

x2i, 

x1i 

Minsta kvadratskattningarna blir således 

^ 1 = X2, 

2X 

i=1 

^ 2 = X1 X2. 

x2i. 

Vi har anledning att återkomma till denna skattningsmetod längre 

fram. 

6 Detta matematiska ord är till för att skilja funktionerna på R från de på R n där 

n > 1 (i vårt fall är n = 2). 

i=1 

c Mikael Möller


5.3.3 Maximum likelihood metoden 

I minsta kvadratmetoden utgick vi ifrån ett stickprov med okänd fördelning 

för att skatta okända parametrar och lyckades, trots denna brist på 

kunskap, komma med förslag på hur man skattar parametrarna. Om vi 

nu lägger till kunskap om fördelningen F vad kan vi då göra? För att 

besvara denna fråga utgår vi ifrån modellen 

Xi = m ( ) + i, i 2 OF , i = 1; 2; : : : ; n 

där F är en känd diskret eller kontinuerlig fördelning. Som vi 

tidigare sett i de två kapitlen om diskreta och kontinuerliga modeller så 

dyker fördelningars utseende ofta upp som en konsekvens av den modellerade 

situationen och de logiska resonemangen. Det är därför inte ett 

orimligt antagande att vi känner fördelningen sånär som på en eller ‡era 

parametrar. 

Vi behandlar de diskreta och kontinuerliga modellerna var för sig. 

De idéer som används är lika men sättet att skriva skiljer sig åt. 7 Den 

bärande idéen är att man för ett givet stickprov X1; X2; : : : ; Xn väljer 

de värden på de okända parametrarna som har störst sannolikhet att 

inträ¤a. Att detta är möjligt följer av att vi känner fördelningen. 

Diskreta modeller 

För de diskreta modellerna är sannolikhetsfunktion P (Xi = k) välde…nerad 

och vi betraktar den simultana sannolikhetsfunktionen 

L ( ) = P (X1 = x1; : : : ; Xn = xn; ) 

= P (X1 = x1; ) P (Xn = xn; ) . 

Denna funktion ger sannolikheten för att vi skall erhålla det observerade 

stickprovet x1; : : : ; xn givet att vår okända parameter är . För olika 

värden på antar denna funktion olika värden och för något antas 

funktionens maximum. Observera att det måste vara så ty L ( ) är en 

sannolikhet och därmed positiv samt ligger L ( ) mellan talen 0 och 1. 8 

Det som maximerar L ( ) kallas Maximum Likelihood skattningen 

av eller på svenska –den Sannolikaste Skattningen. När ett entydigt 

maximum inte …nns så existerar inte ML-skattningen. 

7 Med lite högre matematik kan framställningen göras för båda på en gång men 

denna matematik saknar vi. 

8 En av matematikens satser säger att en positiv, ändlig, funktion vars de…nitionsområde 

är kompakt antar sitt maximum inom de…nitionsområdet. 

c Mikael Möller


Exempel 35 När vi diskuterade optioner angav vi sannolikheten p för 

att optionen skulle gå upp och 1 p för att den skulle ligga stilla eller gå 

ner. I en fotnot angav vi hur vi skulle skatta p. Här skall vi nu se att 

det förslag vi då gav är rimligt och stämmer väl med ML-skattningen. 

Lösning 26 Den statistiska modell vi angav för en option ett tidssteg 

fram var 

X1 = ux0 med sannolikheten p, 

dx0 med sannolikheten 1 p. 

Genom en enkel transformation 

X = X1 dx0 

ux0 dx0 

överförs denna modell i binomialmodellen, Bin (1; p), 

X = 

1 med sannolikheten p, 

0 med sannolikheten 1 p. 

Sannolikhetsfunktionen för en Bin (1; p) kan skrivas 

P (X = xi) = p xi (1 p) 1 xi , i = 1; 2; : : : ; n 

och på grund av oberoendet erhålls att den simultana sannolikhetsfunktionen 

L (p) i sin tur kan skrivas 

L (p) = P (X1 = x1; : : : ; Xn = xn; p) 

= P (X1 = x1; p) P (Xn = xn; p) 

= p x1 1 x1 

(1 p) 

= p x n x 

(1 p) 

p xn 1 xn 

(1 p) 

där x = P n 

i=1 xi. Hur skall vi, givet stickprovet, välja p så att L (p) 

maximeras d v s hur skall vi …nna den skattning på p som ger störst 

sannolikhet. Ja L (p) är inget annat en vanlig enkel snäll matematiskt 

funktion vars maximum härleds med hjälp av matematik. Beräkna första 

derivatan och sätt denna till 0: 

L 0 (p) = xp x 1 n x 

(1 p) 

Detta ger oss ekvationen 

x (1 p) (n x) p = 0 

(n x) p x (1 p) n x 1 = 0. 

c Mikael Möller


vars lösning är 

p = x 

n . 

För att visa att denna lösning ger oss ett maximum beräknar vi andra 

derivatan: 

L 00 

(p) = d (x np) px 1 n x 1 

(1 p) 

dp 

= np x 1 (1 p) n x 1 + (x 

x 

np) p 

1 x 1 

(1 

p 

n 

p) 

x 1 

(x np) p x 1 (1 p) n x 1 n x 1 

1 p 

00 x 

L 

n = npx 1 (1 p) n x 1 < 0 

och eftersom den är negativ följer att vi har ett maximum. 9 

Maximum likelihoodskattningen sammanfaller, i detta fall, med minsta 

kvadratskattningen ty 

Q (p) = 

nX 

(xi p) 2 

i=1 

erhåller sitt minimum för samma värde på p. 

Uppgift 18 Bestäm minsta kvadratskattningen i ovanstående optionsexempel. 

Ofta blir det krångligt och lätt att räkna bort sig när man skall bestämma 

maximum för funktionen L ( ). Det kan då visa sig att en logaritmering 

av L ( ) gör det enklare att bestämma maximum av log L ( ). 

Men erhålls maximum för samma -värde? Faktum är att vi erhåller 

maximum för samma -värde och detta visas i nedanstående uppgift. 

Uppgift 19 Om funktionen L ( ) är lagom snäll så gäller att funktionerna 

L ( ) och log L ( ) har maximum för samma värde på . 

I exemplet ovan räknade vi direkt på L (p) och även om det var enkelt 

så illustrerar vi med samma exempel att räkningarna faktiskt kan bli än 

enklare. 

Exempel 36 En alternativ matematisk metod för att lösa exempel 35 

på sid 131. 

9 En annan av matematikens användbara satser säger detta. 

c Mikael Möller


Lösning 27 Vår likelihood funktion är 

och dess logaritm blir 

Den senares derivata blir 

L (p) = p x n x 

(1 p) 

log L ( ) = x log p + (n x) log (1 p) . 

d log L ( ) 

d 

= x n x 

+ 

p 1 p 

och som satt till 0 ger samma lösning som tidigare. 

Eftersom det alltid är illustrativt och övertygande med bilder ger vi 

här i …gur 5.5 på sid 133 grafer för både L (p) och log L (p). I …guren 

har även markerats det (0:2) som ger maximum. 

4.0e6 

3.0e6 

2.0e6 

1.0e6 

0.0e+0 

0.0 0.1 0.2 0.3 0.4 0.5 0.6 

Maximum för 

L ( ) = p 5 (1 p) 20 

p 

0.10 

12.0 

0.15 0.20 0.25 0.30 

12.5 

13.0 

13.5 

14.0 

Maximum för 

L ( ) = 5 ln p + 20 ln (1 p) 

Figur 5.5: Två sätt att beräkna maximum för en fumktion 

Kontinuerliga modeller 

Om vi har en kontinuerlig fördelning istället för en diskret så använder vi 

täthetsfunktionen istället för sannolikhetfunktionen (att detta fungerar 

kan visas med matematik). Vi har därför att betrakta funktionen 

L ( ) = f (x1; : : : ; xn; ) = f (x1; ) f (xn; ) 

och i övrigt förfar vi på samma sätt som för den diskreta fördelningen. 

Först ger vi ett rakt exempel för exponentialfördelningens parameter. 

p 

c Mikael Möller


Exempel 37 Tider mellan skador på en personbilsförsäkring visade sig, 

enligt den utredning vi gjorde på sid 90, vara Exp ( ). I denna fördelning 

ingår parametern om vilken vi endast vet att den är större än noll. 

Bestäm maximum likelihood skattningen av denna parameter när vi har 

stickprovet X1; X2; : : : ; Xn. 

Lösning 28 Vi har likelihoodfunktionen 

och erhåller 

L ( ) = e 

x1 e 

= n e P n 

i=1 xi 

ln L ( ) = n ln 

Denna funktion ger oss ekvationen 

n 

x2 e 

nX 

xi = 0 

i=1 

nX 

xi. 

i=1 

vars lösning är 

n 

= Pn i=1 xi 

. 

Maximum likelihoodskattningen för kan således skrivas 

^ = 

n 

Pn i=1 Xi 

= 1 

X . 

Nu är det inte alltid så att man enkelt kan …nna maximum likelihoodskattningen 

utan ibland måste man tänka till lite extra. Ett exempel på 

detta ger vårt exempel på sid 25. 

Exempel 38 Din arbetsplats är belägen vid Fältöversten och buss nummer 

1 har en hållplats där. Din väntetid vid hållplatsen kan modelleras 

av en R (0; )-fördelning. Använd maximum likelihoodmetoden för att 

…nna en skattning av givet stickprovet X1; X2; : : : ; Xn. 

Lösning 29 Vi har likelihoodfunktionen 

L ( ) = 1 1 1 = 1 

n 

och denna funktion kan inte maximeras på sedvanligt sätt. Istället konstaterar 

vi att för varje stickprovsvärde så gäller att 


0 xi i = 1; 2; : : : ; n. 

xn


Av dessa n relationer följer att max (x1; x2; : : : ; xn) men detta ger 

att 

L ( ) = 1 

n 

1 

maxn (x1; x2; : : : ; xn) 

varav följer att det största värde L ( ) kan anta är högerledet ovan och 

detta värde antas när 

= max (x1; x2; : : : ; xn) . 

Maximum likelihoodskattningen blir därför 

^ = max (X1; X2; : : : ; Xn) . 

För Maximum Likelihood skattningen gäller att den ej alltid är väntevärdesriktig 

men att den ofta kan korrigeras till att bli det. Vidare är den 

under milda villkor konsistent. Man kan även visa att ML–skattningen 

är asymptotiskt väntevärdesriktig och e¤ektiv samt att den är asymptotiskt 

normalfördelad. Det är således en skattningsmetod som ger en 

skattning med många "bra" egenskaper. 

5.4 Tankeväckande exempel 

Under denna rubrik ger vi några exempel som inte följer den allmäna 

fåra som vi hitills följt. 

Exempel 39 (Median) Inom fysiken förekommer en fördelning som 

av oss statistiker kallas cauchyfördelningen men som inom fysiken också 

går under beteckningar som lorentzfördelningen alternativt breit-wignerfördelningen. 

För statistiker uppstår denna fördelning när man bildar 

kvoten mellan två normalfördelningar (något som inträ¤ar oftare än man 

tror) och cauchyfördelningens täthetsfunktionen de…nieras av 

f (x) = 1 1 

2 

1 + (x 0) 2 1 < x < 1 

vilken beror av de två parametrarna 0 och 1. Här spelar 0 rollen 

av mittpunkt och 1 rollen av variation – observera uttryckssättet. För 

denna fördelning existerar inga moment och eftersom dessa inte existerar 

kan vi inte använda oss av någon av de beskrivna metoderna. Med 

elementära matematiska metoder är det trivialt att visa att första momentet 

ej existerar (för att förenkla sätter vi nu 1 = 1 och 0 = ) ty 

c Mikael Möller

136 5.4. Tankeväckande exempel 

det gäller 

E (X) = 

= 

Z 1 

1 

Z 1 

= 1 

2 

1 

1 1 

x 

1 + (x 

2 dx 

) 

1 x 

1 + (x 

2 dx + 

) 

ln 1 + (x )2 

x=1 

x= 1 

Z 1 

1 

1 

2 dx 

1 + (x ) 

+ 1 arctan (x ) 

x=1 

x= 1 

= 1 1 + 

2 + 2 . 

Ett svar som är ode…nierat och därför ej kan existera. De övriga momenten 

blir inte roligare. 

Om vi ritar grafer för några cauchyfördelningar så erhåller vi …gur 

5.6 på sid 136. En observation ger att är en mittpunkt och att medianen 

0.4 

0.3 

0.2 

0.1 

8 6 4 2 0 2 4 6 8 10 

Figur 5.6: Heldragen kurva: Ca (0; 1). Prickad kurva: Ca (0; 2). 

Streckad kurva: Ca (2; 2). 

(och även typvärdet) antar även de värdet . Beteckna medianen för ett 

stickprov med ^ M. Då gäller följande de…nition av medianskattningen 

8 

>< X (k) n = 2k + 1 

^M (X1; : : : ; Xn) = 

>: 

X (k) + X (k+1) 

n = 2k 

2 

och man kan visa att denna skattning asymptotiskt har fördelningen 


2 

N ; 

4n .


Men detta betyder att medianskattningen är väntevärdesriktig och konsistent 

(åtminstone asymptotiskt). För att visa att E ^ M = , d v s 

att medianen är en väntevärdesriktig skattning, krävs en massa teknisk 

matematik och vi nöjer oss med att konstatera att det är sant (det är 

dessutom intuitivt självklart men en statistiker litar inte helt på intuitionen). 

Exempel 40 (Jackknife) Antag att du av någon anledning behöver en 

väntevärdesriktig skattning av p 2 i en Bin (n; p)-fördelning. Om du bara 

läst denna bok fram till nu så blir ett första försök 

bp 2 = 

1 

n 

nX 

i=1 

Xi 

! 2 

= X 2 n 

där P n 

i=1 Xi (= X) är antalet lyckade försök. Denna skattnings väntevärde 

…nner vi till 

E X 2 n = V Xn + E 2 Xn = 

p (1 p) 

n 

+ p 2 

och den är därför inte väntevärdesriktig. Hur kan vi konstruera en väntevärdesriktig 

skattning för p 2 ? 

För att ange en relativt generella metod som kallas Jackknife lämnar 

vi för en stund exemplet och betecknar med Tn den första statistika 

vi kommer att tänka på för att skatta parametern givet stickprovet 

X1; X2; : : : ; Xn. Vi utgår ifrån att den inte är väntevärdesriktig och vår 

uppgift är att konstruera en väntevärdesriktig skattning om Tn är given. 

För detta behöver vi följande antagande 

E (Tn) = + 

1X 

k=1 

ak ( ) 

n k 

där funktionerna ak ( ) inte beror av n (I vårt exempel har vi = p och 

funktionerna a1 (p) = p (1 p) och ak = 0 för k = 2; 3; : : :). 

Nästa steg är att konstruera statistikorna Tn 1;j, j = 1; 2; : : : ; n, 

genom att inte ta med det j:te stickprovsvärdet. Dessa kommer då ha 

samma väntevärde som Tn och vi bildar därefter medelvärdet av alla 

Tn 1;j, j = 1; 2; : : : ; n, d v s 

Tn 1 = 1 

n 

nX 

j=1 

Tn 1;j 

c Mikael Möller

138 5.4. Tankeväckande exempel 

som i sin tur får väntevärdet E (Tn). Bilda nu den nya statistikan 10 

för vilken det gäller 

T 0 n = nTn (n 1) Tn 1 

E T 0 n = nE (Tn) (n 1) E Tn 1 

= n 

= + 

= + 

+ 

1X 

k=1 

1X 

k=2 

1X 

k=1 

ak ( ) 

nk 1 

ak ( ) 

n k 

ak ( ) 

nk 1 

! 

1X 

k=1 

(n 1) 

ak ( ) 

k 1 

(n 1) 

ak ( ) 

k 1 

(n 1) 

! 

. 

+ 

1X 

k=1 

ak ( ) 

(n 1) k 

! 

Om vi studerar summan närmare så ser vi att den är av storleksordnin- 

gen 1 

n 2 och vi har kommit närmare en väntevärdesriktig skattning. Om 

vi inte är framme efter det första steget gör vi ett steg till. 

I binomialexemplet var 

p (1 

E (Tn) = 

n 

p) 

+ p 2 

och vi …nner därför en väntevärdesriktig skattning redan efter ett steg ty 

alla ak (p) = 0 när k 

utveckla 

2. För att beräkna själva skattningen har vi att 

T 0 n = nTn (n 1) Tn 1 

och måste då först …nna Tn 1 (Tn = X2 n är redan klar). Av själva 

konstruktionen har vi att om nXn = X så gäller 

8 

2 >< 

om de n 1 valda har X 1 lyckade 

Tn 1;j = 

>: 

j=1 

X 1 

n 1 

X 

n 1 

2 

om de n 1 valda har X lyckade 

Det första fallet kan inträ¤a på X olika sätt och det senare på n 

olika sätt och detta ger oss att 

X 

Tn 1 = 1 

nX 

Tn 

n 

1;j = 1 

n 

X 

X 

n 

1 

1 

2 

+ (n X) 

X 

n 1 

2 ! 

= X2 (n 2) + X 

n (n 1) 2 . 

10 Detta är genialt men jag förstår inte själv hur man kan komma att tänka i dessa 

banor. Om någon vet berätta gärna. 

c Mikael Möller


Den sökta skattningen erhålls nu till 

T 0 n = nTn (n 1) Tn 1 

= n X 

n 

= 

= 

2 

(n 1) 1 

n 

X 

X 1 

n 1 

2 

+ (n X) 

X 

n 1 

1 

n (n 1) nX2 X 2 X 3 + 2X 2 X nX 2 + X 3 

1 

n (n 1) X2 X = 

X (X 1) 

n (n 1) 

och att den är väntevärdesriktig följer av följande likheter 

E T 0 n = E 

X (X 1) 

n (n 1) 

n 

= E X2 

(n 1) 

E (X) 

1 

= 

n (n 1) V (X) + E2 (X) np 

1 

= 

n (n 1) np (1 p) + n2p 2 

np 

= n (n 1) p2 

n (n 1) = p2 . 

2 ! 

c Mikael Möller



17 För att visa ovanstående påstående för en normalfördelning har vi att 

använda oss av föjdsatsen 40 på sid 107 samt de…nitionerna av skevhet 

och toppighet. 

1. Den teoretiska skevheten de…nieras av 

1 = E 

X X 3 

vilket är tredje momentet av en N(0; 1) fördelning. Följdsatsen ger 

1 = (2 1 1)!! = 0. 

2. Den teoretiska toppigheten de…nieras av 

2 = E 

X X 4 

vilket är fjärde momentet av en N(0; 1) fördelning. Följdsatsen ger 

2 = (2 2 1)!! 3 = 0. 

En normalfördelning har således både skevheten 0 och toppigheten 0. 

Detta för med sig en del tekniska förenklingar som var av större betydelse 

förr än nu. 

18 Liksom ovan börjar vi med att derivera och sätta derivatan till 0: 

Q 0 (p) = 

nX 

2 (xi p) = 0. 

Det framgår omedelbart att 

i=1 

p = 1 

n 

nX 

xi. 

19 För att se ovanstående påstående beräknar vi första derivatan för de 

båda funktionerna L ( ) och log L ( ) varvid vi erhåller de två ekvationerna 

dL ( ) 

= 0 

d 

d log L ( ) 

d 

i=1 

3 

= 1 dL ( ) 

= 0 

L ( ) d 

och eftersom L ( ) > 0 ser vi att ekvationerna är ekvivalenta. 

c Mikael Möller

6. Passar vår fördelning 

För att se vad som naturligt blir nästa anhalt på vår färd i statistikens 

landskap gör vi en kort rekapitulation av resan hitills. Vi började 

med att säga att statistik handlar om medelvärden och när vi studerade 

dessa hamnade vi hos de stokastiska variablerna och och en axiomatisering, 

av medelvärden till väntevärden, gav oss deras sannolikheter 

(sannolikhetsfunktion, täthetsfunktion, fördelningsfunktion), vi kom så 

fram till modeller vilka gav upphov till fördelningar med okända parametrar 

(Bin (n; p), P o ( ), NegBin (l; p), Exp ( ), N ( ; ) o s v). Därefter 

fördes vi vidare mot skattningar av de okända parameterarna (p, , , 

,: : :) och de skattningsmetoder vi studerade var 

1. Momentmetoden som kräver stickprov X1; : : : ; Xn och fördelning 

F . 

2. Maximum likelihoodmetoden som kräver stickprov X1; : : : ; Xn och 

fördelning F . 

3. Minsta kvadratmetoden som kräver stickprov X1; : : : ; Xn. 

Den skattningsmetod som i någon mening är bäst är maximum likelihoodmetoden 

men det är inte alltid så att fördelningen F är känd utan 

oftast har man bara ett stickprov från densamma. Det gäller således 

att på något sätt …nna fördelningen d v s att skatta F . Den enda tillgängliga 

metoden är logik och intelligenta gissningar ty någon generell 

metod, som de tre ovan för parametrarna, existerar ännu inte. Däremot 

…nns det metoder för att avgöra om gissningen är bra eller ej och det är 

en introduktion till dessa metoder vi nu skall diskutera. 

Vi utgår som vanligt från vårt stickprov och den modell som gett upphov 

till stickprovet. Med hjälp av deskriptiva metoder och intelligenta 

gissningar kommer vi fram till att den underliggande fördelningen är, säg, 

F . Vår fråga är nu om denna fördelning F stämmer med den struktur 

som stickprovet beskriver och som vi betecknar med ^ F (X1; X2; : : : ; Xn). 

Frågan är således: hur avgör vi om ^ F F ? 

Antag att två personer gömmer på varsin snäll funktion G (x) respektive 

H (x) och att det är din uppgift att avgöra om dessa funktioner 

är lika eller ej. Från de båda personerna har du ett löfte (ja en av dem 

är, tyvärr, inte helt pålitlig utan en riktig retsticka och ruckar lite på 

141

142 

si¤rorna – men inte mycket) om att de för varje tal a som du ger dem 

så ger de dig talen G (a) och H (a). Din uppgift är nu att ställa frågor 

d v s ange en svit av tal a1; a2; : : : ; an och i gengäld få två sviter 

G (a1) ; G (a2) ; : : : ; G (an) och H (a1) ; H (a2) ; : : : ; H (an) tillbaks. Din 

uppgift är att utifrån dessa två sviter avgöra om funktionerna är lika 

eller ej. 

För att få idéer till detta hur kan göras ritar vi i ett koordinatsystem 

punktsviten 

G (x) ; H (x) j x = a1; a2; : : : ; an 

och om G = H (d v s om vi har samma funktion) så får vi punkter som 

ligger på en rät linje. Men om för värdet x det gäller att G (x) inte 

är exakt lika med H (x) så erhålles t ex cirklarna/punkterna i …guren 

nedan. 

1.4 

1.2 

1.0 

0.8 

0.6 

0.4 

0.2 

0.0 

0.2 

0.4 

0.2 0.0 0.2 0.4 0.6 0.8 1.0 1.2 

Figur 6.1: Punktdiagrammet (G; H) 

Dessa missar linjen lite grann men i vår …gur råder ändock ingen tvekan 

om att de approximerar en rät linje –eller? Under alla omständigheter 

inser vi att cirklarna kan bilda mönster kring linjen –mönster som beror 

på strukturen hos H relativt G. Det gäller nu att dels tolka dessa mönster 

och dels avgöra om punkterna ligger tillräckligt nära den räta linjen 

för att vi skall tro på att funktionerna är lika. 

Denna visuella metodidé skall vi nu försöka tillämpa på den av oss 

gissade fördelningen F (funktionen G ovan) och den från stickprovet 

skattade fördelningen ^ F (funktionen H ovan). Vidare skall vi undersöka 

några av de vanligaste förekommande mönstren och vad dessa ger för 

information. 

c Mikael Möller

6. Passar vår fördelning 143 

6.1 Funktionen ^ F 

Egentligen …nns det bara ett naturligt val för funktionen ^ F (i varje fall 

känner jag inga andra) så när det gäller att skatta fördelningar så …nns 

inte, som när vi skattade parametrar, olika metoder vilka ofta gav olika 

(om än mycket snarlika) svar. Det naturliga valet av skattning är, givet 

stickprovet, 

^F (x j X1; X2; : : : ; Xn) = 1 

nX 

IfXi xg. 

n 

Om vi använder oss av det ordnade stickprovet erhålls samma skattning 

^F x j X (1); X (2); : : : ; X (n) = 1 

nX 

I 

fX(i) n 

xg 

men det blir lättare att känna igen denna funktion som en stegfunktion, 

från 0 till 1, och därmed en approximation av en fördelningsfunktion. 

1 Denna skattning är väntevärderiktig och har därför en av de goda 

egenskaper vi eftersträvar hos våra skattningar. Detta följer av följande 

likheter, som är baserade på axiom 2 för väntevärden, de…nitionen av 

sannolikhet och att variablerna i ett stickprov är likafördelade: 

E ^ F (x j X1; X2; : : : ; Xn) = E 

= 1 

n 

1 

n 

nX 

i=1 

= F (x) . 

i=1 

i=1 

nX 

IfXi i=1 

! 

xg = 1 

nX 

n 

i=1 

P (Xi x) = 1 

nX 

F (x) 

n 

i=1 

E I fXi xg 

Egenskapen väntevärdesriktighet är därför uppfylld för såväl diskreta 

som kontinuerliga fördelningar. Dessutom är skattningen konsistent d v s 

den närmar sig detta väntevärde när n växer. 2 Däremot blir e¤ektiviteten 

ett litet problem eftersom vi inte har några andra naturliga 

skattningar att jämföra med. 

6.2 Fördelningsdiagram 

Vi skall nu närmast diskutera två visuella metoder för att avgöra om en 

fördelning passar till data eller ej och metoderna benämns P-P diagram 

1 Det lönar sig att stanna upp här och försöka förstå hur funktionen kan se ut. 

2 Faktiskt bättre än så ty integralen av en funktion de…nieras i matematiken som 

en gräns av stegfunktioner. 

c Mikael Möller

144 6.2. Fördelningsdiagram 

och K-K diagram. 3 För att illustrera skillnaderna mellan dessa metoder 

använder vi som genomgående exempel de två fördelningarna N (0; 1) 

och Ca (0; 1). Deras täthetsfunktioner och fördelningsfunktioner framgår 

av …gur 6.2 nedan. 

(a) 

Ca(0; 1) 

F N(0; 1) 

1:0 

x 

(b) 

F 

N(0; 1) 

Ca(0; 1) 

x 

Figur 6.2: Fördelnings- och täthetsfunktioner för N(0; 1) och Ca(0; 1) 

Vi ser av …gurerna att Cauchyfördelningen har "tyngre svansar" än 

normalfördelningen samt att båda fördelningarna är symmetriska kring 

origo. 

Cauchyfördelningen är lustig på så sätt att den saknar moment av 

alla ordningar –den har inte ens ett medelvärde. Detta strider mot allt 

förnuft ty medelvärdet är ju självklart 0 –det syns ju i …guren! Faktum 

är dock att E (X) ej existerar om X 2 Ca (0; 1) och därför kan man 

aldrig, från ett stickprov, få fram ett entydigt aritmetisk medelvärde. 

Det kommer att variera från stickprov till stickprov. Däremot existerar 

Cauchyfördelningens median och den är 0. 

6.2.1 P-P diagram 

P i P-P diagram står för procent d v s hundradelar av och dessa diagram 

är de punktdiagram som beskrivs av punktmängden 

G (x) ; H (x) j x = a1; a2; : : : ; an 

för något val av sannolikhetsfördelningar G och H. I diagrammet avsätts 

oftast den teoretiska (kända) fördelningen på abscissan (x-axeln) och 

den skattade fördelning, som erhålls av stickprovet, på ordinatan (yaxeln). 

I ett P-P diagram blir därför, eftersom fördelningsfunktioner är 

3 I det engelska språket benäms de "p-p plot" och "q-q plot" vilka är förkortningar 

av "percent-percent plot" (alternativt "probability-probability plot") och "quantilequantile 

plot". 

c Mikael Möller


sannolikheter, både värdemängden och de…nitionsmängden det slutna 

intervallet [0; 1]. Om nu funktionerna G och H är lika så bildar P-P 

diagrammet en rät linje. 

Vad är det som vi egentligen mäter med ett P-P diagram? Uppenbarligen 

är det något som händer i vårt huvud, på samma sätt som vid 

kast med tärning. Vi ser det vi vill se, eller rättare sagt, det som är 

intressant att se. För att bättre förstå vad det är vi ser lägger vi till lite 

information i …gur 6.2a och erhåller så …gur 6.3a nedan. 

N(0; 1) 

Ca(0; 1) 

(a) Diagram av två fördelningar 

x 

F = G H 

0:1 

(b) Diagram av fördelningsskillnad 

Figur 6.3: Två fördelningar vid P-P diagram 

När vi, med P-P diagram, visuellt avgör om två fördelningar är 

lika eller ej så genomför vi indirekt en, eller snarare ‡era, avståndsbedömningar 

mellan de två fördelningarnas värden d v s det vertikala 

avståndet mellan fördelningarna. Mer exakt så "mäter" vi avståndet 

G (x) H (x) för alla x och om detta avstånd överlag är litet så säger 

vi att fördelningarna är lika annars inte. 4 För de två fördelningarna 

Ca (0; 1) och N (0; 1) ser vi redan i …gur 6.3a att de ej kan vara lika. Än 

tydligare syns detta om vi gör ett diagram över skillnaden G (x) H (x) 

(se …gur 6.3b) ty då syns tydligt att de två fördelningarna skiljer sig åt 

i sina mittersta områden (mellan 25% och 75% percentilerna). 

Vi avslutar detta avsnitt med en …gur över P-P diagrammet (se …gur 

6.4 på sid 146) för de två fördelningarna Ca (0; 1) och N (0; 1). Figuren 

konstrueras genom att vi avsätter den teoretiska fördelningens percentiler 

(N (0; 1)) på y-axeln och den skattade fördelningens (Ca (0; 1)) 

på x-axeln d v s för varje x 2 R bestämmer vi det p för vilket p = H (x) 

och det q för vilket q = G (x) och därefter ritar vi den parametriska 

kurvan (p; q). 5 

4 Men inte ens detta är hela sanningen ty egentligen tolkar vi även ytan mellan de 

två fördelningarna samt växlingar mellan + och hos F = G H. 

5 Detta val av axlar är betingat av det program (Statistica) som jag använt för att 

x 

c Mikael Möller


N(0; 1) 

Ca(0; 1) 

Figur 6.4: P-P diagrammet för (Ca(0; 1); N(0; 1)) 

Vi ser att vi får en kurva som slingrar sig kring den räta linjen på ett 

mycket karakteristiskt sätt. Detta utseende är typiskt för fördelningar 

som har olika tjocka svansar. 

6.2.2 K-K diagram 

K i K-K diagram står för kvantil och den p:te kvantilen till en fördelning 

F de…nieras av talet F 1 (p). Dessa diagram är de punktdiagram som 

beskrivs av punktmängden 

G 1 (p) ; H 1 (p) j p = a1; a2; : : : ; an 

för något val av sannolikhetsfördelningar G och H. I diagrammet avsätts 

oftast den teoretiska (kända) inversa fördelningen på abscissan (x-axeln) 

och den skattade inversa fördelning, som erhålls av stickprovet, på ordinatan 

(y-axeln). I ett K-K diagram kan därför både värdemängden 

och de…nitionsmängden vara en delmängd av de reella talen. Om nu 

funktionerna G och H är lika så bildar även K-K diagrammet en rät 

linje. 

Med ett K-K diagram mäter vi naturligtvis samma sak som med ett 

P-P diagram men nu betraktar vi ett annat avstånd –det horisontella. 

Vi erhåller då …gur 6.5a som även den baseras på …gur 6.2a på sid 144. 

När vi, med K-K diagram, visuellt avgör om två fördelningar är lika 

eller ej så genomför vi även här en indirekt avståndsbedömning men nu 

mellan de två fördelningarnas kvantiler d v s mellan de två fördelningarnas 

inversa värden. Mer exakt så "mäter" vi avståndet H 1 (p) G 1 (p) 

för alla p i intervallet (0; 1) och om detta avstånd är litet så säger vi att 

fördelningarna är lika annars inte. För de två fördelningarna Ca (0; 1) 

göra illustrationerna i avsnittet Exempel. 

c Mikael Möller


y 

F 

N(0; 1) 1 (y) 

Ca(0; 1) 1 (y) 

(a) Diagram av två fördelningar 

x 

F = H 1 G 1 

Figur 6.5: Två fördelningar 

0:5 

(b) Diagram av inversa fördelningsskillnaden 

och N (0; 1) ser vi redan i …gur 6.5a att de ej kan vara lika. Än tydligare 

ser vi detta om vi gör ett diagram över skillnaden mellan de två inversa 

fördelningarna: H 1 (p) G 1 (p) (se …gur 6.5b) ty då syns tydligt att 

de två fördelningarna skiljer sig åt i sina ytterområden (till vänster om 

första kvartilen och till höger om tredje kvartilen). 

Vi avslutar detta avsnitt med en …gur över K-K diagrammet (se …gur 

6.6) för de två fördelningarna Ca (0; 1) och N (0; 1). Figuren konstrueras 

genom att vi avsätter den teoretiska fördelningens inversa percentiler 

(N (0; 1)) på x-axeln och den skattade fördelningens inversa percentiler 

(Ca (0; 1)) på y-axeln d v s för varje p 2 (0; 1) bestämmer vi det x för 

vilket G (x) = p och det y för vilket H (y) = p och därefter ritar vi den 

parametriska kurvan (x; y). 

Liksom för P-P diagrammet erhålls en kurva som slingrar sig kring 

den räta linjen på ett karakteristiskt sätt. Eftersom den inversa skillnaden 

kan bli hur stor som helst är K-K diagram känsliga för uteliggare 

och kan användas för att hitta sådana. Alla följande K-K diagram visar 

prov på denna känslighet. 

6.2.3 Exempel 

Vi ger nu ett antal exempel på olika fördelningar och vilka diagram de 

ger gentemot ett normalfördelningsantagande. 

I exemplen visar den vänstra övre del…guren (a) funktionen F = 

G H d v s skillnaden mellan fördelningsfunktionerna. Den vänstra undre 

del…guren (b) visar ett P-P diagrammet baserat på en simulering 

från fördelningen H. Den högra övre del…guren (c) visar funktionen 

x 

c Mikael Möller


Ca 1 (0; 1) 

N 1 H 

-2 -1 0 1 2 

(0; 1) 

1 

12 

8 

4 

0 

-4 

-8 

-12 

G 1 

Figur 6.6: K-K diagrammet för (N(0; 1); Ca(0; 1)) 

F = H 1 G 1 d v s skillnaden mellan fördelningsfunktionernas inverser. 

Slutligen så visar den undre högra …guren (d) ett K-K diagram 

baserat på en simulering från fördelningen H. 

Vi noterar sedan att när kurvan i …gur (a) är positiv (kvadrant 1 och 

2) så ligger i …gur (b) punkterna över den räta linjen och när kurvan i 

(a) är negativ (kvadrant 3 och 4) så ligger i …gur (b) punkterna under 

den räta linjen. Analogt gäller för …gurerna (c) och (d). 

I de följande exemplen jämför vi med en normalfördelning som har 

samma väntevärde och standardavvikelse som de simulerade värdena 

ger. I samtliga jämförelser har vi gjort 100 simuleringar på den 

studerade fördelningen H. 

c Mikael Möller


N(0,1) mot N(0,1) 

En simulering om 100 observationer från en N (0; 1)-variabel ger oss två 

punktföljder som enligt teorin, för både P-P diagrammet (b) och K-K 

diagrammet (d), skall följa en rät linje –och det gör de! 

1.4 

1.2 

1.0 

0.8 

0.6 

0.4 

0.2 

0.0 

0.2 

0.4 

0.2 0.0 0.2 0.4 0.6 0.8 1.0 1.2 

(b) 

3 

2 

1 

0 

1 

2 

3 

3 2 1 0 1 2 3 

Hur ser …gurerna (a) och (c) ut för detta val av fördelningar? 

(d) 

c Mikael Möller


N(2,1) mot N(0,1) 

Figur (a) och (b) visar att N (2; 1) skiljer sig mycket från N (0; 1). Figur 

(c) visar att de två fördelningarna är förskjutna till varandra med 2 steg. 

K-K diagrammet är intressant ty det visar en nästan rät linje se sats 20 

nedan. 

1.2 

1.0 

0.8 

0.6 

0.4 

0.2 

0.0 

3 2 1 0 1 2 3 4 5 

0.2 

0.4 

0.6 

(a) 

0.2 

0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 

(b) 

3 

2 

1 

0 

0.0 0.2 0.4 0.6 0.8 1.0 

5 

4 

3 

2 

1 

0 

(c) 

1 

3 2 1 0 1 2 3 

Uppgift 20 Visa att för två fördelningar som endast skiljer sig åt avseende 

väntevärde och standardavvikelse så blir K-K diagrammet en rät 

linje. 

Resultatet av ovanstående uppgift är att K-K diagrammet är mer 

lämpat för att avgöra en struktur och ej så känsligt för parametrarnas 

faktiska värden. 


(d)


2 (4) mot Normal 

En simulering om 100 observationer från en 2 (4)-variabel ger oss två 

punktföljder vars P-P, (b), och K-K, (d), diagram båda har en bananform. 

Denna form är typisk för skeva fördelningar. 

1.4 

1.2 

1.0 

0.8 

0.6 

0.4 

0.2 

0.0 

0.1 

4 2 2 4 6 8 10 12 14 16 18 

0.1 

(a) 

0.2 

0.0 0.2 0.4 0.6 0.8 1.0 1.2 

(b) 

2.0 

1.5 

1.0 

0.5 

0.0 

0.5 

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 

16 

14 

12 

10 

8 

6 

4 

2 

0 

2 

(c) 

4 

3 2 1 0 1 2 3 

(d) 

c Mikael Möller


Beta(2,8) mot Normal 

En simulering om 100 observationer från en B (2; 8)-variabel ger oss två 


1.4 

1.2 

1.0 

0.8 

0.6 

0.4 

0.2 

0.0 

0.05 

0.2 0.1 0.1 0.2 0.3 0.4 0.5 0.6 0.7 

0.05 

(a) 

0.2 

0.0 0.2 0.4 0.6 0.8 1.0 1.2 


(b) 

0.12 

0.10 

0.08 

0.06 

0.04 

0.02 

0.00 

0.02 

0.7 

0.6 

0.5 

0.4 

0.3 

0.2 

0.1 

0.0 

0.1 

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 

(c) 

0.2 

3 2 1 0 1 2 3 

(d)


Ca(0,1) mot Normal 

En simulering om 100 observationer från en Ca (0; 1)-variabel ger oss 

två punktföljder vars P-P diagram, (b), har en S-form och K-K diagram, 

(d), har en speglad S-form. 

14 12 10 8 6 4 2 2 4 6 8 10 12 14 

1.4 

1.2 

1.0 

0.8 

0.6 

0.4 

0.2 

0.0 

0.2 

0.10 

0.05 

0.05 

0.10 

(a) 

0.4 

0.2 0.0 0.2 0.4 0.6 0.8 1.0 1.2 

(b) 

40 

20 

0 

20 

40 

80 

60 

40 

20 

0 

20 

40 

60 

0.0 0.2 0.4 0.6 0.8 1.0 

(c) 

80 

3 2 1 0 1 2 3 

(d) 

c Mikael Möller


R(0,1) mot Normal 

En simulering om 100 observationer från en R (0; 1)-variabel ger oss 

två punktföljder och eftersom R (0; 1):s båda svansar är lättare än normalfördelningens 

så erhåller dess P-P diagram en speglad S-form och 

dess K-K diagram en S-form. 

1.2 

1.0 

0.8 

0.6 

0.4 

0.2 

0.0 

y 

0.06 

0.04 

0.02 

1 1 2 

0.02 

0.04 

0.06 

(a) 

0.2 

0.0 0.2 0.4 0.6 0.8 1.0 


(b) 

x 

0.10 

0.05 

0.00 

0.05 

0.10 

1.4 

1.2 

1.0 

0.8 

0.6 

0.4 

0.2 

0.0 

0.2 

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 

(c) 

0.4 

3 2 1 0 1 2 3 

(d)


Beta(8,2) mot Normal 

En simulering om 100 observationer från en B (8; 2)-variabel ger oss två 


Dessa är en spegling av diagrammen för B (2; 8). 

0.1 

0.0 

0.1 

1.2 

1.0 

0.8 

0.6 

0.4 

0.2 

0.0 

0.2 

0.4 0.6 0.8 1.0 1.2 

(a) 

0.4 

0.2 0.0 0.2 0.4 0.6 0.8 1.0 

(b) 

0.00 

0.05 

0.10 

0.15 

0.20 

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 

1.2 

1.1 

1.0 

0.9 

0.8 

0.7 

0.6 

0.5 

0.4 

(c) 

0.3 

3 2 1 0 1 2 3 

(d) 

c Mikael Möller


Beta(0.5,0.5) mot Normal 

En simulering om 100 observationer från en B (0:5; 0:5)-variabel ger oss 

två punktföljder vars P-P, (b), och K-K, (d), diagram båda har en bananform. 

Dessa är en spegling av diagrammen för B (2; 8). 

1.2 

1.0 

0.8 

0.6 

0.4 

0.2 

0.0 

0.10 

0.05 

1 1 2 

0.05 

0.10 

(a) 

0.2 

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 


(b) 

0.15 

0.10 

0.05 

0.00 

0.05 

0.10 

0.15 

1.6 

1.4 

1.2 

1.0 

0.8 

0.6 

0.4 

0.2 

0.0 

0.2 

0.4 

0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 

(c) 

0.6 

3 2 1 0 1 2 3 

(d)


Slutkommentar 

Teorin för fördelningsdiagram fungerar för både diskreta och kontinuerliga 

variabler men för de diskreta variablerna …nns relativt elementära 

metoder som är mer exakta och enkla att förstå. Vi behandlar därför 

diskreta variabler först i kapitlet om hypotesprövning. 

I kapitlet hypotesprövning kommer vi även ge mer objektiva metoder, 

än ovan, för de kontinuerliga variablerna. Dessa metoder är dock matematiskt 

betydligt mer krävande. 

6.3 Rörvik Timber B 

Betrakta ånyo datamängden Rörvik Timber:s slutkurser, Xt, och bestäm 

utifrån dessa den dagliga vinsten uttryckt i procent av föregående dags 

slutkurs d v s betrakta de nya stokastiska variablerna 

R 0 t = Xt Xt 1 

. 

Xt 

Nu kan dagens slutkurs i Rörvik Timber AB betraktas som summan av 

dagens alla kursförändringar per tim/minut/sekund. Antag nämligen att 

vi mäter per minut t och då får värdet Xt. Slutkursen kan vid tidpunkt 

t skrivas 

Xt = Xt Xt 1 + Xt 1 Xt 2 + + X1 X0 

d v s som en summa av stokastiska variabler och därmed slår centrala 

gränsvärdessatsen till. Härav följer att Xt N ( ; ) och detta ger att 

Xt Xt 1 N 0; p 2 . Vi gör nu en normering av täljaren respektive 

nämnaren och erhåller då den nya dagsräntan 

Rt = 

Xt Xt 1 

p 2 

Xt 

= Xt Xt 1 

p 

2 (Xt ) 

som är kvoten mellan två N (0; 1)-variabler. Dylika variabler följer en 

Cauchyfördelning med parametrarna 0 och 1. 

Uppgift 21 Om det för de två stokastiska variablerna X1 och X2 gäller 

att X1 2 N (0; 1) och X2 2 N (0; 1) så gäller att 

Y = X1 

2 Ca (0; 1) 

X2 

c Mikael Möller

158 6.3. Rörvik Timber B 

d v s Y är Cauchyfördelad och dess täthetsfunktion är 

f (y) = d 

1 1 

P (Y y) = , 1 < y < 1 

dy 1 + y2 Eftersom en Cauchyfördelning ej har några moment förstår vi varför 

vi inte kan normera variablerna R 0 t direkt. 6 

I …gur 6.7 på sid 158 ser vi det stolpdiagram och kumulerade stolpdiagram 

som slutkurserna i Rörvik Timber B ger upphov till. 

Antal 

7 

6 

5 

4 

3 

2 

1 

-3 -2 -1 0 1 2 3 

Rörvik 

Timber 

1.0 

0.8 

0.6 

0.4 

0.2 

p 

-3 -2 -1 0 1 2 3 

Rörvik 

Timber 

Figur 6.7: Stolpdiagram över normaliserad dagsränta i Rörvik Timber 

B, period 2006-01-02–2006-05-29 

Ovanstående innebär att Rt för Rörvik Timber B approximativt blir 

en Cauchyfördelad variabel men är det så? Vårt stolpdiagram indikerar 

att det kan …nnas en symmetrisk fördelning i botten men hur skall vi 

kunna avgöra om normal- eller Cauchyapproximation eller någon annan 

symmetrisk fördelning är lämplig eller ej? 

Svaret på denna fråga får vi genom att studera P-P diagrammet och 

K-K diagrammet för dagsräntan, beräknad på slutkurserna (se sid 159). 

Vi ser att P-P diagrammet starkt indikerar en Cauchyfördelning (i 

varje fall en fördelning med tunga svansar) och likaså gör K-K diagrammet. 

Båda diagrammen indikerar också att den underliggande fördelningen 

är symmetrisk. Sammantaget övertygar detta oss om att dagsräntorna 

följer en Cachyfördelning. Eftersom ovanstående diagram är baserade 

på 100 slutkurser kan det vara av intresse att undersöka vad 

resultatet blir om vi har ett färre eller större antal slutkurser. 

6 Tänk igenom påståendet! Vad blir t ex E(R 0 t )? 

c Mikael Möller


1.4 

1.2 

1.0 

0.8 

0.6 

0.4 

0.2 

0.0 

0.2 

0.4 

0.2 0.0 0.2 0.4 0.6 0.8 1.0 1.2 

(b) 

800 

600 

400 

200 

0 

200 

400 

600 

800 

1000 

1200 

1400 

1600 

3 2 1 0 1 2 3 

Uppgift 22 Hämta kurser för Rörvik Timber AB för olika långa perioder 

och bestäm dagsräntorna enligt ovan. Ta fram dessa dagsräntors 

P-P diagram och K-K diagram. Vilka fördelningar indikeras? 

Vi kan således konstatera att centrala gränsvärdessatsen tillsammans 

med att en Cauchyfördelningen uppstår som en kvot mellan två normalfördelade 

variabler ger den bakomliggande statistiska förklaringen 

till slutkursernas irrationella uppträdande. 

(d) 

c Mikael Möller



20 Ovanstående påstående inses på följande sätt: Antag att X 2 G (0; 1) 

samt att Y 2 H = G ( ; ). Då gäller med 

att 

G (x) = P (X x) 

H (y) = P (Y y) = P 

p = H (y) = G y 

Y y 

När vi så beräknar inversen av en percentil p så erhålls 

varför 

G 1 (p) = G 1 G y 

. 

= y 

y = + G 1 (p) = + x , H 1 (p) = + G 1 (p) 

vilket är ekvationen för en rät linje i K-K diagrammet. 

21 För detta problen …nns en liten matematisk fälla som vi inte skall 

falla i. Man får inte dela med 0 och X2 kan anta just värdet noll. Vi 

delar därför upp problemet i mindre än 0 och större än 0. Vi har då att 

F (y) = P (Y y) 

= P (X1 yX2) = E P (X1 yX2 j X2) 

= 1 

p 2 

= 1 

2 

Z 1 

f (y) = d 

F (y) . 

dy 

1 

p 2 

1 

Z 0 Z 1 

+ 

1 0 

Z yx2 

e 

1 

x2 1 

2 dx1 e x2 2 

2 dx2 

Z yx2 

e 

1 

x2 1 +x2 2 

2 dx1dx2, 

Eftersom vi är ute efter täthetsfunktionen så skall vi derivera fördelningsfunktionen, 

F (y), och eftersom tätheten för en normalfördelning 

är så himla snäll så blir utförandet nedan tillåtet. 

Vi skall använda oss av en sats i matematiken som talar om hur man 

deriverar en integral när integrationsgränserna är funktioner av deriveringsvariabeln. 

Men först måste vi göra en omskrivning av integralen. Integralen 

från ( 1; 0) får genomgå variabeltransformationen x2 := x2 

c Mikael Möller


och vi erhåller då 

F (y) = 1 

2 

= 1 

2 

= 1 

2 

= 1 

2 

Z 0 Z yx2 

e 

1 1 

x2 1 +x2 Z 1 Z yx2 

2 

2 dx1dx2 + e 

0 1 

x2 1 +x2 2 

2 dx1dx2 

Z 0 Z yx2 

e 

1 1 

x2 1 +x2 Z 1 Z yx2 

2 

2 dx1dx2 + 

Z 1 Z 

0 1 

yx2 

e 

0 1 

x2 1 +x2 Z 1 Z yx2 

2 

2 dx1dx2 + e 

0 1 

x2 1 +x2 2 

2 dx1dx2 

Z 1 Z yx2 

e 

0 yx2 

x2 1 +x2 2 

2 dx1dx2. 

e x2 1 +x2 2 

2 dx1dx2 

Efter denna omskrivning …nns ej längre någon fälla och vi deriverar båda 

leden rakt av 

f (y) = 1 

2 

= 1 

2 

Z 1 

0 

Z 1 

0 

= 1 Z 1 

= 1 1 

0 

d 

dy 

. 

1 + y2 Z yx2 

yx2 

e x2 1 +x2 2 

2 dx1 dx2 

0 + x2e y2 x 2 2 +x2 2 

2 ( x2) e y2 x 2 2 +x2 2 

2 dx2 

x2e y2x 2 2 +x2 2 1 1 

2 dx2 = 

1 + y2 e y2x 2 2 +x2 2 

2 

x2=1 

x2=0 

22 Jag skulle bli förvånad om du hittar något annat än Cauchyfördelning. 

c Mikael Möller


c Mikael Möller

7. Trovärdiga intervall 

I föregående kapitel gavs metoder för att …nna lämpliga skattningar av en 

fördelnings parametrar men vi vet fortfarande inte hur bra de så erhållna 

skattningarna är. De tre egenskaperna väntevärdesriktighet, konsistens 

och e¤ektivitet är trubbiga och ger inga bra mått på om vi verkligen är 

nära det sanna men okända värdet eller ej. Om vi däremot kunde säga 

att skattningen skiljer sig så och så mycket från det sanna värdet vore 

mycket vunnet men ej heller detta klarar vi av att göra ty det sanna 

värdet är okänt. 

Däremot kan, om en viss osäkerhet i uttalandet kan tillåtas, en 

speciell sorts intervall som kallas kon…densintervall (osäkerhetsintervall, 

trovärdighetsintervall) konstrueras. Vi börjar med en formalisering av 

våra lösa tankar ovan. 

De…nition 47 Om X1; : : : ; Xn är oberoende och likafördelade stokastiska 

variabler vars kända fördelning F beror av den okända parametern 

och om det existerar två tal a1 och a2, som beror av X1; : : : ; Xn, för 

vilka det, med sannolikheten 1 , gäller att 

a1 

då sägs (a1; a2) vara ett kon…densintervall för parametern med kon- 

…densgraden 1 . 

Eftersom gränserna a1 och a2 beror av X1; : : : ; Xn kan vi i statistikens 

språk formulera de…nitionen på följande sätt 

P a1(X1; : : : ; Xn) a2(X1; : : : ; Xn) = 1 . 

Det gäller således att ett trovärdighetsintervall (kon…densintervall) med 

trovärdighetsgrad (kon…densgrad) 1 har chansen att missa det 

sanna värdet på parametern . Eller uttryckt i klartext: vår konstruktion 

leder ibland till intervall som inte innehåller det sanna värdet. Inte nog 

med att vi kan få ett intervall som vi tror innehåller det sanna värdet 

men som faktiskt inte gör det utan intervallen kan konstrueras på ett 

oändligt antal sätt. Detta följer av följande identiteter 

1 = P a1(X1; : : : ; Xn) a2(X1; : : : ; Xn) 

= P a1(X1; : : : ; Xn) + b " 

163 

a2 

a2(X1; : : : ; Xn) + c "


där b och c kan väljas mer eller mindre fritt (rättare sagt kan en av 

dem väljas efter behag den andra bestäms av den första). På grund av 

denna otydlighet skall vi begränsa oss till att betrakta endast tre typer 

av intervall: 

Symmetriska Här delar vi upp osäkerheten i två lika delar och lägger 

dessa i vardera svansen 

P < a1(X1; : : : ; Xn) = 2 

P > a2(X1; : : : ; Xn) = 2 

Nedåt begränsade Här lägger vi osäkerheten i vänstra svansen 

P a2(X1; : : : ; Xn) < = 

Uppåt begränsade Här lägger vi osäkerheten i högra svansen 

P a1(X1; : : : ; Xn) > = 

Längre än så kommer vi inte med ett allmänt resonemang utan 

vi övergår istället till att betrakta konkreta situationer med konkreta 

fördelningar och för dessa ange hur man konstruerar kon…densintervall. 

Vi börjar med kon…densinterval för fördelningarnas fördelning. 

7.1 Normalfördelningen 

Låt X1; : : : ; Xn vara oberoende och likafördelade stokastiska variabler 

vars fördelning N( ; ) beror av de okända parametrarna och . Vi 

skall bestämma trovärdighetsintervall för både och . Det …nns fyra 

möjliga intervall för olika kombinationer av parametrarna och men 

här behandlar vi endast tre av dem nämligen intervallen 

Fall 1 för när är känt, 

Fall 2 för när är okänt, 

Fall 3 för när är okänt, 

det fjärde fallet överlåts, i en uppgift, åt dig att konstruera. 

Enligt tidigare är X en punktskattning av det förväntade värdet 

och den är både väntevärdesriktig, konsistent och e¤ektiv bland alla 

linjära skattningar av . Vidare gäller att den är normalfördelad med 

väntevärdet samt att den har standardavvikelsen p n . 

c Mikael Möller

7. Trovärdiga intervall 165 

7.1.1 Fall 1: Kon…densintervall för när är känt 

I detta fall gäller att 

P a < X 

= p n 

b = (b) (a) 

där a och b kan väljas så att (b) (a) = 1 . En enkel omskrivning 

ger nu att 

P X bp n < < X ap n = 1 

och det gäller därför att tillhör intervallet X b p n ; X a p n med 

sannolikheten 1 . 

För ett symmetriskt intervall väljs a och b så att 

(a) = 2 

1 (b) = 2 

och vi skriver med vedertagna beteckningar 

a = 2 

b = 2 . 

Ett symmetrisk observerat trovärdighetsintervall för när är känd, 

vid ett normalfördelat stickprov, blir därför 

x 2 p n ; x + 2 p n . 

Exempel 41 Ett taxibolag med en bilpark om 35 taxibilar gör dagligen 

av med bensin i enlighet med en normalfördelning med en standardavvikelse 

om 15:3 liter. En dag mäts bensinförbrukningen på 10 av taxibilarna 

och man erhöll därvid medelförbrukningen 65 liter. Bilda ett 

97 procentigt symmetriskt kon…densintervall för parkens förväntade förbrukning 

denna dag. 


där 

Xi = förbrukning taxi i, i = 1; 2; : : : ; 10 

Xi 2 N( ; 15:3). 

c Mikael Möller


Vi observerar att populationen består av endast 35 bilar samt att vi därur 

plockar 10 bilar. Vi behöver därför göra ändlighetskorrektion ty 10 

35 > 

0:1. 1 Vidare gäller att skattningen blir x = 65. 

Ett 97 procentigt symmetriskt kon…densintervall för 

därför skrivas 

när känd kan 

x 2 p n 

r 

N 

N 

n 

= 65 

1 

r 

15:3 35 

2:17p 10 35 

10 

1 

= 65 9 

= (56; 74) . 

Exempel 42 En dag på Stockholmsbörsen blev medelpriset av 32 slumpmässigt 

utvalda aktier 213 kronor. Den sanna standardavvikelsen var 

69 kronor. Bestäm ett 90 procentigt symmetriskt kon…densintervall för 

medelpriset på samtliga aktier som handlades den dagen. 


Xi = priset på aktie i, i = 1; 2; : : : ; 32 

där, enligt centrala gränsvärdessatsen, 

X N ; 69 

p 32 

ty antalet observationer är större än 30. 

Enligt uppgift gäller att skattningen är x = 213. Ett 90 procentigt 

symmetriskt kon…densintervall för när känd kan därför skrivas 

x 2 p = 213 1:6449 

n 

= 213 20 

= (193; 233) . 

69 

p 32 

I detta fall har vi inte gjort någon ändlighetskorrektion ty det fanns ej 

angivet hur många aktier som fanns på Stockholmsbörsen den aktuella 

dagen. Å andra sidan är det lätt att ta reda på antalet aktier som det 

handlats i och kan då avgöra om ändlighetskorrektion bör göras. 

1 För ändlighetskorrektion se . . . 

c Mikael Möller


7.1.2 Fall 2: Kon…densintervall för med okänt väntevärde 

Det gäller att en väntevärdesriktig skattningen av 2 kan skrivas 

^ 2 = 1 

n 1 

nX 

i=1 

Om denna skattning är bra bör kvoten 

^ 2 

2 

Xi X 2 . 

mellan skattningen ^ 2 och det sanna värdet 2 vara ett tal som är nära 

1. Speciellt bör det gälla att 

(n 1)^ 2 obs 

2 n 1. 

Man kan nu visa att den stokastiska variabeln (stickprovsvariabeln) 

2 = (n 1)^ 2 

har en speciell fördelning som kallas 2 -fördelningen 2 och man skriver 

(n 1)^ 2 

2 

2 2 2 (n 1). 

För en 2 (n 1) gäller att dess väntevärde är n 1 och att dess varians 

är 2(n 1). 

Med hjälp av den ovan konstruerade variabeln kan man bilda sannolikhetsekvationen 

P a < 

(n 1)^2 

2 

för något val av a och b. Det är nu enkelt att övertyga sig om att detta 

uttryck även kan skrivas 

r r ! 

(n 1)^2 (n 1)^2 P 

< < 

= 1 . 

b 

a 

2 Se kapitlet om Fördelningars matematik. 

c Mikael Möller


Vi väljer a och b så att ett symmetriskt, uppåt begränsat eller nedåt 

begränsat (men vem är intresserad av stora varianser) kon…densintervall 

erhålls. Det vill säga, för ett symmetriskt intervall gör vi valet 

a = 2 1 (n 

2 

1) 

b = 2 

(n 1) 

2 

Exempel 43 Vid 25 mätningar av tryckhållfastheten hos betong …ck 

man x = 5:6 ksi och s 2 = 0:44 ksi 2 . Mätvärdena kan betraktas som 

ett observerat stickprov från en normalfördelning – N( ; ). Bilda ett 

uppåt begränsat kon…densintervall för 2 med kon…densgrad 99 procent. 

D v s bestäm en övre gräns på 2 som är sådan att 2 är mindre än denna 

gräns med sannolikheten 0:99. 


Xi = tryckmätning nr i, i = 1; 2; : : : ; 25. 

För den stokastiska variabeln Xi gäller att 

Xi 2 N( ; ). 

På och 2 är följande observerade skattningar givna 

x = 5:6 

s 2 = 0:44. 

Ett uppåt begränsat kon…densintervall med kon…densgraden 99 procent 

för 2 kan nu skrivas 

0; 

(n 1) s2 

a 

= 0; 

24 0:44 

10:9 

= (0; 0:97) 

7.1.3 Fall 3: Kon…densintervall för när är okänt 

I fallet med att variansen var känd betraktade vi den stokastiska variabeln 

Z = p n X 

. 

och använda oss av att Z 2 N (0; 1). För att erhålla ett intervall för 

när variansen är okänd kan man inte använda som nämnare utan 

c Mikael Möller


måste byta ut mot ^ –en skattning av . Härav följer att vi istället 

betraktar den stokastiska variabeln 

T = p n X 

^ 

= p n X p ^ 2 

Vår skattning av variansen är här, liksom tidigare, 

^ 2 = 1 

nX 

n 1 

Xi X 2 . 

i=1 

Det är inte självklart – men man kan visa – att det …nns en ortogonal 

transformation (se en lärobok i linjär algebra) Y=AX sådan att ^ 2 kan 

skrivas 

X 

^ 2 = 1 

n 1 

Y 

n 1 

i=1 

2 

i 

där det gäller att Yi 2 N 0; 2 . Observera att vi nu summerar över 

n 1 termer istället för de ursprungliga n. Man kan även visa att 

Y1; : : : ; Yn 1 och X alla är oberoende. Härav följer att täljaren och 

nämnaren i den betraktade stokastiska variabeln 

T = p n X 

^ 

är två oberoende stokastiska variabler. Variabeln T kan visas vara tfördelad 

med n 1 frihetsgrader 3 och vi skriver 

T 2 t(n 1). 

Fördelningen, som även kallas Student:s fördelning, är mycket lik normalfördelningen 

men har tyngre svansar. Denna egenskap ger att kon- 

…densintervallen blir något längre vid okänt , vilket är precis vad man 

kan förvänta sig ty en större osäkerhet måste resultera i ett bredare intervall. 

Något annat vore inte trovärdigt. 

Fallet med okänd varians ger nu följande kon…densintervall för 

x b ^ 

p n ; x a ^ 

p n 

där man för att få ett symmetriskt kon…densintervall med kon…densgraden 

1 skall välja 

a = t 2 (n 1) 

b = t 2 (n 1) 

3 Se kapitlet Fördelningars matematik. 

c Mikael Möller

170 7.2. Konfidensintervall vid normalapproximation 

Därmed har vi gått igenom kon…densintervall för parametrarna hos 

den absolut viktigaste fördelningen inom statistisk teori, normalfördelningen, 

och visat att olika frågor och olika förutsättningar ger olika typer 

av trovärdighetsintervall för och . 

Uppgift 23 Gör motsvarande härledningar för det fjärde fallet: för 

när känt. 

7.2 Kon…densintervall vid normalapproximation 

Enligt centrala gränsvärdessatsen gäller vid oberoende och likafördelade 

variabler att deras summa är approximativt normalfördelad. Konsekvensen 

av detta är att fördelningen för varje punktskattning, som kan 

beskrivas av en summa, kan approximeras med en normalfördelning. Två 

kända exempel är det skattade väntevärdet och den skattade variansen 

som båda kan approximeras med en normalfördelning. 

Därmed kan vi …nna ett approximativt kon…densintervall för varje 

parameter vars punktskattning kan skrivas som en enkel funktion av det 

aritmetiska medelvärdet. Detta ger oss en metod för att …nna kon…densintervall 

för parametrarna i Poissonfördelningen, i binomialfördelningen 

och i exponentialfördelningen. 

7.2.1 Kon…densintervall vid Poissonfördelning 

Exempel 44 Antalet skador på en försäkringsportfölj under en vecka 

antages vara Poissonfördelat med parametern . Under 8 veckor har 

man erhållit följande observationer 

115; 82; 108; 106; 118; 87; 99; 92. 

Ge ett 95 procentigt approximativt kon…densintervall för det förväntade 

antalet skador per vecka. 

Lösning 33 Skattningen av är 

^ = x = 100:88. 

Detta tal är större än vad som krävs, enligt vår tumregel om 15 4 , för att 

få approximera en Poissonfördelning med en normalfördelning. Eftersom 

variansen för en Poissonfördelning är densamma som väntevärdet 


c Mikael Möller


erhålls det approximativa kon…densintervallet 

x 2 

r x 

n ; x + 2 

r ! 

x 

n 

där vi skattat variansen med hjälp av x (det …nns en alternativ metod 

som beskrivs i nästa exempel). För valet = 5 procent erhålls sedan ett 

approximativt observerat kon…densintervall för antalet skador till 

r r ! 

100:88 

100:88 

100:88 1:96 ; 100:88 + 1:96 

= (93:92; 107:84) . 

8 

8 

Uppgift 24 Approximera ej variansen med x utan använd istället den 

sanna men okända parametern . Man erhåller då en olikhet ur vilken 

kan lösas. Bestäm nu ett kon…densintervall för . 

7.2.2 Kon…densintervall vid binomialfördelning 

Exempel 45 I November 1998 visade SIFO:s väljarundersökning (1800 

intervjuer) att Moderaterna hade 24:6 procent av väljarkåren. Bestäm 

ett 95 procentigt kon…densintervall för Moderaternas sanna proportion p 

av väljarkåren. 


Xi = 

1 om Moderat-röst 

0 annars 

i = 1; 2; : : : ; 1800, 

det gäller då att X = P 1800 

i=1 Xi är approximativt binomialfördelad ty 

1800 

6000000 = 0:0003 < 0:15 och därför kan den hypergeometriska fördelningen 

approximeras av binomialfördelningen. Vi har därför 

X 2 Hyp(N; M; n) Bin(n; p). 

Men eftersom det vidare gäller att np 1800 0:25 > 5 och n(1 p) > 5 

kan vi i nästa steg göra en normalapproximation varför 


X N np; p np(1 p) . 

c Mikael Möller

172 7.2. Konfidensintervall vid normalapproximation 

Betrakta nu istället det aritmetiska medelvärdet X = X 

n 

För detta gäller att 

E(X) = p 

V (X) = 

p(1 p) 

n 

q 

p(1 p) 

och vi har därför att X N p; n 

P 1 n 

= n i=1 Xi. 

. Sökt, approximativt, kon…- 

densintervall för proportionen p kan nu skrivas 

x 2 X = x 

r 

p(1 

2 n 

p) 

; x + 

r 

p(1 

2 n 

! 

p) 

Detta intervall för p innehåller p och man frågar sig, liksom i föregående 

exempel, vad som kommer först – hönan eller ägget. Det …nns i princip 

två sätt att lösa denna motsägelse och det första är att helt enkelt 

använda x för p, ty x ligger ’nära’p, och därvid erhålla intervallet 

r 

0:246 0:754 

x 2 X = 0:246 1:96 

1800 

= 0:246 0:020 

= (0:226; 0:266). 

Men vi kan också notera att vi har följande två olikheter i p 

p < x + 

p > x 

r 

p(1 

2 n 

r 

p(1 

2 n 

p) 

p) 

. 

(7.1) 

(7.2) 

Dessa olikheter kan lösas med avseende på p och man erhåller efter en 

del räknande följande numeriska kon…densintervall för p 

0:227 

Detta intervall är i princip detsamma som det den approximativa lösningen 

ovan gav. Anledningen till att resultaten blir så lika är att normalapproximation 

fungerar mycket bra i detta fall. 

Vid valet 1998 visade det sig att det sanna värdet var pM = 0:229 

dvs 22:9 procent. Även om 24:6 till 22:9 procent ser ut som ett stort tapp 

i väljare så ser vi att 22:9 är ett av de möjliga värden som kan hamna 

c Mikael Möller


i trovärdighetsintervallet. Vi säger att skillnaden mellan 24:6 och 22:9 

procent ligger inom felmarginalen. 

Med felmarginal avses vanligen storheten 

r 

^pobs (1 ^pobs) 

2 

och i vårt fall är felmarginalen, 0:020, större än skillnaden 0:246 

0:229 = 0:017. Observera att en opinionsundersökning som ej anger 

felmarginalen omedelbart skall förpassas till papperskorgen. 

Uppgift 25 Approximera ej variansen utan använd istället den sanna 

men okända parametern p. Man erhåller då en olikhet ur vilken p kan 

lösas. Bestäm nu ett kon…densintervall för p. 

n 

c Mikael Möller



23 Det gäller att en väntevärdesriktig skattningen av 2 kan skrivas 

Genom att betrakta kvoten 

^ 2 = 1 

n 

nX 

(Xi 

i=1 

^ 2 

mellan skattningen och 2 bör vi erhålla ett tal som är nära 1 och 

speciellt bör då 

n^ 2 obs 

2 

Man kan nu visa att den stokastiska variabeln 

2 

n. 

2 = n^ 2 

har en speciell fördelning som kallas 2 -fördelningen och man skriver 

n^ 2 

2 

2 2 2 (n). 

För en 2 (n) kan man visa att att dess väntevärde är n och att dess 

varians är 2n. 

Med hjälp av den ovan konstruerade variabeln kan man bilda sannolikhetsekvationen 

P a < n^2 

2 

för något val av a och b. Det är nu enkelt att övertyga sig om att detta 

uttryck även kan skrivas 

r r ! 

n^2 n^2 P < < = 1 . 

b a 


p 

) 2 . 

p 

x p < < x + p 

2 

2 

n n 

och vi börjar med att betrakta den högra olikheten vilken kan skrivas 

som 

< x + a p 

c Mikael Möller


där vi för enkelhets skull satt 

enligt följande 

pn 2 = a. Denna olikhet kan skrivas om 

x < a p 

2 

2 x + x 2 

Vi löser nu först andragradsekvationen 

som har lösningen 

De två rötterna blir 

och 

x 

1 = 100:88 + 1:962 

8 2 + 

2 = 100:88 + 1:962 

8 2 

2 

2 x + x 2 

( x) 2 < a 2 

a 2 < 0. 

a 2 = 0 

a2 2 = 

r 

xa2 + a4 

4 

1;2 = x + a2 

r 

xa 

2 

2 + a4 

4 . 

r 

r 

100:88 

100:88 

varför sökt kon…densintervall kan skrivas 

(94:16; 108:08) . 

1:96 2 

8 

1:96 2 

8 

1:964 

+ = 108:8 

4 82 1:964 

+ = 94:16 

4 82 Detta intervall är något kortare än det förra intervallet eftersom vi har 

lite mindre osäkerhet här. 

25 Det gäller för proportionen p att 

p < x + 

p > x 

r 

p(1 

2 n 

r 

p(1 

2 n 

p) 

p) 

. 

Vi börjar med att lösa följande likhet, där vi för enkelhets skull satt 

2 = a, 

r 

p(1 

p = x + a 

n 

p) 

c Mikael Möller


med hjälp av omskrivningarna 

np 2 

erhålls andragradsekvationen 

n + a 2 p 2 

p x 

a = 

r 

p(1 p) 

n 

p x 

a 

Denna ekvations lösning kan skrivas 

s 

p1;2 = 

nx + a 

2 

n + a 2 

2 

= p p2 

n 

2npx + nx 2 = a 2 p a 2 p 2 . 

2 nx + a 

2 p + nx2 = 0. 

nx + a 

2 

n + a 2 

2 

nx2 . 

n + a2 Om vi nu sätter in n = 1800, a = 1:96 och x = 0:246 så erhålls det sökta 

intervallet. 

c Mikael Möller

8. Prövning av 

antaganden 

8.1 Introduktion 

I föregående kapitel tog vi oss an problemet att …nna närmevärden på 

de införda parametrarna. Vi konstruerade skattningar för parametrarna 

samt trovärdighetsintervall för dessa. De metoder som lät oss göra detta 

är minsta kvadratmetoden samt, när fördelningen är känd, maximum 

likelihoodmetoden. Båda metoderna utgår från ett observerat stickprov 

x1; x2; : : : ; xn. 

Här skall vi nu betrakta samma problem fast ur en annan synvinkel. 

Många av de situationer som härvid kan behandlas kan vi även behandla 

med hjälp av trovärdighetsintervall men inte alla. Majoriteten av de 

problemställningar vi här ställer kan därför lösas på mer än ett sätt. 

8.2 Test av vid normalfördelning 

Vi börjar med att betrakta följande 

Exempel 46 Vid tillverkning av en viss medicin är det viktigt att mängden 

av en komponent inte varierar för mycket ty om det är för lite av 

komponenten är medicinen verkningslös och om det är för mycket blir 

medicinen ett gift. Den önskade mängden av komponenten per dos är 

60 mikrogram och för att testa om produktionsinställningarna ger denna 

mängd tar man varje dag ett stickprov om 100 piller och mäter komponentens 

mängd. En dag har man erhållit medelvärdet x = 59:7. Produktionens 

standardavvikelse är sedan tidigare känd till att vara = 0:7. 

Kan man skicka iväg dagens produktion till apoteken? Vad tror du? 

Detta exempel är inte konstruerat utan denna typ av frågeställningar 

ställs läkarvetenskapen ofta inför. Ett tidigt exempel är digitalis där 

den första systematiska analysen gjordes i slutet av 1700-talet av britten 

William Withering. Han utgick från ett örtte som botade hjärtsviktsymptom, 

ett medel som kloka gummor använde, och visade att dess 

aktiva ingrediens var blad från …ngerborgsblomman. Han fann också 

177

178 8.2. Test av vid normalfördelning 

att för starkt örtte gav allvarliga biverkningar samt att för svagt örtte 

var verkningslöst. För att krångla till det ytterligare visade det sig att 

doseringens storlek var individuell. Den beror förutom av kroppsmassa 

och ålder på lever- och njurfunktion. 

För att kunna hantera situationer som beskrivs i ovanstående exempel 

har testteorin utvecklats och denna innehåller i princip följande fyra 

(4) steg: 

1. Formulera lämplig hypotes 1 . 

2. Bestäm en testvariabel. 

3. Bestäm en beslutsregel. 

4. Tag ett stickprov och bestäm ett numeriskt värde på testvariabeln 

och jämför detta med beslutsregeln. 

Dessa fyra steg föregås som alltid inom statistiken av byggandet av 

en statistisk modell och de avslutas med ett i klartext fattat beslut. Här 

kommer vi gå igenom alla fyra stegen och hela tiden använda oss av 

exemplet ovan. Som statistisk modell tar vi 

Xi = mängden av komponenten i piller i i = 1; 2; : : : ; 100 

där Xi 2 OF ( ; ). Parametern är den förväntade mängden av komponenten 

ifråga. 

Fördelningen F bör, i detta exempel, vara symmetrisk ty ibland 

blir det lite för lite och ibland lite för mycket av komponenten ifråga. 

På grund av detta, samt stickprovets storlek (100), gäller att stickprovsmedelvärdet, 

X, kan anses vara normalfördelat (Centrala GränsvärdesSatsen). 

8.2.1 Steg 1: Formulera lämplig hypotes 

Eftersom testteorin liksom intervallteorin är baserad på sannolikhetsläran 

väljer man att vara försiktig i sina uttalande (det …nns alltid en 

sannolikhet för ett felaktigt beslut) och blir därmed konservativ. Man 

formulerar därför sin hypotes (nollhypotes) som om inget har förändrats 

d v s H0 : status quo (vad som tidigare gällt) och som motsatt hypotes 

tar man att förändring skett (mothypotes, alternativ hypotes) H1 : vad 

som gäller när vi ej längre tror på H0. 2 

1 Jämför engelskans ’hypothesis’som översatt till svenskan blir ’antagande’. 

2 Observera att det föreligger ett val av ståndpunkt som gör att nollhypotesen 

färgas av den som utför testet eller för den vilken testet utföres. 

c Mikael Möller

8. Prövning av antaganden 179 

Jämför med att enligt sedvanerätt är ingen skyldig till ett brott innan 

det är bevisat utom varje rimligt tvivel att man utfört brottet 3 . 

Rätten utgår ifrån nollhypotesen H0: icke skyldig och det är upp till åklagaren 

att ’bevisa’att den anklagade är skyldig. En fällande dom innebär 

däremot inte att den åtalade begått brottet och motsatsen –en friande 

dom innebär inte att den åtalade ej begått brottet. Rättshistorien ger i 

båda fallen åtskilliga exempel på felaktiga domar. 

Eftersom medicinen ovan måste innehålla en bestämd kvantitet av 

komponenten, 60 mikrogram, konstruerar vi ett test för = 0 och 

skriver 

H0 : = 0 H1 : 6= 0 

där vi har att 0 = 60. Detta betyder att producenten tror att produktionen 

håller sig inom den angivna ramen ty annars måste hela dagsproduktionen 

kastas d v s vi är obenägna till förändring. En tänkt patient 

har troligen nollhypotesen H0 : 0 ty det är inte trevligt att få i 

sig ett gift. Hellre då något som är verkningslöst. Därmed är det sagt 

att ämnet statistik ej alltid är opolitiskt – däremot är den statistiska 

metodiken opolitisk. 

8.2.2 Steg 2: Bestäm en testvariabel 

Vi vet sedan tidigare att x är en lämplig skattning av 0 samt att det 

enligt centrala gränsvärdessatsen gäller att 

X N 0; p n 

ty n = 100 är större än 30. Approximationen torde här ge upphov 

till att X verkligen är normalfördelad ty, som vi tidigare påpekat, en 

tillverkning av piller bör ge en fördelning F som är symmetriskt fördelad 

–d v s vi har lika ofta för mycket som för litet av komponenten ifråga – 

och vid symmetriska fördelningar är konvergensen mot normalfördelning 

supersnabb. Av detta följer att X är en lämplig testvariabel för 0 och 

vi väljer därför att förkasta vår nollhypotes om vi …nner att x skiljer sig 

mycket från 0. Eftersom vi ovan konstaterat att X är approximativt 

normalfördelad betraktar vi, för att bestämma om skillnaden är stor eller 

ej, den stokastiska variabeln 

Z = 

X 60 

0:7 

p 100 

vilken vi sedan tidigare vet har väntevärdet 0 och standardavvikelsen 1. 

3 Detta gäller dock inte alltid i verkligheten. 

c Mikael Möller


8.2.3 Steg 3: Bestäm en beslutsregel 

Vi har nu byggt upp de två första stegen i vår konstruktion av ett test 

och passar här på att sammanfatta dem: 

Steg 1 H0 : = 60 H1 : 6= 60 

Steg 2 Z = 

X 60 

p n 

För att kunna avgöra om data bekräftar att vår hypotes är ’felaktig’ 

eller ej studerar vi följande två sannolikheter: 

samt 

P (förkasta H0 givet H0 sann) 

P (förkasta ej H0 givet H0 ej sann). 

Båda händelserna leder till felaktiga beslut och vi vill därför att de båda 

skall vara små. 4 Nu är det inte möjligt att alltid välja båda små även 

om, som vi längre fram skall se, en utökning av antalet observationer gör 

den ej valda sannolikheten mindre. Eftersom den första sannolikheten är 

’rakt på sak’(ej innehåller dubbla negationer) och vi ogärna vill förkasta 

sanna hypoteser (dessa förändringsobenägna statistiker) så väljer vi att 

låsa den första sannolikheten. Nu kan vi i vårt medicinexempel skriva 

på följande sätt 


P (Z < a eller Z > b givet H0 sann) 

för något val på a och b. Alternativt kan detta skrivas 

ty allmänt gäller likheten 

1 P (a < Z 

P (förkasta H0 givet H0 sann) = 1 P (förkasta ej H0 givet H0 sann) 

och 

4 Däremot vill vi att sannolikheterna 

båda skall vara stora. 


P (förkasta ej H0 givet H0 sann) 

P (förkasta H0 givet H0 ej sann)


Liksom i intervallteorin betraktar vi tre val av a och b och i detta exempel 

passar det symmetriska valet bäst –d v s b = a = . Härav följer att 

vi förkastar nollhypotesen om 

för något val av . 

jZj > 

Uppgift 26 Hur kommer man från a och b till . Utför det saknade 

resonemanget. 

Om vi betecknar P (förkasta H0 givet H0 sann) med (det är samma 

som förekommer i kon…densgraden för trovärdighetsintervallen) så erhåller 

vi nu beslutsregeln 

förkasta H0 om jZj > 2 

och detta har getts ett speciellt namn –signi…kansnivån. 5 Därmed 

har vi klarat av steg 3 vid hypotesprövning och bestämt en beslutsregel. 

Eftersom företaget ogärna vill kasta en hel dags produktion väljer 

man en liten sannolikhet för att förkasta denna om den verkligen be…nner 

sig inom angivna gränser –man sätter därför = 0:01 varvid 0:005 = 

2:576. 

8.2.4 Steg 4: Besluta 

De tre första stegen i vår testalgoritm kan nu skrivas 

Steg 1 H0 : = 60 H1 : 6= 60. 

Steg 2 Z = 

X 60 

= p n . 

Steg 3 Förkasta H0 om jZj > 2 . 

Det fjärde och sista steget är att utifrån det observerade stickprovet 

fatta ett beslut. Vårt observerade värde blev x = 59:7 varför 

5 Om vi sätter 

så erhålls 

varför 

2 

59:7 60 

Zobs = 

0:07 

= 4:286 

= P (förkasta H0 givet H0 sann) 

= P (Z < ) + P (Z > ) = 2P (Z > ) 

är en lämplig beteckning. 

c Mikael Möller


Eftersom det uppenbarligen gäller att jZobsj > 2:576 följer att hypotesen 

förkastas. 

Efter att du gjort detta test, i enlighet med konstens alla regler, går 

du till chefen och säger: Tyvärr håller dagens produktion inte måttet och 

måste därför kastas. 6 

Uppgift 27 Lös exempel46 med hjälp av teorin för kon…densintervall. 

Exempel 46 beskriver ett symmetriskt test där vi vill hamna mitt i 

prick. Nedan ger vi ett exempel på ett osymmetriskt test och passar på 

att införa en ny testvariabel. 

Exempel 47 Picko:s budservice står i begrepp att inköpa ett större antal 

bilar och man har genom ett studium av tekniska speci…kationer funnit 

att märket Finus är intressant. Innan köp hyr man därför 4 bilar av detta 

märke och använder dem under 5 dagar. Följande bensinförbrukning per 

mil uppmättes under provperioden (cl/mil) 

67 68 56 59 67 

56 65 66 63 59 

63 69 58 64 63 

65 62 61 71 73 

Eftersom bensinförbrukningen:s fördelning beror av uppdragens längd och 

förarens körstil och man tidigare funnit att denna fördelning väl kan 

approximeras med en normalfördelning antager man att bensinförbrukningen 

även framöver följer samma fördelning. 

Enligt den tekniska speci…kationen skall detta märke dra högst 65 cl 

per mil i stadskörning. Kan detta stämma? Vad tror du? Försök att ur 

data ovan dra en rimlig slutsats innan du genomför beräkningarna. 


Xi = bensinförbrukning mätning nr i i = 1; 2; : : : ; 20 

där Xi 2 ON( ; ). Picko vill gardera sig och väljer därför ett test där 

sannolikheten, för att köpa bilar som har en förbrukning som överstiger 

65 cl per mil, kan hållas liten. 

Steg 1 H0 : 65 H1 : < 65 

6 Därefter går du och läser platsannonserna. 

c Mikael Möller


Steg 2 I detta fall känner vi inte till standardavvikelsen för bensinförbrukningen 

och måste därför skatta densamma. Detta gör att vi ej kan 

använda den stokastiska variabeln 

utan istället måste använda 

Z = X 

= p n 

T = X 

S= p n . 

För att vi skall kunna göra detta behöver vi en normalfördelning 

i botten (vilket vi enligt antagandet har) och det gäller därför att 

den stokastiska variabeln T 2 t(n 1) där antalet observationer, n, 

i detta fall är 20. 

Steg 3 För att erhålla beslutsregeln ställer vi upp ekvationen 

= P (förkasta H0 givet H0 sann) = P (T < a) 

där a = t (19). Vi förkastar H0 om Tobs a. 

Observera att vi ej delar med 2 ty här har vi ett osymmetriskt 

test. 

Eftersom bensinpriset är på väg upp väljer Picko risknivån 0:01 

d v s att det är 1 procents chans att förkasta hypotesen att bensinförbrukningen 

överstiger 65 cl per mil om så verkligen är fallet. 

Detta kan också uttryckas som att Picko har sannolikheten 0:01 

att, mot sin vilja, välja ett "törstigt" bilmärke. 

Tabell ger att t0:01(19) = 2:54. 

63:75 65 

Steg 4 Data ger att t = 

4:7226= p = 1:18 > 2:54 varför nollhypote- 

20 

sen ej förkastas på signi…kansnivån 1 procent. 

Bilar av märket Finus rekommenderas ej för inköp. 

Om vi nu funderar över vad vi har gjort så inser man att det …nns 

två svårigheter vid utförandet av ett test. Den första svårigheten är att 

bestämma nollhypotesen (och därmed den alternativa hypotesen) och 

den andra är att bestämma vilken testvariabel som skall användas. Den 

första svårigheten är politisk –på vems sida skall man stå. 7 Den andra 

svårigheten är egentligen ej svår ty testvariabeln följer av modellen. Att 

hitta rätt modell kan däremot vara svårt. 

7 Om du hade varit säljare av Finus hur hade då din hypotes sett ut? 

c Mikael Möller

184 8.3. Test av 1 2 vid normalfördelning 

8.2.5 Jämförelse mellan kon…densintervall och test 

När vi byggde upp teorin för trovärdighetsintervall bestämde vi oss för 

att betrakta tre olika typer av intervall. Dessa tre typer översätts i 

testteorin till följande tabell. 

Teori 

Form Intervall Test 

Symmetriskt P (X < a1) = 2 

P (X > a2) = 2 

H0 : = 0 H1 : 6= 0 

Nedåt begränsat P (X < a2) = H0 : 0 H1 : < 0 

Uppåt begränsat P (X > a1) = H0 : 0 H1 : > 0 

8.3 Test av 1 2 vid normalfördelning 

Ibland vill man jämföra medelvärden för två olika behandlingar eller 

mellan två olika grupper för att kunna uttala sig om de skiljer sig åt 

eller ej. För att göra detta behöver vi ingen ny teori utan kan tillämpa 

vad vi tidigare lärt oss. 

Exempel 48 Konkurrensverket misstänker kartellbildning mellan oljebolagen 

och ett av deras instrument för att utröna om denna företeelse 

föreligger är att mäta bensinpriset i olika geogra…ska områden. För 

en slumpmässigt uttagen dag hämtade man in uppgifter från ett antal 

bensinstationer spridda över landet. En delmängd av dessa uppgifter 

föreligger för OKQ8 och Statoil i tabellerna nedan. Undersök om OKQ8:as 

priser skiljer sig från Statoil:s den aktuella dagen. 

Följande är de data som har inhämtats för OKQ8 respektive Statoil 

OKQ8 

9.51 9.65 9.39 9.89 9.55 

9.34 9.21 9.64 9.71 9.59 

9.45 9.49 9.29 9.74 9.35 

9.67 9.78 9.69 9.36 9.45 

10.01 9.53 9.75 9.89 9.67 

Statoil 

9.41 9.11 9.54 9.49 

9.35 9.79 9.91 9.26 

9.64 9.35 9.68 9.79 

9.57 9.43 9.65 9.61 

9.29 9.79 9.54 9.64 

Det aritmetiska medelvärdet för OKQ8 blir x1 = 9:584 och för Statoil 

x2 = 9:542. Populationernas standardavvikelser är sedan tidigare kända 

till att för OKQ8 vara 1 = 0:20322 och för Statoil 2 = 0:20664. 8 Före- 

8 Självklart känner vi inte 1 och 2 utan dessa måste skattas. Dock inför vi inte 

denna komplikation här utan betraktar standardavvikelserna som kända. 

c Mikael Möller


ligger det någon prisskillnad mellan de två bolagen, den aktuella dagen, 

om priserna kan anses vara oberoende och följa en normalfördelning? 


X 1 i = OKQ8:as pris station i i = 1; 2; : : : ; 25 

X 2 j = Statoil:s pris station j j = 1; 2; : : : ; 20 

där X 1 i 2 ON( 1; 1) respektive X 2 j 2 ON( 2; 2). För stickprovsmedel- 

värdena erhålls nu att9 1 

X1 2 N 1; pn 2 

och X2 2 N 2; pn varav 

det följer att 

X1 X2 2 N 

Stegen i ett traditionellt test blir nu 

1 2; 

r 21 

n + 

! 

2 

2 

. 

n 

Steg 1 H0 : 1 = 2 H1 : 1 6= 2 

Vi väljer ett symmetriskt test eftersom vi skall undersöka om priserna 

skiljer sig åt. 

Steg 2 På grund av förutsättningarna ovan följer att 

Z = X1 X2 

q 

21 

n1 + 2 2 

n2 

är normalfördelad N(0; 1) och vi tar Z som vår testvariabel. Observera 

att under nollhypotesen är 1 2 = 0. 10 

Steg 3 Konkurrensverket bestämmer sig för att ta risken 0:05 att förkasta 

nollhypotesen om denna är sann och …nner då förkastelsegränsen 

ur ekvationen 

9 

där 0:025 = 1:96. 

= 0:05 = P (förkasta H0 givet H0 sann) 

= P (jZj > 0:025) 

E X1 = 1 X 

1 

E Xi = 

n 

1 X 

n 

V X1 = 1 

n2 V X X 1 i 

fp g a oberoendetg = 1 

n 2 

10 Varför betonar jag detta? 

X V X 1 i = 

2 

n 

1 = 1 

c Mikael Möller


Steg 4 Data ger följande observerade värde på testvariabeln 

Zobs = 

9:584 9:542 

q 0:20322 2 

25 

0:206642 + 20 

= 0:683 

och eftersom jZobsj < 1:96 kan vi ej förkasta nollhypotesen på signi…kansnivån 

5 procent. 

Ovanstående test ger således belägg för att priserna i genomsnitt är 

lika men om detta beror på kartellbildning eller konkurrens vet vi ej. 

Observera att om standardavvikelserna inte hade varit kända så hade 

vi inte kunnat lösa talet med nuvarande kunskaper. Det …nns dock ett 

fall med okända standardavvikelser som vi kan lösa och detta inträ¤ar 

när de två standardavvikelserna kan anses vara lika. 

Exempel 49 Vägverket har i uppdrag att utreda om hjälmtvång för motorcyklister 

kan minska antalet dödsolyckor för denna kategori tra…kanter. 

För att erhålla jämförbara data studerade man elva stater i USA 

där fem av staterna (A) haft hjälmtvång under de sista 10 åren och sex 

av staterna (B) fortfarande inte har hjälmtvång. Enligt de o¢ ciella källorna 

fann man följande skattade medelvärden och standardavvikelser för 

antalet dödsolyckor 

xA = 0:1021, sA = 0:0918, 

xB = 0:2133, sB = 0:0547. 

Testa om medelantalet dödsolyckor minskar med hjälmtvång om de underliggande 

populationerna kan anses ha samma varians. För perioden 

i fråga föreligger uppgifterna X A 1 ; : : : ; X A 5 respektive X B 1 ; : : : ; X B 6 

vilka är medelvärden för de tio senaste åren. 


X A i = medelantalet dödsolyckor stat i i = 1; 2; : : : ; 5 

X B j = medelantalet dödsolyckor stat j j = 1; 2; : : : ; 6 

där XA i N( A; ) och XB j N( B; ) enligt centrala gränsvärdessatsen. 

’Försöks’bakgrunden ger att oberoende kan förutsättas. 11 Detta 

ger att 

0 

1 

X A X B N 

11 Hur ser egentligen grundmodellen ut? 


@ A B; 

s 2A 

nA 

+ 

2 

B 

nB 

A


där XA = 1 P A 

5 Xi och XB = 1 P B 

6 Xi . Men eftersom varianserna anses 

vara lika kan vi även skriva 

X A X B r 

1 

N A B; + 

nA 

1 

nB 

De observerade skattningarna av A och B är sA och sB ovan. 

Steg 1 Vi utgår ifrån att stater med hjälmtvång har färre antal dödsolyckor 

( A B), eftersom det är vad vi tror. 12 

H0 : A B 0 HA : A B > 0 

Steg 2 Vi har en normalfördelning, litet stickprov och lika varianser och 

detta ger oss testvariabeln 

T = XA XB 

Sp 

q 1 

nA 

+ 1 

nB 

Den observerade skattningen av variansen är 13 

s 2 p = (nA 1)s 2 A + (nB 1)s 2 B 

nA + nB 2 

= 4 0:09182 + 5 0:0547 2 

9 

= 0:0054. 

12 Kan man tänka sig andra skäl för denna nollhypotes? Hur kan man motivera den 

omvända hypotesen? Vem betalar för undersökningen? 

13 Om man logaritmerar likelihood funktionen under antagande om lika varians så 

erhålls funktionen 

P 

xA i A 

L( 1; 2; ) = konstant (nA + nB) ln + 

2 

2 2 

P 

xB i B 

+ 

2 

2 2 

vars derivata satt till noll ger ML-skattningen 

^ 2 = (nA 1) s2 A + (nB 1) s2 nA + nB 

B 

. 

För att denna skattning skall bli väntevärdesriktig ersätter vi nämnaren nA +nB med 

nA + nB 2. 

Man kan också resonera på följande sätt: För att …nna skattningen s2 A används nA 

av de totalt nA +nB observationerna och vi litar därför på s2 nA A i proportionen . nA+nB Motsvarande för s2 nB B blir då . Härav följer att den naturliga skattningen blir 

nA+nB ^ 2 nA 

= s 

nA + nB 

2 A + 

nB 

s 

nA + nB 

2 B = nAs2 A + nBs2 B 

nA + nB 

vilken justeras till ovanstående. 

. 

c Mikael Möller


Steg 3 Beslutsregeln erhålls ur ekvationen 


= P (T > a) 

där a = t0:05(5 + 6 2) = 1:83. 

Steg 4 Data ger att 

0:1021 0:2133 

t = q 

0:0054 1 1 

5 + 6 

= 2:5 

Eftersom detta värde är mindre än 1:83 förkastas ej nollhypotesen 

på signi…kansnivån 5 procent. 

Dödsfrekvensen är signi…kant lägre i de stater som har hjälmtvång än 

i de som ej har det. 

Det är inte alltid som det är bäst att behandla två mätserier som två 

oberoende stickprov. Ibland görs tester där en och samma individ mäts 

två gånger. Varje mätning störs då av dels den naturliga variationen 

mellan individer och dels av mätvariationen (variation inom individ). I 

dylika fall kan man ’trolla bort’den störning som beror av variationen 

mellan individer och därmed få exaktare resultat. Hur man gör beskrivs 

bäst i ett exempel. 

Exempel 50 Två däcksfabrikanter påstår båda att deras däck är hållbarare 

än konkurrentens. Tra…kmagasinet bestämmer sig för att testa 

fabrikanternas påståenden och monterade därför ett däck av vardera märket, 

A och B, på bakhjulen på fem bilar. Bilarna var av samma märke och 

årgång. Fem förare körde sedan varsin bil i exakt 1000 mil och därefter 

uppmättes förslitningen med resultat enligt tabell 

Typ av Förslitning i mm hos bil 

däck 1 2 3 4 5 

A 1:0 0:9 0:7 1:5 0:5 

B 0:9 0:7 0:8 1:2 0:5 

Eftersom förslitningarna av däcken beror av förarens körstil, var denne 

kört m m är det knappast troligt att oberoende mellan däckens förslitning, 

på en bil, föreligger. Hjälp Tra…kmagasinet att testa om det föreligger 

någon skillnad mellan däckstyperna ifråga. Använd risknivån 5 procent. 

c Mikael Möller



X A i = förslitning förare i däck A 

X B i = förslitning förare i däck B 

där i = 1; 2; : : : ; 5. Det är inte orimligt att antaga att dessa stokastiska 

variabler är normalfördelade (ge ett resonemang!) och vi har då 

att X A i 2 N( A + i; A) och X B i 2 N( B + i; B). Här är A och 

B däcktypens förväntade förslitning och i är förare i:s påverkan på 

förslitningen. Denna modell kan också skrivas 

X A i = A + i + A i och X B i = B + i + B i 

där A i 2 N( A; A), B i 2 N( B; B) och i är förare i:s påverkan på 

förslitningen. 

Nu är vi egentligen inte ute efter att mäta de enskilda däckens förslitning 

utan skillnaden i förslitning. Bilda därför den stokastiska variabeln 

Zi = X A i 

X B i . 

Det gäller då att Zi 2 N( ; ) där = A B. Eftersom förarna 

ej anses påverka varandra är det naturligt att anta att Z1; : : : ; Z5 är 

oberoende. Vi har därmed, genom ett enkelt knep, ’trollat bort’den enskilde 

förarens påverkan på däckslitaget. 

För de stokastiska variablerna Z1; : : : ; Z5 erhålls mätvärdena 

0:1; 0:2; 0:1; 0:3; 0 

och vi kan utföra ett av våra tidigare test: 

Steg 1 H0 : = 0 H1 : 6= 0 

Eftersom vi utgår ifrån att ingen skillnad föreligger – Tra…kmagasinet 

har knappast anledning att favorisera någon av däcksfabrikanterna. 

Steg 2 Som testvariabel tar vi 

där T 2 t(n 1). 

T = Z 

S= p n 



= P (jT j > a) 

där a = t0:025(4) = 2:78. 

c Mikael Möller

190 8.4. Test av p 

Steg 4 Vi …nner att jTobsj = 

förkastas på signi…kansnivån 5 procent. 

p 0:1 = 1:414 < 2:78 varför H0 ej kan 

0:025=5 

Tra…kmagasinet kan därför konstatera att det inte föreligger någon 

statistiskt veri…erad skillnad mellan de två däckstyperna. 

Det …nns en mycket vanlig typ av test som förekommer i tidningarna 

stup i kvarten. Nämligen test av proportioner. De mer kända av dessa 

är partisympatiundersökningarna 14 och till de ökända hör t ex det som 

påstod att 80 procent av Stockholmarna vill ha högre skatter. 15 Vi skall 

nu närmast studera test av proportioner. 

8.4 Test av p 

Ofta ställs man inför problemet att uttala sig om en proportion uppfyller 

någon nivå eller ej. Detta är mycket vanligt i samband med riksdagsval 

då proportionen väljare för de olika partierna skattas och publiceras i 

tid och otid. Nedan skall vi ge ett exempel från just detta område men 

väljer att börja med ett något mindre infekterat och enklare exempel 

som dessutom har fördelen att varken kräva normalfördelning eller ett 

stort stickprov. 

Exempel 51 En tillverkare av stålrör vill undersöka om en viss, dyrare, 

ytbehandling har någon korrosionsminskande e¤ekt. Man har därför 

grävt ner 18 behandlade och 18 obehandlade rör parvis – med ett behandlat 

och ett obehandlat rör i varje par –på olika ställen. Man antar 

sedan att de båda rören, i ett par, be…nner sig i samma miljö. 

Efter en tid gräver man upp rören och se efter i hur många par som 

det behandlade röret korroderat mest, säg att detta skett i 6 par. Vi 

förutsätter att man alltid kan se en skillnad ty annars får vi en ytterligare 

komplikation att ta hänsyn till. 

Tillverkarens utgångspunkt är att de behandlade rören korroderat minst 

lika mycket som de obehandlade och att det således inte …nns anledning 

att införa en ny ytbehandling. Denne vill således gardera sig mot att 

införa en dyrare behandlingsmetod om denna inte bevisligen har e¤ekt. 

14 Min privata åsikt om dessa är att de borde förbjudas. Ge en möjlig förklaring 

till denna åsikt. 

15 Denna undersökning publicerades i gratistidningen City efter Socialdemokraternas 

höjning av skatten när de återtog maktens taburetter 2002 i Stockholms stadshus. 

Ett beställningsjobb? 

c Mikael Möller


Lösning 39 För att kunna hjälpa tillverkaren måste vi bygga en modell 

över just hans problem och eftersom han är intresserad av huruvida det 

behandlade röret korroderat minst lika mycket som det obehandlade har 

vi följande grundläggande stokastiska variabel 

Xi = 

1 om behandlat rör korroderat mest . . . 

0 om behandlat rör korroderat minst . . . 

i = 1; 2; : : : ; 18 

där P (Xi = 1) = p. Av den beskrivna situationen kan vi dra slutsatsen 

att de stokastiska variablerna måste vara oberoende ty vi betraktar paren 

och inte varje rör för sig 16 . Bilda nu summavariabeln 

X = 

18X 

i=1 

Xi = antal par där behandlat rör korroderat mest 

för vilken det gäller att X 2 Bin (18; p). 

Steg 1 Försöket utförs för att man vill testa om behandlingen har e¤ekt 

eller ej och mer formellt kan vi skriva detta som 

H0 : behandlingen har ej e¤ekt H1 : behandlingen har e¤ekt 

Nu är det klart att behandlingen har ingen e¤ekt om sannolikheten 

för att det behandlade röret korroderat mest är större än eller lika 

med 0:5. Hypotesen kan därför även skrivas som 

H0 : p 0:5 H1 : p < 0:5. 

Observera att valet av 0:5 är ett val ty vi kunde lika gärna ha valt 

testet 

H0 : p 0:6 H1 : p < 0:4 

Fast då uppstår det problem. Vad skall vi göra när sannolikheten 

p 2 (0:4; 0:6)? 

Steg 2 Det kan nu synas att det gamla hederliga medelvärdet inte är 

användbart i denna situation men om man observerar att en skattning 

av p är17 ^p = x = x 

18 ser man att medelvärdet dyker upp 

även här. Dock har vi endast n = 18 observationer så en normalapproximation 

är inte lämplig. Därför fungerar inte ett vanligt 

medelvärdesresonemang med hjälp av centrala gränsvärdessatsen. 

Däremot känner vi fördelningen för X ty X 2 Bin(n; p) och därför 

får X bli vår testvariabel. 

16 Ett annat exempel på hur man ’trollar bort’en viss typ av störning –i detta fall 

markmiljön. 

P 17 18 

Det gäller här, liksom annorstädes, att x = i=1 xi. 

c Mikael Möller

192 8.4. Test av p 



= P ( ^p p0 j p 0:5 ) 

= P ( X x0 j p 0:5 ). 

I detta fall kan ekvationen skrivas 

= 

x0 X 

k=0 

18 

k pk 18 k 

0(1 p0) 

där sannolikheten p0, under antagande om en sann nollhypotes, är 

större än eller lika med 0:5. Ett utdrag av binomialfördelningstabellen 

(n = 18; x = x0; p = 0:5; 0:6), där cellerna består av sannolikheterna 

P (X x0), ger följande tabell 

x0 p = 0:5 p = 0:6 

2 6:6 10 4 2:6 10 5 

3 3:8 10 3 2:1 10 4 

4 1:5 10 2 1:3 10 3 

5 4:8 10 2 5:8 10 3 

6 1:2 10 1 2:0 10 2 

Vår första observation är att p = 0:5 ger de största sannolikheterna 

på för varje val av x0 när p = 0:5 eller 0:6. Kolumnen för p = 0:5 

innehåller tal som radvis är större än de i kolumnen för p = 0:6. 

Man övertygar sig via några ytterligare exempel på p (0:55, 0:65, 

. . . ) om att det minsta värdet på x0, för ett givet , erhålls när 

p = 0:5. Vidare gäller att när x0 är minst så ställs det högsta 

kravet på behandlingen. Om vi därför följer värsta fallets princip 

(mer om detta i kapitlet om beslutsteori) kan vi ersätta p 0:5 

med p = 0:5. 

Men detta betyder att vår ursprungliga hypotes kan ersättas med 

den ekvivalenta hypotesen 

H0 : p = 0:5 H1 : p < 0:5. 

Om vi nu väljer att ej skall överstiga 5 procent så …nner vi att 

när x0 = 5 så är = 0:048. Vår beslutsregel blir därför: Om det i 

5 eller färre par gäller att det behandlade röret korroderat mest så 

förkastar vi H0 och inför den nya metoden. 

c Mikael Möller


Steg 4 Man fann att x = 6 > 5 varför nollhypotesen ej förkastas på 

signi…kansnivån 4:8 procent. 

Observera at undersökningen ger belägg för att behandlingen saknar effekt. 

Dock ger den inget bevis för att så är fallet. 

Det blir som synes ganska krångligt att bygga ett test när man inte 

kan använda sig av centrala gränsvärdessatsen men det är dock möjligt. 

Det …nns en speciell gren inom statistiken, icke-parametriska metoder, 

som behandlar situationer där fördelningen inte är känd. 

Låt oss nu se hur man förfar när centrala gränsvärdessatsen kan användas. 

Exempel 52 Under ett valår visade SCB:s partisympatiundersökning 

(1903 intervjuade) att Moderaterna:s andel av väljarkåren var 29 procent 

samt att Socialdemokraterna:s andel var 32 procent. Avgör om 

Socialdemokraterna:s andel är signi…kant större än Moderaterna:s på 1 

procentsnivån. 


X 1 i = 

X 2 i = 

1 om röst på Moderaterna 

0 annars 

1 om röst på Socialdemokraterna 

0 annars 

Då N = 1903 är ett ändligt tal har vi här egentligen en hypergeometrisk 

fördelning men eftersom n 

N < 0:1 kan vi i ett första steg göra en binomialapproximation. 

Men det gäller nu att 1903 0:29 = 551 >> 5 och 

därför kan vi i det följande steget även göra en normalapproximation18 . 

Härav följer att modellens fördelningar kan skrivas 

r ! 

r ! 

p1(1 p1) 

p2(1 p2) 

X1 2 N p1; 

och X2 2 N p2; 

. 

n 

n 

Följande procedur erhålls nu 

Steg 1 Praxis ger att om vi vill visa att Moderaternas andel är mindre 

så antager vi det omvända: 

H0 : p1 p2 H1 : p1 < p2 

18 Ett villkor till skall vara uppfyllt men det är det trivialt. 

c Mikael Möller

194 8.4. Test av p 

Steg 2 Som testvariabel väljer vi 

Z = 

X1 X2 

q 

p(1 p) 1 1 

n + n 

ty liksom tidigare erhålls enligt värsta fallets princip att testet kan 

skrivas 

H0 : p1 = p2 H1 : p1 < p2 

varför p1 = p2 = p. En skattning av p blir 19 

^pobs = 

1903 0:29 + 1903 0:32 

1903 + 1903 


där 0:01 = 2:326. 

Steg 4 Vi …nner att 

= 0:305 


= P (Z < ) 

0:29 0:32 

Zobs = q 

1 1 

0:305(1 0:305) 1903 + 1903 

= 2:01 

och eftersom 2:01 < 2:326 förkastas nollhypotesen på signi…kansnivån 

1 procent. 

Moderaternas andel av väljarkåren är signi…kant mindre än Socialdemokraternas 

andel. 

Uppgift 28 Byt hypotesen i exempel 52 mot 

H0 : p1 = p2 H1 : p1 6= p2 

och genomför testet på nivån 1 procent. 

Därmed har vi gått igenom några metoder för att testa parametern 

(parametern p inklusive) när normalfördelning gäller antingen direkt 

eller via centrala gränsvärdessatsen. 

19 Likelihood funktionen blir, när p1 = p2 = p, 

L(p) = n1 

k pk (1 p) n1 k n2 

m pm (1 p) n2 m 

. 

Bestäm maximum för logaritmen av denna funktion varvid man …nner att 

k + m 

^p = 

n1 + n2 

= n1 k m 

+ n2 n1 n2 

n1 + n2 

= n1 ^p1 + n2 ^p2 

. 

n1 + n2 

Det alternativa sättet att ta fram ^p (se tidigare fotnot sid ??) ger samma resultat. 

c Mikael Möller


8.5 Test av vid normalfördelning 

Vid analys av börskurser är test av av större betydelse än test av . Vi 

skall gå igenom två olika test för standardavvikelsen under antagandet 

om att den underliggande fördelningen är normalfördelningen. Det första 

testet handlar om att jämföra standardavvikelsen med ett på förhand 

angivet värde och det andra handlar om att jämföra standardavvikelser 

mellan två oberoende stickprov. 

Exempel 53 En banks ledning har hört att en kö som leder till ‡era kassor 

är e¤ektivare än en kö till varje kassa. För att testa detta mäter man 

under en längre tid variationen på kundernas väntetider och …nner därvid 

att standardavvikelsen är 8 minuter. Därefter inför man systemet med 

endast en kö och …nner då efter 30 kunder att s = 5 minuter. Om kundernas 

väntetider kan anses vara normalfördelade hur skall bankens ledning 

besluta, införa eller inte införa en-kö-system. Banken väljer risken 

2:5 procent för ett felaktigt beslut? 


Xi = kund i:s väntetid i = 1; 2; : : : ; 30 

där Xi 2 N( ; ). Vi vet sedan tidigare att en bra skattning av 2 är s 2 

samt att det gäller att 

(n 1)S 2 

Steg 1 H0 : 2 64 H1 : 2 < 64 

2 2 2 (n 1). 

Om den nya variationen är större än den gamla så …nns ingen 

anledning att införa det nya systemet. 


2 = (n 1)S 2 

där liksom tidigare värsta fallets princip ger att testet kan skrivas 

H0 : 2 = 64 H1 : 2 < 64. 

Steg 3 Beslutsregeln följer ur ekvationen 


= P 2 < a 

där a = 2 0:975(29) = 16 20 . 

20 Observera hur 2 -tabellen är uppbyggd. 

2 

c Mikael Möller


2 29 5 Steg 4 Data ger att = 2 

82 = 11:33 < 16 varför nollhypotesen 

förkastas på 2:5 procentsnivån. 

Banken rekommenderas att införa det nya systemet med en kö till ‡era 

kassor. 

För att kunna ta itu med nästa typ av test –två standardavvikelser 

är lika – behöver vi införa en ny typ av stokastisk variabel. Eftersom 

vi är intresserade av att testa det inbördes storleksförhållandet mellan 

två standardavvikelser behöver vi en storhet som mäter just detta. En 

sådan variabel är 

F = S2 1 

S 2 2 

ty om: F > 1 så tror vi att 1 2, om F < 1 så tror vi att 1 2 

och om F = 1 så tror vi att 1 = 2. Nu vet vi att man måste ta hänsyn 

till slumpen så det gäller att hitta en lämplig ersättare för talet 1 i de 

tre olika fallen. För att kunna hitta denna ersättare konstaterar vi att 

fördelningen för F kan skrivas 

eftersom 

(n1 1) S 2 1 

2 

1 

F = S2 1 

S 2 2 

2 

2 2 (n1 1) och 

2 

1 2 (n1 1) = (n1 1) 

2 

2 2 (n2 1) = (n2 1) 

(n2 1) S 2 2 

2 

2 

2 2 (n2 1) 

För de tre olika testen gäller antagandet att 1 = 2 (värsta fallets 

princip) varför vi kan skriva 

F 2 

2 (n1 1) = (n1 1) 

2 (n2 1) = (n2 1) 

som är helt oberoende av 1 och 2. Denna nya fördelning benämns 

F -fördelningen och den …nns tabulerad för olika värden på n1, n2 och . 

Observera att tabellen oftast pratar om sannolikheten P F (n1; n2) > a . 

Om man istället betraktar P F (n1; n2) 

följande sätt 


P F (n1; n2) 

b < 

1 

F (n1; n2) 

= P 1 

b < F (n2; n1) 

= P F (n2; n1) > 1 

b 

.


och vi är tillbaks till ursprungsfallet där n1 och n2 har bytt roller. Detta 

följer trivialt från de…nitionen av den stokastiska variabeln F . 

Exempel 54 En ekonom har en teori om att volatiliteten i en aktie 

påverkas märkbart när ’insiders’ ger sig in i handeln. För att testa om 

denna teori håller införska¤ar ekonomen börskurserna för en aktie (AssiDomän) 

där denne vet att ’insiders’ har handlat. Data delades upp 

i två perioder: dels perioden där beslutet om inlösen bara var känt av 

en inre krets och dels i en lika lång period före. Data transformerades 

till daglig ränteavkastning och man fann standardavvikelsen 9 kronor för 

perioden då inlösen bara var känd av den inre kretsen och 3 kronor för 

perioden dessförinnan. Har ekonomens teori stöd i data? Antag att 

normalfördelning och oberoende observationer kan anses rimligt. 21 


X F i = avkastning före beslut dag i, i = 1; 2; : : : ; 25 

X E j = avkastning efter beslut dag j, j = 1; 2; : : : ; 25 

där X F i 2 ON( 1; 1) och X E j 2 ON( 2; 2). 

Steg 1 Ekonomen tror på sin teori och vill ogärna förkasta denna om 

den är sann men dennes belackare kommer naturligtvis slå ner på 

första bästa felkälla. Därför väljs testet 

H0 : 1 2 H1 : 1 < 2 

d v s H0 : teorin fungerar ej mot alternativet H1 : teorin fungerar 

och som signi…kansnivå väljs 0:01. 

Steg 2 Som testvariabel tas 

där F 2 F (24; 24). 

F = S2 1 

S 2 2 

Steg 3 Beslutsregeln följer ur ekvationen 


= P F < a 

varför det erhålls att a = 1 

2:66 = 0:376. 

21 Vilket de inte är! Varför? 

c Mikael Möller

198 8.6. Olika typer av fel 

Steg 4 Data ger att Fobs = 32 

9 2 = 0:11 < 0:376 varför nollhypotesen 

förkastas på nivån 1 procent. 

Ekonomen:s teori stämmer med verkligheten och risken för att teorin 

skall vara fel är en på hundra. 

8.6 Olika typer av fel 

Vi har tills nu endast betraktat en typ av de två fel man kan begå vid 

utförande av test – nämligen att förkasta en sann hypotes. Dock …nns 

ytterligare ett fel, som man kan göra, och det framgår av nedanstående 

tabell att det är att ’ej förkasta H0 om H0 ej är sann’. 

Testresultat 

Sanningen Förkasta H0 Förkasta ej H0 

H0 är sann Ej korrekt ( ) Korrekt 

H0 ej är sann Korrekt Ej korrekt ( ) 

Dessa två typer av fel benämns Typ I ( ) och Typ II ( ) fel där typ I 

felen har sannolikheten (signi…kansnivån) att inträ¤a. Båda felen vill 

vi skall vara små. 

8.6.1 Styrkefunktion 

För att illustrera hur dessa två typer av fel hänger ihop betraktar vi 

ånyo exemplet med de nedgrävda rören. Det gäller att Typ II:felet är 

= P (förkasta ej H0 givet H0 ej sann) 

= 1 P (förkasta H0 givet H0 ej sann) 

= 1 f(p). 

Funktionen f(p) = P (förkasta H0 givet H0 ej sann) de…nieras här av 

f(p) = 

5X 

k=0 

18 

k pk 18 k 

(1 p) 

och eftersom det är sannolikheter vi arbetar med ritar vi upp den i 

intervallet (0; 1) och erhåller då …guren nedan 

I …guren har vi noterat signi…kansnivån 4:8 procent för p = 0:5. 

Antag nu att det sanna värdet i verkligheten är p = 0:3 d v s att ytbehandlingen 

har en positiv e¤ekt. Vi ser då i …guren att sannolikheten 

att förkasta H0 (när H0 ej är sann) blir 0:53. 

c Mikael Möller


1 

0.9 

0.8 

0.7 

0.6 

0.5 

0.4 

0.3 

0.2 

0.1 

0 

0 

0.1 

0.2 

0.3 

0.4 

0.5 

0.6 

Figur 8.1: (p) = 1 P 5 

k=0 

0.7 

0.8 

0.9 

18 

k pk 18 k (1 p) 

Eftersom ett p = 0:3 betyder att metoden ger en bättre e¤ekt än 

ingen behandling alls kan sannolikheten att förkasta H0 synas vara väl 

liten. Testet diskriminerar ej bra för p mellan 0:5 och 0:3. 

Ett sätt att göra sannolikheten större, för p = 0:3, är att utöka 

antalet observationer. Om vi t ex tar ytterligare 18 par rör så att vi 

totalt har 36 par så erhålls beslutsregeln att förkasta H0 till x0 = 13 

när = 0:066 och x0 = 12 när = 0:033. Då signi…kansnivån ej skall 

överstiga 5 procent, tar vi = 0:033 (d v s förkastelsegränsen x0 = 12) 

och då erhålls sannolikheten att ’förkasta H0 när p = 0:3’till 0:74 vilken 

är betydligt större än 0:53 –se …gur 8.2. 

Vi ser allmänt i denna …gur att 36 par ger bättre förmåga att diskriminera 

huruvida ytbehandlingen har e¤ekt eller ej. Lite eftertanke ger att 

72 par vore ännu bättre o s v. Men det kostar! 

Funktionen 

f ( ) = P (förkasta H0) 

där är den parameter som studeras, t ex = p, kallas styrkefunktionen 

och för denna funktion gäller att 0 f ( ) 1 för alla värden på . 

Uppgift 29 Bestäm styrkefunktionen för testet i exempel 46 när man 

valt signi…kansnivån 0:01. 

8.7 p-värden 

Filoso…skt är begreppet signi…kansnivå tilltalande eftersom den kopplar 

direkt till undersökningens kostnader samt gör att man funderar igenom 

1 

c Mikael Möller

200 8.7. p-värden 

1 

0.9 

0.8 

0.7 

0.6 

0.5 

0.4 

0.3 

0.2 

0.1 

0 

0 

0.1 

0.2 

0.3 

0.4 

0.5 

Figur 8.2: 18 par (— ) och 36 par (. . . ) 

sitt försök och dess uppläggning innan man sätter igång. Det …nns 

dock tillfällen när användandet av signi…kansnivå ej blir bra som t ex 

vid diskreta fördelningar ty där är det ej alltid möjligt att trä¤a exakt 

rätt med signi…kansnivån. 22 

Det …nns således tillfällen när en annan terminologi skulle vara bättre 

och den metod som utkristalliserats är vad som kallas p–värden. Denna 

metod låser ej sannolikheten 

0.6 

0.7 

0.8 

0.9 


till ett givet värde utan beräknar istället 

P (förkasta H0 givet det resultat vi erhållit givet H0 sann) 

och hur denna sannolikhet skall användas förstås lättast med ett exempel. 

Exempel 55 Antag att vi vill göra ett ensidigt test på m för en N (m; ) 

där är känd: 

H0 : m m0 H1 : m m0 

Det naturliga testet är att vi förkastar H0 om vi …nner ett x som är 

’stort’d v s att x ligger så mycket till höger om m0 att vi måste acceptera 

mothypotesen H1. 

22 Självklart kan testet krånglas till så att önskad signi…kansnivå erhålls. Men varför 

krångla när det …nns bättre metoder. 


1


1. Om vi låser signi…kansnivån till säg 5 procent medför detta att 

vi kan beräkna gränsen 0:05 = 1:96 och om x > m0 + 1:96 p n 

förkastar vi nollhypotesen. 

2. Antag att vi istället beräknar den till x hörande signi…kansnivån 

d v s vi beräknar 

Då uppstår två möjligheter. 

p = P X > x givet H0 sann . 

(a) Det beräknade p-värdet (signi…kansnivån) är mindre än 5 procent: 

Detta betyder att x > m0 + 1:96 p n ty vi har för‡yttat 

oss längre ut i fördelningens svans (vi …ck en mindre sannolikhet) 

och således förkastar vi vår hypotes i detta fall. 

(b) Det beräknade p-värdet (signi…kansnivån) är större än 5 procent: 

Detta betyder att x < m0 + 1:96 p n ty vi har för‡yttat 

oss längre in på fördelningens svans (vi …ck en större sannolikhet) 

och således förkastar vi ej vår hypotes i detta fall. 

Metoden med p-värden är vad alla statistikprogram anammat ty det 

är lätt att beräkna p-värden men det är svårt att gissa en användares 

preferens på signi…kansnivån. 23 

8.8 Test av fördelningar 

8.8.1 

2 -testet 

Det …nns två olika typer av sannolikhetsfördelningar –diskreta och kontinuerliga 

–för vilka vi behöver metoder som avgör om data kommer från 

den tänkta fördelningen eller ej. Eftersom data som kommer från en 

diskret fördelning redan är naturligt grupperade börjar vi med att studera 

dessa. Test för de kontinuerliga fördelningarna behandlas i kapitlet 

Passar vår fördelning. 

Antag att vår modell är ”kast med en tärning”samt att ett stickprov 

på denna tärning är 

3 5 4 5 6 4 3 6 4 2 3 4 5 5 4 6 6 3 

4 5 5 4 3 1 6 4 3 3 2 6 4 4 1 5 4 3 

23 I äldre litteratur kan man läsa om *, ** och *** signi…kans. Dessa beteckningar 

bör användas endast om man medvetet avser föra läsaren bakom ljuset. 

c Mikael Möller

202 8.8. Test av fördelningar 

eller med andra ord att vi har kastat tärningen 36 gånger och därvid 

erhållit de angivna resultaten. Vår statistiska modell för tärningskasten 

är 

X = antal prickar vid ett kast 

där P (X = k) = 1 

6 k 2 f1; 2; : : : ; 6g. Vi skall nu avgöra om stickprovet 

bekräftar denna modell eller om det förkastar den. Med andra ord skall 

vi avgöra om de sannolikheter som kan skattas med hjälp av stickprovet 

skiljer sig märkbart från modellens teoretiska sannolikheter. För att 

kunna göra detta behöver vi betrakta det transformerade stickprovet 

– 2; 2; 8; 11; 7; 6 – där den första 2:an betyder att vi har två 1:or, den 

andra tvåan betyder att vi har två 2:or o s v. Om modellen är bra så bör 

följande approximationer gälla 

2 

36 

1 2 

, 

6 36 

1 8 

, 

6 36 

1 11 

, 

6 36 

1 7 

, 

6 36 

1 6 

, 

6 36 

där 36 är det totala antalet kast. Detta kan även skrivas 

2 36 1 

6 

11 36 1 

6 

0, 2 36 1 

6 

0, 7 36 1 

6 

0, 8 36 1 

6 

0, 6 36 1 

6 

Idéen är således att jämföra vårt observerade värde med det förväntade 

värdet. Denna idé kommer i det följande avsnittet leda oss till 

2 -metoden. En metod som är så allmän att den inte bara kan användas 

för test av diskreta fördelningar utan den förmår även hjälpa oss att 

avgöra om gissningar på kontinuerliga fördelningar är bra eller ej samt 

om händelser är oberoende eller ej. 

8.8.2 Ett enklare exempel 

Betrakta följande enkla försök: För att avgöra om ett mynt är symmetriskt 

eller ej kastas detta n gånger. Räkna antalet krona (1) respektive 

klave (0) och om ungefär hälften av kasten ger krona klassas myntet 

som symmetriskt. 

Detta försök kan beskrivas med följande generella modell där en av 

två möjliga händelser kan inträ¤a: Sätt 

där 


Xi = 

1 om krona kast i 

0 om klave kast i 

P (Xi = k) = 

0; 

0. 

i = 1; 2; : : : ; n 

p om k = 1, 

1 p om k = 0. 

1 

6


Bilda sedan de stokastiska variablerna 

Y1 = antal ettor = 

nX 

i=1 

Y2 = antal nollor = n 

där Y1 2 Bin(n; p) och Y2 2 Bin(n; 1 p). För ett symmetriskt mynt 

gäller att p = 0:5 men det blir inga ytterligare svårigheter om man 

betraktar ett godtyckligt mynt och tillåter p vara ett godtyckligt tal 

mellan 0 och 1, däremot får vi en mer allmän utsaga. 

Eftersom fördelningen för Y1 är Bin (n; p) så gäller enligt centrala 

gränsvärdessatsen att 

Xi 

nX 

i=1 

Y1 np 

p np (1 p) N (0; 1) 

om np > 5 och n(1 p) > 5. I försöket ovan förväntar vi oss att p = 0:5 

varför det behövs mer än 10 slantsinglingar 24 för att normalapproximation 

skall kunna användas. 

I kapitlet Fördelningsmatematik visas att kvadraten på en normalfördelning 

med väntevärde 0 och varians 1 är 2 -fördelad med en frihetsgrad 

och det följer därför att 

(Y1 np) 2 

np (1 p) 

2 (1) 

Denna kvadratsumma skall nu skrivas om så att den innehåller både Y1 

och Y2 och vi kommer då se en viss symmetri. Denna symmetri kan 

överföras till situationer med ‡er än två möjliga utfall. 

En uppdelning i partialbråk ger 

Xi 

(Y1 np) 2 

np (1 p) = (Y1 np) 2 

+ 

np 

(Y1 np) 2 

n (1 p) 

men eftersom Y2 = n Y1 kan detta även skrivas 

(Y1 np) 2 

np (1 p) = (Y1 np) 2 

+ 

np 

(n Y2 np) 2 

n (1 p) 

= (Y1 np) 2 

np 

+ (Y2 n (1 p)) 2 

n (1 p) 

24 Med tumregeln np(1 p) > 10 erhålls istället att antalet slantsinglingar skall 

vara större än 40. 

c Mikael Möller


Sätt nu p = p1 och 1 p = p2 varvid vi erhåller 

(Y1 np) 2 

np (1 p) = (Y1 np1) 2 

np1 

+ (Y2 np2) 2 

Här känner vi nu igen det som nämndes i introduktionen nämligen att vi 

betraktar skillnaden mellan det observerade värdet och det förväntade 

värdet. Detta kan nu skrivas 

y1 np1 och y2 np2 

och vi skall avgöra om dessa skillnader är stora eller ej. Här har lösningen 

förts ett steg längre ty om vi tar skillnaderna i kvadrat och delar med 

det förväntade värdet, E(Yi) i = 1; 2, så erhålls en 2 -fördelning. 

Det är därmed visat att det allmänt gäller 

Q = 

2X 

i=1 

Yi E(Yi) 2 

E(Yi) 

np2 

2 (1) 

där E(Y1) = np1 och E(Y2) = np2. 

De observerade värdena på Y1 och Y2 bör, vid kast med ett mynt, vara 

ungefär lika stora som sina förväntningsvärden (E (Yi) = npi). Kvadratsumman 

bör därför vara liten om vi gissat rätt på p1 och p2 = 1 p1 

och den bör vara stor om vi gissat fel. 

Det hittills sagda ger oss en algoritm för att avgöra om data kommer 

från ett mynt med sannolikheten p för krona eller ej. 

Steg 1 H0 : p = 0:5 H1 : p 6= 0:5 

Vi utgår ifrån att myntet är symmetriskt ty det har alltid varit så 

förut. 


Q = 

och denna är 2 (1)-fördelad. 

2X (Yi npi) 2 

i=1 

npi 

Steg 3 Beslutsregeln erhålls nu ur ekvationen 

där a = 2 (1). 



= P Q > a


Steg 4 Beräkna Qobs och om Qobs > a så förkastas nollhypotesen på 

signi…kansnivån 100 procent. 

Om det mer allmänt …nns r möjliga utfall (för en vanlig tärning är 

r = 6) använder vi oss istället av variabeln 

rX (Yi npi) 

Q = 

2 

npi 

i=1 

för vilken det gäller att Q 2 2 (r 1). 

Exempel 56 (forts på exempel 46 sid 177) Vad gäller för tärningen i 

början av detta avsnitt? Är den rättvis eller har den oönskade egenskaper? 

Använd signi…kansnivån 5 procent. 

Lösning 43 Modellen gavs tidigare och de fyra hypotesstegen blir 

Steg 1 H0 : pi = 1 

6 i = 1; 2; : : : ; 6 H1 : :H0 25 


Q = 

vilken är 2 (6 1)-fördelad. 

6X (Yi npi) 2 

i=1 


npi 


= P (Q > a) 

där a = 2 0:05(5) = 11:1. 

Steg 4 Vårt observerade värde erhålls till 

q = 

+ 11 36 1 

1 2 36 6 

36 1 

6 

6 

36 1 

6 

2 

2 

= 152:8 > 11:1 

+ 2 36 1 

+ 7 36 1 

6 

36 1 

6 

2 

6 

36 1 

6 

2 

+ 8 36 1 

+ 6 36 1 

6 

36 1 

6 

2 

6 

36 1 

6 

varför vi förkastar antagandet om en korrekt tärning på signi…kansnivån 

5 procent. 

Det är därför att rekommendera att tärningen ej används. 

25 Symbolen : skall utläsas ’icke’. 

2 

c Mikael Möller


8.8.3 Fördelningar –diskreta 

Ovanstående metod låter sig utvecklas till ett allmänt test för om en 

gissad diskret fördelning är giltig eller ej. Metoden är direkt överförbar 

om fördelningen är helt känd som i Bin(13; 0:34), P o(2:15) o s v. I de fall 

som vi måste skatta en parameter p, o s v behöver vi endast göra en 

smärre korrigering i antalet frihetsgrader för 2 -fördelningen. Frihetsgraden 

skall minskas med en enhet för varje skattad parameter. 

Exempel 57 En ‡yginstruktör har fört bok över antalet gjorda fel per 

timme i en ‡ygsimulator och därvid efter 30 timmar erhållit följande 

tabell 

Antal fel 0 1 2 3 4 5 6 7 8 9 10 11 

Frekvens 3 8 5 7 2 1 2 1 0 0 1 0 

och vill nu testa sitt antagande om att antalet fel per timme uppträder 

enligt en Poissonfördelning. 

Lösning 44 Eftersom Poissonfördelningens parameter ej är given måste 

denna skattas med hjälp av den givna informationen. Nu gäller det att 

det förväntade antalet fel per timme, , skattas med medelvärdet och vi 

erhåller 

^ 

0 

obs = x = 

3 + 1 8 + 2 5 + 

30 

+ 10 1 + 11 0 

= 81 

= 2:7 

30 

Med hjälp av detta värde kan vi beräkna den teoretiska frekvensen för 

0 fel per timme till nP (X = 0) = 30e 2:7 = 2:016, för 1 fel per timme 

till nP (X = 1) = 30 2:71 

1! e 2:7 = 5:444 o s v. Detta ger, efter en hel del 

c Mikael Möller


arbete, tabellen nedan 

Antal Observerad Teoretisk 

fel frekvens frekvens 

fo 

fe 

(f0 fe) 2 

0 3 2:016 

1 8 5:444 1:679 

2 5 7:350 0:751 

3 7 6:615 0:022 

4 2 4:464 

5 1 2:412 

6 2 1:086 

7 1 0:417 

8 0 0:141 

9 0 0:042 

10 1 0:012 

11 0 0:003 0:290 

2:742 

I den fjärde kolumnen har vi slagit ihop celler så att den teoretiska 

frekvensen överstiger 5 (npi > 5) så att centrala gränsvärdessatsen blir 

möjlig att tillämpa. Summering av den fjärde kolumnen ger sedan det 

observerade värdet på testvariabeln Q till 

q = X (f0 fe) 2 

= 2:742. 

Steg 1 H0 : antal fel per timme 2 P o(2:7) H1 : :H0 


fe 

Q = X (f0 fe) 2 

vilken är 2 (4 1 1)-fördelad. Här har vi dragit bort ytterligare 

1 enhet eftersom vi skattat en parameter . Om vi skattar två 

parametrar drar vi bort 2 o s v. 


fe 


= P (Q > a) 

där a = 2 0:01(2) = 9:21. 

fe 

c Mikael Möller


Steg 4 Tabellen ger att q = 2:742 < 9:21 och H0 förkastas därför ej på 

1 procent nivån. 

Det …nns därför belägg för att antalet fel per timme i ‡ygsimulatorn 

följer en Poissonfördelning. 

8.8.4 Fördelningar –kontinuerliga 

När man har observationer på en kontinuerlig fördelning brukar man 

ofta göra ett histogram över data. Därvid delas data in i klasser och 

på dessa klasser kan man tillämpa 2 -testet för att avgöra om en gissad 

kontinuerlig fördelning passar till data eller ej. 

Exempel 58 En analytiker vill ta reda på om antalet handlade köpoptioner 

per dag fortfarande följer en normalfördelning med väntevärde 

50 (miljoner) och standardavvikelse 10 (miljoner). Analytikern noterar 

därför antalet handlade köpoptioner per dag under 90 dagar och fann då 

följande tabell 

Antal Observerad 

köp frekvens 

fo 

0 10 5 

10 20 9 

20 30 15 

30 40 23 

40 50 20 

50 60 8 

60 70 6 

70 80 3 

80 1 

Totalt 90 

Ger tabellen belägg för ett bibehållet köpmönster? Utför ett test på nivån 

2 procent. 

Lösning 45 Först bildar vi den indikerade modellen och sätter 

Xi = antal köpta köpoptioner dag i i = 1; 2; : : : ; 90 

där Xi 2 ON(50; 10). 

c Mikael Möller


Med hjälp av modellen kan vi nu beräkna de teoretiska frekvenserna 26 

för de angivna klasserna (intervallen). Därefter utvecklar vi tabellen 

enligt samma mönster som för de diskreta fördelningarna. Detta ger oss 

tabellen 

Antal Observerad Teoretisk 

köp frekvens frekvens 

fo 

fe 

(f0 fe) 2 

0 10 5 0:0 

10 20 9 0:126 

20 30 15 1:926 

30 40 23 12:231 99:599 

40 50 20 30:717 3:739 

50 60 8 30:717 16:801 

60 70 6 12:321 

70 80 3 1:926 

80 1 0:126 1:330 

Totalt 90 121:469 

I tabellen har vi slagit ihop de fyra raderna 0 10 till 30 40 så att 

kravet om förväntat värde större än 5 uppfylls. Detsamma har gjorts för 

raderna 60 70 till 80 . Testet blir nu 

Steg 1 H0 : Antal köp per dag 2 N(50; 10) H1 : :H0 


vilken är 2 (4 1)-fördelad. 

Q = X (f0 fe) 2 


fe 


= P (Q > a) 

där a = 2 0:01(3) = 11:345. 

26 För t ex intervallet (20; 30) gäller att den teoretiska frekvensen är 

nP (20 < X 30) = 90P 

20 50 

10 

< X 50 

10 

= 90P ( 3 < Z 2) 

1:926. 

fe 

30 50 

10 

c Mikael Möller


Steg 4 Eftersom Qobs = 121:469 > 11:345 förkastas nollhypotesen på 

nivån 1 procent. 

Testet visar tydligt att köpmönstret har förändrats. En snabb kalkyl ger 

att det skattade medelvärdet är 37:6 miljoner och inte 50 miljoner. Bara 

här uppstår en diskrepans. 

Uppgift 30 Gör om testet i exemplet ovan men ta nu hänsyn till att 

och skattas med x och s. Vad blir nu resultatet? 

8.8.5 Test av oberoende 

2 -testet är även lämpligt när man vill testa om två olika typer av händelser 

A och B är oberoende eller ej (kontigenstabeller). Antag att den 

ena händelsetypen har a olika möjliga utfall, vilka vi betecknar med 

A1; A2; : : : ; Aa, samt att den andra händelsetypen har b möjliga utfall, 

vilka vi betecknar med B1; B2; : : : ; Bb. Sätt 

Xij = antal gånger händelserna Ai och Bj inträ¤at samtidigt 

i = 1; 2; : : : ; a och j = 1; 2; : : : ; b. 

Vi erhåller då en tabell enligt 

Typ B 

Typ A B1 B2 Bb 

A1 X11 X12 X1b r1 

A2 X21 X22 X2b r2 

. 

. 

. 

. .. 

Aa Xa1 Xa2 Xab ra 

c1 c2 cb n 

där det gäller att ri = Pb j=1 Xij och cj = Pa i=1 Xij samt n = Pa Pb j=1 cj. De…niera nu sannolikheterna 

pij = P (Ai \ Bj), 

pi = P (Ai), 

p j = P (Bj). 

Om oberoende föreligger så skall det gälla att 

pij = pi 

Ett test av oberoende händelser blir nu 


p j. 

. 

. 

i=1 ri =


Steg 1 Vår hypotes är 

eller ekvivalent 

H0: händelserna A och B är oberoende H1: :H0 

H0: pij = pi p j , 8 (i; j) : i 6= j H1: :H0. 

Steg 2 Under hypotesen har vi testvariabeln 

Q = 

aX 

i=1 j=1 

bX (fo fe) 2 

= 

fe 

aX 

bX 

i=1 j=1 

(Xij npi p j) 2 

npi p j 

där Q 2 (?) 27 . Nu är p1 ; p2 ; : : : ; pa och p 1; p 2; : : : ; p b okända 

parametrar och de måste därför skattas. Det visar sig att lämpliga 

skattningar (enligt minsta-kvadrat-metoden) är 

pi = ri 

n 

p j = cj 

n 

i = 1; 2; : : : ; a 

j = 1; 2; : : : ; b 

och eftersom det gäller att p a = 1 p 1 p 2 p (a 1) samt 

pb = 1 p1 p2 p (b 1) behöver vi skatta a 1 och b 1 

parametrar. Detta för med sig att antalet frihetsgrader för Q måste 

justeras till 

ab 1 (a 1) (b 1) = ab a b + 1 

Vår testvariabel blir därför 

Q = 

aX 

bX 

i=1 j=1 

där Q 2 (a 1)(b 1) . 

Steg 3 Beslutsregeln erhålls nu till 

27 Fortsätt att läsa! 

Xij n ri 

n 

n ri cj 

n n 

= (a 1)(b 1). 

cj 

n 


= P (Q > 2 ). 

2 

c Mikael Möller


Steg 4 Beräkna Qobs och jämför med 2 . 

Vi ger nu ett exempel på när ett oberoende-test är lämpligt och hur 

det praktiskt utförs. 

Exempel 59 På ett sjukhus har man fört bok över ett stort antal patienter 

och noterat om de bland annat är rökare och/eller har någon 

hjärtsjukdom. En medicine kandidat vill nu undersöka om hennes teori, 

om inget samband mellan rökning och hjärtsjukdom, har stöd i be…ntliga 

observationer (se tabellen nedan). 

R Hjärtsjukdom 

ö Ja (HJ) Nej (HN) 

k Ja (RJ) 300 200 500 

a Nej (RN) 100 300 400 

r 400 500 900 

e 

Lösning 46 En statistikers formulering av ovanstående fråga är: Rökning 

och hjärtsjukdom är oberoende händelser. Vi har därför att utföra 

ett oberoende-test och ur den givna tabellen erhålls att 

samt att 

P (RJ \ HJ) = 300 

900 P (RJ \ HN ) = 200 

900 

P (RN \ HJ) = 100 

900 P (RN \ HN) = 300 

900 

P (RJ)P (HJ) = 500 400 

900 900 P (RJ)P (HN) = 500 500 

900 900 

P (RN)P (HJ) = 400 400 

900 900 P (RN )P (HN) = 400 500 

900 900 . 

Den omformulerade frågan är nu om de…nitionen av oberoende 

P (A \ B) = P (A)P (B) 

är uppfylld eller ej. Observera att villkoret np > 5 är giltigt i varje cell. 

Steg 1 H0 : händelserna R och H är oberoende H1 : :H0 


Q = 

2X 

i=1 j=1 

där Q är 2 (2 1)(2 1) -fördelad. 


2X (fo fe) 2 

fe


Steg 3 Vår beslutsregel erhålls ur ekvationen 

där 2 0:05(1) = 3:84. 

Steg 4 Data ger att 


= P (Q > 2 ) 

q = 

= 300 900 5 

+ 200 900 5 

2X 

2X 

i=1 j=1 

Xij n ri 

n 

n ri cj 

n n 

4 

9 9 

900 

2 

5 4 

9 9 

5 

9 9 

2 

900 5 5 

9 9 

= 110:25 

+ 100 900 4 

+ 300 900 4 

cj 

n 

2 

4 

9 9 

900 

2 

4 4 

9 9 

5 

9 9 

2 

900 4 5 

9 9 

Eftersom q = 110:25 > 3:84 så föreligger signi…kant beroende mellan 

rökning och hjärtsjukdomar. 

Medicine kandidatens teori har ej stöd i be…ntliga observationer. 

Alla de tabeller vi studerat med hjälp av 2 -testet har bestått av 

r rader och c kolumner. Vid test av fördelning har vi 2 kolumner 

(observerad och teoretisk frekvens) och r rader och vid vårt test av 

oberoende var det 2 rader och 2 kolumner (eller allmänt a rader och 

b kolumner). 

Oavsett vad vi studerar behövs antalet frihetsgrader för den aktuella 

2 -fördelningen och vi har angett dessa till att vara (a 1)(b 1). Vid 

fördelningstesten måste vi även ta hänsyn till antalet (m) skattade parametrar 

och erhåller då frihetsgraden (a 1) (b 1) m. 

Dessa frihetsgrader är intimt förknippade med rangen hos en matris 

och vi illustrerar detta på föregående exempel om oberoende. Tabellen 

där har följande principiella utseende 

x1 x2 r 

x3 x4 n r 

c n c n 

c Mikael Möller

214 8.9. Övningar och Problem 

vilket är ekvivalent med ekvationssystemet 

x1 + x2 = r 

x3 + x4 = n r 

x1 + x3 = c 

x2 + x4 = n c 

och detta system har rangen 1 d v s (2 1)(2 1). 

8.9 Övningar och Problem 

c Mikael Möller



26 Eftersom vi valt nollhypotesen = 0 följer att vi vill undvika både 

för stora och för små värden varför a = b. är bara en alternativ 

beteckning. 

27 Ett symmetriskt 99 procentigt trovärdighetsintervall för när är 

okänd är 

x 2 p n 

= 59:7 2:576 0:7 

p 100 

= 59:7 0:18 

= (59:52; 59:88) . 

Eftersom detta intervall ej innehåller värdet 60 kan produktionen ej anses 

hålla sig inom angivna ramar. 

28 Med samma modell som i exempel 52 erhålls 

Steg 1 H0 : p1 = p2 H1 : p1 6= p2 

Steg 2 Som testvariabel väljer vi 

Z = 

X1 X2 

q 

p(1 p) 1 1 

n + n 

eftersom p1 = p2 = p. En skattning av p blir 28 

^pobs = 

1903 0:29 + 1903 0:32 

1903 + 1903 


där 0:005 = 2:5758. 

= 0:305 


= P (jZj > =2) 

28 Likelihood funktionen blir, när p1 = p2 = p, 

L(p) = n1 

k pk (1 p) n1 k n2 

m pm (1 p) n2 m . 

Bestäm maximum för logaritmen av denna funktion varvid man …nner att 

k + m 

^p = = 

n1 + n2 

n1 k 

m 

+ n2 n1 n2 

n1 + n2 

= n1 ^p1 + n2 ^p2 

. 

n1 + n2 

c Mikael Möller


Steg 4 Vi …nner att 

0:29 0:32 

Zobs = q 

1 1 

0:305(1 0:305) 1903 + 1903 

= 2:01 

och eftersom j 2:01j < 2:5758 förkastas ej nollhypotesen på signi- 

…kansnivån 1 procent. 

Moderaterna:s andel av väljarkåren är densamma som Socialdemokraterna:s. 

Observera att denna slutsats strider mot den föregående slutsatsen. Hur 

förklarar du det? 

29 Styrkefunktionen kan här skrivas 

f ( ) = P 

= 1 P 

X 60 

= p n 

X 60 

= p n 

= 1 P 2:576 

= 1 P 2:576 

= 1 P 2:576 

= 1 2:576 

= 1 2:576 

> 2:576 när det sanna värdet är 

2:576 när det sanna värdet är 

X 60 

= p n 

2:576 

X + 60 

= p n 

60 

= p n 

60 

= p n 

60 

= p n 

X 

= p n 

2:576 

+ 2:576 

2:576 

60 

2:576 

= p n 

60 

= p n 

60 

= p n 

Om vi nu stoppar in = 0:7 och n = 100 så erhålls den funktion som 

är skisserad i …guren nedan. Observera att dess minimum ligger precis 

0:005 över -axeln (även om det kan vara svårt att se). 

c Mikael Möller

9. Linjär regression – 

enkel 

217

218 

c Mikael Möller

10. Linjär regression – 

multipel 

219

220 

c Mikael Möller

11. Icke linjär regresion 

221

222 

c Mikael Möller

12. Logistisk regression 

Logistisk regression är en statistisk analysmetod för att dels utröna 

vilka förklarande variabler (x1; x2; : : : ; xm) som signi…kant påverkar en 

diskret svarsvariabel (Y , som endast antar värdena 0 eller 1) och dels 

göra förutsägelser på svarsvariabeln för en given uppsättning förklarande 

variabler. För svarsvariabelns väntevärde ansätts 

E( Y j x1; x2; : : : ; xm ) = p(x1; x2; : : : ; xm) 

d v s att väntevärdet är någon funktion, en sannolikhet, av de förklarande 

variablerna (x1; x2; : : : ; xm). De förklarande variablerna kan här vara 

kontinuerliga och/eller diskreta. Om vi antar att funktionen är linjär, 

d v s att vi har en multipel linjär regression, så gäller 

p(x1; x2; : : : ; xm) = 0 + 1x1 + + mxm, 

men de mätfel som görs vid denna modell är ej normalfördelade och ej 

heller har mätfelen konstant varians –hela teorin för linjär regression 

bryter samman. Därför måste vi ta fram en speciell teori för dylika 

svarsvariabler/modeller en teori där p(x1; x2; : : : ; xm) är en sannolikhet. 

12.1 När är logistisk regression användbart 

Låt oss börja med att betrakta tre exempel där logistisk regression är 

lämplig att använda. 

Exempel 60 I en programmeringstävling ingick bland annat att konstruera 

en algoritm som på en given tid skulle lösa ett givet problem. 

Deltagarna hade en på förhand bestämd tid på sig att lösa problemet och 

beroende på deras resultat klassades de som 1 (löst uppgiften) respektive 

0 (ej löst uppgiften). Över deltagarna …nns en förteckning över deras 

meriter och däribland antalet månader som de arbetat med programmering. 

Frågan är nu om programmerarens erfarenhet spelar någon roll för 

dennes förmåga att lösa uppgiften. Denna fråga kan i vårt statistiska 

språk uttryckas som: beror P (Y = 1) av den oberoende variabeln x = 

erfarenhet? När tävlingen var klar erhölls följande tabell över de 19 

deltagarna. I tabellen står S (1) för att programmeraren lyckades lösa 

uppgiften och F (0) för motsatsen: 

223

224 12.1. När är logistisk regression användbart 

Tabell 12.1: Resultattabell för programmeringstävlingen. 

Programmerare 1 2 3 4 5 6 7 8 9 10 

Erfarenhet 14 29 6 25 18 4 8 12 22 28 

Resultat F F F S S F S F S S 

Programmerare 11 12 13 14 15 16 17 18 19 

Erfarenhet 30 11 19 5 20 13 9 32 24 

Resultat S F F F S F F S F 

Den modell vi här ansätter är 

Yi = p(xi) + i 

i = 1; 2; : : : ; 25, 

där Yi = 1 om programmerare i lyckats lösa uppgiften och 0 annars. Den 

förklarande variabeln, xi, är här antalet månaders programmeringserfarenhet. 

1,2 

1,0 

0,8 

0,6 

0,4 

0,2 

0,0 

0,2 

0 5 10 15 20 25 30 35 

Figur 12.1: Programmerare som löser en uppgift (1 = lyckas och 0 = 

misslyckas) 

När vi ovan ritar en bild av svarsvariabeln, Y , som funktion av den 

förklarande variabeln, x, så blir bilden rätt intensägande ty vi erhåller 

endast två linjer av punkter. Där …nns ingen uppenbar information om 

det vi är ute efter – sannolikheten p(x) = E( Y j x ). Detta gör den 

logistiska regressionen mindre intuitiv än den linjära regressionen där 

punkterna ansluter sig till E( Y j x ). 

Ett möjligt användningsområde kan vara en person som anställer programmerare 

och som med hjälp av denna modell fattar beslut om anställning 

(1) eller ej (0). Självklart räcker det ej med en enda förklarande 

c Mikael Möller

12. Logistisk regression 225 

variabel, vilket data också ger uttryck för, ty programmerare 7 har endast 

8 månaders erfarenhet men lyckas ändock lösa uppgiften på stipulerad tid 

men programmerare 2 har 29 månaders erfarenhet och misslyckas. 

I ovanstående exempel fanns endast en mätning per x-värde och vi säger 

då att data är ogrupperade. Om vi hade haft ‡era programmerare med 

samma erfarenhet så säges data vara grupperade. För att illustrera grupperade 

data byter vi dock till nedanstående exempel. 

Exempel 61 ICA sänder ut rabattkuponger till 1000 hushåll. Av dessa 

rabattkuponger fanns det 200 av varje av 2, 4, 6, 8 och 10 procents rabatt. 

Rabatten gällde vid ett och samma köptillfälle av en speciell vara. 

Svarsvariabeln Y är 1 (Ja) om hushållet använt rabattkupongen och 0 

(Nej) annars. 

Tabell 12.2: Använda rabattkuponger 

Rabatt Hushåll Använt 

2 32 1 

4 51 1 

6 70 1 

8 103 1 

10 148 1 

2 168 0 

4 149 0 

6 130 0 

8 97 0 

10 52 0 

Eftersom det kostar pengar att göra utskick samt ge rabatt måste ett 

tillräckligt stort antal kuponger användas för att det skall bli lönsamt. 

Därför önskar ICA hitta en optimal rabattsats och ett delsvar är att 

…nna en skattning på andelen kunder som verkligen utnyttjar rabatten. 

Om vi plottar data i en …gur erhålls …gur 12.2 på sid 226. Observera 

att varje punkt i denna …gur består av ‡era observationer. Till exempel 

består observation (2; 1) av 32 observationer och observation (10; 0) av 

52 observationer. Den modell vi här ansätter blir därför en utvidgning 

av modellen i exempel 60: 

Yi;j = p(xi) + i;j i = 1; 2; 3; 4; 5 j = 1; 2; : : : ; 200, 

där Yi;j = 1 (Ja) om det j:te av de hushåll som …ck rabatten xi har 

utnyttjat rabatten och 0 (Nej) om de ej utnyttjat rabatten. Den förklarande 

variabeln, xi, är rabattens storlek och till varje storlek …nns en 

c Mikael Möller

226 12.1. När är logistisk regression användbart 

studerad grupp om totalt 200 hushåll. Eftersom vi har ‡er observationer 

1,2 

1,0 

0,8 

0,6 

0,4 

0,2 

0,0 

0,2 

2 4 6 8 10 

Figur 12.2: Rabattkuponger 

per rabattsats har vi också ritat in de skattade värdena av proportionen 

använda rabattkuponger (punkterna ) vid rabattsatsen xi d v s 

^p(2) = 32 

148 

; ; ^p(10) = 

200 200 . 

Vi avslutar med ett exempel inom bankväsendet som troligen återigen 

kommer att bli högaktuellt. 

Exempel 62 Försäkringssparbanken säljer bostadslån till enskilda hushåll. 

För att skydda sig mot eventuella obehagligheter och därmed hålla 

kreditförlusterna nere avkrävs varje låntagare uppgifter om tidigare betalningsinställelser, 

aktuell årsinkomst (medelvärdet av de senaste 5 åren), 

aktuell förmögenhet (ej fastigheter) m m. Efter 5 år har man dessutom 

noteringar över vilka lån där låntagaren någon gång under perioden haft 

problem med att amortera och/eller betala räntorna. Utifrån dessa noteringar 

har man bland annat framställt tabellen 12.3 på sid 227. Den 

modell vi här ansätter är densamma som i exempel 61 men med den 

skillnaden att vi har en variabel gruppstorlek: 

Yi;j = p(xi) + i;j i = 1; 2; 3; : : : ; 11; j = 1; 2; : : : ; ni, 

där Yi;j är 1 (Ja) om det j:te lånet vid årsinkomst xi ej har amorterats 

enligt plan och 0 (Nej) annars. Den förklarande variabeln, xi, är här 

c Mikael Möller


årsinkomstens storlek och till varje årsinkomst; xi, …nns en grupp om ni 

lån. 

Tabell 12.3: Resultat beviljade bostadslån. 

Problemlån Ej problemlån 

Inkomst Problem Antal lån Problem Antal lån 

0 0 567 1 183 

25 0 32 1 8 

75 0 70 1 20 

125 0 218 1 32 

175 0 788 1 48 

225 0 1329 1 81 

275 0 1289 1 31 

350 0 996 1 24 

450 0 227 1 3 

600 0 150 1 0 

850 0 79 1 1 

Om vi plottar data i en …gur erhålls …gur 12.3 och även i denna …gur 

består varje punkt av ‡era observationer.Till exempel består observation 

(0; 1) av 183 lån med problem och observation (850; 0) av 79 lån utan 

problem. Vi har även här ritat in de skattade proportionerna (punkterna 

). Vi får här en kurva som avtar mot 0 till skillnad från kurvan i 

1,2 

1,0 

0,8 

0,6 

0,4 

0,2 

0,0 

0,2 

100 0 100 200 300 400 500 600 700 800 900 

Figur 12.3: Bostadslån 

föregående exempel som växte mot 1. Om vi istället valt att betrakta de 

c Mikael Möller

228 12.2. Hur ser p(x1; : : : ; xm) ut 

problemfria lånen så kommer vi tillbaks till en kurva som växer mot 1. 

Nu låter sig inte betalningsförmågan beskrivas med ett så enkelt mått som 

årsinkomsten utan man bör även ta till vara andra möjliga förklarande 

variabler som förmögenhet, kön, ålder, och tidigare betalningsanmärkningar. 

Gör man detta erhålls istället den mer allmäna modellen 

Yi;j = p(x1;i; : : : ; xm;i) + i;j i = 1; 2; : : : ; 11, j = 1; 2; : : : ; ni, 

där antalet förklarande variabler är m. Av de tidigare 5 uppräknade 

förklarande variablerna är inkomst, förmögenhet och ålder kontinuerliga 

och kön (Man/Kvinna) samt betalningsanmärkningar (Ja/Nej) diskreta. 

Ett användningsområde är att för en låneansökan bestämma om ett lånesökande 

hushåll skall få ett bostadslån eller ej. 

Innan vi går vidare med ovanstående tre exempel behöver vi utreda 

strukturen hos väntevärdet 

E( Y j x1; x2; : : : ; xm ) = p(x1; x2; : : : ; xm). 

12.2 Hur ser p(x1; : : : ; xm) ut 

I de exempel som getts framgår att E( Y j x ) för varje värde på x är 

en sannolikhet samt att när x växer så växer denna sannolikhet mot 1 

och när x avtar så avtar sannolikheten mot 0 (tvärtom gäller i exempel 

62). I exempel 60 gäller ju att den som inte har någon programmeringserfarenhet 

överhuvudtaget har sannolikheten 0 att kunna klara av 

uppgiften på stipulerad tid. Omvänt bör en mycket erfaren programmerare 

ha en sannolikhet nära 1 för att klara uppgiften. Strukturen hos 

p(x) bör därför ha formen av en fördelningsfunktion (eller en spegelvänd 

sådan som i exempel 62). 

I avsnitt 12.2.1 tar vi fram denna sannolikhet med hjälp av en spelbetraktelse 

(odds) och i avsnitt 12.2.1 med hjälp av en populationsbetraktelse. 

12.2.1 Logistisk regressionsmodell via odds 

För att …nna ett uttryck för E( Y j x ) skall vi betrakta begreppet odds. 

Detta är ett typiskt spelbegrepp och välkänt bland alla hasardspelare. 

Låt oss därför resonera som en sådan: Bakom en skärm …nns en person 

(man eller kvinna) och om denna person får du veta dennes längd, x, 

och utifrån denna information skall du gissa på kön. Oddset för att gissa 

c Mikael Möller


rätt de…nieras av 

odds = 

antal kvinnor av längd x 

antal män av längd x 

och anses vara känt (det mesta …nns registrerat i Sverige så varför inte 

en uppdelning på längd). Begreppet odds låter sig nu uttryckas i sannolikhetsteoretiska 

termer ty vi kan dividera med ’antal personer av längd 

x’varvid 

odds = 


antal personer av längd x 

antal män av längd x 


= p(x) 

1 p(x) 

= 

1 





där vi de…nierat 


p(x) = = proportionen kvinnor av längd x. 


Antag att proportionen kvinnor av längd 185 cm är 0:1. Oddset för en 

kvinna, om vi får veta att längden är x = 185, är då 

oddsk = 0:1 1 

= = 1 till 9 

0:9 9 

och motsvarande odds för en man blir 

oddsm = 0:9 9 

= = 9 till 1. 

0:1 1 

Vi ser genast följande mycket enkla samband 

1 

odds för kvinna = 

odds för man 

d v s att ’odds för kvinna’ ’odds för man’= 1. Men eftersom det traditionellt 

är enklare att räkna med + och än med och och vi 

dessutom strävar mot enkla modeller (på något sätt vill vi ha en linjär 

modell) så logaritmerar vi oddset (då blir nämligen 

enligt logaritmlagarna 

+ och ) och 

1 har vi 

ln(odds för kvinna) = ln(odds för man). 

Med hjälp av den ovan införda sannolikheten p(x) kan denna senare 

ekvation även formuleras som 

ln 

p(x) 

1 p(x) 

= ln 1 p(x) 

p(x) 

1 Enligt det matematiska språket skall ln uttydas som den naturliga logaritmen 

d v s basen är det naturliga talet e = 2: 718 3. 

. 

c Mikael Möller

230 12.2. Hur ser p(x1; : : : ; xm) ut 

Approximation av odds 

Ovan införde vi begreppet odds samt dess logaritm 2 för att komma fram 

till ett förslag på utseendet hos E( Y j x ). Eftersom hela vitsen med logaritmeringen 

var att ersätta alla med + och alla med så approximerar 

vi det logaritmerade värdet av ln(odds) med ett linjärt uttryck 3 

d v s vi sätter 

ln 

p(x) 

1 p(x) = 0 + 1x. 

Vårt nästa steg är att hitta ett uttryck för p(x) och studera vilka egenskaper 

detta p(x) har. Först några standardomskrivningar 

ln 

p(x) 

1 p(x) = 0 + 1x 

p(x) 

= e 0+ 1x 

1 p(x) 

p(x) = 1 p(x) e 0+ 1x . 

Ur den sista ekvationen löses sannolikheten, p(x), till 

p(x) = 

e 0+ 1x 

= 

1 + e 0+ 1x 

1 

1 + e 0 1x . 

Låt oss se om detta uttryck på p(x) = E( Y j x ) uppfyller kraven på en 

sannolikhet. Notera att parametern 0:s tecken är ointressant eftersom 

e 0 är en positiv konstant oavsett värdet på 0. 

Antag först att parametern 1 är positiv. Vi ser då att p( 1) = 0 

och p(1) = 1 samt att alla tal mellan 0 och 1 antas men inga andra. 

Antag nu att parametern 1 är negativ. Vi ser då att p( 1) = 1 

och p(1) = 0 samt att alla tal mellan 0 och 1 antas men inga andra. 

Det gäller därför att det funna uttrycket 

p(x) = 

1 

1 + e 0 1x 

2 Det …nns andra logaritmer än ln som t ex log som står för 10-logaritmen vilken 

använder sig av basen 10. Denna var före räknedosornas tid rätt populär men har 

förlorat i in‡ytande ty den ställer till problem i många sammanhang. Man måste 

dras med en irriterande konstant. 

3 Eftersom linjära modeller är linjära i sina parametrar kan vi om så krävs 

ansätta modellen 

p(x) 

ln 

1 p(x) = + 1x + + kx k 

och därmed erhålla godtycklig noggranhet. 

c Mikael Möller


uppträder som en sannolikhet. I …gur 12.4 ges hur denna sannolikhet 

beror av x för några olika värden på parametrarna 0 och 1. 

1 

0.8 

0.6 

0.4 

0.2 

1 

0 

1 2 3 4 5 6 

p(x) = 

e 4+2x 

1+e 4+2x 

1 

0.8 

0.6 

0.4 

0.2 

2 1 

0 

1 2 3 4 5 

p(x) = 

e4 

2x 

1+e4 2x 

Figur 12.4: Två sannolikhetsmodeller som kan genereras med den föreslagna 

metoden. 

Jämför dessa två möjliga utseenden med …gur 61 på sid 225 och …gur 

62 på sid 226. Vi ser att …gur 61 liknar den vänstra …guren ovan och 

…gur 62 liknar den högra (eller snarare delar av dessa). 

12.2.2 Logistisk regressionsmodell via tillväxtmodell 

När vi i föregående avsnitt tog fram väntevärdet för vår responsvariabel 

införde vi en approximation för logaritmen av oddset och det är något 

otillfredsställande. Här skall vi göra en annan härledning av väntevärdet. 

Nu baserat på tillväxten av en populationsmodell. Detta avsnitt kräver 

kunskap om di¤erentialekvationer och integraler och vänder sig därför 

endast till de läsare som har dessa kunskaper. Innehållet i detta avsnitt 

kommer ej behövas längre fram och det kan därför hoppas över. 

Modell 

Vi skall betrakta en population (rabattkuponger, människor, tävlande 

m m) och studera hur den tillväxer under vissa naturliga antaganden som 

t ex begränsat livsutrymme. 

Sätt 

Y (t) = en populations storlek vid tidpunkt t 

och vi intresserar oss för populationens storlek vid tidpunkten t + dt. En 

c Mikael Möller

232 12.2. Hur ser p(x1; : : : ; xm) ut 

första approximation av Y (t + dt) kan nu skrivas 

Y (t + dt) = Y (t) + Y (t) dt 

där dt är ett litet tidsavsnitt. I ord blir detta att populationens storlek 

vid tidpunkt t + dt är först populationens storlek vid tidpunkt t plus en 

ökning/minskning av populationen som är proportionell mot en universiell 

konstant och tidsavsnittet dt. Det verkar rimligt att ju kortare 

tidsavsnitt desto mindre ökning och vice versa. 

Denna ekvation kan skrivas om till 

Y (t + dt) Y (t) 

dt 

= Y (t) 

och om vi låter dt ! 0 så går vänstra ledet mot derivatan av Y (t) d v s 

vi har 

dY (t) 

Tillväxten = = Y (t) . 

dt 

Detta är en di¤erentialekvation och den har lösningen 

Y (t) = e 

som tyvärr leder till orimligheter –en population kan inte växa obegränsat. 

Antag därför att dess största möjliga storlek är N (t ex kan inte 

jordens befolkning bli hur stor som helst). Detta rimliga antagande gör 

att vi kan införa en begränsningsfaktor N Y (t). Om vi dessutom delar 

faktorn med N d v s vi betraktar kvoten 

N Y (t) 

N 

+ t 

0 Y (t) N 

så får vi en faktor som ligger mellan 0 och 1 (här får av naturliga skäl 

Y (t) bara anta värden mellan 0 och N). Detta leder oss till en modi- 

…erade di¤erentialekvation för tillväxten: 

dY (t) 

Tillväxten = = 

dt 

N 

Y (t) 

Y (t) 

N 

= Y (t) 1 

Y (t) 

N 

. 

Om båda leden delas med N erhålls 


Y (t) 

d N 

dt 

= Y (t) 

N 

1 

Y (t) 

N


och vi betraktar 

Y (t) 

p (t) = 

N 

som den möjliga proportionen. Ekvationen för denna proportion blir 

dp (t) 

dt 

= p (t) 1 p (t) . 

Denna ekvation kan lösas medelst separering (separabel di¤erentialekvation) 

Z 

dp (t) 

p (t) 1 p (t) = 

Z 

dt 

Högra ledet blir Z 

och vänstra ledet blir 

Z 

V L = 

varför 

Z 

= 

dt = + t 

dp (t) 

p (t) 1 p (t) 

1 

p (t) 

1 

1 p (t) 

= ln p (t) ln (1 p (t)) 

= ln 

ln 

p (t) 

1 p (t) 

p (t) 

= + t. 

1 p (t) 

Om vi löser ut p (t) i denna ekvation så erhålls 

p (t) = 

1 

1 + e 

t 

dp (t) 

vilket stämmer bra med tidigare resultat. Det är således införandet av 

en övre gräns som ger väntevärdet dess karakteristiska form. 

12.3 Hur bestäms parametrarna 0 och 1 

Vi har nu gett en möjlig beskrivning av väntevärdet, E( Y j x ), för 

svarsvariabeln (Y = 0 eller 1) och visat att detta värde ligger mellan 

0 och 1. Det återstår att …nna en metod för att skatta de i modellen 

c Mikael Möller

234 12.3. Hur bestäms parametrarna 0 och 1 

ingående parametrarna 0 och 1. Vi ställer därför frågan: Finns det 

någon metod att skatta parametrarna 0 och 1 i den logistiska regressionsmodellen 

Yi = 

1 

1 + e 0 1xi + i i = 1; 2; : : : ; n 

där i är generaliserat Bernoullifördelade. Svaret på denna fråga är att 

en sådan metod …nns –Maximum Likelihoodmetoden. Denna metod går 

ut på att man bestämmer parametrarna 0 och 1 så att sannolikheten 

för det utfall man fått blir så sannolikt som möjligt. 4 Vi har därför att 

maximera funktionen 

L( 0; 1) = P (Y1 = y1; Y2 = y2; : : : ; Yn = yn : 0; 1) 

med avseende på 0 och 1. Här beskriver talen y1; y2; : : : ; yn det utfall 

(de observationer) som vi …ck, t ex utfallet 0; 1; 0; : : : ; 1. Men eftersom 

vi har oberoende observationer kan denna funktion skrivas 

L( 0; 1) = P (Y1 = y1 : 0; 1) P (Yn = yn : 0; 1) 

nY 

= P (Yi = yi : 0; 1) 

i=1 

och vi behöver därför endast bestämma P (Yi = yi : 0; 1). Det gäller nu 

att Yi är Bernoullifördelad med sannolikheten pi = p(xi) för att ’lyckas’ 

varför 

P (Yi = yi : 0; 1) = p yi 

i (1 pi) 1 yi ; yi = 0; 1 

(inses om man först sätter yi = 1 och sedan 0). Men 

varför 

P (Yi = yi : 0; 1) = 

= 

pi = 

1 

1 + e 0 1xi 

1 

1 + e 0 1xi 

1 

1 + e 0 1xi 

yi 

yi 

1 

1 

1 + e 0 1xi 

e 0 1xi 

1 + e 0 1xi 

1 yi 

1 yi 

4 Den mer generella modellen med m parametrar och ni observationer per grupp 

tillför inget nytt utan ger endast mer komplicerade uttryck. 


.


Eftersom vi alltid kan numrera om data så är det ingen inskränkning att 

anta att de första n1 mätningarna ger resultatet 1 och de övriga n n1 

resultatet 0. Vi antar därför att 

Y1 = Y2 = = Yn1 = 1 och Yn1+1 = Yn1+2 = = Yn = 0. 

Denna omnumrering ger oss slutligen följande mer hanterbara uttryck på 

likelihoodfunktionen (observera att n1 = Pn i=1 yi varför observationerna 

yi ingår i funktionen) 

L( 0; 1) = 

= 

n1 Y 

i=1 

1 

1 + e 0 1xi 

n1 Y 

e 

i=1 

nY 

(1 + e 

i=1 

0+ 1xi 

0+ 1xi) 

. 

nY 

i=n1+1 

e 0 1xi 

1 + e 0 1xi 

För att …nna maximum av funktionen L( 0; 1) gissar man lämpliga 

startvärden på 0 och 1 och medelst en iterationsteknik genererar man 

i varje iteration nya värden 0 och 1. Förfarandet avslutas när tillräcklig 

noggrannhet uppnåtts. 5 

12.3.1 För att summera och generalisera 

I vår summering betraktar vi den mer allmänna modellen som har m 

förklarande variabler x1; x2; : : : ; xm ty det innebär egentligen ingen extra 

svårighet (tänk igenom de olika stegen ovan med m förklarande variabler 

istället för med en). Vi gör nu följande de…nition: 

De…nition 48 (av logistisk regression.) Logistisk regression är en statistisk 

analysmetod för att kunna göra förutsägelser på en diskret svarsvariabel 

Y , som endast antar värdena 0 eller 1. Dess väntevärde de…nieras 

av 

E( Y j x1; x2; : : : ; xm ) = 

1 

1 + e 0 1x1 2x2 mxm . 

De förklarande variablerna x1; x2; : : : ; xm kan vara kontinuerliga eller 

diskreta. 

5 Likelihoodfunktionens komplicerade utseende gör att man måste förlita sig på 

något statistiskt program. 

c Mikael Möller

236 12.4. Tillbaks till exemplen 

Den logistiska regressionsmodellen för en förklarande variabel, xi, skrivs 

Yi = 

1 

1 + e 0 1xi + i i = 1; 2; : : : ; n, 

där i; i = 1; 2; : : : ; n är n oberoende generaliserat Bernoullifördelade 

variabler för vilka det gäller att 

P ( i = e) = pi om e = 1 pi 

1 pi om e = pi. 

Denna regressionsmodell används när svarsvariabeln endast antar två 

värden och man dels vill förstå vilka av de förklarande variabler (given 

information) som signi…kant påverkar mätresultatet och dels när man 

vill göra prognoser. 

12.4 Tillbaks till exemplen 

Vi skall nu åter betrakta exemplen från avsnitt 12.1. 

Exempel 63 I en programmeringstävling ingick bland annat att konstruera 

en algoritm som på en given tid skulle lösa ett givet problem. 

Deltagarna hade en på förhand bestämd tid på sig att lösa problemet och 

beroende på deras resultat klassades de som 1 (löst uppgiften) respektive 

0 (ej löst uppgiften). Över deltagarna …nns en förteckning över deras 

meriter och däribland antalet månader som de arbetat med programmering. 

Data …nns i tabell 12.1 sid 224. Frågan är nu om programmerarens 

erfarenhet spelar någon roll för dennes förmåga att lösa uppgiften samt 

vad är sannolikheten att en programmerare med 10 månaders erfarenhet 

löser uppgiften? 


Yi = 

1 

1 + e 0 1xi + i i = 1; 2; : : : ; 25 

där Yi är 1 om programmeraren lyckats lösa uppgiften och 0 annars. Den 

förklarande variabeln, xi, är antalet månaders programmeringserfarenhet 

som programmeraren har och i:na är oberoende och generaliserat 

Bernoullifördelade mätfel. Givet data enligt tabell 12.1 så erhålls följande 

observerade skattningar av 0 och 1 


b0 = 3:05970 (1:25959) 

b1 = 0:16149 (0:065)


med standardavvikelser angivna inom parentes. Detta ger den skattade 

sannolikheten (väntevärdet av Y ) vid 10 månaders programmeringserfarenhet 

till 

^p(10) = 

1 

= 0:191 

1 + e3:05970 0:16149 10 

Denna sannolikhet kan även erhållas ur …guren nedan. Eftersom vi bara 

1,2 

1,0 

0,8 

0,6 

0,4 

0,2 

0,0 

0,2 

0 5 10 15 20 25 30 35 

Figur 12.5: Programmering (forts). 

har en observation per punkt kan vi inte med data:s hjälp påvisa att 

modellen är rimlig. Den beskrivna situationen torde dock ge upphov till 

en skattad sannolikhet av denna typ. 

Exempel 64 ICA sänder ut rabattkuponger till 1000 hushåll. Av dessa 

rabattkuponger fanns det 200 av varje med 2, 4, 6, 8 och 10 procents 

rabatt. Rabatten gällde för ett och samma köptillfälle av en speciell vara. 

Data …nns i tabell 12.2 sid 225. Eftersom det kostar pengar att göra utskick 

samt ge rabatt måste ett tillräckligt stort antal kuponger användas för 

att det skall bli lönsamt. Därför önskar ICA hitta en optimal rabattsats 

och ett delsvar är att …nna en skattning på proportionen kunder som 

verkligen utnyttjar rabatten. För att ta igen förlorade marknadsandelar 

planerar man nu en rabattsats på 15 procent . Hur stor proportion av 

utdelade kuponger kan ICA förvänta sig blir inlösta? 

Lösning 48 Eftersom vi här har att göra med grupperade data med lika 

många observationer per grupp sätter vi 

Yi;j = 

1 

1 + e 0 1xi + i;j i = 2; 4; 6; 8; 10; j = 1; 2; : : : ; 200, 

c Mikael Möller

238 12.4. Tillbaks till exemplen 

där Yi;j är 1 om det j:te av de hushåll som …ck rabatten xi har utnyttjat 

rabatten och 0 annars. Den förklarande variabeln, xi, är rabattens storlek 

och till varje storlek …nns en studerad grupp om 200 hushåll. För mätfelen 

i gäller att de är oberoende och generaliserat Bernoullifördelade. 

Givet data enligt tabell 12.2 så erhålls följande observerade skattningar 

av 0 och 1 

b0 = 2:4531 (0:1891) 

b1 = 0:3305 (0:0271) 

med standardavvikelser inom parentes. Detta ger den skattade proportionen 

inlösta rabattkuponger (väntevärdet av Y ) vid rabattstorleken 15 

procent till 

^p(15) = 

1 

= 0:92 

1 + e2:4531 0:3305 15 

Denna sannolikhet kan även erhållas ur …guren nedan. I detta exempel 

1,2 

1,0 

0,8 

0,6 

0,4 

0,2 

0,0 

0,2 

2 4 6 8 10 12 14 16 

Figur 12.6: Rabattkuponger (forts). 

har vi ‡er observationer per xi och kan lokalt skatta p (xi) (punkterna 

). Vi ser att de så erhållna skattningarna väl ansluter till den angivna 

modellen. 

Exempel 65 Försäkringssparbanken ger bostadslån till enskilda hushåll. 

För att skydda sig mot eventuella obehagligheter och därmed hålla kreditförlusterna 

nere avkrävs varje låntagare uppgifter om tidigare betalningsinställelser, 

aktuell årsinkomst (medelvärdet av de senaste 5 åren), 

aktuell förmögenhet (ej fastigheter) m m. Vad är sannolikheten för att 

en kund med årsinkomst 150 000 kronor skall amortera enligt plan? 

c Mikael Möller


Lösning 49 Eftersom vi här har att göra med grupperade data med olika 

antal observationer per grupp sätter vi 

Yi;j = p(xi) + i;j i = 1; 2; : : : ; 11 j = 1; 2; : : : ; ni, 

där Yi;j är 1 (Ja) om det j:te lånet vid årsinkomst xi ej har amorterats 

enligt plan och 0 (Nej) annars. Den förklarande variabeln, xi, är 

här årsinkomstens storlek och till varje årsinkomst; xi, …nns en grupp 

om ni lån. Givet data enligt tabell 12.3 så erhålls följande observerade 

skattningar av 0 och 1 

b0 = 1:1248 (0:0774) 

b1 = 0:0081 (0:0004) 

med standardavvikelser inom parentes. Detta ger den skattade sannolikheten 

till 

^p(150) = 

1 

= 0:088 

1 + e1:12481+0:0081 150 

Denna sannolikhet kan även erhållas ur …guren nedan. Även i detta ex- 

1,2 

1,0 

0,8 

0,6 

0,4 

0,2 

0,0 

0,2 

100 0 100 200 300 400 500 600 700 800 900 1000 

Figur 12.7: Bostadslån (forts). 

empel har vi ‡er observationer per xi och kan lokalt skatta p (xi). Punkterna 

ansluter sig även här till den antagna modellen. 

c Mikael Möller

240 12.5. Hur man tolkar parametrar 

12.5 Hur man tolkar parametrar 

Vid den linjära regressionsmodellen 

E( Y j x ) = 0 + 1x 

tolkas parametrarna 0 och 1 på följande sätt: 0 är linjens skärning 

med y-axeln (d v s när x = 0) och 1 är linjens lutning. Parametern 0 

har ingen annan tolkning än som y-värdet för x = 0. Men för parametern 

1 gäller att om Y är en persons vikt i kg och x en persons längd i cm 

så blir sorten för 1 kg/cm ty annars blir inte sorten för 1x mätt i 

kg. Om vi deriverar funktionen E( Y j x ) med avseende på x så erhålls 

ekvationen 

Denna kan även skrivas 

1 = 

dE( Y j x ) 

. 

dx 

dE( Y j x ) = 1dx 

och dess tolkning är att en ökning av dx med 1 enhet ger en ökning i 

E ( Y j x ) med 1 enheter. Parametern 1 är därför en ökningsparameter 

–hur mycket vikten ökar per cm. Vad gäller nu för parametrarna vid en 

logistisk regression? 

För den logistiska regressionsmodellen gäller att 

ln 

E( Y j x ) 

1 E( Y j x ) = 0 + 1x 

och eftersom vänstra ledet är en dimensionslös storhet följer att även 

det högra ledet måste vara dimensionslöst. Detta ger att parametern 

0 är dimensionslös samt att 1 har dimensionen 1/x:s enhet d v s om 

x är längd i cm så har 1 dimensionen 1/cm. Nu känns det inte riktigt 

naturligt att betrakta den naturliga logaritmen av odds:et så vi övergår 

till att betrakta sannolikheten 

E( Y j x ) = 

1 

1 + e 0 1x 

och skall för denna se vad parametrarna kan tolkas som. 

Om vi till att börja med sätter x = 0 så erhålls som tidigare skärningen 

med y-axeln och denna skärning sker för 


1 

E( Y j x ) = 

1 + e 0 

= e 0 

1 + e 0


d v s om 0 > 0 och växer så ‡yttas grafen för p(x) = E( Y j x ) åt 

höger och tvärtom om 0 < 0 och avtar. För att …nna en tolkning av 1 

deriverar vi funktionen p(x) varvid 

dp (x) 

dx 

= dE( Y j x ) 

dx 

= 1 

e 0 1x 

1 + e 0 1x 2 

vilket i denna form inte är något annat än ett komplicerat uttryck. 

Uppgift 31 Derivera funktionen 

med avseende på x. 

f(x) = 

1 

1 + e 0 1x 

Vi noterar dock att sannolikheten E ( Y j x ) ingår som en del av 

uttrycket:s högerled och leds därför till följande omskrivning (där vi 

använder knepet att lägga till 1 och dra ifrån 1): 

dE( Y j x ) 

dx 

0 1 + e 1x 1 

= 1 

(1 + e 0 1x 2 

) 

= 1 

Men detta känns igen som 

dE( Y j x ) 

dx 

1 

1 + e 0 1x 

1 

1 + e 0 1x 

2 ! 

= 1E( Y j x ) 1 E( Y j x ) . (12.1) 

Derivatan av E( Y j x ) är därför parametern 1 multiplicerad med variansen 

för det mätfel vi gör. Nu gäller att denna varians är störst, 0:25, 

när p(x) = E( Y j x ) = 0:5 och att den avtar när p(x) närmar sig 0 eller 

1, i enlighet med …guren nedan 

Av detta följer att varje satsad enhet i x ger störst resultat när p(x) 

ligger nära 0:5 och ett litet resultat när p(x) ligger nära 0 eller 1. 

Formeln 12.1 kan även skrivas som 

dE( Y j x ) = 1p(x) 1 p(x) dx 

d v s att för varje ökning av dx med 1 enhet så beror ökningen i p(x) = 

E( Y j x ) på parametern 1 multiplicerad med variationen vid det givna 

värdet på x. 

. 

c Mikael Möller

242 12.6. Övningar 

0.4 

0.3 

0.2 

0.1 

12.6 Övningar 

0 

0.2 0.4 0.6 0.8 1 

Figur 12.8: Variansen v(x) = p(x) (1 p(x)). 

En aktieanalytiker vill studera hur bokslutsinformation påverkar aktiekursen 

för olika aktier. Han studerar därför 40 olika bolag och jämför 

vinsten från bokslutskommunikén med vinstbedömningen strax före 

publiceringen. Han bildar sedan följande förklarande variabel 

x = 

verklig vinst per aktie prognosticerad vinst per aktie 

aktiens värde 

och noterar vilka bolag som haft kursuppgång (Y = 1) respektive kursnedgång 

(Y = 0). Dessa observationer ger upphov till följande datatabell 

Tabell 12.4: Köpa eller inte köpa? 

Y 1 1 1 1 1 1 1 1 1 1 

x 1:2 0:7 0:5 0:2 0:2 0:1 0:1 0 0 0:1 

Y 1 1 1 1 1 1 1 1 1 1 

x 0:1 0:2 0:3 0:5 0:5 0:6 0:8 0:8 0:8 0:9 

Y 1 1 1 1 1 1 1 0 0 0 

x 1:1 1:2 1:4 1:4 1:7 2:3 3:7 2:2 1:7 1:0 

Y 0 0 0 0 0 0 0 0 0 0 

x 0:6 0:2 0:1 0 0 0:3 0:4 0:8 1:4 1:4 


100


Bilda en lämplig statistisk modell och skatta sannolikheten för en 

kursuppgång när x = 1? Är den utförda analysen tillförlitlig? 

där 

Sätt 

Y = 

1 om kursuppgång 

0 om kursnedgång 

E( Y j x ) = 

e 0+ 1x 

. 

1 + e 0+ 1x 

Parametrarna 0 och 1 skattas till (med standardavvikelser inom parentes) 

0obs = 0:56 (0; 36) 

1obs = 0:76 (0:41) 

och vi observerar att för båda parametrarna gäller att intervallen skattning 

två standardavvikelser innehåller 0. En plot av data ger …guren 

1,2 

1,0 

0,8 

0,6 

0,4 

0,2 

0,0 

0,2 

3 2 1 0 1 2 3 4 

Sannolikheten för kursuppgång 

E( Y j x = 1 ) = 

e0:56+0:76 1 

1 + e 0:56+0:76 1 0:79 

men på grund av att kon…densintervallen innehåller 0 är detta resultat 

mycket osäkert. 

Ett företag lanserar en ny produkt och satsar en miljon i veckan, 

under fyra veckor, i reklam. Man vill studera hur andelen i befolkningen 

som har hört talas om produkten växer med tiden och låter därför 

ett opinionsinstitut ringa upp, varje dag, ett slumpmässigt urval om 50 

c Mikael Möller


personer vilka tillfrågas om de känner till produkten eller ej. Genom att 

ansätta den logistiska regressionsmodellen med Y = 1 om den uppringda 

personen hört talas om produkten och 0 annars samt som förklarande 

variabel, x, använda antalet dagar som gått sedan introduktionen så erhålls 

parameterskattningarna 0 = 3:13 (0:18) och 1 = 0:308 (0:016) 

med standardavvikelser angivna inom parentes. 

1. Skissa det förväntade värdet d v s sannolikheten för att en slumpmässigt 

tillfrågad person skall känna till produkten. 

2. Efter hur många dagar känner halva befolkningen till produkten? 

Den logistiska regressionsmodellen ger: 

1. det förväntade värdet 

ger oss …guren 

1.2 

1 

0.8 

0.6 

0.4 

0.2 

0 

E( Y j x ) = 

e 3:13+0:308x 

1 + e 3:13+0:308x 

10 20 30 

2. Antalet dagar …nner vi genom att lösa ekvationen 

0:5 = 

Denna kan skrivas om till 

ln 

3:13+0:308x 

e 

. 

1 + e 3:13+0:308x 

0:5 

= 3:13 + 0:308x 

1 0:5 

och denna har lösningen x = 3:13 

0:308 = 10:162 d v s drygt 10 dagar. 

c Mikael Möller


[forts]Om företaget i övning 12.6 är nöjda med att 80 procent av 

befolkningen känner till deras produkt hur många miljoner skall de satsa 

på reklam? 

Antalet dagar tills 80 procent av befolkningen känner till produkten 

erhålls ur 

ln 

0:8 

= 3:13 + 0:308x 

1 0:8 

x = 

och detta ger oss reklamkostnaden 

14:664 

ln 4 + 3:13 

0:308 

1 miljon 

7 

= 14:663 

= 2:1 miljoner 

En mäklare har fått en idé om att den logistiska regressionsmodellen 

kan användas för att bestämma sannolikheten för nedgång hos en aktie 

imorgon om denna aktie gått ned de föregående (k) dagarna. Mäklaren 

insamlade därför information, från A- och O-listan, om aktiers nedgångar 

under ett antal veckor och noterade vilka aktier som gått ned en dag, 

två dagar i följd, tre dagar i följd, fyra dagar i följd och fem dagar i följd. 

Därvid erhöll mäklaren nedanstående datatabell: 

Tabell 12.5: Sälja eller inte sälja 

Antal dagar A-listan O-listan 

med nedgång antal antal med antal antal med 

aktier nedgång aktier nedgång 

1 275 147 145 84 

2 148 83 83 59 

3 83 54 58 39 

4 54 25 39 25 

5 25 19 25 18 

Observera att aktier kan gå från O-listan till A-listan och tvärtom 

samt att de även kan lämna O-listan genom t ex konkurs eller annan 

ekonomisk händelse. T ex fanns det 147 aktier som gått ned två dagar i 

följd men ingångsvärdet är 148 och detta förklaras av att en aktie lämnat 

O-listan och gått över till A-listan. Om modellen är riktig uppskatta 

sannolikheten för att en aktie på 

1. A-listan som gått ned 10 dagar i sträck skall gå ned även den 11:e 

dagen. 

c Mikael Möller


2. O-listan som gått ned 10 dagar i sträck skall gå ned även den 11:e 

dagen. 

Sätt 

Y = 

och antag modellen 

0 om aktien går upp den följande dagen 

1 om aktien går ner den följande dagen 

Yij = 

e 0+ 1x1i+ 2x2i 

1 + e 0+ 1x1i+ 2x2i + ij 

där i = 1; 2; : : : ; 20 x1 = 1; 2; : : : ; 5 x2 = 0; 1 j = 1; 2; : : : ; ni och 

x1 = antal dagar aktien gått ned 

x2 = 

0 om aktien tillhör O-listan 

1 om aktien tillhör A-listan 

och är generaliserat binomialfördelad. Vi erhåller nu föjande observerade 

skattningar på parametrarna (med standardavvikelser inom parentes) 

De sökta sannolikheterna blir nu för 

1. A-listan 

E( Y j x1 = 10; x2 = 1 ) = 

2. O-listan 

E( Y j x1 = 10; x2 = 0 ) = 

0obs = 0:34949 (0:1639), 

1obs = 0:10840 (0:0562), 

2obs = 0:31955 (0:1399). 

10+0:31955 1 

e0:34949+0:1084 

= 0:85. 

1 + e0:34949+0:1084 10+0:31955 1 

10+0:31955 0 

e0:34949+0:1084 

= 0:81. 

1 + e0:34949+0:1084 10+0:31955 0 

6 Airbus använder sig vid konstruktionen av ‡ygplan av en typ av 

metallspännen vilka skall vara trycktåliga. Man är nu intresserade av 

att kunna förutsäga om ett spänne kan klara av ett på förhand givet 

tryck samt få ett mått på hur snabbt tryckkänsligheten ökar vid detta 

6 För att lösa detta tal behöver du en dator med lämplig statistisk programvara. 

c Mikael Möller


tryck. Airbus testar därför ett stort antal spännen vid olika tryck med 

resultat enligt tabellen 

. 

Tabell 12.6: Metallspännens känslighet för tryck 

Tryck Antal testade Antal fel 

2500 50 10 

2700 70 17 

2900 100 30 

3100 60 21 

3300 40 18 

3500 85 43 

3700 90 54 

3900 50 33 

4100 80 60 

4300 65 51 

1. Sätt upp en lämplig statistisk modell. 

2. Skatta sannolikheten för att ett spänne ej klarar trycket 3000. För 

att få konvergens behöver du välja lämpliga värden på 0start och 

1start. 7 

Sätt 

Yi;j = p (xi) + i;j i = 1; 2; 3; : : : ; 10; j = 1; 2; : : : ; ni, 

där Yi;j är 0 (Nej) om det j:te spännet klarar trycket xi och 1 (Ja) om 

det ej klarar trycket. Den förklarande variabeln, xi, är här trycket och 

till varje tryck, xi, …nns en grupp om ni testade spännen. 

1. Som statistisk modell tar vi 

p (xi) = 

e 0+ 1x 

. 

1 + e 0+ 1x 

7 Sannolikt får du ej konvergens vid ditt första försök. Dock beror detta på pro- 

gramvaran. 

c Mikael Möller


2. För att få konvergens måste vi ange lämpliga startvärden på 0 

och 1. Dylika erhålls genom att t ex lösa ekvationssystemet 

eller alternativt 

e 

1 + e 

e 

1 + e 

0+ 1x 

0+ 1x = 0:2, 

0+ 1x 

0+ 1x = 0:24, 

0 + 2500 1 = log 0:2 

0:8 , 

0 + 2700 1 = log 0:24 

0:76 . 

Man …nner att 0start = 4:3065 och 1start = 0:001168. Parametrarna 

0 och 1 skattas till 

0obs = 5:41081 (0:54511), 

1obs = 0:00157 (0:00016). 

där si¤rorna inom parentes anger standardavvikelsen. Den sökta 

sannolikheten blir 


p (3000) = 

e 5:41081+0:00157 3000 

1 + e 5:41081+0:00157 3000 0:332.



31 Vi använder oss av deriveringsformeln för en kvot och erhåller då 

df 

dx = 

d 

dx1 1 + e 0 1x d 1 dx 1 + e 0 1x 

1 + e 0 1x 2 

= 0 0 + ( 1) e 0 1x 

1 + e 0 1x 2 

= 1 

e 0 1x 

1 + e 0 1x 2 

c Mikael Möller


c Mikael Möller

13. Tidsserier 

13.1 Introduktion 

I ekonomiska sammanhang mäter man utfall på olika ekonomiska variabler 

vid olika tidpunkter. Dessa tidpunkter kan vara varje minut som 

vid en aktie:s värde under börsen:s öppehållande, antalet arbetslösa under 

en månad, BNP:s värde kvartalsvis o s v. Det som är gemensamt 

för alla dessa situationer är att man vill kunna förutsäga nästa värde 

som kommer att observeras. Den som kan förutsäga en akties pris blir 

rik, den som kan förutsäga antalet arbetslösa nästa månad kan vidtaga 

åtgärder för att minska detta antal och likaså om man kan förutsäga 

BNP:s utveckling så kan en förändring av …nanspolitiken dämpa eller 

förstärka konjunkturen:s rörelser. 

Men det är inte alltid som man är ute efter enbart en förutsägelse för 

ett kommande värde utan det kan även vara av intresse att förstå hur 

utvecklingen av en tidsserie uppför sig –för att t ex bekräfta ekonomiska 

modeller. 

Det alla dessa serier av data, tidsserier, har gemensamt är att de 

mäts i kronologisk ordning med ett och samma tidsavsnitt mellan mätningarna. 

Vi skall här närmare studera kronologiska data och börjar 

först med en allmän de…nition: 

De…nition 49 En tidsserie fytg t är en kronologisk följd av observationer 

på en stokastisk variabel Y . 

Självklart måste vi, för att kunna göra kvantitativa uttalanden, lägga 

på någon form av struktur på dylika serier. Men vi skall börja med 

metoder som arbetar utan restriktioner på data –glidande medelvärden. 

Därefter går vi över till att betrakta komponentmodeller där 

komponenterna kan tas fram med hjälp av glidande medelvärden. 1 

I nästa steg tittar vi på utjämningsmodeller. De modeller som vi 

skall titta på är lägesmodellen exponentiell utjämning och läges- och 

riktningsmodellen Holt. Den förra är bra för att skatta ett väntevärde 

som förändrar sig långsamt i tiden och den senare för att skatta ett 

väntevärde som förändrar sig enligt ’en styckvis linjär’ kurva. Denna 

1 Observera att även regressionsmodeller kan vara användbara vid uppskattandet 

av en tidsseries komponenter. 

251

252 13.2. Glidande medelvärden 

typ av modeller kan också behandla periodociteter men vi lämnar denna 

komplikation därhän. 

Vi avslutar sedan med att införa vissa restriktioner på tidsserien och 

inför en typ av modeller där tidsseriens kovariansstruktur skall vara konstant 

och dess residualer skall var normalfördelade. Denna typ av modeller 

kallas ARMA (AutoRegressiva-MovingAverage modeller) och de 

är ofta utgångspunkten för mer ingående studier av …nansiella tidsserier. 

13.2 Glidande medelvärden 

För att …nna ett medelvärde över ett år kan man t ex ta och lägga ihop 

kvartalsdata och dela med 4 eller månadsdata och dela med 12 eller mer 

generellt så bildar vi medelvärdet 

X 

yt;k = 1 

t+k 1 

k 

i=t 

yi, t = 1; 2; : : : ; n k + 1 

för något k (k = 4 eller 12 ovan) och beräknar yt;k för t = 1; 2; : : : ; n 

n k+1 

k + 1. Därvid erhålls den nya serien fyt;kgt=1 och denna kan sedan 

n k+1 

jämföras med den ursprungliga serien fytgt=1 . Observera att vi har 

ingen möjlighet att …nna värdet på yn k+1;k innan vi har mätt värdet 

yn+1. Denna typ av medelvärden kallas glidande medelvärden ty när t 

växer så ’glider’ yt;k med. Nu är denna typ av glidande medelvärden 

onödigt begränsade och om man gör observationen att 

yt;k = 

t+k X1 

i=t 

1 

k yi 

inser man att vi lika gärna kan ha en serie av k vikter faig i=1;2;:::;k . 

Detta medför ingen ytterligare svårighet och vi betraktar därför det mer 

generella glidande medelvärdet 

yt;k = 

t+k X1 

i=t 

ai t+1yi = 

kX 

i=1 

aiyt+i 1 

där P k 

i=1 ai = 1 2 . Frågan är nu vilka egenskaper dylika glidande medelvärden 

har och vi skall börja med att besvara denna fråga med hjälp av ett 

exempel: 

2 Denna normering är väsentlig och den är speciellt uppfylld när ai = 1 

k . 

c Mikael Möller

13. Tidsserier 253 

Exempel 66 Tidsserien yt antages bestå av en ren periodisk serie med 

perioden 4 d v s det gäller för alla t att yt+4 = yt. Bestäm serien fyt;4g 

när 

a1 = a2 = a3 = a4 = 1 

4 . 

Lösning 50 Vi börjar med att beräkna de 4 första värdena av serien 

yt;4 och använder oss då av att yt+4 = yt: 

y1;4 = y1 + y2 + y3 + y4 

4 

y2;4 = y2 + y3 + y4 + y5 

4 

y3;4 = y3 + y4 + y5 + y6 

4 

y4;4 = y4 + y5 + y6 + y7 

4 

= y2 + y3 + y4 + y1 

4 

= y3 + y4 + y1 + y2 

4 

= y4 + y1 + y2 + y3 

4 

Vi ser att y1;4 = y2;4 = y3;4 = y4;4 och de är således alla lika. Det är 

nu inte svårt att övertyga sig om att alla yt;4 kommer att vara lika med 

en och samma konstant. Detta innebär att ett glidande medelvärde om 

k = 4, där alla vikter är lika stora, släcker periodiciteter av ordning 4. 

En konsekvens av ovanstående exempel är att kvartalsdata kan transformeras, 

med hjälp av ett glidande medelvärde, så att den inneboende 

periodiciteten försvinner. Därmed skulle säsongsberoendet kunna …ltreras 

bort och man får en bättre kontroll över den verkliga utvecklingen av 

trenden och konjukturcykeln. Man frågar sig nu om detta var en slump 

och att påståendet bara gäller för periodiciteter av ordning 4. Nu är det 

inte svårt att övertyga sig om att en serie med en period av k tidssteg 

faktiskt blir konstant om den …ltreras med ett k-glidande medelvärde 

, i = 1; 2; : : : ; k. 

med lika stora vikter ai = 1 

k 

Uppgift 32 Ge ett konkret exempel på en tidsserie med någon period 

och visa att ett lämpligt val av vikter transformerar denna till en konstant. 

Glidande medelvärden med en jämn periodicitet (t ex 4, 12) har den 

nackdelen att de förskjuter tidsperspektivet ett halvt steg och jämförelser 

mellan den ursprungliga serien och den transformerade serien låter sig 

därför ej göras. För att se och förstå hur denna tidsförskjutning uppträder 

betraktar vi följande: 

c Mikael Möller

254 13.2. Glidande medelvärden 

Exempel 67 Antag att vi har en tidsserie som består av två komponenter 

dels en periodisk komponent y 1 t+4 = y 1 t och dels en linjär komponent 

y 2 t = a + bt d v s att 

yt = y 1 t + y 2 t = y 1 t + a + bt t = 1; 2; : : : . 

För denna tidsserie …nner vi, med c = y1+y2+y3+y4 

4 , 

4a + b (1 + 2 + 3 + 4) 

y1;4 = c + = c + a + b 

4 

2:5 

4a + b (2 + 3 + 4 + 5) 

y2;4 = c + = c + a + b 

4 

3:5 

4a + b (3 + 4 + 5 + 6) 

y3;4 = c + = c + a + b 

4 

4:5 

4a + b (4 + 5 + 6 + 7) 

y4;4 = c + = c + a + b 

4 

5:5 

o s v. Om vi nu vill jämföra seriens värde vid tidpunkt 4, d v s y4, med 

den …ltrerade seriens värde vid samma tidpunkt så måste vi liksom en 

åsna välja antingen y2;4 eller y3;4. För att slippa välja kan vi lägga ihop 

dessa två värden och dela med 2 –vi bildar med andra ord det nya värdet 3 

y2;4 + y3;4 

2 

= c + a + b 3:5 + c + a + b 4:5 

2 

= c + a + b 4. 

Denna nya …ltrerade serie kan jämföras med den ursprungliga, vid varje 

tidpunkt där båda är de…nierade, ty den ursprungliga serien och den 

transformerade serien har nu samma tidskala. Dylika glidande medelvärden 

kallas centrerade glidande medelvärden. 

Uppgift 33 Visa att om vi har ett glidande medelvärde av ordning fyra 

med a1 = a2 = a3 = a4 = 1 

4 och tillämpar detta 2 gånger som exemplet 

ovan föreskriver så erhålls ett nytt glidande medelvärde av ordning 5 med 

vikterna 

a1 = 1 

8 , a2 = 1 

4 , a3 = 1 

4 , a4 = 1 

4 , a5 = 1 

8 . 

Teorin för glidande medelvärden är egentligen teorin om linjära …lter 

och för att förstå dessa behöver man även kunskap i di¤erensekvationer, 

trigonometri och komplexa tal. Denna mycket intressanta och användbara 

teori hjälper oss att förstå många av de ekonomiska processer som 

dagligen försigår men här väljer vi att övergå till en tillämpning av glidande 

medelvärden. 

3 En salomonisk lösning vi känner igen från medianens de…nition. 

c Mikael Möller


13.3 Komponentmodeller 

De ‡esta ekonomiska tidsserier baserar sig på kronologiska data månadsvis, 

kvartalsvis eller årsvis. När vi studerar sådana historiska tidsserier 

så …nner vi att de ofta innehåller en eller ‡era av följande fyra 

komponenter: En trend, ett säsongmönster, ett cykliskt mönster och en 

irreguljär komponent. 

Trenden beskriver en series långsiktiga uppträdande såsom växande/avtagande. 

Detta kan vara en stigande efterfrågan på telefoner, en 

sjunkande bokningsfrekvens till ett visst resemål, lönenivån inom en viss 

industri m m. 

Säsongvariationer är periodiskt återkommande mönster som uppstår 

på grund av varierande efterfrågan. Glass efterfrågas främst under 

våren/sommaren, detaljhandelns försäljning varierar från månad till 

månad där julhandeln har en avgörande betydelse för handels årsvinst, 

försäljningen av charterresor är som störst när folk av tradition har sin 

semester –sommar och vinter. 

Cykliska variationer är variationer med långa perioder –två år eller 

mer. Exempel är olika typer av industrier som skogsindustrin men också 

valutor varierar långsiktigt i takt med den övriga ekonomiska utvecklingen. 

Den irreguljära komponenten är vad som återstår när vi rensat data 

från ovanstående tre komponenter. Denna komponent tar hand om 

tillfälligheter som strejker, naturkatastrofer, olyckor, krig m m men vi 

kan även välja att modellera många av dessa händelser speci…kt. 

13.3.1 Modell 

Inför följande storheter 

yt = tidseriens observerade värde 

Tt = tidseriens trendkomponent 

St = tidseriens säsongkomponent 

Ct = tidseriens cykliska komponent 

It = tidseriens irreguljära komponent 

alla vid en och samma tidpunkt t. Dessa komponenter kan nu sammanställas 

på ett antal olika sätt och vi börjar med att ge några exempel. 

1. Om säsongkomponentens amplitud växer med tiden t och det även 

c Mikael Möller

256 13.3. Komponentmodeller 

…nns en växande trend ansätter vi en multiplikativ modell –yt = 

Tt St Ct It –se …gur 13.1 sid 256. 

50 

37.5 

25 

12.5 

0 

0 

10 

20 

30 

kvartal kvartal 

Figur 13.1: yt = Tt St Ct It 

2. Om både säsongkomponentens och konjunkturkomponentens amplitud 

växer med tiden t så ansätter vi en blandad modell –yt = 

Tt St It + Tt Ct It –se …gur 13.2. 

50 

37.5 

25 

12.5 

0 

0 

10 

20 

30 

kvartal 

Figur 13.2: yt = Tt St + Tt Ct där den undre kurvan är Tt Ct. 

3. Om säsongkomponentens amplitud växer med tiden men konjunkturkomponentens 

är konstant över tiden t så ansätter vi en blandad 

modell –yt = Tt St It + Ct It –se …gur 13.3. 

4. Om säsongkomponentens och konjunkturkomponentens amplitud 

båda är konstanta över tiden t samt det …nns en linjärt ökande 

trend så ansätter vi en additiv modell –yt = Tt + St + Ct + It –se 

…gur 13.4d sid 258 som dock saknar den irreguljära komponenten. 


40 

40


50 

37.5 

25 

12.5 

0 

0 

10 

20 

30 

Kvartal 

Figur 13.3: yt = Tt St + Ct där den undre kurvan är Ct. 

Här kommer vi endast studera den additiva modellen och överlåter 

studiet av den multiplikativa till övningarna. Notera dock att om vi logaritmerar 

den multiplikativa modellen så erhålls den additiva. Övriga 

modeller lämnar vi åt sitt öde eftersom de matematiskt är så svårforcerade. 

Vår första uppgift är nu att förstå a) hur den additiva modellen 

fungerar och b) hur vi kan komma åt de fyra olika komponenterna för 

denna modell. Vi börjar med att matematiskt konstruera en tidsserie 

som kommer från en additiv modell och därefter tar vi fram de verktyg 

som behövs för att, omvänt, plocka fram tidsseriens olika komponenter. 

Det gör vi i huvudsak med hjälp av centrerade glidande medelvärden 

och regressionsanalys. 

13.3.2 Konstruktion av en tidsserie 

Vi börjar med en helt teoretisk påhittad modell som innehåller alla komponenter 

förutom den irreguljära och utifrån denna visar vi sedan hur 

man kan ta fram var och en av de ingående komponenterna. Speciellt 

väljer vi komponenterna 4 

Tt = 1 + 0:1t 

St = sin 2 t 

Ct = 2 sin 2 

It = 0 

34 t 

4 Här är det till god hjälp om man känner till de trigonometriska funktionerna. 

40 

c Mikael Möller


och dessa adderar vi så att en additiv modell yt = Tt + St + Ct erhålls. 

Detta innebär att vi betraktar en modell med linjär trend, en 

säsongkomponent med perioden 4 (t ex kvartalsdata) och en långsiktig 

cyklisk komponent med perioden 17 kvartal. Om vi nu slår ihop de tre 

komponenterna så erhålls den sammansatta serien fytg där 

yt = 1 + 0:1t + sin 2 t + 2 sin 2 

t . 

34 

Om vi ritar upp funktionerna Tt; St; Ct och yt var och en för sig så erhålls 

…gurerna 13.4a-c. Den sista …guren (d) visar oss en additiv serie med 

stigande trend, kvartalssvängningar och en långsiktig konjunkturcykel. 5 

Denna typ av serie är, om än här överdriven, vanlig i mänskliga sammanhang 

–som exempel kan ges bruttonationalprodukten, BNP, kvartalsvis. 

y 

6 

4 

2 

0 

6 

4 

2 

0 

10 20 30 40 

(a) St = sin 2 t 

10 20 30 40 

(c) Tt = 1 + 0:1t 

y 

6 

4 

2 

0 

6 

4 

2 

0 

10 20 30 40 

(b) Ct = 2 sin 2 

34 t 

10 20 30 40 

(d) yt = Tt + St + Ct 

Figur 13.4: De tre skilda komponenterna i en tidsserie 

5 Figuren visar serien för alla t men självklart har vi i verkligheten endast 4 punkter, 

en för varje kvartal. 

c Mikael Möller


13.3.3 Analys av tidsserien ovan 

Vi vet sedan tidigare att sättet att ta bort en periodicitet av storlek 4 

och samtidigt behålla möjligheten till jämförelse med den ursprungliga 

serien är att tillämpa ett glidande medelvärde av ordning 5 och vikterna 

. Bilda därför funktionen 

1 

8 

; 1 

4 

; 1 

4 

; 1 

4 

; 1 

8 

G5 (fytg ; t) = yt 2 + 2yt 1 + 2yt + 2yt+1 + yt+2 

; t = 1; 2; 3; : : : . 

8 

För funktionen G5 ( ; t) gäller att den transformerar konstanter på konstanter 

d v s om a är en konstant så gäller att 

G5 (fag ; t) = a. 

Uppgift 34 Visa att G5 (fag ; t) = a när a är en konstant. 

Vidare gäller att funktionen G5 ( ; t) är additiv 

G5 (a fxtg + fztg ; t) = aG5 (fxtg ; t) + G5 (fztg ; t) . 

Uppgift 35 Visa att G5 (a fxtg + fztg ; t) = aG5 (fxtg ; t)+G5 (fztg ; t) 

där a är en konstant samt fxtg och fztg är två tidsserier. 

För serien yt = t erhålls speciellt att 

G5 (ftg ; t) = 

t 2 + 2 (t 1) + 2t + 2 (t + 1) + (t + 2) 

8 

= t. (13.1) 

Observera att tidsserien:s värden vid tidpunkterna 1 och 2 samt n 1 

och n inte kan jämföras med den …ltrerade tidsserien:s värden ty för 

detta krävs värden som vi inte har nämligen y 2 och y 1 respektive 

yn+1 och yn+2. Om funktionen G5 ( ; t):s egenskaper tillämpas på vår 

konstruerade serie erhålls 

G5 (fytg ; t) = G5 

n 

1 + 0:1t + sin 2 t + 2 sin 2 

= G5 (f1 + 0:1tg ; t) + G5 

+ G5 

n 

2 sin 2 

= 1 + 0:1t + G5 

34 t 

o 

; t 

n 

sin 2 t 

n 

sin 2 t 

o 

; t + G5 

34 t 

o 

; t 

o 

; t 

n 

2 sin 2 

34 t 

o 

; t . 

Vi vet sedan tidigare att G5 ( ; t) släcker periodiciteter av storlek 4 varför 

det gäller 

n o 

G5 (fStg ; t) = G5 sin t 

2 

; t = 0 

c Mikael Möller


och således återstår att studera vad som händer med den sista termen – 

cykeln Ct. Utveckling ger 

n 

G5 (fCtg ; t) = G5 2 sin 2 

34 t 

o 

n 

; t = 2G5 sin 2 

34 t 

o 

; t 

= 2 

h 

sin 

8 

2 

(t 2) + 2 sin2 (t 1) 

34 34 

+ 2 sin 2 

t + 2 sin2 

34 

+ sin 2 

i 

(t + 2) 

34 

(t + 1) 

34 

vilket är ett ganska komplicerat uttryck. Vi kan dock rita upp skillnaden 

mellan den ursprungliga serien fCtg och den transformerade serien 

G5 (fCtg ; t) varvid …guren nedan erhålls 

0.05 

0.025 

0 

0.025 

0.05 

0 

10 

Figur 13.5: f (t) = Ct G5 (fCtg ; t) 

och vi ser att skillnaden är liten jämförd med trenden. Detta betyder 

att …ltret G5 ( ; t) bibehåller trenden samt lämnar konjunkturcykeln i det 

närmaste opåverkad d v s vi har att 

20 

30 

G5 (fCtg ; t) Ct. 

I …gur 13.6 på sid 261 visar vi dels den sanna ursprungliga kurvan 

yt (— ) och dels den kurva som ges av funktionen G5 (fytg ; t) ( ) när 

säsongen har …ltrerats bort. 

Denna …gur ger oss idéen att den skattade säsongsvariationen kan 

skrivas 

st = yt G5 (fytg ; t) , t = 2; 3; : : : ; n 2 

ty om vi från den heldragna kurvan yt (Tt + St + Ct) drar den streckade 

kurva, som är en approximation av Tt + Ct, så återstår i princip bara 


40


6 

5 

4 

3 

2 

1 

0 5 10 15 20 25 30 35 

Figur 13.6: yt (— ) och G5 (fytg ; t) ( ) 

säsongskomponenten. För att se att detta blir en ’bra’ skattning av 

säsongen ritar vi upp den kända säsongen sin 2 t (— ) och den skattade 

säsongen st ( ) i en och samma …gur för 8 kvartal i …gur 13.7. 

1 

0.8 

0.6 

0.4 

0.2 

0 

0.2 

0.4 

0.6 

0.8 

1 

1 2 3 4 5 6 7 8 

Figur 13.7: sin 2 t (— ) och st ( ) 

Det gäller således att trend plus cykel, Tt + Ct, skattas av 

tct = yt st. 

Nästa steg blir att maska ut trenden. För att göra detta använder vi 

vanlig regressionsteknik på serien ftctg och den cykliska komponenten 

blir därefter den ursprungliga serien minskad med skattad säsong och 

skattad trend d v s ct = yt st tt. 

När vi konstruerade vår tidsserie tog vi ej med någon irreguljära 

komponent. Dylika …nns förvisso i alla förekommande ekonomiska tidsserier 

och den irreguljära komponenten trasslar förvisso till det. Dock 

kan man, i princip, genom en enkel medelvärdesbildning av storlek 3 

eliminera dess påverkan. Arbetsgången blir nu 

c Mikael Möller


1. Bilda st = yt G5(fytg ; t). 

2. Bilda tcit = yt st. 

3. Skatta den linjära trenden tt = a + bt. 

4. Bilda cit = yt st tt. 

5. Bilda ct = cit 1 + cit + cit+1 

. 

3 

6 

6. Bilda it = yt st tt ct. 

Till sist; i alla programpaket för säsongrensning görs, innan man går 

vidare med steg 2 ovan , ytterligare medelvärdesbildningar så att en jämn 

periodisk serie st erhålls. För t ex en kvartalsserie bildar man medelvärden 

(si) för kvartal 1, kvartal 2, kvartal 3 och kvartal 4. Därefter centreras 

dessa medelvärden (si) på följande sätt 

si = 1 

m 1 

m 

j=0 

si = si 

X 

s4j+1 i = 1; 2; 3; 4; m = antal år, 

1 

4 

4X 

sj. 

j=1 

Allt sönderhackande av data läggs därför i den irreguljära termen. 

Ovanstående utjämningsmetod har den nackdelen att den ej kan ge 

prognoser ty metoden använder de sista mätvärdena för att skatta ett 

tidigare värde (i fallet med kvartalsserier används de två sista för att 

beräkna det tredje från slutet). Metoden lämpar sig däremot väl för att 

förstå de underliggande mönster som ger upphov till tidserien. Denna 

förståelse kan sedan användas för att ge kvalitativa utsagor om framtiden. 

Exempel 68 Från SCB erhålls en rensad 7 tidsserie över BNP:s kvartalsvärden 

och vi skall dela upp denna serie i dess komponenter. En 

…gur över BNP:s rensade utveckling under åren 1980 till och med 2001 

är …gur 13.8a på sid 263. 

6 Ty konjunkturen varierar långsamt och därför bör ct 1 ct ct+1. Att addera 

tre värden bör därför släcka den slumpmässiga termen. 

7 Ekonomiska tidsserier korrigeras ofta för kalendere¤ekter av typ att påsken ej 

alltid infaller i samma månad, att månaderna är av olika längd o s v. Denna tidsserie 

är dessutom angiven i fast pris. 

c Mikael Möller


500000 

400000 

300000 

200000 

100000 

0 10 20 30 40 50 60 70 80 90 

(a) Rensad BNP 

500000 

400000 

300000 

200000 

100000 

0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 

(b) Trend- cykelkomponent. 

Figur 13.8: Bruttonationalprodukten i fast pris. 

Tillämpar vi ett centrerat glidande medelvärde (a1 = = a4 = 1 

4 ) på 

data så erhålls trend-cykeln i …gur 13.8b. Om vi sedan tar den ursprungliga 

serien minus trend-cykeln så erhålls säsongen –se …gur 13.9a. Observera 

dock att vårt exempel hanterar verkliga data och dessa innehåller 

även den irreguljära komponenten. Den irreguljära komponenten ser vi 

i …gur 13.9b. 

40000 

30000 

20000 

10000 

0 

10000 

20000 

30000 

40000 

Case 1 

Case 5 

Case 9 

Case 17 

Case 13 

Case 89 

Case 85 

Case 81 

Case 77 

Case 73 

Case 69 

Case 65 

Case 61 

Case 57 

Case 53 

Case 49 

Case 45 

Case 41 

Case 37 

Case 33 

Case 29 

Case 25 

Case 21 

(a) Säsongskomponent 

40000 

30000 

20000 

10000 

0 

10000 

20000 

30000 

40000 

Case 1 

Case 5 

Case 9 

Case 13 

Case 17 

Case 21 

Case 25 

Case 29 

Case 33 

Case 37 

Case 41 

Case 45 

Case 49 

Case 53 

Case 57 

Case 61 

Case 65 

Case 69 

Case 73 

Case 77 

Case 81 

Case 85 

Case 89 

(b) Irreguljär komponent 

Figur 13.9: Säsongs- och irreguljär komponent. 

Det framgår med önskvärd tydlighet (se y-axelns skala) att säsongen 

och den irreguljära komponenten förklarar ungefär lika mycket (d v s den 

irreguljära komponenten förklarar ingenting den är bara av samma storleksordning 

som säsongskomponenten). Det återstår därför en hel del 

c Mikael Möller


arbete innan vi har funnit en bra modell. 

13.3.4 Enkel exponentiell utjämning 

En utjämningsteknik som även kan ge korta prognoser är enkel exponentiell 

utjämning och den är främst tillämpbar när tidsserien är 

utsatt för små långsamma förändringar i tiden. Mera exakt utgår vi 

ifrån tidsserien 

yt = (t) + t 

där medelnivån (t) tillåts ha långsamma förändringar över tiden t. 

Denna modell är en första utvidgning av den för oss bekanta modellen 

där konstanten skattas med 

Yt = + t 

^ = y = yn. 

Vad vi behöver nu är en metod för successiva omräkningar av skattningen 

av (t). Idéen till en sådan metod får vi genom att se hur yn kan beräknas 

rekursivt: 

yn = 1 

n 

nX 

i=1 

= 1 

n yn + 

yi = 1 

n (n 1) yn 1 + yn 

n 1 

n yn 1 = 1 

n yn + 1 

1 

n yn 1 

och vi ser att varje ny omräkning beror allt mindre på det senaste värdet 

yn. Men vi vill uppnå en motsatt e¤ekt, nämligen att det sista värdet 

har "stor" betydelse ty det sista värdet indikerar vart serien är på väg. 

Detta ger oss följande idé för uppräkning av skattningen a(t) för (t) 

a(t) = yt + (1 )a(t 1) , 0 < < 1 (13.2) 

där är en konstant som skall väljas klokt. Ett sätt är att välja den 

så att kvadratsumman för medelfelet blir liten (vanligen ligger mellan 

0:01 och 0:3). Ett stort värde på innebär att den utjämnade serien 

a (t) nära följer den ursprungliga, om än förskjuten i tiden. Ett litet 

värde tyder i sin tur på att vi betraktar serien som en slumpmässig serie 

med ett konstant väntevärde. 

c Mikael Möller


Om vi genomför de första iterationerna i ekvation 13.2 så erhålls att 

a(t) = yt + (1 )a(t 1) 

= yt + (1 ) yt 1 + (1 )a(t 2) 

= yt + (1 )yt 1 + (1 ) 2 a(t 2) 

= yt + (1 )yt 1 + (1 ) 2 yt 2 + (1 ) 3 a(t 3) 

varav det framgår att 

a(t) = 

X 

t 1 

(1 ) k yt k + (1 ) t a(0) . 

k=0 

Som prognos vid tidpunkt n + , gjord vid tidpunkt n, tar man det 

senast kända värdet d v s 

^y(n + ) = a(n) 

och ett 100(1 ) procentigt prediktionsinterval för denna prognos kan 

skrivas 

^y(n + ) =2s p 1 + ( 1) 2 . 

Observera att tekniken med enkel exponentiell utjämning ej kräver någon 

bakomliggande statistisk modell och därför kan egentligen inga kon- 

…densintervall konstrueras. Man kan dock visa att enkel exponentiell 

utjämning kan betraktas som en delklass av ARIMA-modellerna – se 

nästa avsnitt för en introduktion till dessa –och då blir det möjligt att 

prata om kon…densintervall. 

Exempel 69 Tabellen nedan innehåller fångstresultat i ton för en …skebåt 

som …skar torsk utanför Islands kust 

Jan Feb Mar Apr Maj Jun 

År 1 362 381 317 297 399 402 

År 2 276 334 394 334 384 314 

Jul Aug Sep Okt Nov Dec 

År 1 375 349 386 328 389 343 

År 2 344 337 345 362 314 365 

Gör en skattning av fångstresultatet för januari, år 3. 

Lösning 51 Vi gör först en …gur över fångstresultatet och erhåller då 

…gur 13.10 och denna …gur ger att möjligen förändras medelvärdet över 

c Mikael Möller


360 

260 

0 2 4 6 8 10 12 14 16 18 20 22 24 

Figur 13.10: Torskfångst i ton. 

tiden – om än lite (det ser ut att sjunka). För att förutsäga värdet i 

januari år 3 använder vi oss av metoden med exponentiell utjämning 

och väljer = 0:02. Vi väljer ett litet värde eftersom serien verkar 

vara helt slumpmässig. Som startvärde tar vi medelvärdet av de 6 första 

observationerna. Vi kunde lika gärna ha tagit medelvärdet av de tre 

första observationerna eller gjort något annat val. Vad som är lämpligt 

följer av sammanhanget. I detta fall ser serien slumpmässig ut om än 

med stor variation och då är vårt val inte så pjåkigt. Följande sekvens 

av värden erhålls: 

a(0) = 359:67 = 1 

6 

6X 

i=1 

a(1) = 0:02 362 + 0:98 359:67 = 359:72 

a(2) = 0:02 381 + 0:98 359:72 = 360:15 

. = . 

a(24) = 0:02 365 + 0:98 355:95 = 356:13 

En …gur över både den ursprungliga tidsserien (— ) och den erhållna exponentiellt 

utjämnade tidsserien ( ) är …gur 13.11 på sid 267. I denna 

syns klart att medelfångsten är svagt avtagande. Det skattade januarivärdet 

är nu detsamma som det sista utjämnade värdet d v s 356:13. Ett 

trovärdighetsintervall med kon…densgraden 95 procent blir 


356:13 1:96 1:25 28:62 = (286:01; 426:25). 

yi 

420 

400 

380 

360 

340 

320 

300 

280


360 

260 

0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 

Figur 13.11: Torskfångst i ton. 

13.3.5 Dubbel exponentiell utjämning à la Holt 

Om data följer en styckvis linjär trend där interceptet och riktningskoe¢ 

cienten förändras långsamt över tiden kan man använda sig av den 

linjära linjens ekvation. Den linjära ekvationen kan skrivas på formen 

y y1 = y1 y2 

(x x1) (13.3) 

x1 x2 

och denna ekvation kommer att utnyttjas för att ta fram ekvationer 

för den rekursiva omräkningen av parametrarna. Om vi liksom tidigare 

betecknar medelnivån med (t) och väljer som riktningsparameter (t) 

så gäller att en tidsserie med en styckvis linjär trend, med föränderliga 

parametrar, kan skrivas 

yt = (t) + (t) t + t. 

Parametrarna ( (t) ; (t)) kan, givet mätvärdena (a(t 1) ; b(t 1)), skattas 

vid den följande tidpunkten t på följande sätt: 

Om läget vid tidpunkt t 1 är a(t 1) så uppdateras läget vid 

tidpunkt t av en del av det nya uppmätta värdet på läget vid 

tidpunkt t ,d v s yt, plus en del som bestäms av det gamla läget 

och riktningskoe¢ cienten vid tidpunkt t 1: 

a(t) = yt + (1 ) a(t 1) 

| {z } 

y1 

+ b(t 1) 

| {z } 

y 1 y 2 

x 1 x 2 

420 

400 

380 

360 

340 

320 

300 

280 

t (t 1) 

| {z } 

x x1 

Den sista parentesen är en tillämpning av ekvation 13.3 för att 

erhålla en uppdatering av läget enligt räta linjens ekvation. Parametern 

skall ligga mellan 0 och 1. 


.


Om riktningen vid tidpunkt t 1 är b(t 1) så beräknas den nya 

utjämnade riktningen vid tidpunkt t av en del av den nya riktningen 

plus en del av den gamla riktningen 

b(t) = 

a(t) a(t 1) 

t (t 1) 

Parametern skall ligga mellan 0 och 1. 

+ (1 ) b(t 1) . 

Ovanstående metod för uppdatering av skattningarna av parametrarna 

(t) och (t) ger oss följande rekursiva förfarande: 

a(t) = yt + (1 ) a(t 1) + b(t 1) , 

b(t) = a(t) a(t 1) + (1 ) b(t 1) . 

En prognos för tidpunkten n + vid tidpunkten n erhålls till 

^y(n + ) = a(t) + b(t) . 

Återstår så att starta rekursionen med några lämpliga värden på 

(a(0) ; b(0)). En sådan uppsättning värden kan vara 

a(0) = 1 

kX 

yt 

k 

t=1 

Pk t=1 b(0) = 

(xt x) (yt y) 

Pk t=1 (xt x) 2 

där xt = t och k ett lämpligt valt tal. I valet av b(0) känner vi igen 

skattningen av riktningskoe¢ cienten i enkel linjär regression. 

Exempel 70 Slutkursen för Ericsson B har uppmätts för perioden 2003- 

01-02 till 2003-09-12. Kursdata ger oss linjediagramet i …gur 13.12 på 

sid 269. Om vi nu tillämpar både enkel exponentiell utjämning (EE) och 

dubbel exponentiell utjämning (DE) så erhålls …gurerna: 

c Mikael Möller


Kronor 

12 

11 

10 

9 

8 

7 

6 

5 

Kronor 

12 

11 

10 

Eriksson B 

4 

0 20 40 60 80 100 120 140 160 

EE, = 0:1 

9 

8 

7 

6 

5 

4 

0 20 40 60 80 100 120 140 160 

Figur 13.12: Ericsson B 

Kronor 

12 

11 

10 

9 

8 

7 

6 

5 

Eriksson B 

4 

0 20 40 60 80 100 120 140 160 

DE, = 0:1 och = 0:3 

Av dessa framgår att Holt:s utjämningsmetod har större följsamhet 

vid styckvisa linjära trender än vad enkel exponentiell utjämning har. 

13.4 ARMA-modeller 

13.4.1 Introduktion 

Många tidsserier beskriver snabba förändringar och då fungerar ovanstående 

utjämningsmetoder ej bra vilket också delvis beskrivs av det 

senaste exemplet med Ericsson:s kursutveckling. Vi har ej heller visat 

hur man tar hand om säsonger vid utjämningsmetoder. Vår nästa modell, 

ARMA-modellen, lämpar sig bättre för dylika serier och innehåller 

dessutom utjämningsmetoderna som specialfall. 

Dock i denna bok skall vi endast betrakta två specialfall av den 

c Mikael Möller

270 13.4. ARMA-modeller 

allmäna ARMA modellen nämligen AR(1) och MA(1) och se hur de 

kan beskriva vissa ekonomiska tidsserier. För vår del räcker det med att 

endast betrakta dessa två ty de behöver alla de väsentliga verktyg som 

behövs för en fullständig ARMA-analys. Vår introduktion kommer därför 

öppna portarna till betydligt mer komplicerade och mer användbara 

modeller –modeller som även inkluderar säsonger. 

ARMA-modellerna ställer andra krav på data än tidigare och det viktigaste 

kravet är stationäritet. Enligt uppslagsboken är ’stillastående’en 

synonym till stationär och det kan därför synas märkligt att kräva av en 

tidsserie att den skall vara stillastående. Nu är det inte tidsseriens värden 

som är stillastående (dessa hoppar vilt till synes helt okontrollerat) 

utan det är de grundläggande förutsättningar, som ger tidsserien dess 

karaktär, som skall vara stationära. Med andra ord förutsätts tidsseriens 

statistiska egenskaper vara konstanta. Detta är ju inget nytt utan är vad 

vi vanligtvis antager i våra statistiska modeller när vi ofta kräver att de 

slumpmässiga felen skall vara 1) oberoende 2) normalfördelade med 

3) väntevärdet 0 (väntevärdet är konstant) och 4) standardavvikelsen 

(standardavvikelsen är konstant). 

Inom tidsserieanalysen gör man motsvarande men svagare antaganden. 

De är svagare eftersom man istället för oberoende endast kräver att 

kovariansen skall bero av tidsdi¤erensen mellan mätningarna. De övriga 

tre antagandena behåller man. Mer exakt de…nierar vi svag stationäritet 

som följer: 

De…nition 50 En tidsserie fYt : t = 1; 2; 3; : : :g säges vara svagt stationär 

om det gäller att 

1. väntevärdet och variansen existerar ändligt för alla t samt är konstanta, 

d v s oberoende av t, 

E(Yt) = , 

V (Yt) = 2 . 

2. för alla par av tidpunkter s och t beror kovariansen mellan Ys och 

Yt endast av s och t genom tidsdi¤erensen t s, via någon ändlig 

funktion f d v s 

C(Ys; Yt) = f(t s) . 

De…nitionens första punkt är punkterna 3 och 4 ovan och dess andra 

punkt är en försvagning av villkoret 1. Punkten 2 behåller vi som den 

är. 

c Mikael Möller


Eftersom vi kallade tidsserien ovan svagt stationär så …nns naturligtvis 

också begreppet starkt stationär. Låt oss därför för fullständighetens 

skull de…niera även detta begrepp även om vi inte kommer att använda 

det. 

De…nition 51 En tidsserie fYt : t = 1; 2; 3; : : :g säges vara starkt stationär 

om den simultana fördelningen för (Ys n; Ys n+1; : : : ; Ys) är densamma 

som den simultana fördelningen för (Yt n; Yt n+1; : : : ; Yt) för 

alla s, t och n. 8 

Eftersom vi endast kommer behandla svagt stationära tidsserier och 

dessutom är lite lata så kommer vi att skriva stationär när vi egentligen 

menar svagt stationär. 

13.4.2 Hur ser en stationär tidsserie ut 

I allmänhet är de ekonomiska tidsserierna inte stationära utan man måste 

tillämpa vissa tekniker för att transformera dem så att den transformerade 

serien blir stationär. En mycket vanlig förekommande transformation 

är bildandet av di¤erenser och vi skall först reda ut några av denna 

transformations egenskaper. 

Antag att vi har en tidsserie fYt : t = 1; 2; 3; : : :g som består av en 

linjär trend plus en slumpmässig komponent. En möjlig modell för en 

sådan serie är 

Yt = a + bt + t t 2 ON(0; ) . 

Denna tidsserie är inte stationär ty för dess väntevärde gäller 

E(Yt) = E(a + bt + t) = a + bt 

och väntevärdet beror av t. 

Bilda nu en ny tidsserie på följande sätt 

Zt = Yt Yt 1. 

8 Nu är begreppet starkt stationär ej ett vedertaget begrepp utan man säger strikt 

stationär eller bara stationär. Men personligen tycker jag det passar bättre med 

starkt ty denna stationäritet innehåller (om man lägger på kraven ändligt första och 

andra moment) även den svaga men tvärtom gäller endast om vi har normalfördelning. 

Med andra ord så är en svagt stationär process vars fel är normalfördelade också starkt 

stationär. 

c Mikael Möller


Vi säger att vi har tagit första di¤erenserna av den gamla tidsserien. 

Vad är detta bra för? Jo för den nya tidsserien fZtg gäller att 

Zt = Yt Yt 1 

= a + bt + t a b(t 1) t 1 

= b + t t 1 t 2 ON (0; ) 

och vips har vi en tidsserie med det konstanta väntevärdet b. 

Uppgift 36 Visa att den nya tidsserien är stationär. 

Hur kan en sådan stationära tidsserie se ut? Om vi gör en simulering 

av Zt med b = 3 och = 2 d v s av modellen 

så erhålls …guren 13.13 

Zt = 3 + t t 1 t 2 ON 0; 2 p 2 

3,06 

3,04 

3,02 

3,00 

2,98 

2,96 

2,94 

Figur 13.13: En stationär tidsserie. 

och vi ser att en stationär tidsserie verkligen hoppar vilt, i detta fall 

kring talet 3, utan något synbart mönster. Dock vet vi att det …nns en 

struktur ty Zt:s felterm är uppbyggd av det nya felet minus det gamla 

felet. 

Låt oss nu konstruera serien 

Yt = 10 + 0:95Yt 1 + t t 2 ON(0; ) ; = 2 

Y0 = 0 

och se hur en dylik kan se ut som ett linjediagram. En möjlig realisering 

visas i …gur nedan och det erhållna linjediagrammet liknar en aktie:s 

kursrörelse. Det intressanta här är att, efter lång tid, är fYtg en stationär 

tidsserie. 

c Mikael Möller


16 

14 

12 

10 

8 

6 

4 

2 

0 

Figur 13.14: En efter lång tid stationär serie. 

Uppgift 37 Visa att serien fYtg ovan, efter lång tid, är stationär. 

Kommer alla tidsserier som skapas av modellen 

Yt = 10 + Yt 1 + t t 2 ON(0; ) ; = 2 

Y0 = 0 

att se ut som kursrörelser? Låt oss välja = 0:4 och generera serien 

fytg på nytt. En typisk …gur över en realisering av en sådan serie är 

14 

13 

12 

11 

10 

9 

8 

7 

6 

5 

och den ger intryck av att ha ett stabilt väntevärde men i övrigt svänga 

runt detta. Dock vet vi att den, efter lång tid, är stationär ty vi kan 

göra samma beräkningar som ovan –vi byter bara ut 0:95 mot 0:4. 

Av ovanstående preliminära analys ser vi att en stationär tidsserie 

kan se ut lite hur som helst. Vi kan därför inte med ögat avgöra om 

en tidsserie är stationär eller ej. Det behövs därför en teori som ger oss 

verktyg med vars hjälp vi kan avgöra om en tidsserie är stationär eller ej. 

c Mikael Möller


En sådan teori är teorin om ARMA-modeller (Auto Regressive Moving 

Average) av ordning (p; q) och vi har ovan sett två exempel på sådana 

modeller nämligen en MA(1) och en AR(1) modell. 

En direkt översättning av ’autoregressive’till svenska skulle bli tidsserier 

som verkar på sig själva, varav modellen 

Yt = 3 + 0:4Yt 1 + t 

är ett exempel på en AR(1) modell. 

För MA-delen blir en direkt översättning ’glidande medelvärde’men 

detta leder tankarna fel ty denna MA-del har mer att göra med enkel 

exponentiell utjämning än med vår de…nition av glidande medelvärde på 

sid 252. Vi väljer därför att behålla den engelska beteckningen för MAdelen. 

En konsekvens av detta blir att vi även behåller beteckningen AR 

istället för dess svenska motsvarighet SB (SjälvBakåtverkande). 

Ett exempel på en MA(1) modell är modellen 

Zt = b + t t 1 

som vi behandlade i ett tidigare exempel. 9 

13.4.3 Autokorrelationsfunktionen 

I de…nitionen av stationäritet ingår kravet på att kovariansen skall vara 

en funktion av tidsdi¤erensen men kovariansen har den nackdelen att 

ej vara begränsad d v s den kan anta godtyckligt stora respektive små 

värden. Observera att 1000 är ett litet värde. Om vi studerar lösningarna 

till uppgifterna 36 respektive 37 ovan så ser vi att kovariansen 

kan skrivas 

36) 

8 

< 

: 

2 2 k = 0 

2 k = 1 

0 k = 2; 3; : : : 

k 2 

respektive 37) 0:95 

och om vi dividerar med variansen 2 2 för serien Zt respektive 2 för 

serien Yt så erhålls 

8 

< 1 k = 0 

36) 

: 

1 

2 

0 

k = 1 

k = 2; 3; : : : 

respektive 37) 0:95 k . 

Med denna operation har vi transformerat kovariansen till att bli korrelationen 

och för korrelationen vet vi att den ligger mellan 1 och +1. 

Vi de…nierar nu autokorrelationsfunktionen: 

9 Nu är inte detta helt sant eftersom man brukar lägga på ett krav på dessa modeller 

och vår modell i detta exempel uppfyller inte detta krav. 

c Mikael Möller


De…nition 52 För en given tidsserie fYt : t = 1; 2; 3; : : :g de…nieras dess 

teoretiska autokorrelationsfunktion k av 

k = C(Yt; Yt k) 

, k = 1; 2; : : : . 

V (Yt) 

För denna autokorrelationsfunktion gäller: 

och den skattas med 

rk = 

1 k 1 

P (yt y) (yt k y) 

P (yt y) 2 

där yt är det observerade värdet på Yt vid tidpunkt t. 

De två uppgifterna 36 och 37 indikerar att en MA(1)-modell har 

en autokorrelationsfunktion som är identiskt 0 från och med k = 2. 

Motsvarande enkla resultat gäller ej för en AR(1)-modell ty där ser vi 

att autokorrelationen avtar i k. 

13.4.4 Partiella autokorrelationsfunktionen 

För en AR(1)-modell gäller att den ej direkt beror av sig självt 2 eller ‡er 

steg bakåt ty den innehåller endast Yt 1 i sin de…nition. Detta betyder 

att t ex kunskap om Yt 3 ej påverkar värdet på Yt om Yt 1 är givet. Om 

vi därför de…nierar den speciella kovariansen 

kk = C( Yt; Yt k j Yt 1; : : : ; Yt k+1 ) 

så gäller för en tidsserie som följer modellen AR(1) att 

11 = C( Yt; Yt 1 j det …nns inget mellanliggande värde ) 

= C(Yt; Yt 1) = 1 2 Y , 

22 = C( Yt; Yt 2 j Yt 1 ) . 

Eftersom Yt 2 endast är kopplat till Yt genom Yt 1 och detta senare 

värde hålls …xt (detta är ju betydelsen av betingning) så …nns det ingen 

samvariation mellan Yt och Yt 2 varav följer att 22 = 0. På samma 

sätt erhålls att kovariansen är 0 för k = 3; 4; : : :. 10 Detta leder oss till 

följande de…nition 

10 Vi skall visa att 22 = 0 och antager (utan inskränkning) att processen har 

förväntningsvärdet 0 (ty om det inte är det kan vi alltid dra bort ett lämpligt tal så 

c Mikael Möller


De…nition 53 För en given tidsserie fYt : t = 1; 2; 3; : : :g de…nieras dess 

teoretiska partiella autokorrelationsfunktion kk av 


, k = 1; 2; : : : . 

V (Yt) 

Den införda funktionen kk har samma betydelse för en AR-process 

som autokorrelationsfunktionen k har för en MA-process. Den är för 

en AR(1)-process 0 för alla k 2. Man kan även visa att kk avtar 

exponentiellt för en MA(1)-process. 

Funktionerna k och kk har således speglade egenskaper vad gäller 

tidsserierna AR(1) och MA(1). 

Den partiella autokorrelationsfunktionen kan skattas via följande kop- 

plade system av funktioner 

där 

r1;1 = r1, rkk = rk 

Pk 1 

j=1 rk 1;jrk j 

1 P k 1 

j=1 rk 1;jrk j 

, k = 2; 3; : : : (13.4) 

rk;j = rk 1;;j rkkrk 1;k ;j, j = 1; 2; : : : ; k 1. (13.5) 

Exakt samma system av ekvationer kan användas för att beräkna det 

teoretiska värdet kk. 

Den partiella autokorrelationsfunktionen anger hur mycket Yt k påverkar 

Yt – när man har tagit bort Yt 1; ; Yt k+1:s påverkan på Yt. 

Ett sätt att mäta Yt 1; ; Yt k+1:s påverkan på Yt är att skatta parametrar 

1; : : : ; k 1 så att 

och därefter bilda kovariansen 

Yt = 1Yt 1 + + k 1Yt k+1 + t k 

C( t k; Yt) = C(Yt 1Yt 1 k 1Yt k+1; Yt) . 

att denna egenskap erhålls). Det gäller då att 

22 = C( Yt; Yt 2 j Yt 1 ) 

= E( YtYt 2 j Yt 1 ) 

= E( ( Yt 1 + t) Yt 2 j Yt 1 ) 

= E( Yt 1Yt 2 j Yt 1 ) + E( tYt 2 j Yt 1 ) 

= Yt 1E( Yt 2 j Yt 1 ) 

= 0. 

| {z } 

=0 

+ E( tYt 2 j Yt 1 ) 

| {z } 

=0 

Den första termen är 0 eftersom väntevärdet är 0 och den andra termen är 0 eftersom 

Yt 2 och t är oberoende och t har väntevärdet 0. 

c Mikael Möller


Den till denna kovarians hörande korrelationskoe…icient ( t k; Yt) är 

den partiella autokorrelationsfunktionen. 

13.4.5 Modellen AR(1) 

I uppgift 37 betraktade vi en speciell AR(1)-modell och vi skall nu generalisera 

denna. Antag därför att följande modell för tidsserien fYtg 

gäller: 

Yt = + Yt 1 + t t 2 ON (0; ) 

samt antag att den är stationär. Att fYtg är stationär innebär först och 

främst att väntevärde och standardavvikelsen är konstanta och därmed 

oberoende av t. Detta ger 

där E(Yt) = E(Yt 1) = mY varvid 

E(Yt) = + E(Yt 1) 

mY = + mY ) mY = 1 

Observera att det är stationäriteten som medför att mY = E(Yt) = 

E(Yt 1). För variansen …nner vi på motsvarande sätt 

V (Yt) = 2 V (Yt 1) + 2 

ty t och Yt 1 är oberoende. Härav följer ekvationen 

2 

Y = 2 2 Y + 2 ) 2 Y = 

Observera även här att det är stationäriteten som ger att 2 Y = V (Yt) = 

V (Yt 1). Till sist beräknar vi autokorrelationen: 

varför 


V (Yt) 

= k 

0 

k = C(Yt; Yt k) = C( + Yt 1 + t; Yt k) 

= C( ; Yt k) + C(Yt 1; Yt k) + C( t; Yt k) 

= 0 + k 1 + 0 = k 1 

= = k 0 

k = k 

k = 0; 1; 2; : : : . 

För konstanten gäller att den måste vara absolut mindre än 1 för att 

vi skall ha stationäritet. 

1 

2 

. 

2 . 

c Mikael Möller


Uppgift 38 Visa att det måste gälla j j < 1. 

För den partiella autokorrelationsfunktionen erhålls liksom tidigare att 

1;1 = C(Yt; Yt 1) 

V (Yt) 

= 1. 

För k = 2; 3; : : : kan vi resonera på följande sätt 


= C( + Yt 1 + t; Yt k j Yt 1; : : : ; Yt k+1 ) 

= C( ; Yt k j Yt 1; : : : ; Yt k+1 ) 

+ C( Yt 1; Yt k j Yt 1; : : : ; Yt k+1 ) 

+ C( t; Yt k j Yt 1; : : : ; Yt k+1 ) 

= 0 + 0 + 0. 

Den första 0:an erhålls därför att är en konstant och det …nns ingen 

variation med Yt. Den sista 0:an erhålls därför att t är oberoende av 

hela det för‡utna (och även av framtiden). Den mittersta 0:an erhålls 

därför att vi betingar med avseende på Yt 1 d v s vi väljer att hålla den 

konstant men om den är konstant så …nns ingen variation med avseende 

på Yt k varför vi får en 0:a. Därmed har vi visat att 

kk = 

1 k = 1 

0 k = 2; 3; : : : 

Det gäller därför för en AR(1)-process att autokorrelationen successivt 

avtar samt att den partiella autokorrelationen är noll från och med lag 

2. 

13.4.6 Modellen MA(1) 

I uppgiften 36 betraktade vi en speciell MA(1)-modell och vi skall nu 

generalisera denna. Antag därför att följande modell för tidsserien fYtg 

gäller: 

Yt = + t t 1 t 2 ON (0; ) . 

En dylik serie är alltid stationär och det gäller att 

8 

>< 

k = 1 + 

>: 

2 k = 1, 

k 2 1 

och kk = 

, k 1 

1 2(k+1) 

0 k = 2; 3; : : : 

c Mikael Möller


Uppgift 39 Visa att en MA(1) alltid är stationär samt har autokorrelationen 

ovan. 

För att bestämma den partiella autokorrelationsfunktionen kk ställer 

vi oss följande fråga: Hur mycket kan vi förbättra vår prognos av yt om 

vi erhåller kunskapen yt 1 och yt 2? Det gäller nu att 

yt = t t 1 

yt 1 = t 1 t 2 

yt 2 = t 2 t 3 

och vi ser att om vi känner yt 2 så har vi även lite kunskap om t 2. 

Detta ger oss i sin tur mer kunskap om t 1 = yt 1 + t 2 vilket sin 

tur förbättrar vår skattning av yt. På samma sätt kan vi resonera om 

yt 3; yt 4; : : :. Men ju längre bort desto mindre inverkan har den extra 

kunskapen. Det måste därför gälla att kk avtar när k växer. 

Uppgift 40 Visa med hjälp av ekvationerna 13.4 och 13.5 på sid 276 

att en MA(1) har den partiella autokorrelationen ovan. 

Vi avslutar detta avsnitt med att indikera arbetsgången i en ARMAanalys 

av en tidsserie och hur man gör en prognos. Härvid kommer vi 

att använda oss av storheter som ej diskuterats men detta är nödvändigt 

för fullständighetens skull. För en full förståelse hänvisas till t ex [2]. 

Exempel 71 Den svenska barnblöjan Libero …ck en minskad försäljning 

i och med Pamper:s intåg på den svenska marknaden. Libero:s försäljningsstatistik 

(1000-tals paket) per månad …nns för 10 år bakåt (hela 

den tid Pamper funnits på den svenska marknaden). Analysera data 

med hjälp av ARMA-teknik och ge en prognos för de följande månadsförsäljningarna. 

Lösning 52 Alla analyser börjar med en …gur över rådata, fytg, och 

vi ser direkt att detta inte är en stationär tidsserie ty dess väntevärde 

ändrar sig över tiden. Serien ger ett intryck av att vara styckvis linjär 

och detta indikerar att en di¤erens skall användas. Vi skapar därför 

serien 

zt = yt yt 1 

vars linjediagram ges i …guren nedan Väntevärdet och variansen för serien 

fztg ser ut att vara konstanta. Vi kan nu skatta den observerade autokorrelationsfunktionen 

och den observerade partiella autokorrelationsfunktionen. 

Därvid erhålls …gurerna 

c Mikael Möller


Lag Corr. S.E. 

1 ,339 ,0905 

2 ,125 ,0901 

3 +,017 ,0898 

4 +,141 ,0894 

5 ,016 ,0890 

6 ,209 ,0886 

7 +,119 ,0882 

8 +,049 ,0878 

9 ,064 ,0874 

10 ,053 ,0870 

11 +,096 ,0866 

12 +,053 ,0862 

13 ,157 ,0858 

14 +,051 ,0854 

15 +,064 ,0850 

1 

2 

3 

1000tals paket 

4 

3 

2 

1 

0 

16 

15 

14 

13 

12 

11 

10 

9 

8 

7 

6 

5 

4 

0 10 20 30 40 50 60 70 80 90 100 110 120 130 

Skattad autokorrelationsfunktion 

0 

0,5 0,0 0,5 

Skattad partiell auotokorrelationsfunktion 


1 ,339 ,0917 

2 ,271 ,0917 

3 ,157 ,0917 

4 +,066 ,0917 

5 +,077 ,0917 

6 ,168 ,0917 

7 ,030 ,0917 

8 +,003 ,0917 

9 ,038 ,0917 

10 ,042 ,0917 

11 +,046 ,0917 

12 +,065 ,0917 

13 ,081 ,0917 

14 ,007 ,0917 

15 +,018 ,0917 

0 

0 

0,5 0,0 0,5 

Figur 13.15: Autokorrelation och partiell autokorrelation för zt. 

Den skattade autokorrelationsfunktionen är signi…kant för k = 1 och 

6. Den skattade partiella autokorrelationsfunktionen ger ett avtagande 

intryck. Om vi i ett första steg bortser från det signi…kanta värdet för 

k = 6 erhålls att vi skall pröva en MA(1)-modell d v s 

zt = t t 1 t 2 ON(0; ) . 

Man …nner då att = 0:51.Residualserien ger oss sedan …guren 

c Mikael Möller



1 +,022 ,0905 

2 ,081 ,0901 

3 +,042 ,0898 

4 +,135 ,0894 

5 ,052 ,0890 

6 ,210 ,0886 

7 +,051 ,0882 

8 +,030 ,0878 

9 ,066 ,0874 

10 ,042 ,0870 

11 +,081 ,0866 

12 +,043 ,0862 

13 ,115 ,0858 

14 +,039 ,0854 

15 +,101 ,0850 

Skattad autokorrelationsfunktion 

residualer 

0 

0 

0,5 0,0 0,5 

Q p 

,06 ,8088 

,87 ,6480 

1,08 ,7808 

3,36 ,5001 

3,70 ,5940 

9,30 ,1577 

9,63 ,2103 

9,75 ,2827 

10,33 ,3246 

10,56 ,3931 

11,44 ,4074 

11,69 ,4708 

13,49 ,4110 

13,69 ,4730 

15,11 ,4434 


1 +,022 ,0917 

2 ,082 ,0917 

3 +,046 ,0917 

4 +,127 ,0917 

5 ,052 ,0917 

6 ,194 ,0917 

7 +,045 ,0917 

8 ,009 ,0917 

9 ,035 ,0917 

10 +,006 ,0917 

11 +,049 ,0917 

12 +,004 ,0917 

13 ,083 ,0917 

14 +,047 ,0917 

15 +,057 ,0917 

Skattad partiell autokorrelationsfunktion 

residualer 

0 

0,5 0,0 0,5 

Figur 13.16: Autokorrelation och partiell autokorrelation för t. 

För För både den skattade autokorrelationen och den skattade partiella 

autokorrelationen gäller att tidsdi¤erensen 6 är signi…kant. Dock 

detta kapitel går ej längre än till MA(1). Dessutom ser vi att p-värdet 

för testvariabeln 11 

Q = (n d)(n d + 2) 

KX 

k=1 

r 2 k 

n d k 

är större än 0:1 för alla tidsdi¤erenser k = 1; 2; : : : ; 15 så vi är nära en 

slutmodell. Vi nöjer oss därför med den funna modellen 

yt = yt 1 + t 0:51 t 1 t 2 ON(0; ) . 

En prognos för månad 121 när y120 = 10:6699459 och ^120 = 1:7662 

blir 

0:51^120 

= 10:6699459 + 0 0:51 ( 1:76620) 

y121 = y120 + 121 

För månad 122 …nner vi 

= 11:571 

0:51 121 

= 11:571 + 0 0:51 0 

y122 = ^y121 + 122 

= 11:571 

11 Denna testvariabel är framtagen av Ljung och Box och den används för att testa 

om vår modell är bra eller ej. 

Talet d står här för antalet gjorda di¤erenser och talet K = 1; 2; 3; : : :. I …gurerna 

anges denna testvariabel samtidigt med den skattade autokorrelationsfunktionen. 

c Mikael Möller


och samma prognosvärde erhålls för de följande månaderna. Observera 

att den bästa skattningen vi kan göra av t för t > 120 är väntevärdet 

och detta är 0. 


33 För serien fytg gäller att 

varav erhålls att 

yt;4 + yt+1;4 

2 

34 Eftersom yt = a så erhålls 

yt;4 = yt + yt+1 + yt+2 + yt+3 

4 

yt+1;4 = yt+1 + yt+2 + yt+3 + yt+4 

4 

G5 ((fag ; t)) = 

35 Eftersom yt = axt + zt så erhålls 

= yt + 2yt+1 + 2yt+2 + 2yt+3 + yt+4 

. 

8 

a + 2a + 2a + 2a + a 

8 

= a 

8G5 (a fxtg + fztg ; t) = axt 2 + zt 2 + 2 (axt 1 + zt 1) + 2 (axt + zt) 

Division med 8 ger nu påståendet. 

+ 2 (axt+1 + zt+1) + axt+2 + zt+2 

= a (xt 2 + 2xt 1 + 2xt + 2xt+1 + xt+2) 

+ (zt 2 + 2zt 1 + 2zt + 2zt+1 + zt+2) 

= 8 aG5 (fxtg ; t) + G5 (fztg ; t) 

36 Vi skall visa att punkt 1 och 2 i de…nitionen är uppfyllda. 

1. Det gäller att 

E(Zt) = E(b + t t 1) 

= b + 0 0 = b 

oberoende av t. På samma sätt erhålls 

V (Zt) = V (b + t t 1) 

= 0 + 2 + 2 = 2 2 

eftersom vi har oberoende t och således är även variansen konstant. 

c Mikael Möller


2. Det gäller att 12 

C(Zt; Zt k) = C(b + t t 1; b + t k t k 1) 

= C(b; b) + C( t 

| {z } 

=0 

t 1; t k t k 1) 

= C( t; t k) C( t; t k 1) C( t 1; t k) 

+ C( t 1; t k 1) . 

Nu gäller att i och j är oberoende (enligt antagandet) när i 6= j 

och därför erhålls att 

8 

< 

C(Zt; Zt k) = 

: 

2 2 k = 0 

2 k = 1 

0 k = 2; 3; : : : 

och det gäller därför att serien fZtg är svagt stationär. 

37 Vi skall visa att punkt 1 och 2 i de…nitionen är uppfyllda. 


t = E(Yt) = E(10 + 0:95Yt 1 + t) 

= 10 + 0:95 t 1 

= 10 + 0:95 (10 + 0:95 t 2) 

= 10 (1 + 0:95) + 0:95 2 t 2 

= 10 1 + 0:95 + 0:95 2 + 0:95 3 t 3 o s v 

Lite triviala räkningar ger nu att 

1 0:95t 

t = 10 

1 0:95 

+ 0:95t 

0 

|{z} 

=0 

1 0:95t t!1 10 

= 10 ! 

1 0:95 1 0:95 

12 Kovariansen är en bilinjär form och detta innebär att följande räkneregler gäller: 

C(X; Y ) = C(Y; X) , 

C(aX; Y ) = aC(X; Y ) , 

C(X + Z; Y ) = C(X; Y ) + C(Z; Y ) . 

Läsaren uppmanas att visa dessa räkneregler utifrån de…nitionen av kovarians 

C(X; Y ) = E X E(X) Y E(Y ) . 

c Mikael Möller


och vi ser att ett svagt beroende av t föreligger men att detta 

beroende klingar av ju längre tiden går. Väntevärdet är således 

konstant efter lång tid. För variansen erhåller vi ett liknande resultat 

varför 

2 1 0:952t 

t = 

1 0:952 2 

t = V (Yt) = V (10 + 0:95Yt 1 + t) 

= 0:95 2 V (Yt 1) + 

= 0:95 4 V (Yt 2) + 0:95 2 2 + 2 

= 

2 2t 

+ 0:95 V (Y0) = 

| {z } 

=0 

1 0:952t 

1 0:952 Variansen är även den konstant efter lång tid. 


2 t!1 

! 

Tk = C(Yt; Yt k) = C(Yt; 10 + 0:95Yt k 1 + t k) 

= C(Yt; 10) 

| {z } 

=0 

= 0:95Tk 1 

+ 0:95C(Yt; Yt k 1) + C (Yt; t k) 

| {z } 

=0 k>0 

= 0:95 2 Tk 2 = 0:95 3 Tk 3 = : : : = 0:95 k T0 

= 0:95 k 2 t 

t!1 

! 

2 

. 

1 0:952 2 

1 0:95 2 

Härav följer att kovariansen, efter lång tid, endast beror av tidsdi¤erensen 

k. 

38 Ovan beräknade vi väntevärdet för Yt till 

mY = 1 

och utgick då ifrån att stationäritet gällde. Antag nu att vi inte vet att 

mY är konstant. Vi får då ekvationen (rekursionen) 


mt = + mt 1 

= + ( + mt 2) 

= + + 2 mt 2


och det är nu inte svårt att övertyga sig om att 

mt = 

Xt 

1 

i=0 

i + t m0 = 1 t 

1 

+ t m0. 

Om nu = 1 så erhålls att mt = t + m0 (l’Hospital:s regel) och om 

j j > 1 så växer högerledet med t. I båda fallen har vi inte ett konstant 

värde på väntevärdet och således kan vi inte ha en stationär tidsserie för 

dessa värden på . 


samt att 

E(Yt) = + E( t) E( t 1) = + 0 + 0 = 

V (Yt) = V ( t) + 2 V ( t 1) = 2 1 + 2 

C(Yt; Yt k) = C( + t t 1; + t k t k+1) 

= C( ; ) + C( ; t k) C( ; t k+1) 

+ C( t; ) + C( t; t k) C( t; t k+1) 

C( t 1; ) C( t 1; t k) + 2 C( t 1; t k+1) . 

Man övertygar sig lätt om att alla kovarianser är 0 för k = 2; 3; : : : samt 

att 

2 

C(Yt; Yt 1) = . 



V (Yt) 

40 Av de…nition följer att 

= 

8 

< 

: 1 + 2 k = 1, 

0 k = 2; 3; : : : . 

1;1 = 1 

Med hjälp av rekursionen 13.4 och 13.5 erhålls 

2;2 = 2 

1 

2 

1 

2 

1 

c Mikael Möller


c Mikael Möller

14. ARMA processer 

287

288 

c Mikael Möller

15. Beslutsteori 

Inom all ekonomisk verksamhet fattas dagligen både stora och små beslut. 

Oftast är det frågan om beslut av ringa ekonomiskt värde och dessa behöver 

sällan någon omfattande utredning men ibland gäller det stora 

projekt som t ex tågtunneln genom Hallandsåsen. Behovet av detta projekt 

gavs en ekonomisk motivering och borde därför ha ställts inför en 

ekonomisk utvärdering för att avgöra om relationen mellan vinst och 

kostnad ger rätt tecken. Dock blev det hela en politisk fråga och all 

vedertagen vetenskap ‡ög sin kos. 

Det …nns också mindre projekt om än ej av samma dignitet som behöver 

en vetenskaplig utvärdering. Exempel på ett sådant är när du har 

tre miljoner och en person kommer till dig och ansöker om ett bolån på 

säg tre miljoner kronor. Skall lånet beviljas eller ej? För att utvärdera 

bästa sättet att förvalta de tre miljonerna – som bolån eller annan investering 

– kan du naturligtvis ta hjälp av logistisk regression för att 

utröna sannolikheten för att personen kan betala ränta och amortering 

under en följd av år. Men detta räcker inte för att avgöra vilket av de 

två (eller ‡era valen) som skall väljas för att optimera avkastningen på 

de tre miljonerna. Istället behöver man beakta förväntad avkastning för 

de olika investeringsmöjligheterna för att slutligen välja den investering 

som ger bäst förväntad avkastning. 

I var och en av de beskrivna situationerna föreligger det en räcka 

av val, som du som beslutsfattare kan göra men du drabbas också av 

händelser som du ej kan påverka: 

Har du gjort ett dåligt val av en tätningsprodukt kan du råka ut 

för Rhoca Gil, förgiftat med akrylamid, med ett bra val hade du 

sluppit detta. 

Har du gjort ett dåligt val av företag får du sparken ty företaget 

slimmar (ett politiskt ord för att man avskedar folk) sin organisation 

på grund av konjunkturnedgång, med ett bra val hade du 

sluppit detta. 

Beslutsteorin hjälper oss att fatta beslut i dylika situationer när vi har 

kunskap om vinster/kostnader för olika val och olika händelser. Denna 

kunskap kan vara antingen exakt som vid de olika valalternativen eller i 

form av någon sannolikhetsfunktion som för händelserna. 

289

290 15.1. Beslutsprocessen 

Vissa beslut fattar vi själva (aktivt) – t ex om man skall köpa ett 

företag som tidigare sysslat med asbest eller om vi skall börja byggandet 

av tunnel –och denna typ av beslut kallar vi val. 

Andra beslut fattas av andra åt oss (icke-aktivt) –t ex om en grupptalan 

i ett asbestmål skall väckas mot företaget eller om en tätningsprodukt 

innehållet ett giftigt ämne –och denna typ av beslut kallar vi för 

händelser. Över händelser rår vi ej (inte alltid sannt) men kan ofta 

åsätta dem en sannolikhet för att de skall inträ¤a. 

Till varje följd av beslut, aktiva och icke-aktiva, förknippas en vinst/kostnad 

som kan beräknas och detta kapitel skall ge oss några enkla modeller som 

kan leda oss till ett rimligt beslut. 

15.1 Beslutsprocessen 

Alla beslutsproblem måste ha ett mål ty utan ett mål har vi inget att 

besluta om. Dessa mål tar alltid ställning för något ty vi bygger inte en 

ny fabrik för att ha något att göra utan för att vi har ett visst mål som 

t ex : 

skapa en större vinst för koncernen under de följande 5 åren, 

skapa sysselsättning åt en del av befolkningen, 

bygga en ny järnvägssträckning, 

berika VD och vissa prominenta styrelseledamöter o s v. 

När så målet är bestämt så gäller det att …nna vad vi kan påverka 

(kontrollerbara variabler) och vad vi inte kan påverka (icke-kontrollerbara 

variabler). 

När det gäller byggandet av en fabrik så kan följande variabler betraktas 

som kontrollerbara: 

1. aktuellt pris på byggmaterial, 

2. tomtpriset, 

3. priser på den blivande produktens råvaror, 

4. priset på den produkt som skall tillverkas o s v. 

Exempel på, för företaget, icke-kontrollerbara variabler kan vara 

1. samhällets ekonomiska utvecklingen, 

c Mikael Möller

15. Beslutsteori 291 

2. politiska beslut om subventioner, 

3. kommer produkten att efterfrågas, 

4. andra aktörers beslut o s v 

Dessa variabler, kontrollerbara och icke-kontrollerbara, är antingen 

helt kända som dagspriset på cement medan andra endast är ofullständigt 

kända som den ekonomiska utvecklingen. Utifrån ovanstående 

information skapar vi sedan en modell för hur vårt beslut skall fattas. 

Exempel 72 Du har fått ett arv om en miljon kronor och just nu har du 

inte behov av dessa pengar. Däremot, om 5 år, är ditt nuvarande projekt 

slut och du tänker då passa på att ta en längre semester. Eftersom du 

är obenägen att ta stora risker väljer du mellan två sparformer 

1. sätta in pengarna på riksgälden mot en fast 5-årig ränta om 100r 

procent. 

2. sätta in pengarna mot en variabel årlig ränta om 100ri procent för 

år i. 

Vad skall du göra? 

Lösning 53 Målsättningen här är uppenbar: Du vill optimera din avkastning 

under en 5-års period. De variabler som ingår är 

Kontrollerbara Antalet år 5, den 5-åriga räntan r, och den första 1åriga 

räntan r1. 

Okontrollerbara De följande fyra 1-åriga räntorna r2; r3; r4; r5. 

De två modellerna som beskriver kapitalets utveckling under de 5 åren 

kan skrivas (där k0 = 1 000 000) 

1. efter 5 år med fast ränta har vi kapitalet 

k5 = k0 (1 + r) 5 . 

2. efter 5 år med 5 ett-åriga räntor har vi kapitalet 

k5 = k0 (1 + r1) (1 + r2) (1 + r3) (1 + r4) (1 + r5) . 

För att fatta beslut simuleras olika troliga (hur det varit historiskt) 

ränteutvecklingar för r2; r3; r4 och r5 samt beräkna kapitalet för respektive 

räntemix. Välj sedan den sparform som ger störst förväntad avkastning. 

c Mikael Möller

292 15.2. Enkla beslutsproblem 

För att föra resonemanget vidare behöver vi följande tre de…nitioner 

av Val, Händelse och Betalning. 

De aktiva valen kan vara V1 = Inga investeringar, V2 = Investera i 

be…ntliga anläggningar och personal eller V3 = Bygg en ny anläggning. 

De…nition 54 De ömsesidigt uteslutande beslutsalternativ som står till 

buds betecknar vi med V1; V2; : : : ; Vn (här står V för ’val’). 

De icke-aktiva valen, framtida händelser, som påverkar vårt företag 

är t ex h1 = konjunkturuppgång och h2 = konjunkturnedgång. 

De…nition 55 De ömsesidigt uteslutande framtida händelser som en beslutsfattare 

ej kan påverka betecknar vi med h1; h2; : : : ; hm (här står h 

för ’händelse’). 

Beroende på de val vi gör och de händelser som drabbar oss erhålls 

en vinst eller kostnad (negativ vinst). 

De…nition 56 De positiva eller negativa kostnader som associeras med 

varje kombination av aktiva och icke-aktiva val betecknar vi med b1;1, 

b1;2, : : :, bn;m (där b står för ’betalning’). 

15.2 Enkla beslutsproblem 

Ett sätt att beskriva en beslutssituation är via en betalningstabell (betalningsmatrisen 

betecknas med B) och den betecknar vi med: 

Händelse 

Val h1 h2 hm 

V1 b1;1 b1;2 b1;m 

V2 b2;1 b2;2 b2;m 

. 

. 

. 

. .. 

Vn bn;1 bn;2 bn;m 

. 

= 

Händelse 

Val h1 h2 hm 

V1 

. B 

Med dess hjälp kan vi fatta enkla deteriministiska beslut. Beroende på 

om bi;j är positiv eller negativ så erhålls en vinst eller en kostnad. Det 

…nns nu tre enkla kriterier för att behandla dylika tabeller – ett pessimistiskt, 

ett optimistiskt och ett som vi kallar ’förlorade möjligheter’. 

Vi skall betrakta och jämföra dessa kriterier utgående från en positiv 

betalningsmatris (vinst) och lämnar åt läsaren att ta fram motsvarande 

algoritmer när betalningsmatrisen är negativ (kostnad). 


Vn


15.2.1 Minimax 

Denna algoritm går ut på att för varje val välja den händelse som ger 

minst förtjänst och därefter välja det val som ger maximum av dessa minimala 

förtjänster. Detta är sannerligen en pessimistisk syn på framtiden 

även om den andas lite optimism på slutet. Formellt lägger vi till en kolumn 

till betalningstabellen och i denna anger vi minima över raderna. 

Längst ned anges det största av dessa minima: 

Händelse Rad 

Val h1 h2 hm min 

V1 b1;1 b1;2 b1;m R1 = min (b1;1; : : : ; b1;m) 

V2 b2;1 b2;2 b2;m R2 = min (b2;1; : : : ; b2;m) 

. 

. . . .. . 

. 

Vn bn;1 bn;2 bn;m Rn = min (bn;1; : : : ; bn;m) 

max (R1; : : : ; Rn) 

Motsvarande för en kostnadsmatris blir maximin där vi först maximerar 

kostnaden för varje val och sedan tar det val som ger minst kostnad. 

15.2.2 Maximax 

Denna algoritm går ut på att för varje val välja den händelse som ger 

mest förtjänst och därefter välja det val som ger maximum av dessa 

maximala förtjänster. Detta är optimistens syn på framtiden. Även här 

lägger vi till en kolumn till betalningstabellen som nu innehåller följande 

uträkningar 

Händelse Rad 


V1 b1;1 b1;2 b1;m R1 = max (b1;1; : : : ; b1;m) 

V2 b2;1 b2;2 b2;m R2 = max (b2;1; : : : ; b2;m) 

. 

. . . .. . 

. 

Vn bn;1 bn;2 bn;m Rn = max (bn;1; : : : ; bn;m) 

max (R1; : : : ; Rn) 

Motsvarande för en kostnadsmatris blir minimin där vi först minimerar 

kostnaden för varje val och sedan tar det val som ger minst kostnad. 

c Mikael Möller

294 15.2. Enkla beslutsproblem 

15.2.3 Förlorade möjligheter 

Ovanstående två metoder är rakt på sak ty de betraktar vinst/kostnad. 

En metod som är mer indirekt är att istället bestämma en betalningsmatris 

som mäter den besvikelse man känner när man har gjort ett val 

och det sedan visar sig att man kunde ha gjort ett bättre val. Först 

de…nerar vi vad vi menar med ’besvikelse’: 

De…nition 57 Om det föreligger n möjliga val V1; V2; : : : ; Vn och m 

möjliga händelser h1; h2; : : : ; hm samt om den ursprungliga betalningsmatrisen 

är B = fbijg n;m 

i;j=1 så gäller att maximal betalning vid händelsen 

hj är b j = max(b1j; b2j; : : : ; bnj); j = 1; 2; : : : ; m. Vi säger nu att valet 

Vi ger oss besvikelsen bij := b j 

bij. 1 

Rent formellt bildar vi för varje enskild händelse maximum, av betalningarna, 

över valen. Därefter bildar vi nya betalvärden genom att 

från varje kolumnmaximum dra betalvärdet. Därvid erhålls den nya 

betalningstabellen 

Händelse 

Val h1 h2 hm 

V1 b 1 b1;1 b 2 b1;2 b m b1;m 

V2 b 1 b2;1 b 2 b2;2 b m b2;m 

. 

. 

. 

Vn b 1 bn;1 b 2 bn;2 b m bn;m 

På denna betalningstabell tillämpar vi sedan maximin-metoden d v s vi 

minimerar de största besvikelserna. Vad de enskilda betalningarna här 

mäter är den indirekta förlust vi gör om vårt val inte blir det bästa 

möjliga. 

För att illustrera hur räkningarna genomförs i de tre ovan angivna 

metoderna ger vi några exempel. 

Exempel 73 Företaget Lego (ett företag i leksaksbranschen) måste för 

att kunna möta den ökande konkurrensen inom leksaksmarknaden göra 

nya investeringar och har att välja mellan följande beslut: 

V1 Inga investeringar görs. 

V2 Investera i be…ntliga anläggningar och personal. 

1 Beteckningen := betyder att vi omde…nierar det som står till vänster till att 

innehålla något nytt – nämligen det som står till höger. 


. 

.


V3 Bygg en ny anläggning. 

Leksaksmarknaden är betingad av antalet barn och konjunkturen. Man 

bedömer att två olika möjliga framtider – h1 och h2 (där h1 är konjunkturuppgång 

och h2 är konjunkturnedgång) –föreligger och baserat på 

tidigare erfarenheter och befolkningsstrukturer sätter man upp följande 

vinsttabell: 

Händelse 

Beslut h1 h2 

V1 200 100 

V2 1200 200 

V3 3000 800 

Vilket beslut skall man fatta med metoderna, när man använder begreppet 

vinst, minimax, maximax och ’förlorade möjligheter’? 

Lösning 54 Minimax-metoden ger oss tabellen 

Händelse Rad 

Beslut h1 h2 min 

V1 200 100 100 

V2 1200 200 200 

V3 3000 800 800 

Rad max: 100 

och vi fattar beslutet V1: att göra inga investeringar. Maximax-metoden 

ger oss betalningstabellen 

Händelse Rad 

Beslut h1 h2 max 

V1 200 100 200 

V2 1200 200 1200 

V3 3000 800 3000 

Rad max: 3000 

och vi fattar beslutet V3: att bygga en ny anläggning. Besvikelsemetoden 

d v s metoden med ’förlorade möjligheter’ ger oss betalningstabellen 

Händelse 

Beslut h1 h2 

V1 3000 200 100 ( 100) 

V2 3000 1200 100 ( 200) 

V3 3000 3000 100 ( 800) 

3000 100 

) 

Händelse Rad 

Beslut h1 h2 max 

V1 2800 0 2800 

V2 1800 100 1800 

V3 0 700 700 

Rad min: 700 

c Mikael Möller

296 15.3. Enkla beslut baserade på väntevärden 

och vi fattar beslutet att bygga en ny anläggning. 

De deterministiska metoderna ovan är behäftade med en del problem. 

Bland annat bryr de sig inte om vinstens storlek utan tar endast hänsyn 

till deras ordning. Om t ex b3;1 = 3 000 000 så väljer minmax-metoden 

fortfarande beslutet: Inga investeringar. Ej heller tar metoderna hänsyn 

till att händelserna kan ha olika sannolikheter att inträ¤a. De påverkas 

även av irrelevanta faktorer som regeringars bidragssystem för vissa 

typer av verksamheter. Dylika ändrar betalningstabellen och därmed 

kan besluten förändras. I nästa avsnitt skall vi ta upp problemet med 

att händelserna kan ha olika sannolikheter för att inträ¤a. 

15.3 Enkla beslut baserade på väntevärden 

Eftersom valen fattas av oss baserat på den kunskap vi äger är dessa 

även fortsättningsvis deterministiska men händelserna skall nu betraktas 

som stokastiska. Detta betyder att vi skapar en stokastisk modell för 

händelserna och därmed kan vi ta hänsyn till storleken på de enskilda 

betalningarna. Sätt därför 

H = den händelse som inträ¤ar, 

där H = fh1; h2; : : : ; hmg och P (H = hi) = pi, i = 1; 2; : : : ; m och 

p1 + p2 + + pm = 1. De av oss ovan betraktade metoderna ersätts nu 

med: 

Förväntad betalning (kostnad) Skillnaden nu blir att istället för 

att ta minimum (maximum) för varje val beräknar vi valets förväntade 

betalning. Därefter tar vi, som förr, det val som ger den 

största förväntade avkastningen (minsta förväntade kostnaden). 

Vår utvidgade betalningstabell blir nu 

Händelse Rad 


V1 b1;1 b1;2 b1;m R1 = P m 

i=1 b1;ipi 

V2 b2;1 b2;2 b2;m R2 = P m 

. 

. 

. 

. 

. 

. 

. .. 

. 

. 

i=1 b2;ipi 

Vn bn;1 bn;2 bn;m Rn = P m 

i=1 bn;ipi 

. 

. 

max (R1; : : : ; Rn) 

och vi väljer det alternativ som har störst förväntad vinst (kostnad). 

Denna metod ersätter de två metoderna minimax och maximax 

(maximin och minimin). 

c Mikael Möller


Förväntad besvikelse Den utvidgade besvikelsetabellen blir i sin 

tur 

Händelse Rad 

Val 

V1 

h1 

b 1 b1;1 

hm 

b m b1;m R1 = Pm i=1 (b V2 b 1 b2;1 b m b2;m 

i 

R2 = Pm i=1 (b . 

Vn 

. 

b 1 bn;1 

. .. . 

b m bn;m 

i 

. 

Rn = Pm i=1 (b i 

min (R1; : : : ; Rn) 

b1;i) pi 

b2;i) pi 

bn;i) pi 

och vi väljer det alternativ som har minst förväntad besvikelse. 

Exempel 74 (forts) Företaget Lego:s ekonomichef bedömer sannolikheten 

för en konjunkturuppgång till 0:6 och för konjunkturnedgång till 0:4. 

Lego:s betalningstabell kan nu skrivas: 

Händelse 

Beslut h1 h2 

V1 200 100 

V2 1200 200 

V3 3000 800 

P (H = hi) 0:6 0:4 

Bestäm det val som ger högst förväntad avkastning respektive lägst förväntad 

besvikelse. 

Lösning 55 I båda fallen har vi att beräkna väntevärden över rader och 

…nner därvid tabellerna: 

Förväntad betalning 

Händelse Rad 


V1 200 100 80 

V2 1200 200 640 

V3 3000 800 1480 

P (H = hi) 0:6 0:4 1480 

Enligt den utvidgade betalningstabellen skall vi välja att bygga en 

ny fabrik. 

c Mikael Möller

298 15.3. Enkla beslut baserade på väntevärden 

Förväntad besvikelse 

Händelse Rad 


V1 2800 0 1680 

V2 1800 100 1120 

V3 0 700 280 

P (H = hi) 0:6 0:4 280 

Även denna tabell säger att vi skall bygga en ny fabrik. 

Exempel 75 En leverantör säljer dagsfärsk morotssaft och inköper varje 

morgon ett antal kartonger om 64 burkar till en kostnad av 200 kronor 

per kartong. Varje försåld kartong ger en intäkt om 500 kronor. Av 

erfarenhet vet leverantören att försäljningen ligger mellan 1 till 3 kartonger 

per dag. Hur många kartonger skall inköpas om man tillämpar 

metoden med förväntad vinst när historien visat att 

P (H = 1) = 0:5, P (H = 2) = 0:3, P (H = 3) = 0:2, 

där H =antal försålda kartonger. 


Vi beräknar de tre väntevärdena till 

Vi = i kartonger köps. 

E(V1) = 300 0:5 + 300 0:3 + 300 0:2 = 300 

E(V2) = 100 0:5 + 600 0:3 + 600 0:2 = 350 

E(V3) = 100 0:5 + 400 0:3 + 900 0:2 = 250 

och vi ser att denna metod föreslår att vi skall köpa två kartonger ty då 

erhålls störst förväntade vinst. 

Om vi i ovanstående exempel med morotssaft använder den givna 

fördelningen på en besvikelsetabell istället så erhålls (V B 

i anger att 

besvikelsetabellens data används) 

E(V B 

1 ) = 0 0:5 + 300 0:3 + 600 0:2 = 210 

E(V B 

2 ) = 200 0:5 + 0 0:3 + 300 0:2 = 160 

E(V B 

3 ) = 400 0:5 + 200 0:3 + 0 0:2 = 260 

och även denna tabell föreslår att vi skall köpa två kartonger ty då erhålls 

den minsta förväntade besvikelsen. 

c Mikael Möller


Vi noterar nu att E(V B 

1 ) + E(V1) = 510 samt att även de två andra 

valen adderar sig till 510. Detta är ingen tillfällighet ty allmänt har vi 

E(V B 

i ) = 

j=1 

E(Vi) = 

j=1 

mX 

j=1 

bijpj 

och motsvarande för besvikelsetabellen blir 

mX 

(b j 

mX 

bij) pj = b jpj 

mX 

mX 

bijpj = b jpj 

Men detta ger oss sambandet 

E(V B 

i ) + E(Vi) = 

j=1 

j=1 

mX 

b jpj = konstant oberoende av i 

j=1 

E (Vi) . 

och därför gäller att E(V B 

i ) är minst när E(Vi) är störst och vice versa. 

Det är därmed visat att metoden med Förväntad betalning ger samma 

resultat som metoden med Förväntad besvikelse och framgent behöver 

vi därför endast betrakta metoden med Förväntad betalning. 

15.4 Enkla beslutsträd 

De ‡esta beslutssituationer är dock inte så enkla att de går in under de 

modeller vi byggt ovan. Vanligen består ett beslut av ‡era på varandra 

följande delbeslut där man inhämtar olika typer av information inför 

varje delbeslut. För att kunna hantera även dessa beslutssituationer på 

ett bra sätt måste vi bygga ut vår modell och för att kunna göra detta 

behöver vi ett alternativt angreppssätt. Vi börjar först med ett par 

visuella de…nitioner. 

Med en beslutspunkt V och n beslutsgrenar V1; : : : ; Vn avses ett 

beslutsträd enligt …guren till vänster. 

V a l 

V1 

V2 

Vn 

H ä n 

h1 

h2 

hn 

c Mikael Möller

300 15.4. Enkla beslutsträd 

Med en händelsepunkt H och m händelsegrenar h1; : : : ; hn avses ett 

beslutsträd enligt …guren till höger höger. Det går naturligtvis utmärkt 

att kombinera dylika enkla beslut- och händelseträd till mycket intrikata 

beslutsträd. 

Vi betraktar åter igen exemplet med företaget Lego och skall för 

detta rita beslutsträd för de två olika betalningstabellerna svarande mot 

minimax-metoden och väntevärdes-metoden. 

Exempel 76 (forts)Bestäm för företaget Lego, med betalningstabellerna 

i exempel 73 sid 294 och 74 sid 297, beslutsträden för en minimax-lösning 

respektive ett väntevärdesbeslut. 

Lösning 57 Från de två betalningstabellerna erhålls följande beslutsträd 

under minimax-regeln 

100 

Inga investeringar 

Investera i bef. anläggningar 

k 

Bygg ny fabrik 

k 

respektive beslutsträdet 

1480 

Inga investeringar 

k 

Investera i bef. anläggningar 

k 

Bygg ny fabrik 

100 

200 

800 

80 

640 

1480 

Konjunktur 

uppgång 

nedgång 

uppgång 

nedgång 

uppgång 

nedgång 

Konjunktur 

uppgång 

nedgång 

uppgång 

nedgång 

uppgång 

nedgång 

200 

100 

1200 

200 

3000 

800 

200 

100 

1200 

200 

3000 

under väntevärdes-regeln. Vi markerar med k att detta val ej skall väljas. 


800


Av detta exempel följer att vi inte har någon ny information utan 

vad vi har är ett generellare sätt att angripa ett beslutsproblem. Betalningstabellerna 

klarar bara av två dimensioner t ex ett val och en 

händelse och det är inte trivialt att utveckla dessa tabeller till ‡era val 

och ‡era händelser. Däremot är det trivialt att haka på ‡era val och 

händelser i ett beslutsträd och detta kommer att ge oss allmäna beslutsträd. 

Dock, innan vi går in på de allmäna beslutsträden skall vi utreda 

vad betingning kan ge. 

15.5 Aposteriorisannolikheter 

Tidigare, i avsnittet Sannolikhetslära, de…nierade vi den betingade sannolikheten 

för en händelse A givet en händelse B enligt 

P (A j B) = 

P (A \ B) 

P (B) 

och denna de…nition innebär att vi begränsar vårt utfallsrum till att 

endast omfatta mängden B d v s att B nu utgör det nya utfallsrummet. 

Med hjälp av de…nition för betingad sannolikhet skall vi visa en inom 

beslutsteorin mycket användbar sats kallad Bayes sats. 

Theorem 58 Låt A1; A2; : : : ; An vara ömsesidigt uteslutande händelser 

sådana att de tillsammans beskriver hela utfallsrummet . Då gäller för 

en godtycklig händelse B i att 

P (Ai j B) = 

P (B j Ai) P (Ai) 

P (B j A1) P (A1) + + P (B j An) P (An) 

i = 1; 2; : : : ; n. 

Bevis 20 Att de ömsesidigt uteslutande händelserna A1; A2; : : : ; An tillsammans 

bildar hela utfallsrummet innebär att 

= A1 [ A2 [ [ An och Ai \ Aj = ;, för varje par i; j. 

Figuren nedan ger oss följande samband 

B = \ B = (A1 [ A2 [ [ An) \ B 

= (A1 \ B) [ (A2 \ B) [ [ (An \ B) 

där det gäller att alla (Ai \ B) i sin tur är ömsesidigt uteslutande och 

därmed har vi, enligt den speciella additionssatsen, att 

P (B) = P (A1 \ B) + P (A2 \ B) + + P (An \ B) . 

c Mikael Möller

302 15.5. Aposteriorisannolikheter 

Men eftersom det enligt de…nition av betingning gäller att 

P (Ai \ B) = P (B j Ai) P (Ai) i = 1; 2; : : : ; n 

följer påståendet i satsen. 

A3 

A2 

A4 

B 

A1 

An 1 

Vad det hela handlar om är således: Givet en apriori-sannolikhet, 

P (Ai), samt den nya kunskapen B, bestäm hur den ursprungliga sannolikheten 

förändras när B är känd d v s bestäm aposteriori-sannolikheten 

P (Ai j B). 2 

Exempel 77 En ny …lm har premiär och …lmbolaget bedömer sannolikheten 

för succé till 0:7. Historiskt sett har en viss kritiker gett bra 

recensioner i 75 procent av de fall då …lmerna blivit succéer och dåliga recensioner 

i 90 procent av de fall då de varit misslyckade. Efter premiären 

hyllar kritikern …lmen och din uppgift är att bestämma sannolikheten för 

en ny succé baserat på denna nya kunskap. 

Lösning 58 Av texten följer att händelserna ’succé’och ’bra recension’ 

är av betydelse. Frågan är vilken av dem som skall erhålla beteckningen 

A respektive B. För att avgöra detta konstaterar vi att texten ger 

sannolikheten 

P (’bra recension’j ’succé’) = 0:75 

samt att vi skall beräkna 

: : : 

An 

P (’succé’j ’bra recension’) . 

Följande beteckningar är därför lämpliga 

A1 = ’succé’ 

A2 = ’ej succé’ 

B = ’bra recension’ 

2 ’prior’står för föregående och ’posterior’för efterföljande. 

c Mikael Möller


och vi söker P (A1 j B). Denna sannolikhet kan enligt Bayes sats skrivas 

P (A1 j B) = 

Ur texten …nner vi 3 

P (B j A1) P (A1) 

P (B j A1) P (A1) + P (B j A2) P (A2) . 

P (A1) = 0:7 

P (B j A1) = 0:75 

P {B j A2 = 0:9 

varför P (A2) = 0:3 och P (B j A2) = 0:1. Sökt sannolikhet erhålls nu 

enligt Bayes sats till 

P (’succé’j ’bra recension’) = 

15.6 Allmäna beslutsträd 

0:75 0:7 

= 0:95. 

0:75 0:7 + 0:1 0:3 

Vi såg ovan att vi med hjälp av Bayes sats kan uppdatera vår ursprungliga 

sannolikhet (priorsannolikhet) till en ny sannolikhet (posteriorsannolikhet) 

när ny information blir tillgänglig. Bayesianska beslutsträd 

utnyttjar denna egenskap genom att strukturera olika beslut i form av 

ett träd och i detta träd ange de sannolikheter med vilka vi väljer olika 

grenar. Därefter kan vi för de olika valen räkna ut de förväntade betalningarna 

och med deras hjälp fatta det beslut som ger högst (minst) 

förväntad vinst (kostnad). 

Exempel 78 För att slippa ifrån EU:s skyddstullar bestämmer sig Toyota 

för att bygga en fabrik i England. Man har då att välja mellan att 

bygga en liten fabrik (200 000 bilar per år) och en stor fabrik (600 000 bilar 

per år). Nu kan efterfrågan på dessa bilar antingen bli svag eller stark 

och man bedömer sannolikheten för svag efterfrågan till 0:7. Genom 

att ta hänsyn till så många faktorer som möjligt har man beräknat den 

genomsnittliga årsvinsten under de närmaste 5 åren och därvid erhållit 

betalningstabellen (i någon sort) nedan 

Händelse 

Beslut h1 h2 

V1 8 5 

V2 2 12 

P (H = hj): 0:7 0:3 

3 Beteckningen {B betyder komplementet till mängden B. 

c Mikael Möller

304 15.6. Allmäna beslutsträd 

där 

V1 = bygg liten fabrik 

V2 = bygg stor fabrik 

h1 = svag efterfrågan 

h2 = stark efterfrågan 

För att underlätta beslutsfattandet anlitar Toyota en Europeisk konsult 

som är specialiserad på marknadsundersökningar för biltillverkare i Europa. 

Om denna konsult gäller att denne, historiskt sett, har haft rätt i 

sina prognoser om svag efterfrågan i 90 procent av de fall där efterfrågan 

blivit svag. I de fall där de prognosticerat stark efterfrågan har de 

haft rätt i 80 procent av fallen. Konsulten tar självklart betalt för sin 

medverkan och för en dylik prognos debiterar denne 0:1. Hjälp Toyota 

att fatta ett beslut – bygga liten eller stor fabrik? 

Lösning 59 Först gör vi en så kallad prior-analys baserad på Toyotas 

egen information och därefter en posterior-analys där informationen från 

konsulten tas med. Med hjälp av denna analys skall vi sedan avgöra om 

det är värt pengarna att engagera konsulten samt vilken fabrik som skall 

byggas. Betalningstabellen ger följande förväntade vinster: 

Liten fabrik: 8 0:7 + 5 0:3 = 7:1 

Stor fabrik: 2 0:7 + 12 0:3 = 2:2 

och vår rekommendation blir, utan ytterligare information, att Toyota 

skall bygga en liten fabrik eftersom den förväntade vinsten då är 

störst. Låt oss se hur marknadskonsulten kan ändra på detta resultat. 

Vi behöver nu en beteckning för konsultens utlåtande och sätter därför 

R1 = konsulten förutsäger svag efterfrågan 

R2 = konsulten förutsäger stark efterfrågan 

och baserat på det historiska materialet erhålls följande skattade sannolikheter 


P (R1 j H = h1) = 0:9, P (R2 j H = h1) = 0:1, 

P (R2 j H = h2) = 0:8, P (R1 j H = h2) = 0:2. 

P (R1) = P (R1 j H = h1) P (H = h1) + P (R1 j H = h2) P (H = h2) 


= 0:9 0:7 + 0:2 0:3 = 0:69


och 

P (R2) = 1 P (R1) = 1 0:69 = 0:31. 

Med hjälp av dessa sannolikheter beräknar vi nu med hjälp av Bayes sats 

0:9 0:7 

P (H = h1 j R1) = 

P (R1) 

0:2 0:3 

P (H = h2 j R1) = 

P (R1) 

0:1 0:7 

P (H = h1 j R2) = 

P (R2) 

0:8 0:3 

P (H = h2 j R2) = 

P (R2) 

63 

= 

69 

6 

= 

69 

7 

= 

31 

24 

= 

31 

0:91 

0:09 

0:23 

0:77 

De förväntade vinsterna i noderna blir (för ett färdigt beslutsträd se …gur 

nedan) 

7:63 = 0:91 7:9 + 0:09 4:9 

0:84 = 0:91 2:1 + 0:09 11:9 

5:59 = 0:23 7:9 + 0:77 4:9 

8:68 = 0:23 2:1 + 0:77 11:9 

7:1 = 0:7 8 + 0:3 5 

2:2 = 0:7 2 + 0:3 12 

7:63 = max( 0:84; 7:63) 

8:68 = max(5; 59; 8:68) 

7:1 = max(2:2; 7:1) 

7:9555 = 7:63 0:69 + 8:68 0:31 

7:9555 = max(7:1; 7:9555) 

Den maximala förväntade vinsten blir därför 7:9555 och den erhålls via 

beslutskedjan: Eftersom 7:9555 7:1 = 0:8555 > 0:1 skall Toyota ge 

konsult…rman i uppdrag att undersöka den blivande marknaden. Beslutsträdet 

15.1 på sid 306 ger oss nu följande beslutstrategier: Om konsulten 

spår 

svag efterfrågan bygg en liten fabrik, 

stark efterfrågan bygg en stor fabrik. 

c Mikael Möller

306 15.6. Allmäna beslutsträd 

P (H = h 1 j R 1 ) 12 

B y g g lit e n f a b r i k 

7:63 

P (H = h 2 j R 1 ) 2 

P (R 1 ) 

7:63 

P (H = h 1 j R 1 ) 5 

B y g g s t o r f a b r i k 


0:84 

P (H = h 2 j R 1 ) 8 

H y r k o n s u lt 

7:96 

P (H = h 1 j R 2 ) 11:9 

B y g g lit e n f a b r i k 

5:59 

P (H = h 2 j R 2 ) 2:1 

P (R 2 ) 

8:68 

P (H = h 1 j R 2 ) 4:9 

B y g g s t o r f a b r i k 

8:68 

7:96 

P (H = h 2 j R 2 ) 7:9 

P (H = h 1 ) 11:9 

B y g g lit e n f a b r ik 

7:1 

P (H = h 2 ) 2:1 

E j k o n s u lt 

7:10 

P (H = h 1 ) 4:9 

B y g g s t o r f a b r ik 

2:2 

P (H = h 2 ) 7:9 

Figur 15.1: Beslutsträd för Toyota.

Litteraturförteckning 

[1] A. Agresti (1996), An introduction to categorical data analysis, John 

Wiley & Sons, Inc. 

[2] Bowerman och O’Connell, Forecasting and time series. 

[3] D. Collett (1991), Modelling binary data, Chapman & Hall. 

[4] D. R. Cox (1970), Analysis of binary data, Methuen & CO, Ltd. 

[5] F. M. Möller (2006), Introduktion till matematik för ekonomer, 

www.tex-sales.se 

[6] F. C. Pampel (2000), Logistic regression, Sage Publications, Inc. 

[7] M. Drosnin, Bibelkoden 

[8] Qvartilen årgång 19 Vol 3 

[9] Qvartilen årgång 20 Vol 2 

307

Introduktion Till Statistiken

Create successful ePaper yourself

Delete template?

Save as template?