29.08.2013 Views

Projekt 1 - Matematikcentrum - Lunds Tekniska Högskola

Projekt 1 - Matematikcentrum - Lunds Tekniska Högskola

Projekt 1 - Matematikcentrum - Lunds Tekniska Högskola

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK<br />

1 Syfte<br />

MATEMATISK STATISTIK, AK FÖR L, FMS 033, HT-02<br />

I den första delen av detta projekt skall vi försöka<br />

hitta begripliga tolkningar av begreppen väntevärde<br />

och varians, dels utifrån de teoretiska fördelningarna<br />

och dels utifrån datorsimuleringar. Vi<br />

skall också titta på några standardfördelningar och<br />

bland dessa välja en lämplig fördelning som passar<br />

till hastighetsmätningarna.<br />

Vi skall också studera fördelningarna för summor<br />

av stokastiska variabler och vad som händer när<br />

antalet termer i summan växer.<br />

Vi skall också fördjupa begreppet sannolikhet via<br />

frekvenstolkning genom att genomföra en enkel<br />

riskstudie dels via datorsimuleringar och dels genom<br />

teoretiska överläggningar.<br />

<strong>Projekt</strong>et skall redovisas i form av en rapport.<br />

Rapporten skall omfatta vissa nyckelmoment så<br />

det är viktigt att du läser igenom projekthandledningen<br />

och gör upp en disposition för hur rapporten<br />

skall se ut innan du börjar själva arbetet. Tänk<br />

till exempel efter vilka frågor det är som skall besvaras<br />

och vilka figurer och histogram som då bör<br />

vara med i rapporten.<br />

2 Moment hos och faltning av<br />

fördelningar<br />

2.1 Förberedelseuppgifter<br />

Läs noga igenom avsnitt 5.1–5.3 i Blom Bok C.<br />

• (a) Hur lyder definitionen av väntevärde?<br />

• (b) Hur lyder definitionen av varians?<br />

• (c) Hur kan variansen beräknas på annat sätt<br />

än direkt genom definitionen? (Det finns<br />

<strong>Projekt</strong> 1:<br />

Om fördelningar och risker<br />

en omskrivning som ofta är mer användbar<br />

i praktiska sammanhang.)<br />

• (d) Om E(X ) = 3 och V(X ) = 1/3, vad får då<br />

Y = (X − 2)/3 för väntevärde respektive<br />

varians?<br />

• (e) Om X är likformigt fördelad på intervallet<br />

(2, 4), vilken fördelning får då Y =<br />

(X − 2)/3? Vad har Y för väntevärde och<br />

varians? Hur stämmer detta överens med<br />

föregående uppgift?<br />

• (f) Låt X ∈ R(0, 1) och beräkna m = E(X ),<br />

V(X ), täthetsfunktionen för Y = (X − m) 2<br />

och E(Y ).<br />

• (g) Vad menas med faltning av fördelningar för<br />

stokastiska variabler och varför faltar vi?<br />

• (h) Räkna uppgift 507 i Blom Bok C.<br />

2.2 Angående grafisk presentation<br />

Först en liten kommentar angående stolpdiagram<br />

och histogram. Då vi arbetar med diskreta stokastiska<br />

variabler och vill plotta resultat från studier<br />

av dessa använder vi stolpdiagram, just för<br />

att understryka variablernas diskreta karaktär. I ett<br />

stolpdiagram är det höjden av varje stolpe som representerar<br />

frekvensen (se Fig. 1). Vid arbete med<br />

kontinuerliga stokastiska variabler är det mera ändamålsenligt<br />

att indela materialet i klasser och rita<br />

ett histogram. I ett histogram är det arean av varje<br />

stapel som representerar frekvensen (se Fig. 2).<br />

På detta sätt får histogrammet över de relativa frekvenserna<br />

en viktig egenskap gemensam med täthetsfunktionen<br />

— nämligen att den sammanlagda<br />

arean under grafen är lika med ett. (Se i övrigt<br />

avsnittet om beskrivande statistik i kursboken.)


<strong>Projekt</strong> 1, Matstat AK för L, HT-02<br />

Figur 1: Stolpdiagram Figur 2: Histogram<br />

Slumptalsgeneratorn rand i MATLAB genererar<br />

slumptal från en rektangelfördelning över intervallet<br />

från noll till ett, dvs observationer av en stokastisk<br />

variabel X ∈ R(0, 1).<br />

Uppgift 2.1:<br />

Är den stokastiska variabeln X ovan diskret eller<br />

kontinuerlig?<br />

Svar:<br />

Uppgift 2.2:<br />

Hur bär du dig åt för att plotta en diskret funktion<br />

i MATLAB?<br />

Svar:<br />

Uppgift 2.3:<br />

Hur bär du dig åt för att plotta en kontinuerlig<br />

funktion i MATLAB?<br />

Svar:<br />

Uppgift 2.4:<br />

Börja med att plotta täthetsfunktionen för X .<br />

>> plot([0 0 1 1],[0 1 1 0])<br />

>> axis([-0.5 1.5 0 1.5])<br />

>> title([’Täthetsfunktion för’...<br />

’rektangelfördelning p˚a (0,1)’])<br />

>> xlabel(’x’)<br />

>> ylabel(’f(x)’)<br />

2<br />

Generera sedan, till exempel, hundra slumptal<br />

från denna fördelning och plotta histogrammet<br />

över de relativa frekvenserna för detta stickprov i<br />

samma figur som täthetsfunktionen:<br />

>> hold on<br />

>> X = rand(1,100);<br />

>> hist2(X);<br />

>> hold off<br />

Eftersom ett histogram enligt definitionen i kursboken<br />

(och avsnitt 2.2 ovan) är arean av varje stapel<br />

som representerar den relativa frekvensen, använder<br />

vi hist2 istället för den i MATLAB inbyggda<br />

hist som använder absoluta frekvenser<br />

till staplarnas höjd.<br />

2.3 Väntevärde<br />

Gör om simuleringarna ovan men med 1000 observationer<br />

från X ∈ R(0, 1) istället och rita<br />

om histogrammet tillsammans med täthetsfunktionen.<br />

Öppna sedan ett nytt grafikfönster<br />

med kommandot figure. I detta fönster<br />

skall du plotta de successiva medelvärdena, mx =<br />

cumsum(X)./(1:1000), för de 1, 2, 3, . . . , 1000<br />

första observationerna tillsammans med den linje<br />

som anger vad medelvärdena bör konvergera mot:<br />

>> plot(mx)<br />

>> u = ? % byt ? mot konvergensvärdet<br />

>> line([0 1000],[u u])<br />

• Uppgift 2.5:<br />

Använd dina figurer och beräkningar för att förklara<br />

vad väntevärdet för den stokastiska variabeln<br />

X är.<br />

Svar:


2.4 Varians<br />

Vi skall nu titta på variansen för X . Eftersom<br />

V(X ) är definierad som E((X − m) 2 ) där m =<br />

E(X ) skall vi titta närmare på fördelningen för<br />

Y = (X − m) 2 . I förberedelseuppgift (f) beräknade<br />

du täthetsfunktionen för Y när X ∈ R(0, 1).<br />

Plotta den tillsammans med ett histogram över de<br />

1000 Y -värdena:<br />

>> Y = (X-m).^2 % byt ut m mot E(X)<br />

>> y = 0:0.001:0.25;<br />

>> fy = % ange f_Y(y)<br />

>> plot(y,fy)<br />

>> title(’Täthetsfunktion för Y=(X-m)^2’)<br />

>> xlabel(’y’)<br />

>> ylabel(’f_Y(y)’)<br />

>> hold on<br />

>> hist2(Y)<br />

>> hold off<br />

Plotta sedan, i ett annat fönster och på samma<br />

sätt som för väntevärdet, de successiva medelvärdena<br />

my = cumsum(Y)./(1:1000) tillsammans<br />

med en linje som anger vad de borde konvergera<br />

mot.<br />

• Uppgift 2.6:<br />

Använd dina figurer och beräkningar för att förklara<br />

vad variansen för den stokastiska variabeln<br />

X är.<br />

Svar:<br />

Vi skall nu studera R(−1/2, 1/2)-fördelningen<br />

på samma sätt och sedan jämföra de två. Generera<br />

alltså, i en vektor X1, 1000 slumptal från denna<br />

fördelning (se avsnitt 3.1) och plotta de successiva<br />

medelvärdena på sätt som ovan. Beräkna också<br />

Y1 = (X1 - m1)^2, där m1= E(X1), och plotta<br />

de successiva medelvärdena.<br />

• Uppgift 2.7:<br />

Ge en tolkning av väntevärde och varians för en<br />

R(−1/2, 1/2)-variabel. Hur förhåller sig dessa<br />

till väntevärde och varians för en R(0, 1)-variabel?<br />

Svar:<br />

3<br />

<strong>Projekt</strong> 1, Matstat AK för L, HT-02<br />

3 Simulering av stokastiska<br />

variabler, några statistiska<br />

standardfördelningar<br />

I den här delen av projektet kommer du att simulera<br />

slumptal från fördelningarna, rita histogram<br />

över slumptalen och även jämföra simulerade värden<br />

med motsvarande täthetsfunktioner.<br />

3.1 Rektangelfördelning (likformig fördelning)<br />

Fördelningen, som är beskriven på sidan 62 i<br />

kursboken, är användbar för att till exempel beskriva<br />

avrundningsfel vid mätningar. Den är också<br />

grundfördelningen vid Monte Carlo-fördelningar.<br />

Funktionen rand genererar rektangelfördelade<br />

slumptal i intervallet (0, 1). Med<br />

>> x = rand(20,1);<br />

genereras 20 rektangelfördelade slumptal i intervallet<br />

[0, 1) och läggs i en 20 × 1-matris. Ett rektangelfördelat<br />

slumptal i intervallet [a, b) fås med<br />

a+(b-a)*rand (tänk efter att det är rimligt!).<br />

Uppgift 3.1:<br />

Generera 100 slumptal från en rektangelfördelning<br />

med a = 4 och b = 12. Plotta data<br />

i ett histogram med hjälp av hist2. Verkar det<br />

stämma med en rektangelfördelning?<br />

Svar:<br />

Öka antalet slumptal till 1000, 10 000 och<br />

100 000 och gör respektive normerade histogram.<br />

Vad händer?<br />

Svar:<br />

3.2 Weibullfördelning<br />

Weibullfördelningen är mycket användbar för att<br />

beskriva variationer i hållfasthetsdata, till exempel<br />

sträck-, brott-, och utmattningsgränser.<br />

Fördelningsfunktionen ges av F(x) = 1 − e −(x/a)c<br />

om x ≥ 0 och där a och c är konstanter som kan<br />

ges olika värden.<br />

Slumptal från Weibullfördelningen med parametrar<br />

a och c läggs i en p × q ma-


<strong>Projekt</strong> 1, Matstat AK för L, HT-02<br />

tris med hjälp av MATLAB-kommandot<br />

weibrnd((1/a)^c,c,p,q). Om man använder<br />

STIXBOX blir kommandot istället rweib([p<br />

q],c,a) för en p × q-matris eller rweib(p,c,a)<br />

för en vektor med p element.<br />

Uppgift 3.2:<br />

Generera 1000 slumptal från en Weibullfördelning<br />

med a = 0.6 och c = 0.8 och lägg dem<br />

i en vektor. Sätt alltså p = 1000 och q = 1 i<br />

weibrnd-kommandot. Plotta data i ett histogram<br />

med hjälp av hist2.<br />

Svar:<br />

Uppgift 3.3:<br />

Bestäm täthetsfunktionen för Weibullfördelningen<br />

genom att derivera fördelningsfunktionen<br />

F(x) = 1 − e−(x/a)c med a = 0.6 och c = 0.8.<br />

Täthetsfunktionen blir<br />

⎧<br />

⎨<br />

f (x) =<br />

⎩<br />

Du kan rita ut täthetsfunktionen med kommandona<br />

>> x = [0:0.1:9];<br />

>> plot(x,fx,’-’)<br />

där fx ersätts med det uttryck som du just beräknat.<br />

Jämför täthetsfunktionen med histogrammet i föregående<br />

uppgift. Du kan plotta histogrammet i<br />

samma figur om du har skrivit hold on. Glöm<br />

inte att skriva hold off innan du fortsätter att<br />

rita figurer.<br />

Svar:<br />

Uppgift 3.4:<br />

Generera 1000 slumptal från en Weibullfördelning<br />

med a = 3 och c = 1. Plotta data i ett<br />

histogram med hjälp av hist2. Med konstanten<br />

c = 1 får man som specialfall exponentialfördelningen.<br />

Rita upp dess täthetsfunktion.<br />

Svar:<br />

4<br />

3.3 Normalfördelningen<br />

Täthetsfunktionen för en normalfördelad stokastisk<br />

variabel ges av fX (x) = 1<br />

e (x−m)2 /2 2<br />

för<br />

√ 2<br />

<br />

−∞ < x < ∞. Den beror alltså på två parametrar<br />

och där är väntevärdet i fördelningen<br />

och är standardavvikelsen. Normalfördelningen<br />

är en av de fördelningar som används mest inom<br />

sannolikhets- och statistikteorin.<br />

Funktionen normrnd (rnorm i STIXBOX) i MAT-<br />

LAB genererar normalfördelade slumptal. Kommandot<br />

>> y = normrnd(4,1,p,q);<br />

genererar slumptal från en normalfördelning med<br />

väntevärdet 4 och standardavvikelsen 1 och placerar<br />

dem i matrisen y med dimensionen p × q.<br />

(STIXBOX: rnorm([p q],4,1))<br />

Uppgift 3.5:<br />

Generera 1000 slumptal från en normalfördelning<br />

med m = 1 och = 0.5. Plotta data i ett<br />

histogram med hjälp av hist2.<br />

Svar:<br />

Uppgift 3.6:<br />

Generera 1000 slumptal från en normalfördelning<br />

med m = 1 och = 2. Plotta data i ett<br />

histogram med hjälp av hist2. Hur påverkar -<br />

värdet dina histogram?<br />

Svar:<br />

Normalfördelningens täthetsfunktion, fX (x) fås<br />

genom normpdf (STIXBOX: dnorm). Rita ut normalfördelningar<br />

för olika värden på m och och<br />

se hur fördelningarna påverkas:<br />

>> x = [0:0.1:10];<br />

>> plot(x,normpdf(x,1,0.5))<br />

>> hold on<br />

>> plot(x,normpdf(x,6,0.5),’r’)<br />

>> plot(x,normpdf(x,4,2),’g’)<br />

>> plot(x,normpdf(x,3,0.1),’y’)<br />

>> hold off


Svar:<br />

Fördelningsfunktionen, FX (x), för en normalfördelad<br />

stokastisk variabel fås med kommandot<br />

normcdf (STIXBOX: pnorm).<br />

Uppgift 3.7:<br />

Rita ut samma normalfördelningar som ovan men<br />

nu med hjälp av fördelningsfunktioner. Lägg märke<br />

till hur olika värden på och påverkar fördelningsfunktionerna:<br />

>> x = [0:0.1:10];<br />

>> plot(x,normcdf(x,1,0.5))<br />

>> hold on<br />

>> plot(x,normcdf(x,6,0.5),’r’)<br />

>> plot(x,normcdf(x,4,2),’g’)<br />

>> plot(x,normcdf(x,3,0.1),’y’)<br />

>> hold off<br />

Svar:<br />

3.4 Andra fördelningar<br />

Andra MATLAB-funktioner som genererar<br />

slumptal från olika fördelningar är listade i Appendix<br />

A.<br />

Ett generellt sätt att generera ett slumptal från en<br />

given fördelningsfunktion F(x) är att använda inversmetoden.<br />

Denna innebär att man löser ekvationen<br />

F(x) = u<br />

där u är ett slumptal från en rektangelfördelning<br />

på intervallet (0, 1). Några fördelningar är lätta<br />

att invertera direkt, till exempel<br />

Exponentialfördelning F(x) = 1 − e−x/a x = −a ln(1 − u)<br />

Weibullfördelning F(x) = 1 − e−(x/a)c x = a(− ln(1 − u)) 1/c<br />

Extremvärdefördelning F(x) = exp(−e −(x−b)/a )<br />

x = b − a ln(− ln(−u))<br />

I andra fall, till exempel för normalfördelningen,<br />

måste inverteringen ske numeriskt. Det finns olika<br />

specialkonstruerade metoder för att simulera<br />

slumptal från sådana fördelningar. Det finns för<br />

normalfördelningen den så kallade Box-Müllertransformationen<br />

samt Marsaglias metod för generering<br />

av slumptal.<br />

5<br />

<strong>Projekt</strong> 1, Matstat AK för L, HT-02<br />

Box-Müller-transformationen:<br />

Om U1, U2 är oberoende och R(0, 1)-fördelade<br />

så är X1 = √ −2 ln(U1) cos(2 U2), X2 √<br />

=<br />

−2 ln(U1) sin(2 U2) oberoende och båda är<br />

standard normalfördelade.<br />

Marsaglias metod: Generera U1, U2 oberoende<br />

och R(0, 1)-fördelade tills vi fått W = U 2 1 +<br />

U 2 2 ≤ 1 (detta kräver i medeltal 4/ ≈ 1.27<br />

försök), då är X1 = U1 −2 ln(W )/W , X2 =<br />

−2 ln(W )/W oberoende och båda är stan-<br />

U2<br />

dard normalfördelade.<br />

I vissa fall kan Marsaglias metod vara en aning<br />

snabbare eftersom den undviker de tidskrävande<br />

uträkningarna av de trigonometriska funktionerna<br />

cosinus och sinus.<br />

3.5 Att hitta en lämplig fördelning som<br />

beskriver data<br />

Som beskrivs i kursboken är de relativa frekvenserna<br />

uppskattningar av ett antal areor under täthetsfunktionen.<br />

Om man har ett stort stickprov<br />

kan man välja en fin klassindelning och med ett<br />

histogram över de relativa frekvenserna få en god<br />

bild av täthetsfunktionens utseende.<br />

En naturlig fråga är om vi kan hitta någon statistisk<br />

standardfördelning som väl beskriver den<br />

variation som vi observerat?<br />

Vi kan undersöka detta på två sätt: med hjälp av<br />

empirisk fördelningsfunktion och med hjälp av<br />

sannolikhetspapper, att grafiskt jämföra en fördelning<br />

baserad på data med en hypotetisk fördelning.<br />

De två olika sätten är i stort sett samma sak.<br />

Vi kommer här att använda metoden med empirisk<br />

fördelningsfunktion medan vi på laboration<br />

3 kommer att titta närmare på metoden med sannolikhetspapper.<br />

3.5.1 Empirisk fördelningsfunktion<br />

Från en dags produktion av tegelstenar tog man<br />

slumpmässigt ut 125 stycken och mätte deras<br />

vikt (kg). Vikterna är lagrade i filen tegel.<br />

Uppgift 3.8:<br />

Ladda in data och gör ett histogram över vikterna.<br />

Beräkna även medelvärde mean och standardavvikelse<br />

std. Vilken fördelning tror du kan beskriva<br />

variationen i vikt?


<strong>Projekt</strong> 1, Matstat AK för L, HT-02<br />

Svar:<br />

För att undersöka om du har rätt ska du jämföra<br />

den empiriska fördelningsfunktionen med din hypotetiska<br />

fördelningsfunktionen.<br />

Uppgift 3.9:<br />

Rita den empiriska fördelningsfunktionen för tegelstensvikterna<br />

med hjälp av följande MATLAB<br />

kommandon:<br />

>> xs = sort(vikt);<br />

>> n = length(xs);<br />

>> Fn = [1:n]/n;<br />

>> stairs(xs,Fn);<br />

Avläs från figuren vad medianvärdet är för vikterna,<br />

och vilken vikt som understigs av 90 % av tegelstenarna.<br />

Använd kommandot zoom on för att<br />

se detaljer i plotten.<br />

Svar:<br />

En fördelningsfunktion för normalfördelningen<br />

kan plottas med funktionen normcdf (normal cumulative<br />

distribution function) men kräver värden<br />

på parametrarna och i fördelningen. Håll<br />

kvar den empiriska fördelningsfunktionen i figuren<br />

med hold on och rita in en normalfördelning<br />

med = 1 och standardavvikelsen = 0.05 i<br />

figuren.<br />

>> x = [0:0.01:2];<br />

>> plot(x,normcdf(x,1,0.05))<br />

• Uppgift 3.10:<br />

Identifiera väsentliga avvikelser mellan de två fördelningarna.<br />

Relatera dessa avvikelser till dem<br />

som du sett i de tidigare plottarna.<br />

Svar:<br />

4 Summor av stokastiska<br />

variabler — faltning<br />

4.1 Symmetrisk fördelning<br />

Börja med att hitta på en diskret sannolikhetsfunktion<br />

med några möjliga utfall, till exempel<br />

den likformiga fördelningen över 1,2,. . . ,6, dvs<br />

ett tärningskast. Mata sedan in denna sannolikhetsfunktion<br />

i form av en vektor.<br />

6<br />

>> p = [0 1 1 1 1 1 1]/6<br />

Nollan finns där för att det blir lättare att hålla<br />

reda på saker och ting om det första elementet i<br />

vektorn är sannolikheten för att utfallet är noll.<br />

Rita upp sannolikhetsfunktionen med kommandot<br />

stem.<br />

>> stem(0:length(p)-1,p)<br />

Funktionen length ger antalet element i en vektor.<br />

Som du vet beräknas sannolikhetsfunktionen för<br />

en summa av två oberoende diskreta stokastiska<br />

variabler genom en diskret faltning (se kursboken).<br />

I MATLAB finns en funktion, conv, som<br />

utför just en sådan faltning (faltning heter convolution<br />

på engelska).<br />

>> p2 = conv(p,p);<br />

>> p4 = conv(p2,p2);<br />

>> p8 = conv(p4,p4);<br />

Här blir p8 alltså sannolikhetsfunktionen för en<br />

summa av åtta stycken oberoende stokastiska variabler<br />

med sannolikhetsfunktionen p. Rita upp<br />

var och en av dessa nya sannolikhetsfunktioner<br />

med hjälp av stem (om du använder subplotkommandot<br />

kan du få plottarna i följd på ett<br />

överskådligt sätt).<br />

Nu kan vi också åstadkomma slumptal från fördelningen<br />

p8 genom att generera åtta stycken<br />

slumptal från fördelningen p och sedan lägga<br />

ihop dem. Om vi gör detta, till exempel,<br />

hundra gånger kan vi sedan rita ett stolpdiagram<br />

över de relativa frekvenserna och jämföra<br />

detta med sannolikhetsfunktionen för p8. I<br />

MATLAB gör vi detta lätt och snabbt genom<br />

att först generera en 8 × 100-slumptalsmatris<br />

Y=floor(6*rand(8,100)+1), där vi kan betrakta<br />

varje kolonn som observationer av åtta stycken<br />

tärningskast. Ta, innan du går vidare, reda på hur<br />

funktionen sum fungerar.<br />

>> s = sum(Y);<br />

>> [yy,xx] = hist(s,0:length(p8)-1);<br />

>> stem(xx,yy/100)<br />

Den andra inparametern till funktionen hist är<br />

en vektor vars element anger klassmitten för respektive<br />

klass, och på detta sätt får vi samma indelning<br />

som i stolpdiagrammet över sannolikhetsfunktionen<br />

p8.<br />

Nu kan det vara dags att ta det lite lugnt ett slag<br />

och fundera över några frågor:


• Uppgift 4.1:<br />

(a) Hur stämmer fördelningen för de simulerade<br />

värdena överens med den teoretiska fördelningen<br />

för p8?<br />

(b) Varför förskjuts den resulterande fördelningen<br />

allt längre mot höger för varje faltning?<br />

(c) Varför blir sannolikhetsfunktionen för den<br />

resulterande fördelningen bredare för varje<br />

faltning?<br />

(d) Kan du skönja någon tendens beträffande<br />

resultaten av de successiva faltningarna?<br />

Svar:<br />

4.2 Skev fördelning<br />

Utför sedan ett antal faltningar på samma sätt som<br />

ovan, men med en skev fördelning, till exempel<br />

>> q = [0 1 2 3 4 5 6]/a<br />

(Vad skall a vara?) Börja med att rita upp sannolikhetsfunktionen<br />

med hjälp av stem, så att du vet<br />

hur den ser ut.<br />

• Uppgift 4.2:<br />

(a) Kan du se samma tendens här som du såg i<br />

föregående fall?<br />

(b) Om du svarat ja på ovanstående fråga, hur<br />

många faltningar tycker du behövs för att<br />

tydligt kunna se tendensen? Om du svarat<br />

nej, fortsätt med ett par faltningar till!<br />

Svar:<br />

4.2.1 Jämförelse med normalfördelningen<br />

Vi skall nu avsluta detta avsnitt med en liten jämförelse<br />

med normalfördelningen. Det kan kanske<br />

verka en aning långsökt, men det skall så småningom<br />

visa sig, att det finns goda skäl till detta.<br />

Räkna först ut väntevärde och standardavvikelse<br />

för en stokastisk variabel med sannolikhetsfunktionen<br />

p.<br />

7<br />

<strong>Projekt</strong> 1, Matstat AK för L, HT-02<br />

>> m = sum((0:6).*p)<br />

>> sigma = sqrt(sum(((0:6)-m).^2 .* p))<br />

Funktionen sum ger summan av elementen i en<br />

vektor, notationen .^2 betyder elementvis kvadrering<br />

av en vektor och sqrt är kvadratroten. Vi kan<br />

nu jämföra sannolikhetsfunktionen<br />

√<br />

p4 med den<br />

normalfördelning N(4m, 4) som har samma<br />

väntevärde och varians/standardavvikelse som p4.<br />

>> stem(0:length(p4)-1,p4)<br />

>> hold on<br />

>> xx = 0:0.5:30<br />

>> plot(xx,normpdf(xx,4*m,sqrt(4)*sigma))<br />

>> hold off<br />

Sist, men inte minst, några frågor:<br />

• Uppgift 4.3:<br />

(a) Approximeras p4 väl av normalfördelningen?<br />

(b) Hur stort måste antalet termer n i summan<br />

vara, för att approximationen skall bli bra?<br />

(Pröva med summor av fler och färre stokastiska<br />

variabler, och notera det värde på<br />

n, för vilket du tycker att approximationen<br />

är bra.)<br />

(c) Påverkas hur väl fördelningen för summan<br />

approximeras av normalfördelningen,<br />

av något mer än antalet termer i summan?<br />

Svar:<br />

5 Riskanalys<br />

Om igelkottar kilar över en väg vid n oberoende<br />

tillfällen och varje gång en igelkott passerar över<br />

vägen riskerar den att råka ut för en olycka med<br />

en sannolikhet som är 1/n, hur stor är då risken<br />

att någon av igelkottarna råkar ut för en olycka?


<strong>Projekt</strong> 1, Matstat AK för L, HT-02<br />

• Uppgift 5.1:<br />

(a) Simulera fram olycksrisken för några olika<br />

n. Du kan använda den färdigskrivna mfilen<br />

igelkott.<br />

(b) Beräkna olycksrisken då n = 1000 exakt,<br />

med hjälp av oberoende händelser.<br />

(c) Om vi utsätter oss för små risker, så små att<br />

de nästan inte kan inträffa, många gånger,<br />

hur stor är då sannolikheten att vi någon<br />

gång råkar ut för denna olycka? Om du räknar<br />

med P(olycka en viss gång) = 1/n, vad<br />

är då sannolikheten att olyckan inträffar<br />

någon gång av n? Vad händer då n → ∞?<br />

Svar:<br />

6 Avslutning<br />

När man som ingenjör utför sina beräkningar,<br />

räcker det inte att de är formellt korrekta.<br />

Resultaten måste också sättas i relation till den<br />

omgivande verkligheten, tolkas i ett sammanhang.<br />

Väntevärde och varians är viktiga begrepp<br />

i sannolikhets- och statistikteorin, men de är abstraktioner<br />

som i varje enskilt fall måste tolkas<br />

för att få en mening. Den mekaniska analogin<br />

vid sannolikhets- eller täthetsfunktioner samt frekvenstolkningen<br />

är två möjliga vägar som illustrerats<br />

i första delen av denna laboration.<br />

I statistiken arbetar man ofta med summor av stokastiska<br />

variabler, inte minst när man bildar medelvärden.<br />

Avsnittet om faltning handlade just om<br />

detta, och de avslutande jämförelserna med normalfördelningen<br />

kan ses som en heuristisk härledning<br />

av centrala gränsvärdessatsen. Denna sats intar<br />

en central plats inom statistikteorin och förklarar<br />

också till viss del varför normalfördelningen är så<br />

ofta förekommande i statistiska sammanhang.<br />

I mitten av projektet fick du tillfälle att lite mer<br />

ingående studera några standardfördelningar och<br />

8<br />

några av deras egenskaper. Varje fördelning har<br />

sina speciella egenskaper som gör den mer eller<br />

mindre användbar i olika sammanhang. För att<br />

kunna modellera den komplexa värld vi lever i behöver<br />

vi därför en bred repertoar av fördelningar,<br />

och vi skulle kunna underkasta var och en av de<br />

fördelningar som presenteras under kursens gång<br />

ett liknande specialstudium. Nu räcker inte den<br />

utmätta tiden till detta, och detta moment får därför<br />

samtidigt stå som ett exempel på hur man kan<br />

studera en fördelning och dess egenskaper för att<br />

kunna välja en fördelning som passar till ett specifikt<br />

problem.<br />

7 Redovisning — Rapport<br />

<strong>Projekt</strong>et utförs i grupper om två eller tre personer<br />

och skall redovisas i form av en kort rapport koncentrerad<br />

kring de nyckelfrågor som är markerade<br />

med en bomb, •. Figurer och histogram som kan<br />

förtydliga resonemang och slutsatser skall givetvis<br />

också vara med.<br />

Rapporten skall senast vara inlämnad måndagen<br />

den 23 oktober klockan 17.00. Du kan lämna<br />

den till antingen labbhandledaren eller sekreteraren.<br />

Om rapporten inte är inlämnad senast detta<br />

datum rättas den inte förrän nån gång i framtiden<br />

när vi har tid. Rättade rapporter delas ut på föreläsningarna<br />

och finns sedan i fack i korridoren på<br />

andra våningen i mattehuset. Icke godkända rapporter<br />

skall kompletteras och lämnas in igen så<br />

fort som möjligt.<br />

Utformningen av rapporten skall i görligaste mån<br />

följa instruktionerna i den utdelade promemorian<br />

angående redovisning av datorlaborationer.<br />

Rapporten skall bara omfatta väsentligheterna i<br />

projektet. Det finns delmoment och Uppgifter<br />

som är till för att stödja nyckelmomenten. Dessa<br />

behöver så klart ej redovisas i detalj och bör bara<br />

tas med för att stödja och förtydliga eventuella<br />

resonemang.


LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK<br />

Checklista<br />

REDOVISNING AV PROJEKT 1: OM FÖRDELNINGAR OCH RISKER<br />

MATEMATISK STATISTIK, AK FÖR L, FMS 033, HT-02<br />

Detta blad skall lämnas som försättsblad till rapporten.<br />

(a) Vi har utfört alla moment i projektet, inklusive förberedelseuppgifterna<br />

(b) Vi har korrekturläst rapporten och rättat språk- och skrivfel<br />

(c) Vi har försett figurer, tabeller och liknande med figurtexter och tydlig numrering<br />

(d) Vi har försett alla axlar i alla figurer med storheter, där så är möjligt<br />

(e) Vi har kontrollräknat de beräkningar som kan kontrollräknas<br />

(f) Vi har gjort en rimlighetsbedömning av samtliga resultat<br />

(g) Vi har kontrollerat och kommenterat eventuella orimliga resultat<br />

(h) Vi har strukturerat den löpande texten väl med tydliga avsnittsrubriker<br />

(i) Vi har försett rapporten med sidnumrering och datum<br />

(j) Vi har tydligt redovisat förutsättningar, förenklingar och gjorda antaganden<br />

(k) Vår rapport är läsbar utan tillgång till laborationshandledningen<br />

(l) Härmed intygas att alla ovanstående frågor kan besvaras med Ja och att denna rapport är ett resultat<br />

av våra egna ansträngningar, bortsett från att vi samarbetat med<br />

[namn]<br />

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .<br />

[ort och datum]<br />

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .<br />

[underskrifter]<br />

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .<br />

[namnförtydliganden]<br />

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .<br />

Rättarens anteckningar<br />

Rättat av:<br />

Godkänt (datum):

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!