06.08.2013 Views

Noter til eksponentielle familier. Første udgave. - Aarhus Universitet

Noter til eksponentielle familier. Første udgave. - Aarhus Universitet

Noter til eksponentielle familier. Første udgave. - Aarhus Universitet

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

E T F Ø R S T E K U R S U S<br />

I T E O R E T I S K S T A T I S T I K<br />

J E N S L E D E T J E N S E N


© Jens Ledet Jensen 2006<br />

Institut for Matematiske Fag<br />

Det Naturvidenskabelige Fakultet<br />

<strong>Aarhus</strong> <strong>Universitet</strong><br />

Januar 2006


Indhold<br />

1 Indledning 1<br />

2 Eksponentielle <strong>familier</strong> 5<br />

2.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5<br />

2.2 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6<br />

2.3 Minimal frems<strong>til</strong>ling og konveks støtte . . . . . . . . . . . . . . . . . . . . 7<br />

2.4 Laplace- og kumulanttransform . . . . . . . . . . . . . . . . . . . . . . . . 10<br />

2.5 Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14<br />

2.6 Marginale og betingede fordelinger . . . . . . . . . . . . . . . . . . . . . . 17<br />

2.7 Komplethed af den minimalkanoniske observator . . . . . . . . . . . . . 19<br />

2.8 Opgaver . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21<br />

3 Sufficiens 25<br />

3.1 Indledning og definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25<br />

3.2 Tilfældet med diskret udfaldsrum X . . . . . . . . . . . . . . . . . . . . . 26<br />

3.3 Det generelle <strong>til</strong>fælde . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27<br />

3.4 Minimal sufficiente observatorer . . . . . . . . . . . . . . . . . . . . . . . 29<br />

3.5 Sufficiensprincippet og B-sufficiens . . . . . . . . . . . . . . . . . . . . . . 36<br />

3.6 Opgaver . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36<br />

4 Ancillaritet og Basu’s sætning 43<br />

4.1 Definitioner og diskussion . . . . . . . . . . . . . . . . . . . . . . . . . . . 43<br />

4.2 Basu’s sætning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48<br />

4.3 Birnbaum’s sætning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50<br />

4.4 Opgaver . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53<br />

5 Likelihoodbegreber 57<br />

5.1 Opgaver . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62<br />

6 Centrale estimatorer med minimal varians 67<br />

6.1 Centrale estimatorer med minimal varians . . . . . . . . . . . . . . . . . . 67<br />

6.2 Variansuligheder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71<br />

6.3 Pusterum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75<br />

6.4 Opgaver . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76<br />

i


ii INDHOLD<br />

7 Testteori 79<br />

7.1 Indledning og definitioner . . . . . . . . . . . . . . . . . . . . . . . . . . . 79<br />

7.2 Neyman-Pearson’s lemma og monotone kvotienter . . . . . . . . . . . . 81<br />

7.3 Sammensat nulhypotese – test for en delparameter . . . . . . . . . . . . . 89<br />

7.4 Lokalt stærkeste test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94<br />

7.5 Opgaver . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95<br />

8 Separat inferens 101<br />

8.1 L-sufficiens og L-ancillaritet . . . . . . . . . . . . . . . . . . . . . . . . . . 101<br />

8.2 S-sufficiens og S-ancillaritet . . . . . . . . . . . . . . . . . . . . . . . . . . 104<br />

8.3 G-sufficiens og G-ancillaritet . . . . . . . . . . . . . . . . . . . . . . . . . . 107<br />

8.4 Itemanalysemodellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112<br />

8.5 Afsluttende bemærkninger . . . . . . . . . . . . . . . . . . . . . . . . . . . 116<br />

8.6 Opgaver . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117<br />

9 Bayes statistik 121<br />

10 Referencer 129<br />

11 Notation og regneregler 135<br />

11.1 notation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135<br />

11.2 Transformationssætningen . . . . . . . . . . . . . . . . . . . . . . . . . . . 135<br />

11.3 Betinget middelværdi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136<br />

11.4 Betingede tætheder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136<br />

11.5 Regnereler for tætheder og integraler . . . . . . . . . . . . . . . . . . . . . 138<br />

11.6 Entydighed af Laplacetransformen . . . . . . . . . . . . . . . . . . . . . . 139<br />

Indeks 141


Kapitel 1<br />

Indledning<br />

Med disse indledende bemærkninger vil jeg forsøge at ryste jeres statistiske grundvold,<br />

og vise at statistik (d.v.s. her teoretisk statistik) er mere end matematik. Jeg vil<br />

nævne nogle af de forskellige indgange <strong>til</strong> statistik for at afgrænse, hvad vi skal beskæftige<br />

os med i disse noter. Jeg vil her i indledningen foretage diskussionen ud fra<br />

et eksempel.<br />

En ukendt parameter θ kan antage værdier i {0, 1, 2, . . . }. En værdi k af θ vælges<br />

(måske af naturen, måske af en person), og 6 brikker placeres i en pose. Af de 6 brikker<br />

er 2 mærket med værdien k og de 4 andre med værdierne 4k + 1, . . . , 4k + 4. Eksperimentet<br />

består nu i at vælge én af brikkerne <strong>til</strong>fældigt og observere værdien S på denne,<br />

Fordelingen af S beskrives med følgende tabel, hvori for hver række er angivet 6 gange<br />

sandsynligheden for de mulige udfald:<br />

S<br />

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24<br />

0 2 1 1 1 1<br />

1 2 1 1 1 1<br />

θ 2 2 1 1 1 1<br />

3 2 1 1 1 1<br />

4 2 1 1 1 1<br />

5 2 1 1 1 1<br />

Vores opgave er ud fra observationen s at sige noget om den ukendte parameter θ. Når<br />

s er observeret, ved vi, at θ enten er s eller for s > 0, er der også muligheden [(s − 1)/4],<br />

hvor [·] er heltalsdelen af et tal. Fra observationen s kan vi altså gætte på<br />

ˆθ = s eller ˜θ =<br />

0 hvis s = 0<br />

[(s − 1)/4] hvis s > 0,<br />

hvor ˆ θ faktisk er maksimum likelihood estimatet.<br />

Normalt vil vi vælge ˆθ som skøn over θ, idet Pˆθ (s) = 2 6 > P˜ θ (s) = 1 6 for s > 0, altså<br />

den observerede værdi s har større sandsynlighed under målet Pˆθ end under målet P˜ θ .<br />

Men hvis vi spørger om sandsynligheden for at gætte den rigtige værdi af θ, har vi<br />

Død og pine, hvad gør vi nu?<br />

P θ( ˆθ = θ) = 2 6 < P θ( ˜θ = θ) = 4 6 .<br />

1


2 KAPITEL 1. INDLEDNING<br />

Indenfor den såkaldte Bayes-statistik optræder der ingen problemer (=problemet er<br />

flyttet et andet sted hen - en særdeles velkendt problemløsningmetode). Hvis man er<br />

“bayesianer”, formuleres alt ved hjælp af sandsynligheder. I stedet for at sige at θ er<br />

ukendt, siger man, at θ er en stokastisk variabel med en prior tæthed pk = P(θ = k), og<br />

at vores viden om θ, efter at eksperimentet er udført, udtrykkes gennem den betingede<br />

tæthed<br />

⎧<br />

1 k = s = 0<br />

⎪⎨ 1<br />

3 (<br />

P(θ = k|S = s) =<br />

⎪⎩<br />

1 3 ps + 1 6 p [(s−1)/4]) −1 pk k = s, s > 0<br />

1<br />

6 ( 1 3 ps + 1 6 p [(s−1)/4]) −1 pk k = [(s − 1)/4], s > 0<br />

0 ellers<br />

Eventuelt kan vi lave et estimat ˆθB, som er den værdi af θ, som har størst sandsynlighed<br />

givet S = s.<br />

For at gennemføre dette program skal vi altså vælge en prior tæthed p k. Hvis vi<br />

tager p k = 1/2 k+1 , vil ˆ θB = ˜ θ for alle s. Det kan vises, at for en vilkårlig tæthed med<br />

p k > 0 for alle k vil ˆθB = ˜θ for uendelig mange værdier af s . Hvis p k = 0 for k ≥ 5 og<br />

p k = 1/4 for k < 5, vil<br />

ˆθB = ˆθ for s < 5 og ˆθB = ˜θ for 5 ≤ s ≤ 20.<br />

Dette sidste eksempel dækker over det generelle udsagn, at jo mere uniform vi gør den<br />

prior tæthed, desto oftere vil ˆθB = ˆθ.<br />

Det er klart, at det oprindelige problem er blevet ført over i, hvordan vi skal vælge<br />

prior tætheden. Hvis vi ikke har nogen viden, der kan hjælpe os i dette, må vi altså<br />

foretage et subjektivt valg, og af denne grund bryder mange statistikere sig ikke om<br />

Bayes-statistik. Ud fra en pragmatisk synsvinkel kan det dog i visse situationer være<br />

praktisk at tænke i termer af Bayes-statistik. F.eks. i store ekspertsystemer, hvor et af<br />

problemerne er jævnligt at opdatere den akkumulerede viden om de mange parametre,<br />

kan det være praktisk at bruge Bayes-statistik. Jeg omtaler kort Bayes-statistik i kapitel<br />

9.<br />

En anden <strong>til</strong>gang <strong>til</strong> statistik er decisionsteori. Her fores<strong>til</strong>ler man sig, at der <strong>til</strong> hver<br />

observation x skal foretages en beslutning d = d(x), og for enhver beslutning d og<br />

enhver parameter θ er der givet en pris, eller et tab, w(θ, d) ≥ 0. Det forventede tab<br />

kaldes risikofunktionen (engelsk: risk function)<br />

r(θ, d) = E θw(θ, d(X)).<br />

I vort eksempel kan beslutningen være, at vi peger på enten ˆθ eller ˜θ som den sande<br />

værdi af θ. Lad os f.eks. sige at tabet er givet ved<br />

⎧<br />

⎪⎨ 0 hvis θ1 = θ<br />

w(θ, θ1) = α<br />

⎪⎩<br />

β<br />

<br />

12 α +<br />

r(θ, ˆθ) =<br />

hvis |θ1 − θ| ≤ 3<br />

hvis |θ1 − θ| > 3,<br />

1 6 β hvis θ = 0<br />

4<br />

6 β hvis θ > 0<br />

⎧<br />

⎪⎨<br />

0<br />

og r(θ, ˜θ) = 2<br />

6α ⎪⎩<br />

β<br />

hvis θ = 0<br />

hvis 1 ≤ θ ≤ 3<br />

hvis θ > 3.<br />

2<br />

6


Hvis θ > 3 vil ˜θ have en mindre risiko end ˆθ, men for 1 ≤ θ ≤ 3 vil ˆθ have en<br />

mindre risiko end ˜θ, hvis blot β < α/2.<br />

Decisionsteori giver anledning <strong>til</strong> mange nye definitioner. En beslutningsregel d<br />

kaldes inadmissible, hvis der findes en anden regel d1, så at r(θ, d) ≥ r(θ, d1) for alle θ og<br />

med skarp ulighed for mindst én værdi af θ. Hvis en regel ikke er inadmissible, kaldes<br />

den admissible, og disse er klart at foretrække. En minimax regel d er en admissible<br />

beslutningsregel, som opfylder<br />

sup<br />

θ<br />

r(θ, d1) ≥ sup r(θ, d)<br />

θ<br />

for enhver anden admissible regel d1. En minimax regel er et fornuftigt valg, hvis man<br />

er to personer, der spiller mod hinanden, og at man må forvente, at modspilleren er<br />

så ond som mulig. Ligesom at jeg ikke vil komme ind på Bayes-statistik, vil jeg ikke<br />

beskæftige mig med decisionsteori i disse noter.<br />

Hvad er så emnet for disse noter? Løst sagt skal vi så præcist som muligt opsummere<br />

den viden, som vi har fået om den ukendte parameter fra den foretagne observation<br />

og fra vores viden om den sandsynlighedsmekanisme, som ligger bagved. Dette<br />

betyder bl.a., at vi ikke skal bruge de hypotetiske gentagelser af forsøget <strong>til</strong> at konstruere<br />

et spil mod en usynlig modpart og dernæst minimere tabet, men derimod bruge<br />

gentagelserne <strong>til</strong> at belyse den faktiske observation i forhold <strong>til</strong> de andre mulige observationer.<br />

Heri ligger også, at de potentielle gentagelser skal være relevante, som for<br />

eksempel at de skal foretages med det samme måleudstyr (disse problemer tages op i<br />

kapitel 4 og kapitel 8). Den type problems<strong>til</strong>linger, som vi ønsker at anvende teorien<br />

på, kan være spørgsmål som: Hvad er lysets hastighed? Hvor en stor procentdel af den<br />

danske befolkning går ind for en kombineret vej- og jernbanebro <strong>til</strong> Sverige?; Hvad er<br />

sandsynligheden for at blive rask med en given behandling?; etc., etc.<br />

I ovenstående eksempel, hvis vi f.eks. har observeret s = 2, kan vi sige, at de mulige<br />

værdier af θ er θ = 0 og θ = 2, og at sandsynlighederne for s = 2 er 1 6 og 2 6 under de to<br />

muligheder. Meget mere kan vi ikke sige. Normalt vil vi gerne angive et estimat og en<br />

relevant varians på estimatet eller et relevant konfidensområde, men her hvor der kun<br />

er to muligheder, kan vi kun give en rangordning. Da vi nu ved, at θ = 0 eller θ = 2 er<br />

ˆθ og ˜θ ikke relevante i hypotestiske gentagelser. For en ny observation s ∈ {0, 1, 3, 4}<br />

ved gentagelse, kan vi slutte at θ = 0, og for s ∈ {9, 10, 11, 12} kan vi slutte at θ = 2.<br />

Det er kun for s = 2, at vi ikke kan slutte hvad θ er. Hvis vi definerer<br />

<br />

<br />

ˆθ2(s)<br />

0 s ∈ {0, 1, 3, 4}<br />

=<br />

og ˇ<br />

0 s ∈ {0, 1, 2, 3, 4}<br />

θ2(s) =<br />

2 s ∈ {2, 9, 10, 11, 12}<br />

2 s ∈ {9, 10, 11, 12}<br />

har vi at<br />

og<br />

P0( ˆθ2 = 0) = 5 6 , P2( ˆθ2 = 2) = 1,<br />

P0( ˇθ2 = 0) = 1, P2( ˇθ2 = 2) = 4 6 ,<br />

og anskuet på denne vis vil vi sige, at maksimum likelihood estimatet ˆθ2 er det bedste<br />

estimat.<br />

Lad mig slutte denne indledning med en ultrakort gennemgang af de forskellige<br />

kapitler:<br />

3


4 KAPITEL 1. INDLEDNING<br />

Kapitel 2: Her opsumerer jeg de vigtigste begreber og resultater for ekponentielle <strong>familier</strong>.<br />

Eksponentielle <strong>familier</strong> er vigtige på grund af deres pæne matematiske egenskaber,<br />

på grund af deres udbredelse, og fordi der er en simpel sammenhæng mellem<br />

tætheden og de såkaldte sufficiente observatorer. Faktisk kan man vende bøtten rundt,<br />

og starte med at sige, hvad der skal være sufficiente observatorer, og man vil så hurtigt<br />

blive ledt frem <strong>til</strong> de <strong>eksponentielle</strong>r <strong>familier</strong>. De <strong>eksponentielle</strong>r <strong>familier</strong> vil optræde<br />

gennem hele notesættet.<br />

Kapitel 3: Her gives en udførlig matematisk teori for sufficiente observationer, d.v.s.<br />

funktioner af data som “indeholder al information” om den ukendte parameter.<br />

Kapitel 4: Handler on hvordan vi definerer relevante gentagelser ved at betinge med<br />

værdien af en såkaldt ancillær observator. Sammenhængen mellem dette og de sufficiente<br />

observatorer diskuteres.<br />

Kapitel 5: Nævner de vigtigste begreber omkring likelihoodfunktionen og den afledede.<br />

Resultater baseret på at antallet af observationer går mod uendelig bliver kort<br />

omtalt. Dette kapitel kan godt læses før de andre.<br />

Kapitel 6: Giver en teori for hvordan vi på fornuftig vis kan vælge estimatorer, d.v.s. at<br />

vi forsøger at minimere variansen uniformt i parameteren. For at dette får mening, må<br />

vi nøjes med at betragte de såkaldte unbiased estimatorer.<br />

Kapitel 7: Heri beskrives hvordan man konstruerer test med visse optimale egenskaber.<br />

Kapitel 8: Dette kapitel hænger sammen med kapitel 4, idet det undersøges, hvad der<br />

er relevante gentagelser, når vi ønsker at udtale os om en delparameter.<br />

Lad mig <strong>til</strong> sidst påpege at udgangspunktet er, at vi har valgt en model <strong>til</strong> beskrivelse<br />

af det udførte forsøg, og ønsker nu at optimere vores konklusioner idenfor modellen.<br />

Det vil bl.a. sige, at vi ikke kommer ind på kontrol af modellen. En anden vigtig<br />

ting vi ikke kommer ind på, er robusthed af vores procedurer overfor antagelser i modellen,<br />

d.v.s. spørgsmål som, om en optimal procedure under modellen vil være langt<br />

fra optimal, hvis modellen ændres ganske lidt.<br />

En henvisning <strong>til</strong> Jørgen Hoffman-Jørgensens bøger angives med “JHJ”.


Kapitel 2<br />

Eksponentielle <strong>familier</strong><br />

2.1 Motivation<br />

Eksponentielle <strong>familier</strong> er klasser af sandsynlighedsmål med “særligt pæne egenskaber".<br />

Det smarte er, at når først vi har vist (og det er ikke svært), at noget er en eksponentiel<br />

familie, så ved vi, at en hel masse resultater er opfyldt. Lad os som et eksempel<br />

betragte n uafhængige variable X1, . . . , Xn som er normalfordelte med middelværdi µ<br />

og varians σ 2 . Hvis f(·) er en funktion fra R ind i R med den egenskab, at<br />

E µ,σ 2 f( ¯X) = 0 for alle µ ∈ R,<br />

så kan vi slutte, at f er identisk lig med nul pånær på en nulmængde. Denne egenskab<br />

kan måske nok synes lidt teknisk, men den kan hjælpe os <strong>til</strong> at vise andre egenskaber.<br />

Det sædvanlige estimat for σ 2 er s 2 = ∑i(X i − ¯X) 2 /(n − 1). Dette estimat har den rigtige<br />

middelværdi: Es 2 = σ 2 , og vi siger, at s 2 er middelværdiret. Man kan nu vise, at s 2<br />

er det estimat, der har mindst mulig varians, blandt alle estimater der er middelværdirette.<br />

For <strong>eksponentielle</strong> <strong>familier</strong> kan vi vise at for visse hypoteser er der særligt attraktive<br />

tests. I eksemplet ovenfor kan vi betragte et test for hypotesen µ = 0 mod alternativet<br />

µ > 0. Det sædvanlige t-test forkaster hypotesen hvis t = ¯X/ √ s 2 /n er stor, og vi kan<br />

vise at dette i en vis forstand er det bedste vi kan gøre.<br />

De ovenstående eksempler viser, at der er god grund <strong>til</strong> at beskæftige sig med <strong>eksponentielle</strong><br />

<strong>familier</strong>. Et andet argument er, at nogle af de vigtigste klasser af fordelinger<br />

faktisk er <strong>eksponentielle</strong> <strong>familier</strong>: Binomialfordelingerne, Poissonfordelingerne,<br />

normalfordelingerne og Gammafordelingerne. Ydermere er disse fordelinger byggestene<br />

for det der hedder Generaliserede Lineære Modeller som er et vigtigt redskab i<br />

en statistikers værktøjskasse.<br />

Definitionen på en eksponentiel familie vedrører hvordan data og parameter spiller<br />

sammen. Lad som et eksempel Pλ være poissonfordelingen med parameter λ og lad µ<br />

være tællemålet. Så kan vi skrive tætheden som<br />

dPλ λx<br />

(x) =<br />

dµ x! e−λ = e −λ · 1<br />

x!<br />

· exp{log(λ)x}.<br />

Hvad jeg har fremhævet her, er at tætheden kan skrives som en funktion af parameteren,<br />

ganget med en funktion af data, ganget med en eksponentialfunktion, hvor<br />

5


6 KAPITEL 2. EKSPONENTIELLE FAMILIER<br />

argumentet er en funktion af parameteren ganget med en funktion af data. Det er denne<br />

struktur der nedenfor vil blive brugt i den generelle definition. Bemærk at den første<br />

funktion af parameteren, lad os kalde den a(λ), er en normeringskonstant: eftersom vi<br />

betragter en tæthed, vil denne integrere <strong>til</strong> 1, og dermed har vi<br />

a(λ) ∑ x<br />

2.2 Definition<br />

<br />

1<br />

exp{log(λ)x} = 1 ⇒ a(λ) =<br />

x! ∑<br />

x<br />

1<br />

x! exp{log(λ)x}<br />

−1 .<br />

Jeg vil betragte en klasse P = {Pθ|θ ∈ Θ} af sandsynlighedsmål på målrummet<br />

(X , A, µ), hvor µ er et σ-endeligt mål. Familien P er parametriseret ved θ ∈ Θ, hvor<br />

Θ ⊆ Rp , d.v.s at hvis θ1 = θ2 så vil Pθ1 = Pθ2 . Antag, at µ dominerer alle målene i<br />

P, Pθ ≪ µ ∀θ ∈ Θ, og at der eksisterer en funktion φ = (φ1, . . . , φk) : Θ → Rk , en<br />

målelig funktion t = (t1, . . . , tk) : X → Rk , og en målelig funktion b : X → R således<br />

at<br />

dPθ<br />

dµ (x) = a(θ)b(x)eφ(θ)·t(x) , ∀θ ∈ Θ. (2.1)<br />

Hvis (2.1) er opfyldt, kaldes P en eksponentiel familie med kanonisk observator T = t(X)<br />

og kanonisk parameter φ(θ). Bemærk, at i (2.1) er a(·) bestemt ved<br />

<br />

a(θ) = b(x)e φ(θ)·t(x) −1 µ(dx)<br />

og er derfor kun en funktion af θ gennem φ(θ). Det mindste k for hvilket en repræsentation<br />

på formen (2.1) er mulig kaldes ordenen af familien. Hvis repræsentationen er<br />

minimal, d.v.s. at k er ordenen af familien, kaldes T en minimal kanonisk observator og<br />

ϕ en minimal kanonisk parameter.<br />

Eksempel 2.1.<br />

Jeg opskriver her nogle af de fordelinger I kender i forvejen på eksponentiel familieform.<br />

Binomialfordelingen. Lad X være binomialfordelt med antalsparamter n og sandsynlighedsparameter<br />

θ med 0 < θ < 1. Så er tætheden med hensyn <strong>til</strong> tællemålet µ<br />

givet ved<br />

dPθ (x) =<br />

dµ<br />

for x ∈ {0, . . . , n}.<br />

n<br />

x<br />

<br />

θ x (1 − θ) n−x = (1 − θ) n<br />

n<br />

x<br />

<br />

<br />

θ<br />

exp log x ,<br />

1 − θ<br />

Normalfordelingen. Lad X være normalfordelt med middelværdi µ og varians σ 2<br />

med (µ, σ 2 ) ∈ R × R+. Så er tætheden med hensyn <strong>til</strong> lebesguemålet m givet ved<br />

dP (µ,σ 2 )<br />

dm<br />

(x) = exp{− 1<br />

2σ 2(x − µ) 2 }<br />

√ 2πσ 2<br />

= exp{− µ2<br />

2σ 2 }<br />

√ 2πσ 2<br />

<br />

µ<br />

exp<br />

σ<br />

2σ<br />

1<br />

x − x2<br />

2 2<br />

for x ∈ R. Bemærk at i dette eksempel er b(x) = 1. <br />

<br />

,


2.3. MINIMAL FREMSTILLING OG KONVEKS STØTTE 7<br />

2.3 Minimal frems<strong>til</strong>ling og konveks støtte<br />

Jeg skal i dette afsnit angive en metode <strong>til</strong> at afgøre, om en frems<strong>til</strong>ling er minimal, og<br />

skal i denne forbindelse udtrykke mig “næsten sikkert” mht. et mål. Jeg starter derfor<br />

med følgende observation.<br />

Observation 2.2 Lad ν være målet på X givet ved<br />

dν<br />

(x) = b(x), (2.2)<br />

dµ<br />

hvor b(x) er fra (2.1). Der gælder at alle målene i P er indbyrdes ækvivalente, og at de<br />

er ækvivalente med ν , d.v.s. at alle disse mål har de samme nulmængder. <br />

Bevis. Da<br />

<br />

Pθ(A) =<br />

a(θ)e<br />

A<br />

φ(θ)·t(x) <br />

b(x)µ(dx) =<br />

A<br />

a(θ)e φ(θ)·t(x) ν(dx),<br />

har vi, at<br />

dPθ dν (x) = a(θ)eφ(θ)·t(x) . (2.3)<br />

Vi har derfor, at hvis N er en nulmængde for ν er N også en nulmængde for Pθ for alle<br />

θ ∈ Θ. Da (2.3) er strengt positiv, gælder der at ν(B) > 0 ⇒ Pθ(B) > 0. Hvis derfor N<br />

er en nulmængde for Pθ, følger det, at ν(N) = 0. <br />

Jeg vil skrive “næsten sikkert mht. P” som n.s.−P, og på grund af Observation 2.2<br />

skrive n.s.−P hvormed menes, at den angivne relation er korrekt på nær en af de fælles<br />

nulmængder for P θ og ν. Bemærk at Observation 2.2 viser, at hvis målene i en familie<br />

P ikke har samme støtte, så kan P ikke være en eksponentiel familie. Et eksempel på<br />

dette er familien af uniforme fordelinger på intervallet [0, θ], θ > 0.<br />

Lemma 2.3 Frems<strong>til</strong>lingen (2.1) er minimal hvis og kun hvis (i) og (ii) nedenfor er opfyldt:<br />

(i) funktionerne 1,φ1, . . . , φ k på Θ er lineært uafhængige, d.v.s.<br />

c0 + c1φ1(θ) + · · · + c kφ k(θ) = 0 ∀θ ∈ Θ ⇒ c0 = c1 = · · · = c k = 0, (2.4)<br />

(ii) funktionerne 1,t1, . . . , t k på X er lineært uafhængige næsten sikker mht. P, d.v.s<br />

c0 + c1t1(x) + · · · + c kt k(x) = 0 n.s. − P ⇒ c0 = c1 = · · · = c k = 0. (2.5)<br />

Bevis. Jeg viser først, at hvis (i) eller (ii) ikke er opfyldt, så er repræsentationen ikke<br />

minimal. Antag at (i) ikke er opfyldt. Der eksisterer altså en vektor c = 0, så at c0 + c ·<br />

φ(θ) = 0 ∀θ ∈ θ. Lad os sige at ck = 0, så har vi, at φk(θ) = −1<br />

c<br />

{c0 + c1φ1(θ) + · · · +<br />

k<br />

ck−1φk−1(θ)}, og vi kan skrive (2.1) som<br />

dP θ<br />

dµ (x) = a(θ)b(x)e−c0 t k(x)/c k exp<br />

<br />

k−1<br />

∑<br />

1<br />

φ i(θ)[t i(x) − c it k(x)/c k]<br />

<br />

.


8 KAPITEL 2. EKSPONENTIELLE FAMILIER<br />

D.v.s. at vi har konstrueret en repræsentation af dimension k−1, og (2.1) er derfor ikke<br />

minimal. På helt <strong>til</strong>svarende måde vises, at hvis (ii) ikke er opfyldt, så er (2.1) ikke<br />

minimal.<br />

Vi antager nu, at (i) og (ii) er opfyldt, og skal vise at frems<strong>til</strong>lingen (2.1) er minimal.<br />

Vi bemærker først, at hvis θ0 ∈ Θ, så har vi fra (2.1) og Observation 2.2, at (se JHJ 3.19)<br />

dPθ dPθ0 = a(θ)<br />

a(θ0) exp[{φ(θ) − φ(θ0)} · t(x)]. (2.6)<br />

Vi betragter nu endvidere en minimal repræsentation af dimension m , med kanonisk<br />

parameter β(θ) og kanonisk observator u(x) . Vi har altså<br />

dPθ dPθ0 = ã(θ)<br />

ã(θ0) exp[{β(θ) − β(θ0)} · u(x)], (2.7)<br />

og skal vise at k = m. Fra (i) har vi, at vi kan vælge θ1, . . . , θk, så at k × k matricen<br />

⎛<br />

⎞∗<br />

φ(θ1) − φ(θ0)<br />

⎜<br />

⎟<br />

A = ⎝ . ⎠<br />

φ(θk) − φ(θ0)<br />

har fuld rang. Da (2.6) og (2.7) er tæthed for det samme mål, er de identiske n.s.−P, og<br />

vi har for i = 1, . . . , k,<br />

{φ(θ i) − φ(θ0)} · {t(x) − t(x0)} = {β(θ i) − β(θ0)} · {u(x) − u(x0)} n.s. − P.<br />

Skrevet på matriks form gælder der, at<br />

hvor B er m × k matricen<br />

{t(x) − t(x0)}A = {u(x) − u(x0)}B n.s. − P, (2.8)<br />

B =<br />

⎛<br />

⎜<br />

⎝<br />

β(θ1) − β(θ0)<br />

.<br />

β(θ k) − β(θ0)<br />

Da (2.7) er antaget minimal, har vi at m ≤ k. Antag nu at m < k, så eksisterer der<br />

d ∈ R k , d = 0, så at Bd ∗ = 0. Da A har fuld rang, er c ∗ = Ad ∗ = 0, og (2.8) giver<br />

⎞<br />

⎟<br />

⎠<br />

{t(x) − t(x0)}c ∗ = {u(x) − u(x0)}Bd ∗ = 0 n.s. − P,<br />

hvilket er i modstrid med (ii). Altså er m = k, og (2.1) er en minimal frems<strong>til</strong>ling. <br />

Betingelsen (2.4) er ækvivalent med at mængden<br />

Λ0 = {ϕ(θ)|θ ∈ Θ}<br />

ikke <strong>til</strong>hører et affint underrum af R k .<br />

Jeg vil nu diskutere betingelsen (2.5). Støtten for en stokastisk variabel T, der lever<br />

i et metrisk rum, defineres som<br />

{t|P(kugle med centrum t og radius ǫ) > 0, ∀ǫ > 0}.<br />


2.3. MINIMAL FREMSTILLING OG KONVEKS STØTTE 9<br />

Specielt hvis T kun kan antage endelig mange værdier, så er støtten de punkter, hvor<br />

der er positiv sandsynlighed. Hvis T ∈ R k siger vi, at koordinaterne i T er affint uafhængige<br />

n.s. hvis støtten for T ikke er indeholdt i et affint underrum af R k . Dette er<br />

ækvivalent med at sige, at der ikke findes c ∈ R k , c = 0, så at c · T er lig med en konstant<br />

n.s. Men dette er netop betingelsen (2.5). Betingelsen er også ækvivalent med at sige,<br />

at variansen af T, Var(T), er positiv definit. Lad os lige eftervise det sidste udsagn:<br />

cVar(T)c ∗ = 0 ⇐⇒ Var(c · T) = 0<br />

⇐⇒ c · T = konstant n.s. ⇔ c = 0,<br />

hvor den sidste ækvivalens er betingelsen (2.5). Bemærk, at for en eksponentiel familie<br />

P giver Observation 2.2 at støtten for T er den samme uanset hvilket sandsynlighedsmål<br />

Pθ ∈ P vi betragter. Tilsvarende, hvis variansen for T er positiv definit under<br />

P θ1 ∈ P så er variansen positiv definit under alle P θ ∈ P.<br />

Den lukkede konvekse støtte Ct for den <strong>eksponentielle</strong> familie P defineres som den<br />

mindste lukkede konvekse mængde K ⊂ R k med P θ(t(X) ∈ K) = 1 for alle θ ∈ Θ,<br />

eller ækvivalent hermed {x|t(x) /∈ K} er en P-nulmængde. I symboler kan vi skrive<br />

Ct = <br />

K∈K<br />

K, (2.9)<br />

hvor K er mængden af lukkede og konvekse mængder K med ν({x|t(x) /∈ K}) = 0.<br />

Det indre af Ct betegnes intCt. Hvis støtten for T er indeholdt i et affint underrum af R k ,<br />

vil vi i definitionen af Ct tage snit over mængder, der er indeholdt i et affint underrum,<br />

og vi vil derfor have at intCt = ∅. Med andre ord vil intCt = ∅ medføre, at støtten<br />

for T ikke er indeholdt i et affint underrum af R k , og dermed at betingelsen (2.5) er<br />

opfyldt. Omvendt, hvis støtten for T ikke er indeholdt i et affint underrum af R k kan<br />

vi finde k støttepunkter der udspænder R k og dermed vil intCt = ∅.<br />

Vi kan samle vores diskussion ovenfor i:<br />

Observation 2.4 Følgende betingelser er ækvivalente:<br />

• Betingelsen (2.5);<br />

• Støtten for T er ikke indeholdt i et affint underrum af R k ;<br />

• intCt = ∅;<br />

• Variansen Var(T) er positiv definit. <br />

Eksempel 2.5 (Binomialfordelingen).<br />

Lad X være binomialfordelt med antalsparamter n og sandsynlighedsparameter θ med<br />

0 < θ < 1. Så er tætheden med hensyn <strong>til</strong> tællemålet µ givet ved<br />

<br />

dPθ n<br />

(x) = (1 − θ)n<br />

dµ x<br />

<br />

θ<br />

exp log x .<br />

1 − θ


10 KAPITEL 2. EKSPONENTIELLE FAMILIER<br />

Dette er en eksponentiel familie med t(x) = x og ϕ(θ) = log(θ/(1 − θ)). Repræsentationen<br />

er af dimension 1, og vi vil nu vise at den er minimal. Støtten for T er<br />

{0, 1, . . . , n} og denne <strong>til</strong>hører ikke et affint underrum af R, det vil sige at (2.5) er op-<br />

fyldt. Hvis<br />

<br />

θ<br />

c0 + c1 log = 0 ∀0 < θ < 1,<br />

1 − θ<br />

kan vi tage θ = 1/2 hvoraf følger at c0 = 0, og dernæst kan vi tage θ = 1/4 hvoraf<br />

følger at c1 = 0. Det vil sige at (2.4) er opfyldt, og vi har vist at repræsentationen er<br />

minimal. Dette eksempel er meget simpelt: hvis vi har en eksponentiel familie med en<br />

repræsentation af dimension 1, vil repræsentationen altid være minimal så længe at<br />

der er mindst to sandsynlighedsmål i familien (hvis ordenen af familien er nul vil der<br />

kun være et sandsynlighedsmål i familien). <br />

2.4 Laplace- og kumulanttransform<br />

Laplacetransformen for T = t(X) under målet ν er<br />

<br />

<br />

c(ξ) = exp(ξ · t(x))ν(dx) =<br />

Rk exp(ξ · t)νT(dt) (2.10)<br />

X<br />

for ξ ∈ R k . Domænet for c(·) er Λ = {ξ ∈ R k |c(ξ) < ∞}. Lad os definere et sandsynlighedsmål<br />

˜P ξ på X , for ξ ∈ Λ, ved<br />

d ˜P ξ<br />

dν (x) = c(ξ)−1 exp(ξ · t(x)). (2.11)<br />

Så svarer P θ i (2.1) <strong>til</strong> ˜P φ(θ) her og a(θ) = c(φ(θ)) −1 . Klassen P er givet ved<br />

P = { ˜P ξ|ξ ∈ Λ0}, Λ0 = {φ(θ)|θ ∈ Θ}.<br />

Vi har altid at Λ0 ⊆ Λ. Hvis Λ0 = Λ kaldes familien P fuld, og hvis P er fuld og Λ er<br />

åben, kaldes familien regulær. Laplacetranformen for t(X) under ˜P ξ0 er<br />

<br />

X<br />

<br />

exp(ξ · t(x)) ˜P ξ0 (dx) =<br />

X<br />

exp((ξ + ξ0) · t(x))<br />

ν(dx) =<br />

c(ξ0)<br />

Kumulanttransformen for t(X) under målet ν er defineret som<br />

κ(ξ) = ln c(ξ).<br />

Fra (2.12) har vi at kumulanttransformen af t(X) under ˜P ξ0 er<br />

κ ξ0 (ξ) = κ(ξ + ξ0) − κ(ξ0).<br />

c(ξ + ξ0)<br />

. (2.12)<br />

c(ξ0)<br />

Hvis κP er kumulanttransformen for t(X) under et sandsynlighedsmål P, kaldes de<br />

afledede af κP taget i nul for t(X)’s kumulanter. Bemærk at for kumulanttransformen af<br />

t(X) under ˜P ξ0 har vi<br />

∂kκξ0 ∂<br />

(0) =<br />

kκ (ξ0)<br />

∂ξ i1 · · · ∂ξ ik<br />

∂ξ i1 · · · ∂ξ ik


2.4. LAPLACE- OG KUMULANTTRANSFORM 11<br />

Den første og anden kumulant er henholdsvis middelværdi og varians af t(X) under<br />

P, se (2.17) og (2.18) nedenfor. For en en-dimensional variable t(X) kaldes<br />

for henholdsvis skævheden og kurtosis.<br />

κ (3)<br />

P (0)<br />

(κ ′′ ,<br />

P<br />

(0))3/2<br />

κ (4)<br />

P (0)<br />

(κ ′′<br />

P<br />

(0))2 ,<br />

Fremover vil jeg skrive P ξ for ˜P ξ, selvom dette kan give forvirring i forhold <strong>til</strong> det<br />

tidligere P θ. Vi lader E ξ betegne middelværdi mht. sandsynlighedsmålet P ξ. Desuden<br />

vil Λ blive omtalt som det fulde parameterområde for den <strong>eksponentielle</strong> familie.<br />

Sætning 2.6. Antag at t(·) opfylder (2.5). Det fulde parameterområde Λ = {ξ|c(ξ) <<br />

∞} er konvekst, og κ er strengt konveks på Λ, d.v.s. at κ(αξ1 + (1 − α)ξ2) < ακ(ξ1) +<br />

(1 − α)κ(ξ2) for alle ξ1, ξ2 ∈ Λ, ξ1 = ξ2, og alle 0 < α < 1. <br />

Bevis. Lad ξ1, ξ2 ∈ Λ. Hölders ulighed (JHJ 3.11) giver<br />

<br />

e (αξ <br />

1+(1−α)ξ2)·t(x)<br />

ν(dx) = {e ξ1·t(x) α ξ2·t(x) 1−α } {e } ν(dx)<br />

<br />

e ξ α <br />

1·t(x)<br />

ν(dx)<br />

≤<br />

e ξ2·t(x) ν(dx)<br />

1−α<br />

= c(ξ1) α c(ξ2) 1−α < ∞, (2.13)<br />

så at αξ1 + (1 − α)ξ2 ∈ Λ, d.v.s. Λ er konvekst. Tager vi logaritmen i ovenstående<br />

ulighed, fås at κ(ξ) er en konveks funktion. Der gæder lighedstegn i Hölders ulighed,<br />

hvis og kun hvis<br />

e ξ 1·t(x) = Ke ξ2·t(x) n.s. − ν,<br />

for en konstant K, og dette er ensbetydende med at ξ1 = ξ2 ifølge (2.5). <br />

Sætning 2.7. Lad ξ ∈ Λ og antag at ξ ± h ∈ Λ. Så gælder<br />

E ξ|h · t(X)| n < ∞ ∀ n ∈ N.<br />

Specielt gælder, at hvis ξ ∈ intΛ, så eksisterer alle momenter af t(X) under P ξ. <br />

Bevis. Da |y| n /n! ≤ e y + e −y for alle y ∈ R, har vi<br />

<br />

|h · t(x)| n e ξ·t(x) <br />

ν(dx) ≤ n!<br />

e (ξ+h)·t(x) <br />

ν(dx) +<br />

e (ξ−h)·t(x) <br />

ν(dx) < ∞.<br />

Hvis ξ ∈ intΛ, vil ξ ± h ∈ Λ for alle små h. Derfor har vi, at E ξ|t j(X)| n < ∞ for alle<br />

j = 1, . . . , k og alle n. Hölders ulighed giver så, at<br />

E ξ|t1(X) n 1 · · · tk(X) n k| < ∞ for alle n1, . . . , n k. (2.14)


12 KAPITEL 2. EKSPONENTIELLE FAMILIER<br />

Sætning 2.8. Hvis ξ ∈ intΛ gælder der at<br />

∂ n c(ξ1, . . . , ξ k)<br />

∂ξ a 1<br />

1 . . . ∂ξa k<br />

k<br />

= c(ξ)E ξ {t1(X) a 1 · · · tk(X) a k}, (2.15)<br />

hvor a1 + · · · + a k = n. <br />

Bevis. Ifølge (2.14) eksisterer momenterne i (2.15). Påstanden i (2.15) kan vises ved<br />

induktion i n : Lad kuglen med centrum i ξ og radius ǫ0 være indeholdt i Λ. Antag at<br />

påstanden holder for alle a1, . . . , a k med a1 + · · · + a k = n og betragt situationen hvor<br />

vil ændre a j <strong>til</strong> a j + 1. Vi vil benytte at<br />

Så fås<br />

|e ǫt <br />

<br />

j − 1| = <br />

<br />

ǫ<br />

0<br />

∂ n+1 c(ξ1, . . . , ξ k)<br />

∂ξ a1 1 . . . ∂ξa j+1<br />

j<br />

tje ut <br />

<br />

jdu ≤ ǫ|tj|(e ǫ0tj −ǫ0t<br />

+ e j) ∀ |ǫ| < ǫ0. (2.16)<br />

. . . ∂ξ ak k<br />

= lim 1<br />

<br />

∂nc(ξ1, . . . , ξj + ǫ, . . . , ξk) −<br />

ǫ<br />

∂n <br />

c(ξ1, . . . , ξk) <br />

= lim<br />

<br />

= lim =<br />

∂ξ a 1<br />

1 . . . ∂ξa k<br />

k<br />

∂ξ a1 1 . . . ∂ξa k<br />

k<br />

t1(x) a1 · · · tk(x) ak ξ·t(x)<br />

e eǫtj(x) − 1<br />

ν(dx)<br />

<br />

ǫ<br />

t1(x) a 1 · · · tj(x) a j+1 · · · tk(x) a ke ξ·t(x) ν(dx)<br />

= c(ξ)E ξ{t1(X) a 1 · · · tj(X) a j+1 · · · tk(X) a k },<br />

hvor det andet lighedstegn er induktionsantagelsen, og det tredje lighedstegn følger af<br />

(2.16) og sætningen om domineret konvergens. <br />

Bemærkning 2.9 Bemærk at Sætning 2.8 er et eksempel på, at vi må differentiere ind<br />

under integraltegnet. <br />

Benyttes Sætning 2.8 får vi følgende vigtige relationer for ξ ∈ intΛ,<br />

τ(ξ) := Eξt(X) = ∂κ<br />

(ξ)<br />

∂ξ<br />

(2.17)<br />

V(ξ) := Varξ(t(X)) = ∂2κ ∂τ<br />

(ξ) =<br />

∂ξ∂ξ ∗ ∂ξ∗(ξ) (2.18)<br />

Desuden har vi fra Observation 2.4 at hvis t(·) opfylder (2.5) så er<br />

Var ξ(t(X)) positiv definit for ξ ∈ intΛ. (2.19)<br />

Observation 2.10 Antag at t(·) opfylder (2.5). Hvis ξ1, ξ2 ∈ intΛ og ξ1 = ξ2, så er<br />

τ(ξ1) = τ(ξ2).


2.4. LAPLACE- OG KUMULANTTRANSFORM 13<br />

Bevis.<br />

(ξ2 − ξ1) · {τ(ξ2) − τ(ξ1)} = (ξ2 − ξ1) ·<br />

=<br />

1<br />

0<br />

1<br />

0<br />

dτ(ξ1 + s(ξ2 − ξ1))<br />

ds<br />

ds<br />

(ξ2 − ξ1)V(ξ1 + s(ξ2 − ξ1))(ξ2 − ξ1) ∗ ds > 0<br />

ifølge (2.19). <br />

Eksempel 2.11 (Normalfordelingen).<br />

Lad X være normalfordelt med middelværdi µ og varians σ 2 med (µ, σ 2 ) ∈ R × R+.<br />

Så er tætheden med hensyn <strong>til</strong> lebesguemålet m givet ved<br />

dP (µ,σ2 )<br />

(x) ==<br />

dm<br />

1<br />

√ 2πσ 2<br />

µ2<br />

exp{− } exp<br />

2σ2 µ<br />

σ<br />

2σ<br />

1<br />

x − x2<br />

2 2<br />

for x ∈ R. Dette er en eksponentiel familie med t(x) = (x, x2 ) og ϕ(µ, σ2 ) = ( µ<br />

I dette <strong>til</strong>fælde er<br />

Λ0 = R × R−,<br />

og da området har ikke tomt indre er (2.4) opfyldt. Støtten for T er<br />

{(x, x 2 )|x ∈ R},<br />

<br />

,<br />

σ2 , − 1<br />

2σ2). eftersom enhver kugle omkring (z, z 2 ) vil indeholde et interval af x-værdier, og dermed<br />

have positiv sandsynlighed. Da støtten ikke er indeholdt i et affint underrum af<br />

R 2 , er (2.5) opfyldt, og vi har vist at repræsentationen er minimal. Vi vil nu undersøge<br />

om familien er fuld. Vi skal da undersøge hvornår integralet<br />

<br />

R<br />

exp ξ1x + ξ2x 2 dx<br />

er endeligt. Hvis ξ2 ≥ 0 vil integranten gå mod uendelig for x gående mod enten +∞<br />

eller −∞ og integralet er ikke endeligt. Tilbage er området Λ0 og vi har derfor vist at<br />

Λ = Λ0, det vil sige at familien er fuld. Da Λ også er åben er familien regulær.<br />

Laplacetransformen for T under lebesguemålet er<br />

<br />

c(ξ) = exp{ξ1x + ξ2x 2 }dx<br />

R<br />

<br />

= exp<br />

=<br />

− 1<br />

4 ξ2 1 /ξ2<br />

<br />

R<br />

<br />

π/(−ξ2) exp{− 1<br />

4 ξ2 1 /ξ2}.<br />

<br />

exp ξ2 x − 1<br />

2 ξ1/(−ξ2)<br />

2 dx<br />

Kumulanttransformen er derfor κ(ξ) = − 1 4 ξ2 1 /ξ2 − 1 2 log(−ξ2/π). Fra (2.17) får vi<br />

EξX = −ξ1<br />

, EξX 2ξ2<br />

2 = ξ2 1<br />

4ξ2 −<br />

2<br />

1<br />

.<br />

2ξ2<br />

Med ξ = (ξ1, ξ2) = (µ/σ 2 , −1/(2σ 2 )) bliver formlerne<br />

E (µ,σ 2 ) X = − µ(−2σ2 )<br />

2σ 2 = µ, E (µ,σ 2 ) X2 = µ2 (4σ 4 )<br />

4σ 4<br />

−2σ2<br />

−<br />

2 = µ2 + σ 2 .


14 KAPITEL 2. EKSPONENTIELLE FAMILIER<br />

Det er sommetider muligt at vise at en familie er fuld ved hjælp af følgende resultat.<br />

Observation 2.12 Lad Λ0 være et åbent område i R k . Hvis der for ethvert punkt ξ1 på<br />

randen af Λ0 gælder, at der eksisterer ξ0 ∈ Λ0, så at<br />

c(ξ) → ∞,<br />

for ξ → ξ1 langs liniestykket fra ξ0 <strong>til</strong> ξ1, så vil Λ0 = Λ. <br />

Bevis. Vi vil vise at c(ξ1) = ∞ for alle punkter ξ1 på randen af Λ0. Så følger det fra<br />

sætning 2.6 at Λ ikke kan være større end Λ0 (hvis ˜ξ ∈ Λ \ Λ0 så vil der, da Λ er<br />

konvekst, findes ξ1 ∈ Λ med ξ1 på randen af Λ0, men dette er en modstrid med c(ξ1) =<br />

∞). Vi laver et modstridsbevis. Antag at c(ξ1) < ∞. Så fra (2.13) har vi med ξ = αξ1 +<br />

(1 − α)ξ0, 0 < α < 1,<br />

c(ξ) ≤ c(ξ1) α c(ξ0) 1−α ≤ max{c(ξ1), c(ξ0)},<br />

hvilket er en modstrid med at c(ξ) → ∞. Altså er c(ξ1) = ∞. <br />

Observation 2.12 bruges på den måde at for ξ ∈ Λ0 har vi at ξ = ϕ(θ) for et θ ∈ Θ og<br />

dermed<br />

c(ξ) = a(θ) −1 .<br />

Hvis derfor a(θ) går mod nul for θ gående mod randen af Θ og Λ0 er åbent i R k vil<br />

familien være fuld.<br />

Det næste lemma viser at Observation 2.12 har en invers: hvis c(ξ) → ∞ for ξ<br />

gående mod randen af Λ0, så vil familien ikke være fuld.<br />

Lemma 2.13 Lad ξ /∈ Λ og lad ξn ∈ Λ med ξn → ξ for n → ∞. Så vil c(ξn) → ∞. <br />

Bevis. Da exp{ξn · t(x)} ≥ 0 siger Fatou’s lemma (JHJ 3.5) at<br />

<br />

∞ = c(ξ) = lim inf exp{ξn · t(x)}ν(dx)<br />

n<br />

<br />

≤ lim inf exp{ξn · t(x)}ν(dx)<br />

n<br />

= lim inf c(ξn),<br />

n<br />

hvilket viser resultatet. <br />

2.5 Estimation<br />

Jeg betragter i dette afsnit den fulde <strong>eksponentielle</strong> familie (2.11) med ξ ∈ Λ = {ξ|<br />

c(ξ) < ∞}, og antager at frems<strong>til</strong>lingen er minimal. For den observerede værdi t =<br />

t(x) er log likelihood funktionen<br />

l(ξ) = l(ξ; t) = ξ · t − κ(ξ), ξ ∈ Λ. (2.20)


2.5. ESTIMATION 15<br />

Sætning 2.14. Antag at den <strong>eksponentielle</strong> familie er regulær og på minimal form.<br />

Da eksisterer der ˆξ = ˆξ(t) ∈ Λ, så at log likelihood funktionen (2.20) antager sin<br />

maksimumsværdi i ˆξ, hvis og kun hvis t ∈ intCt. Da fra Sætning 2.6 l(ξ) er strengt<br />

konkav, vil for t ∈ intCt estimatet ˆξ være entydigt bestemt og være løsning <strong>til</strong> ligningen<br />

∂l(ξ)<br />

∂ξ<br />

= t − ∂κ(ξ)<br />

∂ξ<br />

= t − τ(ξ) = 0, (2.21)<br />

d.v.s. ˆξ = τ −1 (t). <br />

Bevis. Vi viser først, at t ∈ intCt medfører, at l(ξ) antager sit maksimum på Λ. Vi<br />

bruger et modstrids bevis. Antag at l(ξn) er voksende, hvor ξn ∈ Λ og ξn går mod<br />

randen af Λ. Hvis følgen ξn er begrænset, kan vi tage en delfølge {nk}, så at ξn → k<br />

˜ξ /∈ Λ. Det følger af Lemma 2.13, at c(ξn ) → ∞ da c( k ˜ ξ) = ∞, og dermed fra (2.20),<br />

at l(ξn ) → −∞, hvilket er en modstrid. Hvis i stedet følgen ξn er ubegrænset, kan vi<br />

k<br />

tage en delfølge på formen ξn = u k kek, hvor ek er en enhedsvektor i Rk med ek → e, og<br />

uk → ∞. Så giver Fatou’s lemma<br />

lim inf e<br />

k<br />

−l(ξn<br />

<br />

)<br />

k = lim inf e<br />

k<br />

ukek·(t(x)−t) ν(dx)<br />

<br />

≥ lim inf e<br />

k<br />

ukek·(t(x)−t) ν(dx)<br />

≥ ∞ · ν({x : e · (t(x) − t) > 0} = ∞,<br />

hvor det sidste lighedstegn følger af, at t ∈ intCt. Altså har vi igen at l(ξn k ) → −∞, og<br />

dermed en modstrid.<br />

Vi skal nu vise, at hvis t /∈ intCt, så antager l(ξ) ikke sit maksimum på Λ. Vi vil<br />

vise, at for ethvert ξ0 ∈ Λ findes der en retning e , så at når vi forlader ξ0 i e’s retning<br />

vokser l(ξ). Da t /∈ intCt findes der en enhedsvektor e, så at<br />

Derfor vil<br />

ν({x|e · (t(x) − t)) > 0} = 0.<br />

e −l(ξ0+λe)<br />

<br />

=<br />

e λe·(t(x)−t) e ξ0·(t(x)−t) ν(dx) (2.22)<br />

være aftagende i λ > 0. Den strenge konkavitet af l(ξ) giver, at (2.22) er strengt aftagende,<br />

og l(ξ) har derfor ikke maksimum i ξ0. <br />

Bemærkning 2.15 Bemærk at Sætning 2.14 viser, at i en regulær familie på minimal<br />

form, er<br />

τ(Λ) = intCt, (2.23)<br />

eftersom τ(ξ) = t medfører at l(·; t) har maksimum i ξ. Fra Observation 2.10 har vi<br />

altså, at τ(·) er en en-<strong>til</strong>-en afbildning af Λ på intCt. Da τ fra Sætning 2.8 er uendelig<br />

ofte differentiabel, gælder det samme for ˆξ(·) = τ −1 (·) : intCt → Λ. <br />

Den næste sætning angiver jeg uden bevis.<br />

Sætning 2.16. For en fuld eksponentiel familie med minimal repræsentation (2.11)<br />

gælder at


16 KAPITEL 2. EKSPONENTIELLE FAMILIER<br />

(i) t ∈ intCt ⇒ l(ξ; t) har entydigt bestemt maksimumspunkt ˆξ(t),<br />

(ii) t /∈ intCt ⇒ l(ξ; t) antager ikke sit supremum for ξ ∈ Λ ,<br />

(iii) t ∈ τ(intΛ) ⊆ intCt ⇒ ˆξ(t) er den entydigt bestemte løsning <strong>til</strong> ligningen τ(ξ) =<br />

t, med ξ ∈ intΛ. <br />

Bemærk at hvis t ∈ intCt\τ(intΛ), så skal det entydigt bestemte ˆξ(t) findes på randen<br />

af Λ. Et eksempel <strong>til</strong> belysning af situationen i Sætning 2.16 er tætheden<br />

1<br />

exp(−|x| + θx − κ(θ)),<br />

1 + x4 hvor Ct er hele R og τ(int Λ) er et endeligt interval.<br />

Jeg slutter dette afsnit med at se på situationen med n uafhængige og identisk fordelte<br />

variable X1, . . . , Xn, hvor fordelingen <strong>til</strong>hører den <strong>eksponentielle</strong> familie (2.11).<br />

Den simultane tæthed er<br />

dPn ξ<br />

dνn (x1, . . . , xn) = c(ξ) −n <br />

exp ξ · t(xi) ,<br />

d.v.s. at vi har igen en eksponentiel familie af orden k idet :<br />

Observation 2.17 Hvis 1, t1(x), . . . , t k(x) er lineært uafhængige n.s.−ν, så er også 1,<br />

∑ n 1 t1(x i), . . . , ∑ n 1 t k(x i) lineært uafhængige n.s.−ν n . <br />

Bevis.<br />

⇓<br />

⇓<br />

n<br />

c0 + c1 ∑<br />

1<br />

t1(x i) + · · · + c k<br />

n<br />

∑<br />

1<br />

n<br />

∑<br />

1<br />

t k(x i) = 0 n.s. − ν n<br />

∃ x2, . . . , xn så at der n.s-ν mht. x1 gælder:<br />

n<br />

n <br />

c0 + c1 t1(xi) + · · · + ck tk(xi) + c1t1(x1) + · · · + cktk(x1) = 0<br />

∑ 2<br />

∑ 2<br />

c k = · · · = c1 = c0 = 0. <br />

Log likelihood funktionen er<br />

ln(ξ) = ξ ·<br />

n<br />

∑<br />

1<br />

t(x i) − nκ(ξ) = nl(ξ; ¯t)<br />

med ¯t = ∑ t(x i)/n, og hvor l(ξ; t) er givet i (2.19). Estimation baseret på x1, . . . , xn er<br />

derfor som før med t erstattet af ¯t, og resultaterne fra Sætningerne 2.14 og 2.16 kan<br />

bruges.


2.6. MARGINALE OG BETINGEDE FORDELINGER 17<br />

Eksempel 2.18 (Normalfordelingen).<br />

I eksempel 2.11 så vi at normalfordelingerne med middelværdi µ og varians σ 2 med<br />

(µ, σ 2 ) ∈ R × R+ udgør en regulær eksponentiel familie. Den kanoniske observator er<br />

t(x) = (x, x 2 ) og støtten for T er<br />

Den konvekse støtte for T er derfor<br />

{(x, y) ∈ R 2 |y = x 2 }.<br />

Ct = {(x, y) ∈ R 2 |y ≥ x 2 }.<br />

Da ethvert punkt (x, x 2 ) er på randen af Ct vil maksimum likelihood estimaterne for<br />

(µ, σ 2 ) eller ξ = (µ/σ 2 , −1/(2σ 2 ) ikke eksistere når vi blot har én observation. Når vi<br />

istedet har n > 1 observationer x1, . . . , xn eksisterer maksimum likelihood estimaterne<br />

med sandsynlighed 1. Dette er fordi<br />

1<br />

n<br />

n<br />

∑<br />

i=1<br />

(x i, x 2 i<br />

1<br />

) =<br />

n (x1, x 2 1<br />

1 ) + · · · +<br />

n (xn, x 2 n) ∈ int Ct<br />

hvis der blot er to observationer der er forskellige. Udsagnet følger af at x → x 2 er en<br />

strengt konveks kurve og derfor vil en konveks kombination af forskellige punkter på<br />

denne kurve ikke ligge på kurven. <br />

2.6 Marginale og betingede fordelinger<br />

Vi betragter igen en fuld eksponentiel familie med minimal repræsentation (2.11). Lad<br />

ξ = (ξ (1) , ξ (2) ) og t(x) = (t (1) (x), t (2) (x)) være en opsplitning i de første m og de sidste<br />

(k − m) koordinater med 1 ≤ m < k. Hvad kan vi sige om de marginale fordelinger<br />

for t (2) (X) og de betingede fordelinger af t (1) (X) givet t (2) (X)?<br />

Observation 2.19 Der gælder generelt følgende formel for marginale tætheder<br />

<br />

dQU<br />

dQ<br />

(u) = EP (X) | U = u .<br />

dPU<br />

dP<br />

Bevis. Se afsnit 11.4. <br />

Benyttes denne for den marginale tæthed for t (2) (X) fås<br />

dP ξT (2)<br />

dP ξ0T (2)<br />

(v) = E ξ0<br />

= c(ξ0)<br />

c(ξ) E ξ0<br />

dPξ<br />

dP ξ0<br />

<br />

exp<br />

(X) | t (2) <br />

(X) = v<br />

<br />

(ξ (1) − ξ (1)<br />

0 ) · t(1) (X)<br />

<br />

| t (2) <br />

(X) = v exp<br />

(ξ (2) − ξ (2)<br />

0<br />

<br />

(2.24)<br />

<br />

) · v .<br />

Hvis vi ser på delklassen P0 = {P ξ|ξ ∈ Λ0} med Λ0 = {(ξ (1) , ξ (2) )|ξ (1) = ξ (1)<br />

0 }, er<br />

(2.24) på formen (2.1), og de marginale fordelinger af t (2) (X) udgør en ekponentiel<br />

familie P 0T (2).


18 KAPITEL 2. EKSPONENTIELLE FAMILIER<br />

Hvis P er fuld, er P 0T (2) også fuld, idet<br />

<br />

exp[α · v]P ξ0T (2)(dv) = Eξ0 exp[α · t(2) (X)] = Eξ0 exp[0 · t(1) (X) + α · t (2) (X)]<br />

som er endelig, hvis og kun hvis (0, α) = ξ − ξ0 for et eller andet ξ ∈ Λ, d.v.s. α = ξ (2) −<br />

ξ0 (2) for ξ ∈ Λ, og vi får netop klassen P 0T (2). Hvis Λ er åben, er {α|ξ0 + (0, α) ∈ Λ} en<br />

åben mængde i R k−m , d.v.s. hvis P er regulær, er P 0T (2) også regulær.<br />

Vi vender os nu mod de betingede fordelinger.<br />

Observation 2.20 Lad P og Q være to sandsynlighedsmål på (X , A) med Q ≪ P. Lad<br />

(Y, B) være et andet målrum og lad t : X → Y være en målelig afbildning. Definer<br />

f(x) = dQ<br />

<br />

(x), g(t) =<br />

dP<br />

Så gælder der at Q T (·|t) ≪ P T (·|t) og<br />

dQ(·|t)<br />

(x) =<br />

dP(·|t)<br />

f(x)P T (dx|t), D = {t|0 < g(t) < ∞}.<br />

⎧<br />

⎨<br />

f(x)<br />

g(t)<br />

t ∈ D<br />

⎩<br />

1 t /∈ D.<br />

Bemærk at PT({t|g(t) = ∞}) = 0 og dermed også QT({t|g(t) = ∞}) = 0. Desuden<br />

har vi fra Observation 2.19 også at QT({t|g(t) = 0}) = 0. Vi har altså at QT(D c ) = 0. <br />

Bevis. Se afsnit 11.4. <br />

Eksempel 2.21.<br />

Lad Q være fordelingen for (X1, . . . , Xn), hvor X-erne er uafhængige og<br />

Q(X i = 1) = 1 − Q(X i = 0) = θ,<br />

og lad P være den <strong>til</strong>svarende fordeling med θ = 1/2. Med U + X1 + · · · + Xn er<br />

og<br />

Fra Observation 2.20 får vi<br />

dQ(·|U = u)<br />

(x) =<br />

dP(·|U = u)<br />

dP<br />

d♯n(x) =<br />

<br />

1<br />

n ,<br />

2<br />

dQ<br />

d♯ n(x) = θu (1 − θ) n−u ,<br />

dQ<br />

dP (x) = 2n θ u (1 − θ) n−u .<br />

2 n θ u (1 − θ) n−u<br />

EP(2 n θ u (1 − θ) n−u |U = u) =<br />

2 n θ u (1 − θ) n−u<br />

2 n θ u (1 − θ) n−u EP(1|U = u)<br />

hvilket viser at den betingede fordeling af (X1, . . . , Xn) givet U = u er den samme<br />

uanset værdien af θ. <br />

= 1,


2.7. KOMPLETHED AF DEN MINIMALKANONISKE OBSERVATOR 19<br />

For den betingede fordeling af X givet t (2) (X) = u får vi<br />

dP ξ(·|t (2) (X) = u)<br />

dP ξ0 (·|t(2) (X) = u) =<br />

=<br />

e (ξ−ξ0)·t(x)<br />

E ξ0 (e(ξ−ξ0)·t(X) |t (2) (X) = u)<br />

e (ξ(1) −ξ (1)<br />

0 )·t(1) (x)<br />

E ξ0 (e(ξ(1) −ξ (1)<br />

0 )·t(1) (x) |t (2) (X) = u)<br />

For en fast værdi af u udgør de betingede fordelinger således en eksponentiel familie.<br />

Denne betingede familie er ikke nødvendigvis fuld, selvom P er fuld.<br />

Ovenfor betragtede vi de første m og sidste k − m koordinater i ξ og t(x). Generelt<br />

kan vi lade A2 være en k × (k − m) matrix af fuld rang k − m. Denne supplerer vi med<br />

A1 : k × m så at<br />

A = (A1, A2)<br />

er en invertibel k × k matriks. Da<br />

ξ · t(x) = ξt(x) ∗ = [ξA ∗−1 ][t(x)A] ∗ ,<br />

kan vi opskrive P som en eksponentiel familie med minimal kanonisk observator<br />

˜t(x) = t(x)A og minimal kanonisk parameter ˜ξ = ξA ∗−1 . Vi har derfor:<br />

Sætning 2.22. Lad P være en regulær familie og lad A være som ovenfor. Så udgør<br />

de marginale fordelinger for ˜t (2) (X) = t(X)A2 i delmodellen med ˜ξ (2) fast en regulær<br />

eksponentiel familie. <br />

Bemærkning 2.23 Hvis vi betragter en delmodel givet ved {P ξ|ξ ∈ ˜Λ}, hvor ˜Λ ⊂ Λ<br />

er åben, vil det kanoniske parameterområde for de marginale fordelinger af t(X)A2<br />

under ˜ξ (2) fast også være åben. Når det kanoniske parameterområde er åbent taler vi<br />

om en åben eksponentiel familie. <br />

2.7 Komplethed af den minimalkanoniske observator<br />

For en general klasse P af sandsynlighedsmål på målrummet (X , A), og en generel<br />

observator t : (X , A) → (Y, B) med værdier i målrummet (Y, B), skal jeg nu definere<br />

komplethed. Intuitivt skal vi formalisere, at klassen P er stor nok <strong>til</strong>, at en funktion er<br />

entydigt fastlagt ud fra dens middelværdier under P, P ∈ P.<br />

Observatoren T = t(X) siges at være komplet under P (henholdsvis begrænset komplet)<br />

hvis der for enhver funktion f : (Y, B) → (R, B(R)) (henholdsvis enhver begrænset<br />

funktion) med<br />

<br />

EP f(T) = f(t(x))P(dx) = 0 ∀ P ∈ P,<br />

gælder at<br />

f(t(x)) = 0 n.s. − P for alle P ∈ P.<br />

Observation 2.24 Hvis T er komplet så er T også begrænset komplet. <br />

Observation 2.25 Hvis T er komplet så er også ˜T = g(T) komplet, hvor g er en målelig<br />

afbildning fra Y <strong>til</strong> ˜Y.


20 KAPITEL 2. EKSPONENTIELLE FAMILIER<br />

Bevis. Antag at EP f( ˜T) = EP f(g(T)) = 0 for alle P ∈ P. Heraf følger at f(g(t(x))) =<br />

f(˜t(x)) = 0 n.s.-P for alle P ∈ P. <br />

Sætning 2.26. Lad P = {P ξ|ξ ∈ Λ0} være en eksponentiel familie på minimal form<br />

dPξ<br />

dµ (x) = a(ξ)b(x)eξ·t(x) , x ∈ X , ξ ∈ Λ0 ⊆ R k .<br />

Vi antager ikke her, at Λ0 er det fulde parameter område. Hvis intΛ0 = ∅, er T = t(X)<br />

komplet under P = {P ξ|ξ ∈ Λ0}. <br />

Bevis. Lad ξ0 ∈ Λ0 og lad f : Rk → R opfylde<br />

<br />

0 = a(ξ)b(x)e ξ·t(x) f(t(x))µ(dx) = a(ξ)<br />

<br />

a(ξ0)<br />

e (ξ−ξ0)·t(x) f(t(x))Pξ0 (dx), (2.25)<br />

for alle ξ ∈ Λ0. Lad f + (t) = f(t)1( f(t) > 0) og f − (t) = − f(t)1( f(t) < 0), og definer<br />

de to mål ν + og ν − på (R k , B(R k )) ved<br />

dν +<br />

dP ξ0T<br />

(t) = f + (t) og dν−<br />

(t) = f<br />

dPξ0T − (t).<br />

Disse to mål er endelige, idet f er Pξ-integrabel for alle ξ ∈ Λ0. Så viser (2.25), at<br />

<br />

e (ξ−ξ0)·t<br />

<br />

+<br />

ν (dt) = e (ξ−ξ0)·t −<br />

ν (dt) ∀ ξ ∈ Λ0.<br />

Denne ligning siger, at Laplacetransformerne for de to mål ν + og ν − stemmer overens<br />

på Λ0 − ξ0. Da int(Λ0 − ξ0) = ∅ følger det af JHJ, afsnit 4.19, at ν + = ν − . Dette giver<br />

<strong>til</strong> gengæld, at<br />

f + (t) = f − (t) n.s. − P ξ0T,<br />

og dermed fra definitionen af f + og f − , at<br />

Observationen 2.2 giver så, at<br />

f(t) = 0 n.s. − P ξ0T.<br />

f(t(x)) = 0 n.s. − P ξ for alle ξ ∈ Λ0. <br />

Eksempel 2.27.<br />

Lad X være binomialfordelt med antalsparameter n og sandsynlighedsparameter θ. Så<br />

siger sætningen ovenfor at hvis<br />

E θ f(X) = 0 ∀ 0 < θ < 1,<br />

så vil der gælde at f(0) = f(1) = · = f(n) = 0. Lad os vise dette direkte. Vi har altså<br />

at<br />

<br />

θ x (1 − θ) n−x = 0<br />

n <br />

n<br />

∑ f(x)<br />

x<br />

x=0<br />

for alle θ. Lader vi nu θ → 0 forsvinder alle led i summen pånær det første, som bliver<br />

f(0). Vi kan altså slutte at f(0) = 0. Vi dividerer nu ligningen ovenfor med θ og lader<br />

igen θ → 0. Dette giver os at f(1) = 0, og sådan fortsætter vi ind<strong>til</strong> vi har vist at f er<br />

identisk nul.


2.8. OPGAVER 21<br />

2.8 Opgaver<br />

Opgave 2.1<br />

Opskriv hver af <strong>familier</strong>ne nedenfor på eksponentiel familieform. Angiv støtten for<br />

den kanoniske observator T, den konvekse støtte Ct, samt variationsområdet Λ0 for<br />

den kanoniske parameter og det fulde parameterområde Λ. Udregn desuden middelværdi<br />

og varians for den kanoniske observator.<br />

a) Binomialfordelingerne med antalsparameter n fast og sandsynlighedsparameter<br />

0 < θ < 1.<br />

b) Poissonfordelingerne med parameter λ > 0. Find i dette <strong>til</strong>fælde også skævhed<br />

og kurtosis af en poissonfordelt variabel.<br />

c) Normalfordelingerne med middelværdi µ og varians σ 2 med (µ, σ 2 ) ∈ R × R+.<br />

d) Gammafordelingerne med formparameter λ og invers skalaparameter β med<br />

(λ, β) ∈ R 2 + .<br />

Opgave 2.2<br />

Find det fulde parameterområde Λ for den <strong>eksponentielle</strong> familie med tætheder<br />

i <strong>til</strong>fældene<br />

Her er m Lebesguemålet på R.<br />

dP ξ<br />

dm (x) = a(ξ)b(x)eξx , x ∈ R,<br />

(i) b(x) = e −|x| og (ii) b(x) = e−|x|<br />

.<br />

1 + x2 Opgave 2.3<br />

Betragt en eksponentiel familie på formen (2.1) med t(x) ∈ R k . Vis, at hvis støtten for<br />

T er begrænset, og familien er ikke tom, så er det fulde parameterområde Λ lig med<br />

R k .<br />

Opgave 2.4<br />

Denne opgave er en hjælp <strong>til</strong> jer, når I skal vise affin uafhængighed næsten sikkert.<br />

Lad (X , A, µ) være et metrisk målrum, hvor målet µ giver strengt positivt mål <strong>til</strong><br />

enhver åben kugle. Lad desuden t1, . . . , t k være kontinuerte funktioner fra X ind i R.<br />

Vis, at hvis t1(·), . . . , t k(·) er affint uafhængige som funktioner på X , så er de også<br />

affint uafhængige næsten sikkert med hensyn <strong>til</strong> µ.<br />

Vink: Lad (α0, . . . , α k) = 0. Så findes x0 ∈ X , så at α0 + α1t1(x0) + · · · + α kt k(x0) = 0.<br />

Overvej, at<br />

{x ∈ X |α0 + α1t1(x) + · · · + α kt k(x) = 0}<br />

er en åben og ikke-tom mængde, og dermed har positivt µ-mål.


22 KAPITEL 2. EKSPONENTIELLE FAMILIER<br />

Opgave 2.5<br />

Denne opgave viser, at den minimal kanoniske observator kan være komplet, selv om<br />

det indre af det kanoniske paramterområde er tomt.<br />

Lad X og Y være uafhængige og Poissonfordelte med EX = θ −1 og EY = exp(−θ),<br />

hvor parameteren θ varierer i R+. Vis, at dette er en eksponentiel familie af orden 2<br />

med kanonisk observator t(x, y) = (x, y) og kanonisk parameter (− ln θ, −θ). Vis, ved<br />

direkte undersøgelser, at (X, Y) er komplet.<br />

Vink: Hvis E θ f(X, Y) = 0 for alle θ, vis da først at f(0, 0) = 0 ved at lade θ → ∞,<br />

dernæst f(k, 0) = 0 for alle k > 0, og endelig at f(k, l) = 0 for alle k > 0 og l > 0.<br />

Opgave 2.6<br />

Betragt en eksponentiel familie på minimal form<br />

dP θ<br />

dµ (x) = a(θ)b(x)eϕ(θ)·t(x) ,<br />

hvor ϕ : Θ → R k og Θ er et åbent område i R k . Vis at<br />

og<br />

E θt(X) = τ(ϕ(θ)) =<br />

V θt(X) =<br />

∂(− ln a(θ))<br />

∂θ<br />

∂ϕ ∗<br />

<br />

∂ϕ<br />

∂θ∗ −1 ∂Eθt(X)<br />

∂θ∗ .<br />

Opgave 2.7<br />

Lad (X1, Y1), (X2, Y2), . . . , (Xn, Yn) være n uafhængige observationer fra den todimensionale<br />

normalfordeling med middelværdivektor (0, 0) og variansmatrix<br />

<br />

1 ρ<br />

ρ 1<br />

∂θ<br />

−1<br />

hvor korrelationskoefficienten ρ har intervallet (−1, 1) som variationsområde.<br />

1) Vis at den således fastlagte familie af fordelinger for samplet (X1, Y1), . . . , (Xn, Yn)<br />

er eksponentiel, bestem ordenen af denne <strong>eksponentielle</strong> familie, og angiv en<br />

minimal kanonisk observator og en minimal kanonisk parameter. Er familien<br />

fuld?<br />

2) Ops<strong>til</strong> likelihoodligningen for ρ.<br />

Opgave 2.8<br />

Antag, at X−1 og X1 er uafhængige og Poissonfordelte med middelværdi<br />

λ i = 1 2 eα+iβ , i = −1 og 1.<br />

Lad P = {P (α,β) : (α, β) ∈ R 2 } betegne klassen af fordelinger for X = (X−1, X1).


2.8. OPGAVER 23<br />

1) Vis, at P er en regulær eksponentiel familie af orden 2.<br />

2) Angiv definitionsområdet D for maximum likelihood estimatoren (ˆα, ˆ β) og vis,<br />

at hvis x ∈ D, så er<br />

<br />

ˆα(x) = ln 2 <br />

X−1X1<br />

og<br />

ˆβ(x) = ln<br />

<br />

X1<br />

X−1<br />

3) Vis, at informationsfunktionen svarende <strong>til</strong> observationen (x−1, x1) er<br />

4) Lad<br />

j(α, β) =<br />

<br />

e α cosh(β) e α sinh(β)<br />

e α sinh(β) e α cosh(β)<br />

.<br />

<br />

.<br />

τ = e α cosh(β) (= E (α,β)(X−1 + X1)).<br />

Vis, at P kan parametriseres ved (τ, β) samt at variationsområdet for (τ, β) er<br />

(0, ∞) × (−∞, ∞).<br />

Opgave 2.9(Den logaritmiske fordeling)<br />

Definer sandsynlighedsmålet P θ, 0 < θ < 1, på X = {1, 2, . . .} ved<br />

dPθ θx<br />

(x) = (− log(1 − θ))−1<br />

d♯ x ,<br />

hvor ♯ er tællemålet. Opskriv familien på eksponentiel familieform. Angiv støtten for<br />

den kanoniske observator T, den konvekse støtte Ct, samt variationsområdet Λ0 for<br />

den kanoniske parameter og det fulde parameterområde Λ. Udregn desuden middelværdi<br />

og varians for den kanoniske observator.<br />

Opgave 2.10(Den negative binomialfordeling)<br />

Definer sandsynlighedsmålet Pθ, 0 < θ < 1, på X = {0, 1, 2, . . .} ved<br />

<br />

dPθ κ + x − 1<br />

(x) =<br />

θ<br />

d♯ x<br />

x (1 − θ) κ ,<br />

hvor ♯ er tællemålet og κ > 0 er en fast parameter. Opskriv familien på eksponentiel familieform.<br />

Angiv støtten for den kanoniske observator T, den konvekse støtte Ct, samt<br />

variationsområdet Λ0 for den kanoniske parameter og det fulde parameterområde Λ.<br />

Udregn desuden middelværdi og varians for den kanoniske observator.<br />

Opgave 2.11(Den inverse gauss fordeling)<br />

Definer sandsynlighedsmålet P (χ,ψ), (χ, ψ) ∈ R 2 + , på X = R+ ved<br />

dP (χ, ψ)<br />

(x) =<br />

dm<br />

√ χ exp( √ χψ)<br />

√ 2πx 3<br />

<br />

exp − χ<br />

2x<br />

<br />

ψx<br />

− ,<br />

2


24 KAPITEL 2. EKSPONENTIELLE FAMILIER<br />

hvor m er lebesguemålet. Opskriv familien på eksponentiel familieform. Angiv støtten<br />

for den kanoniske observator T, den konvekse støtte Ct, samt variationsområdet<br />

Λ0 for den kanoniske parameter og det fulde parameterområde Λ. Udregn desuden<br />

middelværdi og varians for den kanoniske observator.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!