Noter til eksponentielle familier. Første udgave. - Aarhus Universitet
Noter til eksponentielle familier. Første udgave. - Aarhus Universitet
Noter til eksponentielle familier. Første udgave. - Aarhus Universitet
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
E T F Ø R S T E K U R S U S<br />
I T E O R E T I S K S T A T I S T I K<br />
J E N S L E D E T J E N S E N
© Jens Ledet Jensen 2006<br />
Institut for Matematiske Fag<br />
Det Naturvidenskabelige Fakultet<br />
<strong>Aarhus</strong> <strong>Universitet</strong><br />
Januar 2006
Indhold<br />
1 Indledning 1<br />
2 Eksponentielle <strong>familier</strong> 5<br />
2.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5<br />
2.2 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6<br />
2.3 Minimal frems<strong>til</strong>ling og konveks støtte . . . . . . . . . . . . . . . . . . . . 7<br />
2.4 Laplace- og kumulanttransform . . . . . . . . . . . . . . . . . . . . . . . . 10<br />
2.5 Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14<br />
2.6 Marginale og betingede fordelinger . . . . . . . . . . . . . . . . . . . . . . 17<br />
2.7 Komplethed af den minimalkanoniske observator . . . . . . . . . . . . . 19<br />
2.8 Opgaver . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21<br />
3 Sufficiens 25<br />
3.1 Indledning og definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25<br />
3.2 Tilfældet med diskret udfaldsrum X . . . . . . . . . . . . . . . . . . . . . 26<br />
3.3 Det generelle <strong>til</strong>fælde . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27<br />
3.4 Minimal sufficiente observatorer . . . . . . . . . . . . . . . . . . . . . . . 29<br />
3.5 Sufficiensprincippet og B-sufficiens . . . . . . . . . . . . . . . . . . . . . . 36<br />
3.6 Opgaver . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36<br />
4 Ancillaritet og Basu’s sætning 43<br />
4.1 Definitioner og diskussion . . . . . . . . . . . . . . . . . . . . . . . . . . . 43<br />
4.2 Basu’s sætning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48<br />
4.3 Birnbaum’s sætning . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50<br />
4.4 Opgaver . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53<br />
5 Likelihoodbegreber 57<br />
5.1 Opgaver . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62<br />
6 Centrale estimatorer med minimal varians 67<br />
6.1 Centrale estimatorer med minimal varians . . . . . . . . . . . . . . . . . . 67<br />
6.2 Variansuligheder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71<br />
6.3 Pusterum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75<br />
6.4 Opgaver . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76<br />
i
ii INDHOLD<br />
7 Testteori 79<br />
7.1 Indledning og definitioner . . . . . . . . . . . . . . . . . . . . . . . . . . . 79<br />
7.2 Neyman-Pearson’s lemma og monotone kvotienter . . . . . . . . . . . . 81<br />
7.3 Sammensat nulhypotese – test for en delparameter . . . . . . . . . . . . . 89<br />
7.4 Lokalt stærkeste test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94<br />
7.5 Opgaver . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95<br />
8 Separat inferens 101<br />
8.1 L-sufficiens og L-ancillaritet . . . . . . . . . . . . . . . . . . . . . . . . . . 101<br />
8.2 S-sufficiens og S-ancillaritet . . . . . . . . . . . . . . . . . . . . . . . . . . 104<br />
8.3 G-sufficiens og G-ancillaritet . . . . . . . . . . . . . . . . . . . . . . . . . . 107<br />
8.4 Itemanalysemodellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112<br />
8.5 Afsluttende bemærkninger . . . . . . . . . . . . . . . . . . . . . . . . . . . 116<br />
8.6 Opgaver . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117<br />
9 Bayes statistik 121<br />
10 Referencer 129<br />
11 Notation og regneregler 135<br />
11.1 notation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135<br />
11.2 Transformationssætningen . . . . . . . . . . . . . . . . . . . . . . . . . . . 135<br />
11.3 Betinget middelværdi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136<br />
11.4 Betingede tætheder . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136<br />
11.5 Regnereler for tætheder og integraler . . . . . . . . . . . . . . . . . . . . . 138<br />
11.6 Entydighed af Laplacetransformen . . . . . . . . . . . . . . . . . . . . . . 139<br />
Indeks 141
Kapitel 1<br />
Indledning<br />
Med disse indledende bemærkninger vil jeg forsøge at ryste jeres statistiske grundvold,<br />
og vise at statistik (d.v.s. her teoretisk statistik) er mere end matematik. Jeg vil<br />
nævne nogle af de forskellige indgange <strong>til</strong> statistik for at afgrænse, hvad vi skal beskæftige<br />
os med i disse noter. Jeg vil her i indledningen foretage diskussionen ud fra<br />
et eksempel.<br />
En ukendt parameter θ kan antage værdier i {0, 1, 2, . . . }. En værdi k af θ vælges<br />
(måske af naturen, måske af en person), og 6 brikker placeres i en pose. Af de 6 brikker<br />
er 2 mærket med værdien k og de 4 andre med værdierne 4k + 1, . . . , 4k + 4. Eksperimentet<br />
består nu i at vælge én af brikkerne <strong>til</strong>fældigt og observere værdien S på denne,<br />
Fordelingen af S beskrives med følgende tabel, hvori for hver række er angivet 6 gange<br />
sandsynligheden for de mulige udfald:<br />
S<br />
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24<br />
0 2 1 1 1 1<br />
1 2 1 1 1 1<br />
θ 2 2 1 1 1 1<br />
3 2 1 1 1 1<br />
4 2 1 1 1 1<br />
5 2 1 1 1 1<br />
Vores opgave er ud fra observationen s at sige noget om den ukendte parameter θ. Når<br />
s er observeret, ved vi, at θ enten er s eller for s > 0, er der også muligheden [(s − 1)/4],<br />
hvor [·] er heltalsdelen af et tal. Fra observationen s kan vi altså gætte på<br />
ˆθ = s eller ˜θ =<br />
0 hvis s = 0<br />
[(s − 1)/4] hvis s > 0,<br />
hvor ˆ θ faktisk er maksimum likelihood estimatet.<br />
Normalt vil vi vælge ˆθ som skøn over θ, idet Pˆθ (s) = 2 6 > P˜ θ (s) = 1 6 for s > 0, altså<br />
den observerede værdi s har større sandsynlighed under målet Pˆθ end under målet P˜ θ .<br />
Men hvis vi spørger om sandsynligheden for at gætte den rigtige værdi af θ, har vi<br />
Død og pine, hvad gør vi nu?<br />
P θ( ˆθ = θ) = 2 6 < P θ( ˜θ = θ) = 4 6 .<br />
1
2 KAPITEL 1. INDLEDNING<br />
Indenfor den såkaldte Bayes-statistik optræder der ingen problemer (=problemet er<br />
flyttet et andet sted hen - en særdeles velkendt problemløsningmetode). Hvis man er<br />
“bayesianer”, formuleres alt ved hjælp af sandsynligheder. I stedet for at sige at θ er<br />
ukendt, siger man, at θ er en stokastisk variabel med en prior tæthed pk = P(θ = k), og<br />
at vores viden om θ, efter at eksperimentet er udført, udtrykkes gennem den betingede<br />
tæthed<br />
⎧<br />
1 k = s = 0<br />
⎪⎨ 1<br />
3 (<br />
P(θ = k|S = s) =<br />
⎪⎩<br />
1 3 ps + 1 6 p [(s−1)/4]) −1 pk k = s, s > 0<br />
1<br />
6 ( 1 3 ps + 1 6 p [(s−1)/4]) −1 pk k = [(s − 1)/4], s > 0<br />
0 ellers<br />
Eventuelt kan vi lave et estimat ˆθB, som er den værdi af θ, som har størst sandsynlighed<br />
givet S = s.<br />
For at gennemføre dette program skal vi altså vælge en prior tæthed p k. Hvis vi<br />
tager p k = 1/2 k+1 , vil ˆ θB = ˜ θ for alle s. Det kan vises, at for en vilkårlig tæthed med<br />
p k > 0 for alle k vil ˆθB = ˜θ for uendelig mange værdier af s . Hvis p k = 0 for k ≥ 5 og<br />
p k = 1/4 for k < 5, vil<br />
ˆθB = ˆθ for s < 5 og ˆθB = ˜θ for 5 ≤ s ≤ 20.<br />
Dette sidste eksempel dækker over det generelle udsagn, at jo mere uniform vi gør den<br />
prior tæthed, desto oftere vil ˆθB = ˆθ.<br />
Det er klart, at det oprindelige problem er blevet ført over i, hvordan vi skal vælge<br />
prior tætheden. Hvis vi ikke har nogen viden, der kan hjælpe os i dette, må vi altså<br />
foretage et subjektivt valg, og af denne grund bryder mange statistikere sig ikke om<br />
Bayes-statistik. Ud fra en pragmatisk synsvinkel kan det dog i visse situationer være<br />
praktisk at tænke i termer af Bayes-statistik. F.eks. i store ekspertsystemer, hvor et af<br />
problemerne er jævnligt at opdatere den akkumulerede viden om de mange parametre,<br />
kan det være praktisk at bruge Bayes-statistik. Jeg omtaler kort Bayes-statistik i kapitel<br />
9.<br />
En anden <strong>til</strong>gang <strong>til</strong> statistik er decisionsteori. Her fores<strong>til</strong>ler man sig, at der <strong>til</strong> hver<br />
observation x skal foretages en beslutning d = d(x), og for enhver beslutning d og<br />
enhver parameter θ er der givet en pris, eller et tab, w(θ, d) ≥ 0. Det forventede tab<br />
kaldes risikofunktionen (engelsk: risk function)<br />
r(θ, d) = E θw(θ, d(X)).<br />
I vort eksempel kan beslutningen være, at vi peger på enten ˆθ eller ˜θ som den sande<br />
værdi af θ. Lad os f.eks. sige at tabet er givet ved<br />
⎧<br />
⎪⎨ 0 hvis θ1 = θ<br />
w(θ, θ1) = α<br />
⎪⎩<br />
β<br />
<br />
12 α +<br />
r(θ, ˆθ) =<br />
hvis |θ1 − θ| ≤ 3<br />
hvis |θ1 − θ| > 3,<br />
1 6 β hvis θ = 0<br />
4<br />
6 β hvis θ > 0<br />
⎧<br />
⎪⎨<br />
0<br />
og r(θ, ˜θ) = 2<br />
6α ⎪⎩<br />
β<br />
hvis θ = 0<br />
hvis 1 ≤ θ ≤ 3<br />
hvis θ > 3.<br />
2<br />
6
Hvis θ > 3 vil ˜θ have en mindre risiko end ˆθ, men for 1 ≤ θ ≤ 3 vil ˆθ have en<br />
mindre risiko end ˜θ, hvis blot β < α/2.<br />
Decisionsteori giver anledning <strong>til</strong> mange nye definitioner. En beslutningsregel d<br />
kaldes inadmissible, hvis der findes en anden regel d1, så at r(θ, d) ≥ r(θ, d1) for alle θ og<br />
med skarp ulighed for mindst én værdi af θ. Hvis en regel ikke er inadmissible, kaldes<br />
den admissible, og disse er klart at foretrække. En minimax regel d er en admissible<br />
beslutningsregel, som opfylder<br />
sup<br />
θ<br />
r(θ, d1) ≥ sup r(θ, d)<br />
θ<br />
for enhver anden admissible regel d1. En minimax regel er et fornuftigt valg, hvis man<br />
er to personer, der spiller mod hinanden, og at man må forvente, at modspilleren er<br />
så ond som mulig. Ligesom at jeg ikke vil komme ind på Bayes-statistik, vil jeg ikke<br />
beskæftige mig med decisionsteori i disse noter.<br />
Hvad er så emnet for disse noter? Løst sagt skal vi så præcist som muligt opsummere<br />
den viden, som vi har fået om den ukendte parameter fra den foretagne observation<br />
og fra vores viden om den sandsynlighedsmekanisme, som ligger bagved. Dette<br />
betyder bl.a., at vi ikke skal bruge de hypotetiske gentagelser af forsøget <strong>til</strong> at konstruere<br />
et spil mod en usynlig modpart og dernæst minimere tabet, men derimod bruge<br />
gentagelserne <strong>til</strong> at belyse den faktiske observation i forhold <strong>til</strong> de andre mulige observationer.<br />
Heri ligger også, at de potentielle gentagelser skal være relevante, som for<br />
eksempel at de skal foretages med det samme måleudstyr (disse problemer tages op i<br />
kapitel 4 og kapitel 8). Den type problems<strong>til</strong>linger, som vi ønsker at anvende teorien<br />
på, kan være spørgsmål som: Hvad er lysets hastighed? Hvor en stor procentdel af den<br />
danske befolkning går ind for en kombineret vej- og jernbanebro <strong>til</strong> Sverige?; Hvad er<br />
sandsynligheden for at blive rask med en given behandling?; etc., etc.<br />
I ovenstående eksempel, hvis vi f.eks. har observeret s = 2, kan vi sige, at de mulige<br />
værdier af θ er θ = 0 og θ = 2, og at sandsynlighederne for s = 2 er 1 6 og 2 6 under de to<br />
muligheder. Meget mere kan vi ikke sige. Normalt vil vi gerne angive et estimat og en<br />
relevant varians på estimatet eller et relevant konfidensområde, men her hvor der kun<br />
er to muligheder, kan vi kun give en rangordning. Da vi nu ved, at θ = 0 eller θ = 2 er<br />
ˆθ og ˜θ ikke relevante i hypotestiske gentagelser. For en ny observation s ∈ {0, 1, 3, 4}<br />
ved gentagelse, kan vi slutte at θ = 0, og for s ∈ {9, 10, 11, 12} kan vi slutte at θ = 2.<br />
Det er kun for s = 2, at vi ikke kan slutte hvad θ er. Hvis vi definerer<br />
<br />
<br />
ˆθ2(s)<br />
0 s ∈ {0, 1, 3, 4}<br />
=<br />
og ˇ<br />
0 s ∈ {0, 1, 2, 3, 4}<br />
θ2(s) =<br />
2 s ∈ {2, 9, 10, 11, 12}<br />
2 s ∈ {9, 10, 11, 12}<br />
har vi at<br />
og<br />
P0( ˆθ2 = 0) = 5 6 , P2( ˆθ2 = 2) = 1,<br />
P0( ˇθ2 = 0) = 1, P2( ˇθ2 = 2) = 4 6 ,<br />
og anskuet på denne vis vil vi sige, at maksimum likelihood estimatet ˆθ2 er det bedste<br />
estimat.<br />
Lad mig slutte denne indledning med en ultrakort gennemgang af de forskellige<br />
kapitler:<br />
3
4 KAPITEL 1. INDLEDNING<br />
Kapitel 2: Her opsumerer jeg de vigtigste begreber og resultater for ekponentielle <strong>familier</strong>.<br />
Eksponentielle <strong>familier</strong> er vigtige på grund af deres pæne matematiske egenskaber,<br />
på grund af deres udbredelse, og fordi der er en simpel sammenhæng mellem<br />
tætheden og de såkaldte sufficiente observatorer. Faktisk kan man vende bøtten rundt,<br />
og starte med at sige, hvad der skal være sufficiente observatorer, og man vil så hurtigt<br />
blive ledt frem <strong>til</strong> de <strong>eksponentielle</strong>r <strong>familier</strong>. De <strong>eksponentielle</strong>r <strong>familier</strong> vil optræde<br />
gennem hele notesættet.<br />
Kapitel 3: Her gives en udførlig matematisk teori for sufficiente observationer, d.v.s.<br />
funktioner af data som “indeholder al information” om den ukendte parameter.<br />
Kapitel 4: Handler on hvordan vi definerer relevante gentagelser ved at betinge med<br />
værdien af en såkaldt ancillær observator. Sammenhængen mellem dette og de sufficiente<br />
observatorer diskuteres.<br />
Kapitel 5: Nævner de vigtigste begreber omkring likelihoodfunktionen og den afledede.<br />
Resultater baseret på at antallet af observationer går mod uendelig bliver kort<br />
omtalt. Dette kapitel kan godt læses før de andre.<br />
Kapitel 6: Giver en teori for hvordan vi på fornuftig vis kan vælge estimatorer, d.v.s. at<br />
vi forsøger at minimere variansen uniformt i parameteren. For at dette får mening, må<br />
vi nøjes med at betragte de såkaldte unbiased estimatorer.<br />
Kapitel 7: Heri beskrives hvordan man konstruerer test med visse optimale egenskaber.<br />
Kapitel 8: Dette kapitel hænger sammen med kapitel 4, idet det undersøges, hvad der<br />
er relevante gentagelser, når vi ønsker at udtale os om en delparameter.<br />
Lad mig <strong>til</strong> sidst påpege at udgangspunktet er, at vi har valgt en model <strong>til</strong> beskrivelse<br />
af det udførte forsøg, og ønsker nu at optimere vores konklusioner idenfor modellen.<br />
Det vil bl.a. sige, at vi ikke kommer ind på kontrol af modellen. En anden vigtig<br />
ting vi ikke kommer ind på, er robusthed af vores procedurer overfor antagelser i modellen,<br />
d.v.s. spørgsmål som, om en optimal procedure under modellen vil være langt<br />
fra optimal, hvis modellen ændres ganske lidt.<br />
En henvisning <strong>til</strong> Jørgen Hoffman-Jørgensens bøger angives med “JHJ”.
Kapitel 2<br />
Eksponentielle <strong>familier</strong><br />
2.1 Motivation<br />
Eksponentielle <strong>familier</strong> er klasser af sandsynlighedsmål med “særligt pæne egenskaber".<br />
Det smarte er, at når først vi har vist (og det er ikke svært), at noget er en eksponentiel<br />
familie, så ved vi, at en hel masse resultater er opfyldt. Lad os som et eksempel<br />
betragte n uafhængige variable X1, . . . , Xn som er normalfordelte med middelværdi µ<br />
og varians σ 2 . Hvis f(·) er en funktion fra R ind i R med den egenskab, at<br />
E µ,σ 2 f( ¯X) = 0 for alle µ ∈ R,<br />
så kan vi slutte, at f er identisk lig med nul pånær på en nulmængde. Denne egenskab<br />
kan måske nok synes lidt teknisk, men den kan hjælpe os <strong>til</strong> at vise andre egenskaber.<br />
Det sædvanlige estimat for σ 2 er s 2 = ∑i(X i − ¯X) 2 /(n − 1). Dette estimat har den rigtige<br />
middelværdi: Es 2 = σ 2 , og vi siger, at s 2 er middelværdiret. Man kan nu vise, at s 2<br />
er det estimat, der har mindst mulig varians, blandt alle estimater der er middelværdirette.<br />
For <strong>eksponentielle</strong> <strong>familier</strong> kan vi vise at for visse hypoteser er der særligt attraktive<br />
tests. I eksemplet ovenfor kan vi betragte et test for hypotesen µ = 0 mod alternativet<br />
µ > 0. Det sædvanlige t-test forkaster hypotesen hvis t = ¯X/ √ s 2 /n er stor, og vi kan<br />
vise at dette i en vis forstand er det bedste vi kan gøre.<br />
De ovenstående eksempler viser, at der er god grund <strong>til</strong> at beskæftige sig med <strong>eksponentielle</strong><br />
<strong>familier</strong>. Et andet argument er, at nogle af de vigtigste klasser af fordelinger<br />
faktisk er <strong>eksponentielle</strong> <strong>familier</strong>: Binomialfordelingerne, Poissonfordelingerne,<br />
normalfordelingerne og Gammafordelingerne. Ydermere er disse fordelinger byggestene<br />
for det der hedder Generaliserede Lineære Modeller som er et vigtigt redskab i<br />
en statistikers værktøjskasse.<br />
Definitionen på en eksponentiel familie vedrører hvordan data og parameter spiller<br />
sammen. Lad som et eksempel Pλ være poissonfordelingen med parameter λ og lad µ<br />
være tællemålet. Så kan vi skrive tætheden som<br />
dPλ λx<br />
(x) =<br />
dµ x! e−λ = e −λ · 1<br />
x!<br />
· exp{log(λ)x}.<br />
Hvad jeg har fremhævet her, er at tætheden kan skrives som en funktion af parameteren,<br />
ganget med en funktion af data, ganget med en eksponentialfunktion, hvor<br />
5
6 KAPITEL 2. EKSPONENTIELLE FAMILIER<br />
argumentet er en funktion af parameteren ganget med en funktion af data. Det er denne<br />
struktur der nedenfor vil blive brugt i den generelle definition. Bemærk at den første<br />
funktion af parameteren, lad os kalde den a(λ), er en normeringskonstant: eftersom vi<br />
betragter en tæthed, vil denne integrere <strong>til</strong> 1, og dermed har vi<br />
a(λ) ∑ x<br />
2.2 Definition<br />
<br />
1<br />
exp{log(λ)x} = 1 ⇒ a(λ) =<br />
x! ∑<br />
x<br />
1<br />
x! exp{log(λ)x}<br />
−1 .<br />
Jeg vil betragte en klasse P = {Pθ|θ ∈ Θ} af sandsynlighedsmål på målrummet<br />
(X , A, µ), hvor µ er et σ-endeligt mål. Familien P er parametriseret ved θ ∈ Θ, hvor<br />
Θ ⊆ Rp , d.v.s at hvis θ1 = θ2 så vil Pθ1 = Pθ2 . Antag, at µ dominerer alle målene i<br />
P, Pθ ≪ µ ∀θ ∈ Θ, og at der eksisterer en funktion φ = (φ1, . . . , φk) : Θ → Rk , en<br />
målelig funktion t = (t1, . . . , tk) : X → Rk , og en målelig funktion b : X → R således<br />
at<br />
dPθ<br />
dµ (x) = a(θ)b(x)eφ(θ)·t(x) , ∀θ ∈ Θ. (2.1)<br />
Hvis (2.1) er opfyldt, kaldes P en eksponentiel familie med kanonisk observator T = t(X)<br />
og kanonisk parameter φ(θ). Bemærk, at i (2.1) er a(·) bestemt ved<br />
<br />
a(θ) = b(x)e φ(θ)·t(x) −1 µ(dx)<br />
og er derfor kun en funktion af θ gennem φ(θ). Det mindste k for hvilket en repræsentation<br />
på formen (2.1) er mulig kaldes ordenen af familien. Hvis repræsentationen er<br />
minimal, d.v.s. at k er ordenen af familien, kaldes T en minimal kanonisk observator og<br />
ϕ en minimal kanonisk parameter.<br />
Eksempel 2.1.<br />
Jeg opskriver her nogle af de fordelinger I kender i forvejen på eksponentiel familieform.<br />
Binomialfordelingen. Lad X være binomialfordelt med antalsparamter n og sandsynlighedsparameter<br />
θ med 0 < θ < 1. Så er tætheden med hensyn <strong>til</strong> tællemålet µ<br />
givet ved<br />
dPθ (x) =<br />
dµ<br />
for x ∈ {0, . . . , n}.<br />
n<br />
x<br />
<br />
θ x (1 − θ) n−x = (1 − θ) n<br />
n<br />
x<br />
<br />
<br />
θ<br />
exp log x ,<br />
1 − θ<br />
Normalfordelingen. Lad X være normalfordelt med middelværdi µ og varians σ 2<br />
med (µ, σ 2 ) ∈ R × R+. Så er tætheden med hensyn <strong>til</strong> lebesguemålet m givet ved<br />
dP (µ,σ 2 )<br />
dm<br />
(x) = exp{− 1<br />
2σ 2(x − µ) 2 }<br />
√ 2πσ 2<br />
= exp{− µ2<br />
2σ 2 }<br />
√ 2πσ 2<br />
<br />
µ<br />
exp<br />
σ<br />
2σ<br />
1<br />
x − x2<br />
2 2<br />
for x ∈ R. Bemærk at i dette eksempel er b(x) = 1. <br />
<br />
,
2.3. MINIMAL FREMSTILLING OG KONVEKS STØTTE 7<br />
2.3 Minimal frems<strong>til</strong>ling og konveks støtte<br />
Jeg skal i dette afsnit angive en metode <strong>til</strong> at afgøre, om en frems<strong>til</strong>ling er minimal, og<br />
skal i denne forbindelse udtrykke mig “næsten sikkert” mht. et mål. Jeg starter derfor<br />
med følgende observation.<br />
Observation 2.2 Lad ν være målet på X givet ved<br />
dν<br />
(x) = b(x), (2.2)<br />
dµ<br />
hvor b(x) er fra (2.1). Der gælder at alle målene i P er indbyrdes ækvivalente, og at de<br />
er ækvivalente med ν , d.v.s. at alle disse mål har de samme nulmængder. <br />
Bevis. Da<br />
<br />
Pθ(A) =<br />
a(θ)e<br />
A<br />
φ(θ)·t(x) <br />
b(x)µ(dx) =<br />
A<br />
a(θ)e φ(θ)·t(x) ν(dx),<br />
har vi, at<br />
dPθ dν (x) = a(θ)eφ(θ)·t(x) . (2.3)<br />
Vi har derfor, at hvis N er en nulmængde for ν er N også en nulmængde for Pθ for alle<br />
θ ∈ Θ. Da (2.3) er strengt positiv, gælder der at ν(B) > 0 ⇒ Pθ(B) > 0. Hvis derfor N<br />
er en nulmængde for Pθ, følger det, at ν(N) = 0. <br />
Jeg vil skrive “næsten sikkert mht. P” som n.s.−P, og på grund af Observation 2.2<br />
skrive n.s.−P hvormed menes, at den angivne relation er korrekt på nær en af de fælles<br />
nulmængder for P θ og ν. Bemærk at Observation 2.2 viser, at hvis målene i en familie<br />
P ikke har samme støtte, så kan P ikke være en eksponentiel familie. Et eksempel på<br />
dette er familien af uniforme fordelinger på intervallet [0, θ], θ > 0.<br />
Lemma 2.3 Frems<strong>til</strong>lingen (2.1) er minimal hvis og kun hvis (i) og (ii) nedenfor er opfyldt:<br />
(i) funktionerne 1,φ1, . . . , φ k på Θ er lineært uafhængige, d.v.s.<br />
c0 + c1φ1(θ) + · · · + c kφ k(θ) = 0 ∀θ ∈ Θ ⇒ c0 = c1 = · · · = c k = 0, (2.4)<br />
(ii) funktionerne 1,t1, . . . , t k på X er lineært uafhængige næsten sikker mht. P, d.v.s<br />
c0 + c1t1(x) + · · · + c kt k(x) = 0 n.s. − P ⇒ c0 = c1 = · · · = c k = 0. (2.5)<br />
Bevis. Jeg viser først, at hvis (i) eller (ii) ikke er opfyldt, så er repræsentationen ikke<br />
minimal. Antag at (i) ikke er opfyldt. Der eksisterer altså en vektor c = 0, så at c0 + c ·<br />
φ(θ) = 0 ∀θ ∈ θ. Lad os sige at ck = 0, så har vi, at φk(θ) = −1<br />
c<br />
{c0 + c1φ1(θ) + · · · +<br />
k<br />
ck−1φk−1(θ)}, og vi kan skrive (2.1) som<br />
dP θ<br />
dµ (x) = a(θ)b(x)e−c0 t k(x)/c k exp<br />
<br />
k−1<br />
∑<br />
1<br />
φ i(θ)[t i(x) − c it k(x)/c k]<br />
<br />
.
8 KAPITEL 2. EKSPONENTIELLE FAMILIER<br />
D.v.s. at vi har konstrueret en repræsentation af dimension k−1, og (2.1) er derfor ikke<br />
minimal. På helt <strong>til</strong>svarende måde vises, at hvis (ii) ikke er opfyldt, så er (2.1) ikke<br />
minimal.<br />
Vi antager nu, at (i) og (ii) er opfyldt, og skal vise at frems<strong>til</strong>lingen (2.1) er minimal.<br />
Vi bemærker først, at hvis θ0 ∈ Θ, så har vi fra (2.1) og Observation 2.2, at (se JHJ 3.19)<br />
dPθ dPθ0 = a(θ)<br />
a(θ0) exp[{φ(θ) − φ(θ0)} · t(x)]. (2.6)<br />
Vi betragter nu endvidere en minimal repræsentation af dimension m , med kanonisk<br />
parameter β(θ) og kanonisk observator u(x) . Vi har altså<br />
dPθ dPθ0 = ã(θ)<br />
ã(θ0) exp[{β(θ) − β(θ0)} · u(x)], (2.7)<br />
og skal vise at k = m. Fra (i) har vi, at vi kan vælge θ1, . . . , θk, så at k × k matricen<br />
⎛<br />
⎞∗<br />
φ(θ1) − φ(θ0)<br />
⎜<br />
⎟<br />
A = ⎝ . ⎠<br />
φ(θk) − φ(θ0)<br />
har fuld rang. Da (2.6) og (2.7) er tæthed for det samme mål, er de identiske n.s.−P, og<br />
vi har for i = 1, . . . , k,<br />
{φ(θ i) − φ(θ0)} · {t(x) − t(x0)} = {β(θ i) − β(θ0)} · {u(x) − u(x0)} n.s. − P.<br />
Skrevet på matriks form gælder der, at<br />
hvor B er m × k matricen<br />
{t(x) − t(x0)}A = {u(x) − u(x0)}B n.s. − P, (2.8)<br />
B =<br />
⎛<br />
⎜<br />
⎝<br />
β(θ1) − β(θ0)<br />
.<br />
β(θ k) − β(θ0)<br />
Da (2.7) er antaget minimal, har vi at m ≤ k. Antag nu at m < k, så eksisterer der<br />
d ∈ R k , d = 0, så at Bd ∗ = 0. Da A har fuld rang, er c ∗ = Ad ∗ = 0, og (2.8) giver<br />
⎞<br />
⎟<br />
⎠<br />
{t(x) − t(x0)}c ∗ = {u(x) − u(x0)}Bd ∗ = 0 n.s. − P,<br />
hvilket er i modstrid med (ii). Altså er m = k, og (2.1) er en minimal frems<strong>til</strong>ling. <br />
Betingelsen (2.4) er ækvivalent med at mængden<br />
Λ0 = {ϕ(θ)|θ ∈ Θ}<br />
ikke <strong>til</strong>hører et affint underrum af R k .<br />
Jeg vil nu diskutere betingelsen (2.5). Støtten for en stokastisk variabel T, der lever<br />
i et metrisk rum, defineres som<br />
{t|P(kugle med centrum t og radius ǫ) > 0, ∀ǫ > 0}.<br />
∗
2.3. MINIMAL FREMSTILLING OG KONVEKS STØTTE 9<br />
Specielt hvis T kun kan antage endelig mange værdier, så er støtten de punkter, hvor<br />
der er positiv sandsynlighed. Hvis T ∈ R k siger vi, at koordinaterne i T er affint uafhængige<br />
n.s. hvis støtten for T ikke er indeholdt i et affint underrum af R k . Dette er<br />
ækvivalent med at sige, at der ikke findes c ∈ R k , c = 0, så at c · T er lig med en konstant<br />
n.s. Men dette er netop betingelsen (2.5). Betingelsen er også ækvivalent med at sige,<br />
at variansen af T, Var(T), er positiv definit. Lad os lige eftervise det sidste udsagn:<br />
cVar(T)c ∗ = 0 ⇐⇒ Var(c · T) = 0<br />
⇐⇒ c · T = konstant n.s. ⇔ c = 0,<br />
hvor den sidste ækvivalens er betingelsen (2.5). Bemærk, at for en eksponentiel familie<br />
P giver Observation 2.2 at støtten for T er den samme uanset hvilket sandsynlighedsmål<br />
Pθ ∈ P vi betragter. Tilsvarende, hvis variansen for T er positiv definit under<br />
P θ1 ∈ P så er variansen positiv definit under alle P θ ∈ P.<br />
Den lukkede konvekse støtte Ct for den <strong>eksponentielle</strong> familie P defineres som den<br />
mindste lukkede konvekse mængde K ⊂ R k med P θ(t(X) ∈ K) = 1 for alle θ ∈ Θ,<br />
eller ækvivalent hermed {x|t(x) /∈ K} er en P-nulmængde. I symboler kan vi skrive<br />
Ct = <br />
K∈K<br />
K, (2.9)<br />
hvor K er mængden af lukkede og konvekse mængder K med ν({x|t(x) /∈ K}) = 0.<br />
Det indre af Ct betegnes intCt. Hvis støtten for T er indeholdt i et affint underrum af R k ,<br />
vil vi i definitionen af Ct tage snit over mængder, der er indeholdt i et affint underrum,<br />
og vi vil derfor have at intCt = ∅. Med andre ord vil intCt = ∅ medføre, at støtten<br />
for T ikke er indeholdt i et affint underrum af R k , og dermed at betingelsen (2.5) er<br />
opfyldt. Omvendt, hvis støtten for T ikke er indeholdt i et affint underrum af R k kan<br />
vi finde k støttepunkter der udspænder R k og dermed vil intCt = ∅.<br />
Vi kan samle vores diskussion ovenfor i:<br />
Observation 2.4 Følgende betingelser er ækvivalente:<br />
• Betingelsen (2.5);<br />
• Støtten for T er ikke indeholdt i et affint underrum af R k ;<br />
• intCt = ∅;<br />
• Variansen Var(T) er positiv definit. <br />
Eksempel 2.5 (Binomialfordelingen).<br />
Lad X være binomialfordelt med antalsparamter n og sandsynlighedsparameter θ med<br />
0 < θ < 1. Så er tætheden med hensyn <strong>til</strong> tællemålet µ givet ved<br />
<br />
dPθ n<br />
(x) = (1 − θ)n<br />
dµ x<br />
<br />
θ<br />
exp log x .<br />
1 − θ
10 KAPITEL 2. EKSPONENTIELLE FAMILIER<br />
Dette er en eksponentiel familie med t(x) = x og ϕ(θ) = log(θ/(1 − θ)). Repræsentationen<br />
er af dimension 1, og vi vil nu vise at den er minimal. Støtten for T er<br />
{0, 1, . . . , n} og denne <strong>til</strong>hører ikke et affint underrum af R, det vil sige at (2.5) er op-<br />
fyldt. Hvis<br />
<br />
θ<br />
c0 + c1 log = 0 ∀0 < θ < 1,<br />
1 − θ<br />
kan vi tage θ = 1/2 hvoraf følger at c0 = 0, og dernæst kan vi tage θ = 1/4 hvoraf<br />
følger at c1 = 0. Det vil sige at (2.4) er opfyldt, og vi har vist at repræsentationen er<br />
minimal. Dette eksempel er meget simpelt: hvis vi har en eksponentiel familie med en<br />
repræsentation af dimension 1, vil repræsentationen altid være minimal så længe at<br />
der er mindst to sandsynlighedsmål i familien (hvis ordenen af familien er nul vil der<br />
kun være et sandsynlighedsmål i familien). <br />
2.4 Laplace- og kumulanttransform<br />
Laplacetransformen for T = t(X) under målet ν er<br />
<br />
<br />
c(ξ) = exp(ξ · t(x))ν(dx) =<br />
Rk exp(ξ · t)νT(dt) (2.10)<br />
X<br />
for ξ ∈ R k . Domænet for c(·) er Λ = {ξ ∈ R k |c(ξ) < ∞}. Lad os definere et sandsynlighedsmål<br />
˜P ξ på X , for ξ ∈ Λ, ved<br />
d ˜P ξ<br />
dν (x) = c(ξ)−1 exp(ξ · t(x)). (2.11)<br />
Så svarer P θ i (2.1) <strong>til</strong> ˜P φ(θ) her og a(θ) = c(φ(θ)) −1 . Klassen P er givet ved<br />
P = { ˜P ξ|ξ ∈ Λ0}, Λ0 = {φ(θ)|θ ∈ Θ}.<br />
Vi har altid at Λ0 ⊆ Λ. Hvis Λ0 = Λ kaldes familien P fuld, og hvis P er fuld og Λ er<br />
åben, kaldes familien regulær. Laplacetranformen for t(X) under ˜P ξ0 er<br />
<br />
X<br />
<br />
exp(ξ · t(x)) ˜P ξ0 (dx) =<br />
X<br />
exp((ξ + ξ0) · t(x))<br />
ν(dx) =<br />
c(ξ0)<br />
Kumulanttransformen for t(X) under målet ν er defineret som<br />
κ(ξ) = ln c(ξ).<br />
Fra (2.12) har vi at kumulanttransformen af t(X) under ˜P ξ0 er<br />
κ ξ0 (ξ) = κ(ξ + ξ0) − κ(ξ0).<br />
c(ξ + ξ0)<br />
. (2.12)<br />
c(ξ0)<br />
Hvis κP er kumulanttransformen for t(X) under et sandsynlighedsmål P, kaldes de<br />
afledede af κP taget i nul for t(X)’s kumulanter. Bemærk at for kumulanttransformen af<br />
t(X) under ˜P ξ0 har vi<br />
∂kκξ0 ∂<br />
(0) =<br />
kκ (ξ0)<br />
∂ξ i1 · · · ∂ξ ik<br />
∂ξ i1 · · · ∂ξ ik
2.4. LAPLACE- OG KUMULANTTRANSFORM 11<br />
Den første og anden kumulant er henholdsvis middelværdi og varians af t(X) under<br />
P, se (2.17) og (2.18) nedenfor. For en en-dimensional variable t(X) kaldes<br />
for henholdsvis skævheden og kurtosis.<br />
κ (3)<br />
P (0)<br />
(κ ′′ ,<br />
P<br />
(0))3/2<br />
κ (4)<br />
P (0)<br />
(κ ′′<br />
P<br />
(0))2 ,<br />
Fremover vil jeg skrive P ξ for ˜P ξ, selvom dette kan give forvirring i forhold <strong>til</strong> det<br />
tidligere P θ. Vi lader E ξ betegne middelværdi mht. sandsynlighedsmålet P ξ. Desuden<br />
vil Λ blive omtalt som det fulde parameterområde for den <strong>eksponentielle</strong> familie.<br />
Sætning 2.6. Antag at t(·) opfylder (2.5). Det fulde parameterområde Λ = {ξ|c(ξ) <<br />
∞} er konvekst, og κ er strengt konveks på Λ, d.v.s. at κ(αξ1 + (1 − α)ξ2) < ακ(ξ1) +<br />
(1 − α)κ(ξ2) for alle ξ1, ξ2 ∈ Λ, ξ1 = ξ2, og alle 0 < α < 1. <br />
Bevis. Lad ξ1, ξ2 ∈ Λ. Hölders ulighed (JHJ 3.11) giver<br />
<br />
e (αξ <br />
1+(1−α)ξ2)·t(x)<br />
ν(dx) = {e ξ1·t(x) α ξ2·t(x) 1−α } {e } ν(dx)<br />
<br />
e ξ α <br />
1·t(x)<br />
ν(dx)<br />
≤<br />
e ξ2·t(x) ν(dx)<br />
1−α<br />
= c(ξ1) α c(ξ2) 1−α < ∞, (2.13)<br />
så at αξ1 + (1 − α)ξ2 ∈ Λ, d.v.s. Λ er konvekst. Tager vi logaritmen i ovenstående<br />
ulighed, fås at κ(ξ) er en konveks funktion. Der gæder lighedstegn i Hölders ulighed,<br />
hvis og kun hvis<br />
e ξ 1·t(x) = Ke ξ2·t(x) n.s. − ν,<br />
for en konstant K, og dette er ensbetydende med at ξ1 = ξ2 ifølge (2.5). <br />
Sætning 2.7. Lad ξ ∈ Λ og antag at ξ ± h ∈ Λ. Så gælder<br />
E ξ|h · t(X)| n < ∞ ∀ n ∈ N.<br />
Specielt gælder, at hvis ξ ∈ intΛ, så eksisterer alle momenter af t(X) under P ξ. <br />
Bevis. Da |y| n /n! ≤ e y + e −y for alle y ∈ R, har vi<br />
<br />
|h · t(x)| n e ξ·t(x) <br />
ν(dx) ≤ n!<br />
e (ξ+h)·t(x) <br />
ν(dx) +<br />
e (ξ−h)·t(x) <br />
ν(dx) < ∞.<br />
Hvis ξ ∈ intΛ, vil ξ ± h ∈ Λ for alle små h. Derfor har vi, at E ξ|t j(X)| n < ∞ for alle<br />
j = 1, . . . , k og alle n. Hölders ulighed giver så, at<br />
E ξ|t1(X) n 1 · · · tk(X) n k| < ∞ for alle n1, . . . , n k. (2.14)
12 KAPITEL 2. EKSPONENTIELLE FAMILIER<br />
Sætning 2.8. Hvis ξ ∈ intΛ gælder der at<br />
∂ n c(ξ1, . . . , ξ k)<br />
∂ξ a 1<br />
1 . . . ∂ξa k<br />
k<br />
= c(ξ)E ξ {t1(X) a 1 · · · tk(X) a k}, (2.15)<br />
hvor a1 + · · · + a k = n. <br />
Bevis. Ifølge (2.14) eksisterer momenterne i (2.15). Påstanden i (2.15) kan vises ved<br />
induktion i n : Lad kuglen med centrum i ξ og radius ǫ0 være indeholdt i Λ. Antag at<br />
påstanden holder for alle a1, . . . , a k med a1 + · · · + a k = n og betragt situationen hvor<br />
vil ændre a j <strong>til</strong> a j + 1. Vi vil benytte at<br />
Så fås<br />
|e ǫt <br />
<br />
j − 1| = <br />
<br />
ǫ<br />
0<br />
∂ n+1 c(ξ1, . . . , ξ k)<br />
∂ξ a1 1 . . . ∂ξa j+1<br />
j<br />
tje ut <br />
<br />
jdu ≤ ǫ|tj|(e ǫ0tj −ǫ0t<br />
+ e j) ∀ |ǫ| < ǫ0. (2.16)<br />
. . . ∂ξ ak k<br />
= lim 1<br />
<br />
∂nc(ξ1, . . . , ξj + ǫ, . . . , ξk) −<br />
ǫ<br />
∂n <br />
c(ξ1, . . . , ξk) <br />
= lim<br />
<br />
= lim =<br />
∂ξ a 1<br />
1 . . . ∂ξa k<br />
k<br />
∂ξ a1 1 . . . ∂ξa k<br />
k<br />
t1(x) a1 · · · tk(x) ak ξ·t(x)<br />
e eǫtj(x) − 1<br />
ν(dx)<br />
<br />
ǫ<br />
t1(x) a 1 · · · tj(x) a j+1 · · · tk(x) a ke ξ·t(x) ν(dx)<br />
= c(ξ)E ξ{t1(X) a 1 · · · tj(X) a j+1 · · · tk(X) a k },<br />
hvor det andet lighedstegn er induktionsantagelsen, og det tredje lighedstegn følger af<br />
(2.16) og sætningen om domineret konvergens. <br />
Bemærkning 2.9 Bemærk at Sætning 2.8 er et eksempel på, at vi må differentiere ind<br />
under integraltegnet. <br />
Benyttes Sætning 2.8 får vi følgende vigtige relationer for ξ ∈ intΛ,<br />
τ(ξ) := Eξt(X) = ∂κ<br />
(ξ)<br />
∂ξ<br />
(2.17)<br />
V(ξ) := Varξ(t(X)) = ∂2κ ∂τ<br />
(ξ) =<br />
∂ξ∂ξ ∗ ∂ξ∗(ξ) (2.18)<br />
Desuden har vi fra Observation 2.4 at hvis t(·) opfylder (2.5) så er<br />
Var ξ(t(X)) positiv definit for ξ ∈ intΛ. (2.19)<br />
Observation 2.10 Antag at t(·) opfylder (2.5). Hvis ξ1, ξ2 ∈ intΛ og ξ1 = ξ2, så er<br />
τ(ξ1) = τ(ξ2).
2.4. LAPLACE- OG KUMULANTTRANSFORM 13<br />
Bevis.<br />
(ξ2 − ξ1) · {τ(ξ2) − τ(ξ1)} = (ξ2 − ξ1) ·<br />
=<br />
1<br />
0<br />
1<br />
0<br />
dτ(ξ1 + s(ξ2 − ξ1))<br />
ds<br />
ds<br />
(ξ2 − ξ1)V(ξ1 + s(ξ2 − ξ1))(ξ2 − ξ1) ∗ ds > 0<br />
ifølge (2.19). <br />
Eksempel 2.11 (Normalfordelingen).<br />
Lad X være normalfordelt med middelværdi µ og varians σ 2 med (µ, σ 2 ) ∈ R × R+.<br />
Så er tætheden med hensyn <strong>til</strong> lebesguemålet m givet ved<br />
dP (µ,σ2 )<br />
(x) ==<br />
dm<br />
1<br />
√ 2πσ 2<br />
µ2<br />
exp{− } exp<br />
2σ2 µ<br />
σ<br />
2σ<br />
1<br />
x − x2<br />
2 2<br />
for x ∈ R. Dette er en eksponentiel familie med t(x) = (x, x2 ) og ϕ(µ, σ2 ) = ( µ<br />
I dette <strong>til</strong>fælde er<br />
Λ0 = R × R−,<br />
og da området har ikke tomt indre er (2.4) opfyldt. Støtten for T er<br />
{(x, x 2 )|x ∈ R},<br />
<br />
,<br />
σ2 , − 1<br />
2σ2). eftersom enhver kugle omkring (z, z 2 ) vil indeholde et interval af x-værdier, og dermed<br />
have positiv sandsynlighed. Da støtten ikke er indeholdt i et affint underrum af<br />
R 2 , er (2.5) opfyldt, og vi har vist at repræsentationen er minimal. Vi vil nu undersøge<br />
om familien er fuld. Vi skal da undersøge hvornår integralet<br />
<br />
R<br />
exp ξ1x + ξ2x 2 dx<br />
er endeligt. Hvis ξ2 ≥ 0 vil integranten gå mod uendelig for x gående mod enten +∞<br />
eller −∞ og integralet er ikke endeligt. Tilbage er området Λ0 og vi har derfor vist at<br />
Λ = Λ0, det vil sige at familien er fuld. Da Λ også er åben er familien regulær.<br />
Laplacetransformen for T under lebesguemålet er<br />
<br />
c(ξ) = exp{ξ1x + ξ2x 2 }dx<br />
R<br />
<br />
= exp<br />
=<br />
− 1<br />
4 ξ2 1 /ξ2<br />
<br />
R<br />
<br />
π/(−ξ2) exp{− 1<br />
4 ξ2 1 /ξ2}.<br />
<br />
exp ξ2 x − 1<br />
2 ξ1/(−ξ2)<br />
2 dx<br />
Kumulanttransformen er derfor κ(ξ) = − 1 4 ξ2 1 /ξ2 − 1 2 log(−ξ2/π). Fra (2.17) får vi<br />
EξX = −ξ1<br />
, EξX 2ξ2<br />
2 = ξ2 1<br />
4ξ2 −<br />
2<br />
1<br />
.<br />
2ξ2<br />
Med ξ = (ξ1, ξ2) = (µ/σ 2 , −1/(2σ 2 )) bliver formlerne<br />
E (µ,σ 2 ) X = − µ(−2σ2 )<br />
2σ 2 = µ, E (µ,σ 2 ) X2 = µ2 (4σ 4 )<br />
4σ 4<br />
−2σ2<br />
−<br />
2 = µ2 + σ 2 .
14 KAPITEL 2. EKSPONENTIELLE FAMILIER<br />
Det er sommetider muligt at vise at en familie er fuld ved hjælp af følgende resultat.<br />
Observation 2.12 Lad Λ0 være et åbent område i R k . Hvis der for ethvert punkt ξ1 på<br />
randen af Λ0 gælder, at der eksisterer ξ0 ∈ Λ0, så at<br />
c(ξ) → ∞,<br />
for ξ → ξ1 langs liniestykket fra ξ0 <strong>til</strong> ξ1, så vil Λ0 = Λ. <br />
Bevis. Vi vil vise at c(ξ1) = ∞ for alle punkter ξ1 på randen af Λ0. Så følger det fra<br />
sætning 2.6 at Λ ikke kan være større end Λ0 (hvis ˜ξ ∈ Λ \ Λ0 så vil der, da Λ er<br />
konvekst, findes ξ1 ∈ Λ med ξ1 på randen af Λ0, men dette er en modstrid med c(ξ1) =<br />
∞). Vi laver et modstridsbevis. Antag at c(ξ1) < ∞. Så fra (2.13) har vi med ξ = αξ1 +<br />
(1 − α)ξ0, 0 < α < 1,<br />
c(ξ) ≤ c(ξ1) α c(ξ0) 1−α ≤ max{c(ξ1), c(ξ0)},<br />
hvilket er en modstrid med at c(ξ) → ∞. Altså er c(ξ1) = ∞. <br />
Observation 2.12 bruges på den måde at for ξ ∈ Λ0 har vi at ξ = ϕ(θ) for et θ ∈ Θ og<br />
dermed<br />
c(ξ) = a(θ) −1 .<br />
Hvis derfor a(θ) går mod nul for θ gående mod randen af Θ og Λ0 er åbent i R k vil<br />
familien være fuld.<br />
Det næste lemma viser at Observation 2.12 har en invers: hvis c(ξ) → ∞ for ξ<br />
gående mod randen af Λ0, så vil familien ikke være fuld.<br />
Lemma 2.13 Lad ξ /∈ Λ og lad ξn ∈ Λ med ξn → ξ for n → ∞. Så vil c(ξn) → ∞. <br />
Bevis. Da exp{ξn · t(x)} ≥ 0 siger Fatou’s lemma (JHJ 3.5) at<br />
<br />
∞ = c(ξ) = lim inf exp{ξn · t(x)}ν(dx)<br />
n<br />
<br />
≤ lim inf exp{ξn · t(x)}ν(dx)<br />
n<br />
= lim inf c(ξn),<br />
n<br />
hvilket viser resultatet. <br />
2.5 Estimation<br />
Jeg betragter i dette afsnit den fulde <strong>eksponentielle</strong> familie (2.11) med ξ ∈ Λ = {ξ|<br />
c(ξ) < ∞}, og antager at frems<strong>til</strong>lingen er minimal. For den observerede værdi t =<br />
t(x) er log likelihood funktionen<br />
l(ξ) = l(ξ; t) = ξ · t − κ(ξ), ξ ∈ Λ. (2.20)
2.5. ESTIMATION 15<br />
Sætning 2.14. Antag at den <strong>eksponentielle</strong> familie er regulær og på minimal form.<br />
Da eksisterer der ˆξ = ˆξ(t) ∈ Λ, så at log likelihood funktionen (2.20) antager sin<br />
maksimumsværdi i ˆξ, hvis og kun hvis t ∈ intCt. Da fra Sætning 2.6 l(ξ) er strengt<br />
konkav, vil for t ∈ intCt estimatet ˆξ være entydigt bestemt og være løsning <strong>til</strong> ligningen<br />
∂l(ξ)<br />
∂ξ<br />
= t − ∂κ(ξ)<br />
∂ξ<br />
= t − τ(ξ) = 0, (2.21)<br />
d.v.s. ˆξ = τ −1 (t). <br />
Bevis. Vi viser først, at t ∈ intCt medfører, at l(ξ) antager sit maksimum på Λ. Vi<br />
bruger et modstrids bevis. Antag at l(ξn) er voksende, hvor ξn ∈ Λ og ξn går mod<br />
randen af Λ. Hvis følgen ξn er begrænset, kan vi tage en delfølge {nk}, så at ξn → k<br />
˜ξ /∈ Λ. Det følger af Lemma 2.13, at c(ξn ) → ∞ da c( k ˜ ξ) = ∞, og dermed fra (2.20),<br />
at l(ξn ) → −∞, hvilket er en modstrid. Hvis i stedet følgen ξn er ubegrænset, kan vi<br />
k<br />
tage en delfølge på formen ξn = u k kek, hvor ek er en enhedsvektor i Rk med ek → e, og<br />
uk → ∞. Så giver Fatou’s lemma<br />
lim inf e<br />
k<br />
−l(ξn<br />
<br />
)<br />
k = lim inf e<br />
k<br />
ukek·(t(x)−t) ν(dx)<br />
<br />
≥ lim inf e<br />
k<br />
ukek·(t(x)−t) ν(dx)<br />
≥ ∞ · ν({x : e · (t(x) − t) > 0} = ∞,<br />
hvor det sidste lighedstegn følger af, at t ∈ intCt. Altså har vi igen at l(ξn k ) → −∞, og<br />
dermed en modstrid.<br />
Vi skal nu vise, at hvis t /∈ intCt, så antager l(ξ) ikke sit maksimum på Λ. Vi vil<br />
vise, at for ethvert ξ0 ∈ Λ findes der en retning e , så at når vi forlader ξ0 i e’s retning<br />
vokser l(ξ). Da t /∈ intCt findes der en enhedsvektor e, så at<br />
Derfor vil<br />
ν({x|e · (t(x) − t)) > 0} = 0.<br />
e −l(ξ0+λe)<br />
<br />
=<br />
e λe·(t(x)−t) e ξ0·(t(x)−t) ν(dx) (2.22)<br />
være aftagende i λ > 0. Den strenge konkavitet af l(ξ) giver, at (2.22) er strengt aftagende,<br />
og l(ξ) har derfor ikke maksimum i ξ0. <br />
Bemærkning 2.15 Bemærk at Sætning 2.14 viser, at i en regulær familie på minimal<br />
form, er<br />
τ(Λ) = intCt, (2.23)<br />
eftersom τ(ξ) = t medfører at l(·; t) har maksimum i ξ. Fra Observation 2.10 har vi<br />
altså, at τ(·) er en en-<strong>til</strong>-en afbildning af Λ på intCt. Da τ fra Sætning 2.8 er uendelig<br />
ofte differentiabel, gælder det samme for ˆξ(·) = τ −1 (·) : intCt → Λ. <br />
Den næste sætning angiver jeg uden bevis.<br />
Sætning 2.16. For en fuld eksponentiel familie med minimal repræsentation (2.11)<br />
gælder at
16 KAPITEL 2. EKSPONENTIELLE FAMILIER<br />
(i) t ∈ intCt ⇒ l(ξ; t) har entydigt bestemt maksimumspunkt ˆξ(t),<br />
(ii) t /∈ intCt ⇒ l(ξ; t) antager ikke sit supremum for ξ ∈ Λ ,<br />
(iii) t ∈ τ(intΛ) ⊆ intCt ⇒ ˆξ(t) er den entydigt bestemte løsning <strong>til</strong> ligningen τ(ξ) =<br />
t, med ξ ∈ intΛ. <br />
Bemærk at hvis t ∈ intCt\τ(intΛ), så skal det entydigt bestemte ˆξ(t) findes på randen<br />
af Λ. Et eksempel <strong>til</strong> belysning af situationen i Sætning 2.16 er tætheden<br />
1<br />
exp(−|x| + θx − κ(θ)),<br />
1 + x4 hvor Ct er hele R og τ(int Λ) er et endeligt interval.<br />
Jeg slutter dette afsnit med at se på situationen med n uafhængige og identisk fordelte<br />
variable X1, . . . , Xn, hvor fordelingen <strong>til</strong>hører den <strong>eksponentielle</strong> familie (2.11).<br />
Den simultane tæthed er<br />
dPn ξ<br />
dνn (x1, . . . , xn) = c(ξ) −n <br />
exp ξ · t(xi) ,<br />
d.v.s. at vi har igen en eksponentiel familie af orden k idet :<br />
Observation 2.17 Hvis 1, t1(x), . . . , t k(x) er lineært uafhængige n.s.−ν, så er også 1,<br />
∑ n 1 t1(x i), . . . , ∑ n 1 t k(x i) lineært uafhængige n.s.−ν n . <br />
Bevis.<br />
⇓<br />
⇓<br />
n<br />
c0 + c1 ∑<br />
1<br />
t1(x i) + · · · + c k<br />
n<br />
∑<br />
1<br />
n<br />
∑<br />
1<br />
t k(x i) = 0 n.s. − ν n<br />
∃ x2, . . . , xn så at der n.s-ν mht. x1 gælder:<br />
n<br />
n <br />
c0 + c1 t1(xi) + · · · + ck tk(xi) + c1t1(x1) + · · · + cktk(x1) = 0<br />
∑ 2<br />
∑ 2<br />
c k = · · · = c1 = c0 = 0. <br />
Log likelihood funktionen er<br />
ln(ξ) = ξ ·<br />
n<br />
∑<br />
1<br />
t(x i) − nκ(ξ) = nl(ξ; ¯t)<br />
med ¯t = ∑ t(x i)/n, og hvor l(ξ; t) er givet i (2.19). Estimation baseret på x1, . . . , xn er<br />
derfor som før med t erstattet af ¯t, og resultaterne fra Sætningerne 2.14 og 2.16 kan<br />
bruges.
2.6. MARGINALE OG BETINGEDE FORDELINGER 17<br />
Eksempel 2.18 (Normalfordelingen).<br />
I eksempel 2.11 så vi at normalfordelingerne med middelværdi µ og varians σ 2 med<br />
(µ, σ 2 ) ∈ R × R+ udgør en regulær eksponentiel familie. Den kanoniske observator er<br />
t(x) = (x, x 2 ) og støtten for T er<br />
Den konvekse støtte for T er derfor<br />
{(x, y) ∈ R 2 |y = x 2 }.<br />
Ct = {(x, y) ∈ R 2 |y ≥ x 2 }.<br />
Da ethvert punkt (x, x 2 ) er på randen af Ct vil maksimum likelihood estimaterne for<br />
(µ, σ 2 ) eller ξ = (µ/σ 2 , −1/(2σ 2 ) ikke eksistere når vi blot har én observation. Når vi<br />
istedet har n > 1 observationer x1, . . . , xn eksisterer maksimum likelihood estimaterne<br />
med sandsynlighed 1. Dette er fordi<br />
1<br />
n<br />
n<br />
∑<br />
i=1<br />
(x i, x 2 i<br />
1<br />
) =<br />
n (x1, x 2 1<br />
1 ) + · · · +<br />
n (xn, x 2 n) ∈ int Ct<br />
hvis der blot er to observationer der er forskellige. Udsagnet følger af at x → x 2 er en<br />
strengt konveks kurve og derfor vil en konveks kombination af forskellige punkter på<br />
denne kurve ikke ligge på kurven. <br />
2.6 Marginale og betingede fordelinger<br />
Vi betragter igen en fuld eksponentiel familie med minimal repræsentation (2.11). Lad<br />
ξ = (ξ (1) , ξ (2) ) og t(x) = (t (1) (x), t (2) (x)) være en opsplitning i de første m og de sidste<br />
(k − m) koordinater med 1 ≤ m < k. Hvad kan vi sige om de marginale fordelinger<br />
for t (2) (X) og de betingede fordelinger af t (1) (X) givet t (2) (X)?<br />
Observation 2.19 Der gælder generelt følgende formel for marginale tætheder<br />
<br />
dQU<br />
dQ<br />
(u) = EP (X) | U = u .<br />
dPU<br />
dP<br />
Bevis. Se afsnit 11.4. <br />
Benyttes denne for den marginale tæthed for t (2) (X) fås<br />
dP ξT (2)<br />
dP ξ0T (2)<br />
(v) = E ξ0<br />
= c(ξ0)<br />
c(ξ) E ξ0<br />
dPξ<br />
dP ξ0<br />
<br />
exp<br />
(X) | t (2) <br />
(X) = v<br />
<br />
(ξ (1) − ξ (1)<br />
0 ) · t(1) (X)<br />
<br />
| t (2) <br />
(X) = v exp<br />
(ξ (2) − ξ (2)<br />
0<br />
<br />
(2.24)<br />
<br />
) · v .<br />
Hvis vi ser på delklassen P0 = {P ξ|ξ ∈ Λ0} med Λ0 = {(ξ (1) , ξ (2) )|ξ (1) = ξ (1)<br />
0 }, er<br />
(2.24) på formen (2.1), og de marginale fordelinger af t (2) (X) udgør en ekponentiel<br />
familie P 0T (2).
18 KAPITEL 2. EKSPONENTIELLE FAMILIER<br />
Hvis P er fuld, er P 0T (2) også fuld, idet<br />
<br />
exp[α · v]P ξ0T (2)(dv) = Eξ0 exp[α · t(2) (X)] = Eξ0 exp[0 · t(1) (X) + α · t (2) (X)]<br />
som er endelig, hvis og kun hvis (0, α) = ξ − ξ0 for et eller andet ξ ∈ Λ, d.v.s. α = ξ (2) −<br />
ξ0 (2) for ξ ∈ Λ, og vi får netop klassen P 0T (2). Hvis Λ er åben, er {α|ξ0 + (0, α) ∈ Λ} en<br />
åben mængde i R k−m , d.v.s. hvis P er regulær, er P 0T (2) også regulær.<br />
Vi vender os nu mod de betingede fordelinger.<br />
Observation 2.20 Lad P og Q være to sandsynlighedsmål på (X , A) med Q ≪ P. Lad<br />
(Y, B) være et andet målrum og lad t : X → Y være en målelig afbildning. Definer<br />
f(x) = dQ<br />
<br />
(x), g(t) =<br />
dP<br />
Så gælder der at Q T (·|t) ≪ P T (·|t) og<br />
dQ(·|t)<br />
(x) =<br />
dP(·|t)<br />
f(x)P T (dx|t), D = {t|0 < g(t) < ∞}.<br />
⎧<br />
⎨<br />
f(x)<br />
g(t)<br />
t ∈ D<br />
⎩<br />
1 t /∈ D.<br />
Bemærk at PT({t|g(t) = ∞}) = 0 og dermed også QT({t|g(t) = ∞}) = 0. Desuden<br />
har vi fra Observation 2.19 også at QT({t|g(t) = 0}) = 0. Vi har altså at QT(D c ) = 0. <br />
Bevis. Se afsnit 11.4. <br />
Eksempel 2.21.<br />
Lad Q være fordelingen for (X1, . . . , Xn), hvor X-erne er uafhængige og<br />
Q(X i = 1) = 1 − Q(X i = 0) = θ,<br />
og lad P være den <strong>til</strong>svarende fordeling med θ = 1/2. Med U + X1 + · · · + Xn er<br />
og<br />
Fra Observation 2.20 får vi<br />
dQ(·|U = u)<br />
(x) =<br />
dP(·|U = u)<br />
dP<br />
d♯n(x) =<br />
<br />
1<br />
n ,<br />
2<br />
dQ<br />
d♯ n(x) = θu (1 − θ) n−u ,<br />
dQ<br />
dP (x) = 2n θ u (1 − θ) n−u .<br />
2 n θ u (1 − θ) n−u<br />
EP(2 n θ u (1 − θ) n−u |U = u) =<br />
2 n θ u (1 − θ) n−u<br />
2 n θ u (1 − θ) n−u EP(1|U = u)<br />
hvilket viser at den betingede fordeling af (X1, . . . , Xn) givet U = u er den samme<br />
uanset værdien af θ. <br />
= 1,
2.7. KOMPLETHED AF DEN MINIMALKANONISKE OBSERVATOR 19<br />
For den betingede fordeling af X givet t (2) (X) = u får vi<br />
dP ξ(·|t (2) (X) = u)<br />
dP ξ0 (·|t(2) (X) = u) =<br />
=<br />
e (ξ−ξ0)·t(x)<br />
E ξ0 (e(ξ−ξ0)·t(X) |t (2) (X) = u)<br />
e (ξ(1) −ξ (1)<br />
0 )·t(1) (x)<br />
E ξ0 (e(ξ(1) −ξ (1)<br />
0 )·t(1) (x) |t (2) (X) = u)<br />
For en fast værdi af u udgør de betingede fordelinger således en eksponentiel familie.<br />
Denne betingede familie er ikke nødvendigvis fuld, selvom P er fuld.<br />
Ovenfor betragtede vi de første m og sidste k − m koordinater i ξ og t(x). Generelt<br />
kan vi lade A2 være en k × (k − m) matrix af fuld rang k − m. Denne supplerer vi med<br />
A1 : k × m så at<br />
A = (A1, A2)<br />
er en invertibel k × k matriks. Da<br />
ξ · t(x) = ξt(x) ∗ = [ξA ∗−1 ][t(x)A] ∗ ,<br />
kan vi opskrive P som en eksponentiel familie med minimal kanonisk observator<br />
˜t(x) = t(x)A og minimal kanonisk parameter ˜ξ = ξA ∗−1 . Vi har derfor:<br />
Sætning 2.22. Lad P være en regulær familie og lad A være som ovenfor. Så udgør<br />
de marginale fordelinger for ˜t (2) (X) = t(X)A2 i delmodellen med ˜ξ (2) fast en regulær<br />
eksponentiel familie. <br />
Bemærkning 2.23 Hvis vi betragter en delmodel givet ved {P ξ|ξ ∈ ˜Λ}, hvor ˜Λ ⊂ Λ<br />
er åben, vil det kanoniske parameterområde for de marginale fordelinger af t(X)A2<br />
under ˜ξ (2) fast også være åben. Når det kanoniske parameterområde er åbent taler vi<br />
om en åben eksponentiel familie. <br />
2.7 Komplethed af den minimalkanoniske observator<br />
For en general klasse P af sandsynlighedsmål på målrummet (X , A), og en generel<br />
observator t : (X , A) → (Y, B) med værdier i målrummet (Y, B), skal jeg nu definere<br />
komplethed. Intuitivt skal vi formalisere, at klassen P er stor nok <strong>til</strong>, at en funktion er<br />
entydigt fastlagt ud fra dens middelværdier under P, P ∈ P.<br />
Observatoren T = t(X) siges at være komplet under P (henholdsvis begrænset komplet)<br />
hvis der for enhver funktion f : (Y, B) → (R, B(R)) (henholdsvis enhver begrænset<br />
funktion) med<br />
<br />
EP f(T) = f(t(x))P(dx) = 0 ∀ P ∈ P,<br />
gælder at<br />
f(t(x)) = 0 n.s. − P for alle P ∈ P.<br />
Observation 2.24 Hvis T er komplet så er T også begrænset komplet. <br />
Observation 2.25 Hvis T er komplet så er også ˜T = g(T) komplet, hvor g er en målelig<br />
afbildning fra Y <strong>til</strong> ˜Y.
20 KAPITEL 2. EKSPONENTIELLE FAMILIER<br />
Bevis. Antag at EP f( ˜T) = EP f(g(T)) = 0 for alle P ∈ P. Heraf følger at f(g(t(x))) =<br />
f(˜t(x)) = 0 n.s.-P for alle P ∈ P. <br />
Sætning 2.26. Lad P = {P ξ|ξ ∈ Λ0} være en eksponentiel familie på minimal form<br />
dPξ<br />
dµ (x) = a(ξ)b(x)eξ·t(x) , x ∈ X , ξ ∈ Λ0 ⊆ R k .<br />
Vi antager ikke her, at Λ0 er det fulde parameter område. Hvis intΛ0 = ∅, er T = t(X)<br />
komplet under P = {P ξ|ξ ∈ Λ0}. <br />
Bevis. Lad ξ0 ∈ Λ0 og lad f : Rk → R opfylde<br />
<br />
0 = a(ξ)b(x)e ξ·t(x) f(t(x))µ(dx) = a(ξ)<br />
<br />
a(ξ0)<br />
e (ξ−ξ0)·t(x) f(t(x))Pξ0 (dx), (2.25)<br />
for alle ξ ∈ Λ0. Lad f + (t) = f(t)1( f(t) > 0) og f − (t) = − f(t)1( f(t) < 0), og definer<br />
de to mål ν + og ν − på (R k , B(R k )) ved<br />
dν +<br />
dP ξ0T<br />
(t) = f + (t) og dν−<br />
(t) = f<br />
dPξ0T − (t).<br />
Disse to mål er endelige, idet f er Pξ-integrabel for alle ξ ∈ Λ0. Så viser (2.25), at<br />
<br />
e (ξ−ξ0)·t<br />
<br />
+<br />
ν (dt) = e (ξ−ξ0)·t −<br />
ν (dt) ∀ ξ ∈ Λ0.<br />
Denne ligning siger, at Laplacetransformerne for de to mål ν + og ν − stemmer overens<br />
på Λ0 − ξ0. Da int(Λ0 − ξ0) = ∅ følger det af JHJ, afsnit 4.19, at ν + = ν − . Dette giver<br />
<strong>til</strong> gengæld, at<br />
f + (t) = f − (t) n.s. − P ξ0T,<br />
og dermed fra definitionen af f + og f − , at<br />
Observationen 2.2 giver så, at<br />
f(t) = 0 n.s. − P ξ0T.<br />
f(t(x)) = 0 n.s. − P ξ for alle ξ ∈ Λ0. <br />
Eksempel 2.27.<br />
Lad X være binomialfordelt med antalsparameter n og sandsynlighedsparameter θ. Så<br />
siger sætningen ovenfor at hvis<br />
E θ f(X) = 0 ∀ 0 < θ < 1,<br />
så vil der gælde at f(0) = f(1) = · = f(n) = 0. Lad os vise dette direkte. Vi har altså<br />
at<br />
<br />
θ x (1 − θ) n−x = 0<br />
n <br />
n<br />
∑ f(x)<br />
x<br />
x=0<br />
for alle θ. Lader vi nu θ → 0 forsvinder alle led i summen pånær det første, som bliver<br />
f(0). Vi kan altså slutte at f(0) = 0. Vi dividerer nu ligningen ovenfor med θ og lader<br />
igen θ → 0. Dette giver os at f(1) = 0, og sådan fortsætter vi ind<strong>til</strong> vi har vist at f er<br />
identisk nul.
2.8. OPGAVER 21<br />
2.8 Opgaver<br />
Opgave 2.1<br />
Opskriv hver af <strong>familier</strong>ne nedenfor på eksponentiel familieform. Angiv støtten for<br />
den kanoniske observator T, den konvekse støtte Ct, samt variationsområdet Λ0 for<br />
den kanoniske parameter og det fulde parameterområde Λ. Udregn desuden middelværdi<br />
og varians for den kanoniske observator.<br />
a) Binomialfordelingerne med antalsparameter n fast og sandsynlighedsparameter<br />
0 < θ < 1.<br />
b) Poissonfordelingerne med parameter λ > 0. Find i dette <strong>til</strong>fælde også skævhed<br />
og kurtosis af en poissonfordelt variabel.<br />
c) Normalfordelingerne med middelværdi µ og varians σ 2 med (µ, σ 2 ) ∈ R × R+.<br />
d) Gammafordelingerne med formparameter λ og invers skalaparameter β med<br />
(λ, β) ∈ R 2 + .<br />
Opgave 2.2<br />
Find det fulde parameterområde Λ for den <strong>eksponentielle</strong> familie med tætheder<br />
i <strong>til</strong>fældene<br />
Her er m Lebesguemålet på R.<br />
dP ξ<br />
dm (x) = a(ξ)b(x)eξx , x ∈ R,<br />
(i) b(x) = e −|x| og (ii) b(x) = e−|x|<br />
.<br />
1 + x2 Opgave 2.3<br />
Betragt en eksponentiel familie på formen (2.1) med t(x) ∈ R k . Vis, at hvis støtten for<br />
T er begrænset, og familien er ikke tom, så er det fulde parameterområde Λ lig med<br />
R k .<br />
Opgave 2.4<br />
Denne opgave er en hjælp <strong>til</strong> jer, når I skal vise affin uafhængighed næsten sikkert.<br />
Lad (X , A, µ) være et metrisk målrum, hvor målet µ giver strengt positivt mål <strong>til</strong><br />
enhver åben kugle. Lad desuden t1, . . . , t k være kontinuerte funktioner fra X ind i R.<br />
Vis, at hvis t1(·), . . . , t k(·) er affint uafhængige som funktioner på X , så er de også<br />
affint uafhængige næsten sikkert med hensyn <strong>til</strong> µ.<br />
Vink: Lad (α0, . . . , α k) = 0. Så findes x0 ∈ X , så at α0 + α1t1(x0) + · · · + α kt k(x0) = 0.<br />
Overvej, at<br />
{x ∈ X |α0 + α1t1(x) + · · · + α kt k(x) = 0}<br />
er en åben og ikke-tom mængde, og dermed har positivt µ-mål.
22 KAPITEL 2. EKSPONENTIELLE FAMILIER<br />
Opgave 2.5<br />
Denne opgave viser, at den minimal kanoniske observator kan være komplet, selv om<br />
det indre af det kanoniske paramterområde er tomt.<br />
Lad X og Y være uafhængige og Poissonfordelte med EX = θ −1 og EY = exp(−θ),<br />
hvor parameteren θ varierer i R+. Vis, at dette er en eksponentiel familie af orden 2<br />
med kanonisk observator t(x, y) = (x, y) og kanonisk parameter (− ln θ, −θ). Vis, ved<br />
direkte undersøgelser, at (X, Y) er komplet.<br />
Vink: Hvis E θ f(X, Y) = 0 for alle θ, vis da først at f(0, 0) = 0 ved at lade θ → ∞,<br />
dernæst f(k, 0) = 0 for alle k > 0, og endelig at f(k, l) = 0 for alle k > 0 og l > 0.<br />
Opgave 2.6<br />
Betragt en eksponentiel familie på minimal form<br />
dP θ<br />
dµ (x) = a(θ)b(x)eϕ(θ)·t(x) ,<br />
hvor ϕ : Θ → R k og Θ er et åbent område i R k . Vis at<br />
og<br />
E θt(X) = τ(ϕ(θ)) =<br />
V θt(X) =<br />
∂(− ln a(θ))<br />
∂θ<br />
∂ϕ ∗<br />
<br />
∂ϕ<br />
∂θ∗ −1 ∂Eθt(X)<br />
∂θ∗ .<br />
Opgave 2.7<br />
Lad (X1, Y1), (X2, Y2), . . . , (Xn, Yn) være n uafhængige observationer fra den todimensionale<br />
normalfordeling med middelværdivektor (0, 0) og variansmatrix<br />
<br />
1 ρ<br />
ρ 1<br />
∂θ<br />
−1<br />
hvor korrelationskoefficienten ρ har intervallet (−1, 1) som variationsområde.<br />
1) Vis at den således fastlagte familie af fordelinger for samplet (X1, Y1), . . . , (Xn, Yn)<br />
er eksponentiel, bestem ordenen af denne <strong>eksponentielle</strong> familie, og angiv en<br />
minimal kanonisk observator og en minimal kanonisk parameter. Er familien<br />
fuld?<br />
2) Ops<strong>til</strong> likelihoodligningen for ρ.<br />
Opgave 2.8<br />
Antag, at X−1 og X1 er uafhængige og Poissonfordelte med middelværdi<br />
λ i = 1 2 eα+iβ , i = −1 og 1.<br />
Lad P = {P (α,β) : (α, β) ∈ R 2 } betegne klassen af fordelinger for X = (X−1, X1).
2.8. OPGAVER 23<br />
1) Vis, at P er en regulær eksponentiel familie af orden 2.<br />
2) Angiv definitionsområdet D for maximum likelihood estimatoren (ˆα, ˆ β) og vis,<br />
at hvis x ∈ D, så er<br />
<br />
ˆα(x) = ln 2 <br />
X−1X1<br />
og<br />
ˆβ(x) = ln<br />
<br />
X1<br />
X−1<br />
3) Vis, at informationsfunktionen svarende <strong>til</strong> observationen (x−1, x1) er<br />
4) Lad<br />
j(α, β) =<br />
<br />
e α cosh(β) e α sinh(β)<br />
e α sinh(β) e α cosh(β)<br />
.<br />
<br />
.<br />
τ = e α cosh(β) (= E (α,β)(X−1 + X1)).<br />
Vis, at P kan parametriseres ved (τ, β) samt at variationsområdet for (τ, β) er<br />
(0, ∞) × (−∞, ∞).<br />
Opgave 2.9(Den logaritmiske fordeling)<br />
Definer sandsynlighedsmålet P θ, 0 < θ < 1, på X = {1, 2, . . .} ved<br />
dPθ θx<br />
(x) = (− log(1 − θ))−1<br />
d♯ x ,<br />
hvor ♯ er tællemålet. Opskriv familien på eksponentiel familieform. Angiv støtten for<br />
den kanoniske observator T, den konvekse støtte Ct, samt variationsområdet Λ0 for<br />
den kanoniske parameter og det fulde parameterområde Λ. Udregn desuden middelværdi<br />
og varians for den kanoniske observator.<br />
Opgave 2.10(Den negative binomialfordeling)<br />
Definer sandsynlighedsmålet Pθ, 0 < θ < 1, på X = {0, 1, 2, . . .} ved<br />
<br />
dPθ κ + x − 1<br />
(x) =<br />
θ<br />
d♯ x<br />
x (1 − θ) κ ,<br />
hvor ♯ er tællemålet og κ > 0 er en fast parameter. Opskriv familien på eksponentiel familieform.<br />
Angiv støtten for den kanoniske observator T, den konvekse støtte Ct, samt<br />
variationsområdet Λ0 for den kanoniske parameter og det fulde parameterområde Λ.<br />
Udregn desuden middelværdi og varians for den kanoniske observator.<br />
Opgave 2.11(Den inverse gauss fordeling)<br />
Definer sandsynlighedsmålet P (χ,ψ), (χ, ψ) ∈ R 2 + , på X = R+ ved<br />
dP (χ, ψ)<br />
(x) =<br />
dm<br />
√ χ exp( √ χψ)<br />
√ 2πx 3<br />
<br />
exp − χ<br />
2x<br />
<br />
ψx<br />
− ,<br />
2
24 KAPITEL 2. EKSPONENTIELLE FAMILIER<br />
hvor m er lebesguemålet. Opskriv familien på eksponentiel familieform. Angiv støtten<br />
for den kanoniske observator T, den konvekse støtte Ct, samt variationsområdet<br />
Λ0 for den kanoniske parameter og det fulde parameterområde Λ. Udregn desuden<br />
middelværdi og varians for den kanoniske observator.