Noter til E6 - dirac

dirac.ruc.dk

Noter til E6 - dirac

A En udledning af

normalfordelingen

Normalfordelingen benyttes meget ofte i statistiske modeller. Nogle

gange kan man begrunde brugen af den ud fra Den Centrale Grænseværdisætning,

andre gange af matematiske bekvemmelighedsgrunde. Der findes

imidlertid også argumentationer af formen »hvis man har tænkt sig

at analysere data på den-og-den måde, så svarer det indirekte til at antage

at observationerne stammer fra den-og-den fordeling«. I dette afsnit

vil vi præsentere et eksempel på en sådan argumentation; grundideen i

det hidrører vistnok fra C.F. Gauß.

Den overordnede opgave er at finde et forslag til en type sandsynlighedsfordelinger

der kan bruges til at beskrive hvordan observationer fordeler

sig tilfældigt omkring en bestemt ukendt værdi µ. Vi gør nogle antagelser:

Antagelse 1: Fordelingerne er kontinuerte fordelinger på R, dvs. de har

en kontinuert tæthedsfunktion.

Antagelse 2: Parameteren µ kan have en vilkårlig reel værdi og er en

positionsparameter, dvs. modelfunktionen er af formen

f(x − µ), (x, µ) ∈ R 2

for en passende funktion f som er defineret på hele R (og kontinuert

ifølge antagelse 1).

Antagelse 3: Funktionen f er kontinuert differentiabel.

Antagelse 4: Maksimaliseringsestimatet for µ skal være gennemsnittet af

observationerne, mere præcist: for enhver stikprøve x 1 , x 2 , . . . , x n

fra fordelingen med tæthedsfunktion x ↦→ f(x − µ), skal maksimaliseringsestimatet

være gennemsnittet x.

Vi skal nu se hvad man kan deducere herudfra.

Log-likelihoodfunktionen svarende til observationerne x 1 , x 2 , . . . , x n

n∑

ln L(µ) = ln f(x i − µ) som er differentiabel med

i=1

er

(ln L) ′ (µ) =

n∑

g(x i − µ)

i=1

109

More magazines by this user
Similar magazines