IMFUFA-tekst 304e (Statistiknoter) - dirac

dirac.ruc.dk

IMFUFA-tekst 304e (Statistiknoter) - dirac

18 Ordforklaringer og definitioner

outlier: en observation der ligger usædvanlig langt fra det store flertal af tilsvarende

observationer.

Pascals trekant: en rekursiv algoritme til udregning af binomialkoefficienter:

( ( ) ( )

n n − 1 n − 1

= +

k)

k k − 1

Poissonfordeling: Poissonfordelingen med parameter µ ≥ 0 er den sandsynlighedsfordeling

på {0, 1, 2, . . . } som har sandsynlighedsfunktion

f (y; µ) = µy

y!

exp(−µ), y ∈ {0, 1, 2, . . . }.

Middelværdien i fordelingen er µ, og variansen er også µ.

probit (‘probability unit’): Hvis man lægger 5 til α-fraktilen i N (0, 1)-fordelingen,

får man probit(α), dvs.

probit(α) = Φ −1 (α) + 5,

hvor Φ er den kumulerede fordelingsfunktion for N (0, 1)-fordelingen.

R 2 : se determinationskoefficient

regressionsanalyse: En generel betegnelse for en lang række analysemetoder

der går ud på at beskrive (middelværdien af) y 1 , y 2 , . . . , y n ved hjælp af

en eller flere forklarende variable.

regressionskoefficient: I den simple lineære regressionsmodel EY i = α + βx i

kaldes parameteren β for regressionskoefficienten.

residual: Residualerne er forskellene y i − ŷ i mellem de observerede og de fittede

værdier.

sample: et engelsk ord der kan oversættes til stikprøve (eller hvis det er et udsagnsord

til at indsamle en stikprøve).

sandsynlighedspapir (normalfordelingspapir): En særlig type papir med fortrykte

skalaer der letter tegningen af fraktildiagrammer for normalfordelte

observationer.

Sandsynlighedspapirets ordinatakse har to skalaer, dels en probit-skala,

dels den tilsvarende sandsynlighedsskala.

scatterplot: en diagram hvor man i al enkelhed indtegner punkter (x i , y i ).

signifikans: Udtrykket benyttes i forbindelse med test af en statistisk hypotese.

Man siger at der er signifikans på niveau α hvis testsandsynligheden

er udregnet til α (og man forkaster hypotesen).

Hvis man har den strategi at forkaste hypotesen hver gang testsandsynligheden

er mindre end α, så siger man at man benytter et signifikansniveau

på α, og man kan fortolke α som sandsynligheden for at forkaste

hypotesen selv om den er rigtig. – Man benytter ofte α = 5%.

More magazines by this user
Similar magazines