Formelsammlung fÃ¼r die Vorlesung Statistik A - UniversitÃ¤t Bonn

Formelsammlung 

für die Vorlesung 

Statistik A 

Univ.-Prof. Dr. Kneip / Dr. Scheer 

Universität Bonn 

Statistische Abteilung 

Wintersemester 2009/2010 

Inhaltsverzeichnis 

2 Univariate Deskription und Exploration von Daten 2 

3 Bivariate Deskription und Exploration von Daten 9 

4 Zeitreihenanalyse 16 

5 Indexzahlen 17 

6 Wahrscheinlichkeitsrechnung 20

Formelsammlung Statistik I Seite 2 

2 Univariate Deskription und Exploration von 

Daten 

Gegeben seien Daten x 1 , . . . , x n eines Merkmals X mit Ausprägungen a 1 , . . . , a k . 

Häugkeiten und ihre graphischen Darstellungen 

Formel/Notation 

Erläuterung 

Absolute Häugkeit h(a j ) = h j Anzahl der Werte mit x i = a j 

Relative Häugkeit f(a j ) = f j = h j 

Anteil der Werte mit x 

n 

i = a j 

Abs. Häugkeitsverteilung {h 1 , . . . , h k } Menge der abs. Häugkeiten 

Rel. Häugkeitsverteilung {f 1 , . . . , f k } Menge der rel. Häugkeiten 

Diagramm 

Strichliste 

Stabdiagramm 

Säulendiagramm 

Balkendiagramm 

Kreisdiagramm 

Histogramm 

Beschreibung 

Für jedes a k jeweils h k Striche 

Über a 1 , . . . , a k jeweils zur x-Achse senkrechter Strich 

mit Höhe h 1 , . . . , h k (oder f 1 , . . . , f k ) 

wie Stabdiagramm, jedoch mit Rechtecken anstatt 

Strichen 

wie Säulendiagramm, jedoch mit a 1 , . . . , a k auf der y- 

Achse 

Kreissektoren mit Winkeln α j = f j · 360 ◦ , so daÿ Fläche 

proportional zu den Häugkeiten 

Über den Klassen [c 0 , c 1 ], . . . , (c k−1 , c k ] Rechtecke mit 

Breite δ j = c j − c j−1 und Höhe gleich (oder proportional 

zu) h j /δ j bzw. f j /δ j . Damit ist die Fläche der 

Rechtecke gleich (oder proportinal zu) h j bzw. f j . 

Kumulierte Häugkeitsverteilungen 

Absolute kumulierte 

Häugkeitsverteilung 

Empirische Verteilungsfunktion 

(relative kumulierte 

Häugkeitsverteilung) 

Formel/Notation 

H(x) = 

∑ h(a i ) 

i:a i ≤x 

F (x) = H(x) 

n 

= ∑ 

i:a i ≤x 

f(a i ) 

Erläuterung 

Anzahl der Werte x i 

mit x i ≤ x 

Anteil der Werte x i mit 

x i ≤ x 

Statistik_A@statistik.uni-bonn


Lagemaÿe 

Lagemaÿ Formel Erläuterung 

Arithmetisches 

n∑ 

¯x = 

Mittel 

1 Empirischer Mittelwert der Beobachtungen 

x 

n i 

i=1 

∑ 

¯x = k k∑ 

f j a j = 1 h 

h 

n j a j = h(a j ) abs. Häugkeiten 

j 

j=1 

j=1 

f j = f(a j ) rel. Häugkeiten 

Für ungerades n: 

x med = x ( 

n+1 

Median 

Modus 

Geometrisches 

Mittel 

Harmonisches 

Mittel 

2 ) 

Für gerades ( n: ) 

x med = 1 x(n/2) + x 

2 

(n/2+1) 

x mod = a i , 

mit f i = max j=1,···k f j 

¯x geo = n√ x 1 · x 2 · · · x n 

n∑ 

bzw. ln(¯x geo ) = 1 ln(x 

n i ) 

i=1 

x (1) ≤ . . . ≤ x (n) bezeichnet 

die aufsteigend sortierte Urliste 

x 1 , . . . , x n . 

Ausprägung mit gröÿter Häugkeit. 

Nur für positive x 1 , . . . , x n . 

∑ 

bzw. ln(¯x geo ) = k f j ln(a j ) Häugkeitsdaten mit a j > 0 

¯x har = 1 

1 

n 

bzw. 

1 

¯x har 

bzw. 

1 

¯x har 

n∑ 

i=1 

1 

x i 

n∑ 

= 1 n 

i=1 

= k ∑ 

j=1 

j=1 

Entweder alle x i > 0 

1 

oder alle x i < 0 

x i 

f j 

1 

aj 

Häugkeitsdaten und entweder 

alle a j > 0 oder alle a j < 0 

Lageregeln 

Verteilung 

symmetrisch 

linkssteil (rechtsschief) 

rechtssteil (linksschief) 

Lagemaÿe 

¯x ≈ x med ≈ x mod 

¯x > x med > x mod 

¯x < x med < x mod 



Streuungsmaÿe 

Streuungsmaÿ Formel Erläuterung 

Empirische Varianz 

n∑ 

n∑ 

˜s 2 = 1 (x 

n i − ¯x) 2 = 1 x 2 n i − ¯x 2 ¯x emp. Mittelwert 

Empirische Standardabweichung 

i=1 

i=1 

∑ 

˜s 2 = k ∑ 

f j (a j − ¯x) 2 = k f j a 2 j − ¯x 2 

j=1 

Stichprobenvarianz s 2 = 1 

n−1 

j=1 

Für Häugkeitsdaten 

˜s = √˜s Quadratwurzel aus emp. 

2 

Varianz 

n∑ 

(x i − ¯x) 2 Division durch n − 1 

i=1 

Sinnvoll für 

Variationskoezient v = ˜s/¯x 

Beobachtungen x i > 0 

x 

Spannweite R = max i x i − min i x i = x (n) − x (1) ≤ . . . ≤ x (n) , geordnete 

(1) 

Urliste 

x 

Interquartilsabstand QA = x 0.75 − x 0.25 , x 0.75 unteres bzw. oberes 

0.25 

Quartil 

Bemerkung: Die Formel für die empirische Varianz wird oft auch in der 

n∑ 

Form ˜s 2 = x 2 − ¯x 2 , wobei x 2 = 1 x 2 n i der Mittelwert der quadrierten Daten 

ist, geschrieben. 

i=1 

Schichtung und Streuungszerlegung 

Eine Erhebungseinheit E vom Umfang n sei zerlegt in r Schichten (oder Teilgesamtheiten) 

E 1 , . . . , E r , jeweils vom Umfang n j , ∑ r 

j=1 n j = n, mit Mittel 

¯x j und Varianz ˜s 2 j. Dann gilt 

• Gesamtmittel in E: 

• Varianz in E: 

¯x = 1 n 

r∑ 

n j ¯x j 

j=1 

˜s 2 1 

r∑ 

= n j˜s 2 j + 1 r∑ 

n j (¯x j − ¯x) 2 

n 

n 

j=1 

j=1 

} {{ } } {{ } 

Streuung innerhalb Streuung zwischen 

der Schichten den Schichten 



Quantile und Boxplot 

Quantile 

Für 0 

Anzahl(x i : x i ≤ x p ) 

Anzahl(x 

≥ p und 

i : x i ≥ x p ) 

n 

n 

gilt, p-Quantil. Damit gilt für das p-Quantil: 

Bemerkungen: 

x p = x (⌊np⌋+1) , wenn np nicht ganzzahlig 

x p ∈ [ x (np) , x (np+1) 

] 

, wenn np ganzzahlig 

• Spezielle Bezeichnungen: 

x 0.5 Median 

x 0.25 , x 0.75 Unteres bzw. Oberes Quartil 

x 0.1 , . . . , x 0.9 Dezile 

≥ 1 − p 

• Analog zum Median kann man für ganzzahliges ( np) ein p-Quantil auch 

eindeutig als den Mittelwert x p = 1 x(np) + x 

2 

(np+1) denieren. 

• In Statistikprogrammen werden empirische p-Quantile gewöhnlich durch 

lineare Näherung aus der empirischen Verteilungsfunktion gewonnen. 

Graphische Darstellung 

• 5-Punkte Zusammenfassung einer Verteilung: 

Angabe von x min , x 0.25 , x med , x 0.75 , x max . 

• Boxplot: 

1. x 0.25 = Anfang der Box 

2. x 0.75 = Ende der Box 

3. x med durch senkr. Strich in der Box markieren 

4. Berechnung der Zäune z u = x 0.25 − 1.5 QA und z o = x 0.75 + 

1.5 QA 

5. Zwei Linien (whiskers) gehen von der Box aus zum kleinsten und 

gröÿten Beobachtungswert innerhalb des Bereichs [z u , z o ] der Zäune. 

(Üblicherweise werden die Endpunkte durch senkrechte Striche 

markiert.) 

6. Beobachtungen auÿerhalb der Zäune z u , z o werden einzeln markiert. 



Gruppierte Daten 

Lagemaÿe 

Arithm. Mittel 

Median 

Formel 

Erläuterung 

∑ 

¯x = k f j¯c j 

¯c j Mitte der Klasse (c j−1 , c j ] 

f j rel. Häugkeit 

j=1 

x med = c i−1 + δ i 

0.5−F i−1 

f i 

F i−1 = ∑ i−1 

j=1 f j (emp. Vert.), 

(c i−1 , c i ] Einfallsklasse des Medians, 

d.h. F i−1 ≤ 0.5 < F i 

δ i = c i − c i−1 Breite der i-ten Klasse 

Modus x mod = ¯c i ¯c i Mitte der Modalklasse 

Geom. Mittel 

k∑ 

ln(¯x geo ) = 1 f 

n j ln(¯c j ) Alle ¯c j > 0 

Harm. Mittel 

1 

¯x har 

Streuungsmaÿe 



mit Sheppard-Korrektur 

k∑ 

= 1 n 

j=1 

j=1 

Formel 

f j 

¯c j 

Entweder alle ¯c j > 0 oder alle ¯c j < 0 

∑ 

˜s 2 = k ∑ 

f j (¯c j − ¯x) 2 = k f j¯c 2 j − ¯x 2 

j=1 

˜s 2 = k ∑ 

j=1 

j=1 

f j (¯c j − ¯x) 2 − δ2 

12 

Erläuterung 

¯x emp. Mittelwert, 

f j rel. Häugkeit, 

¯c j Klassenmitte 

Nur für konstante Klassenbreiten 

δ = c j − c j−1 

c 0 Untergrenze der untersten 

Klasse 

Spannweite R = c k − c 0 

c k Obergrenze der obersten 

Klasse 

x 0.25 , x 0.75 unteres bzw. 

Interquartilsabstand QA = x 0.75 − x 0.25 oberes Quartil (für gruppierte 

Daten) 

p-Quantil für gruppierte Daten 

Analog zum Median für gruppierte Daten wird ein p-Quantil (0 

deniert durch 

x p = c i−1 + δ i 

p − F i−1 

f i 

, 

wobei der Index i so bestimmt wird, daÿ ∑ i−1 

j=1 f j ≤ p < ∑ i 

j=1 f j. 



Maÿzahlen für Schiefe 

Empirische Momente 

Empirische Momente 

Empirische zentrale 

Momente 

Formel 

M r = 1 n 

m r = 1 n 

Erläuterung 

n∑ 

x r i r = 1, 2, . . . M 1 = Arithmetisches Mittel 

n∑ 

(x i − ¯x) r r = 2, 3, . . . m 2 = Empirische Varianz 

i=1 

i=1 

Maÿzahlen für Schiefe (Skewness) 

Schiefemaÿ Formel Erläuterung 

Momentenkoezient 

n∑ 

m 3 emp. 3tes zentrales Moment, 

g 

der Schiefe 

m = m 3 

mit m 

s 3 3 = 1 (x 

n i − ¯x) 3 

i=1 

s emp. Standardabw. 

Quantilskoezient 

g 

der Schiefe 

p = (x 1−p−x med )−(x med −x p) Für p = 0.25 ergibt sich 

x 1−p −x p 

der Quartilskoezient 

Konzentrationsmaÿe 

Lorenzkurve und Gini-Koezient 

Die Lorenzkurve ist der Streckenzug durch die Punkte (0, 0), (u 1 , v 1 ), . . . , (u κ , v κ ) = 

(1, 1), wobei für die Punkte (u j , v j ) gilt: 

• Bei geordneter Urliste x 1 ≤ . . . ≤ x n : 

u j = j n 

v j = 

∑ j 

i=1 x i 

∑ n 

i=1 x i 

für j = 1, . . . , n 

• Bei Häugkeitsdaten {(a i , f i )} 1≤i≤k (aufsteigend geordnet): 

u j = 

j∑ 

f i v j = 

i=1 

∑ j 

i=1 f ia i 

∑ k 

i=1 f ia i 

für j = 1, . . . , k 

• Bei gruppierten Daten mit Klassen [c 0 , c 1 ], . . . , (c k−1 , c k ] und Klassenmittelpunkten 

¯c i : 

u j = 

j∑ 

f i v j = 

i=1 

∑ j 

i=1 f i¯c i 

∑ k 

i=1 f i¯c i 

für j = 1, . . . , k 



Gini-Koezient 

Fläche zw. Diagonale u. Lorenzkurve 

G = = 2·Fläche zw. Diagonale u. Lorenzkurve 

Fläche zw. Diagonale und u-Achse 

Damit ergibt sich für den Gini-Koezienten 

• Bei geordneter Urliste x 1 ≤ . . . ≤ x n : 

G = 

∑ 

2 n ix i 

i=1 

n n ∑ 

i=1 

− n + 1 

n 

x i 

= n + 1 

n − 2 · 1 

n 

• Bei Häugkeitsdaten {(a i , f i )} 1≤i≤k (aufsteigend geordnet): 

n∑ 

j=1 

v j 

G = 

∑ k 

i=1 (u i−1 + u i )f i a i 

∑ k 

i=1 f ia i 

− 1 = 1 − 2 · 

k∑ 

j=1 

f j¯v j , mit ¯v j = v j−1 + v j 

2 

• Bei gruppierten Daten mit Klassen [c 0 , c 1 ], . . . , (c k−1 , c k ] und Klassenmittelpunkten 

¯c i : 

G = 

∑ k 

i=1 (u i−1 + u i )f i¯c i 

∑ k 

i=1 f i¯c i 

− 1 = 1 − 2 · 

k∑ 

j=1 

f j¯v j , mit ¯v j = v j−1 + v j 

2 

Normierter Gini-Koezient (Lorenz-Münzner-Koezient) 

G ⋆ = 

G 

G max 

= 

Absolute Konzentrationsmaÿe 

n 

n − 1 G mit dem Wertebereich: G⋆ ∈ [0, 1] 

Ausgangspunkt ist eine geordnete Urliste x 1 ≤ . . . ≤ x n . 

• Merkmalsanteil der i-ten Einheit: p i = 

x i 

n∑ 

x j 

j=1 

• Konzentrationsrate der g gröÿten Merkmalsträger: CR g = 

∑ 

• Herndahl-Index: H = n p 2 i ; Wertebereich: H ∈ [ 1 , 1] n 

i=1 

n∑ 

p i 

i=n−g+1 



3 Bivariate Deskription und Exploration von 

Daten 

Gegeben seien zwei Merkmale X und Y mit den möglichen Ausprägungen 

a 1 , . . . , a k für X und b 1 , . . . , b m für Y . 

Die Urliste enthält für jedes Objekt die gemeinsamen Messwerte (x 1 , y 1 ), . . . , (x n , y n ). 

Kontingenztabelle der absoluten Häugkeiten 

Eine (k × m)Kontingenztabelle der absoluten Häugkeiten besitzt die Form 

XY b 1 b 2 · · · b m 

a 1 h 11 h 12 . . . h 1m h 1• 

a 2 

. 

h 21 

. 

h 22 

. 

. . . h 2m 

. 

h 2• 

. 

a k h k1 h k2 . . . h km h k• 

h •1 h •2 · · · h •m n 

und gibt die gemeinsame Verteilung der Merkmale X und Y in absoluten 

Häugkeiten wieder. 

Bezeichnungen 

Absolute Häugkeit der Kombination 

(a i , b j ) 

h ij = h(a i , b j ) 

Zeilensummen h i• = h i1 + · · · + h im , 1 ≤ i ≤ k 

Spaltensummen h •j = h 1j + · · · + h kj , 1 ≤ j ≤ m 

∑ 

Gesamtsumme 

h • • = k m∑ ∑ 

h ij = k ∑ 

h i• = m h •j = n 

Randhäugkeiten 

des Merkmals X 

Randhäugkeiten 

des Merkmals Y 

i=1 j=1 

h 1• , . . . , h k• 

h •1 , . . . , h •m 

i=1 

j=1 



Kontingenztabelle der relativen Häugkeiten 

Eine (k × m)-Kontingenztabelle der relativen Häugkeiten besitzt die Form 

XY b 1 b 2 · · · b m 

a 1 f 11 f 12 . . . f 1m f 1• 

a 2 

. 

f 21 

. 

f 22 

. 

. . . f 2m 

. 

f 2• 

. 

a k f k1 f k2 . . . f km f k• 

f •1 f •2 · · · f •m 1 

und gibt die gemeinsame Verteilung der Merkmale X und Y wieder. 

Relative Häugkeit der Kombination 

(a i , b j ) 

Zeilensummen 

Spaltensummen 

Gesamtsumme 

Bezeichnungen 

f ij = h ij 

n 

f i• = f i1 + · · · + f im = h i• 

, 1 ≤ i ≤ k 

n 

f •j = f 1j + · · · + f kj = h •j 

, 1 ≤ j ≤ m 

n 

k∑ m∑ ∑ 

f ij = k ∑ 

f i• = m f •j = 1 

i=1 j=1 

i=1 

Randverteilung des Merkmals X {f 1• , . . . , f k• } 

Randverteilung des Merkmals Y {f •1 , . . . , f •m } 

Bedingte Häugkeitsverteilung 

von X unter der Bedingung 

Y = b j , kurz X|Y = b j 

Bedingte Häugkeitsverteilung 

von Y unter der Bedingung 

X = a i , kurz Y |X = a i 

j=1 

f X (a 1 |Y = b j ) = f 1j 

f •j , . . . , f X(a k |Y = b j ) = f kj 

f •j 

f Y (b 1 |X = a i ) = f i1 

f i• , . . . , f Y (b m |X = a i ) = f im 

f 

i• 



Graphische Darstellung quantitativer Merkmale 

Streudiagramm (Scatter plot) 

• Darstellung der Meÿwerte (x 1 , y 1 ), . . . , (x n , y n ) im xy-Koordinatensystem. 

Zweidimensionales Histogramm 

• Intervalle [c 0 , c 1 ], . . . , (c k−1 , c k ] für Merkmal X. 

• Intervalle [d 0 , d 1 ], . . . , (d m−1 , d m ] für Merkmal Y . 

• Quader mit den Rechtecken (c i−1 , c i ] × (d j−1 , d j ] als Grundäche und 

Höhe 

h ij 

(c i − c i−1 ) · (d j − d j−1 ) 

bzw. 

f ij 

(c i − c i−1 ) · (d j − d j−1 ) 

Odds und Kreuzproduktverhältnis 

Ausgangspunkt ist eine (k×m)-Kontingenztabelle der relativen Häugkeiten. 

• (Empirische) bedingte Chance (Odds) zwischen Y = b r und Y = b s 

für gegebenes X = a i ist: 

γ(b r , b s |X = a i ) = h ir 

h is 

• Das Kreuzproduktverhältnis (Odds ratio) zwischen X = a i und X = 

a j in bezug auf die Chancen von Y = b r zu Y = b s ist: 

γ(b r , b s |X = a i , X = a j ) = h ir/h is 

h jr /h js 

= h irh js 

h jr h is 



Kontingenz und χ 2 Koezient 

Formel 

Wertebereich/Erläuterung 

χ 2 -Koezient 

χ 2 = 

k∑ 

i=1 

( 

m∑ h ij − h i•h •j 

n 

j=1 

h i• h •j 

n 

) 2 

Es gilt: 0 ≤ χ 2 ≤ n · (min(k, m) − 1) 

˜h ij = h i•h •j 

= erwartete Häugkeiten, 

n 

wenn kein Zusammenhang vorliegt. 

Kontingenzkoezient 

Korrigierter 

Kontingenzkoezient 

K = 

√ 

K ⋆ = 

χ 2 

K ∈ [0, K max ], wobei K max = 

n + χ 2 M = min(k, m). 

K 

K max 

K ⋆ ∈ [0, 1] 

√ 

M−1 

M , 

√ 

Assoziationsmaÿ 

χ 

von Cramér V = 

2 

n(min(k, m) − 1) 

V ∈ [0, 1] 

V = |φ-Koezient| für 2 × 2-Tafeln 

Spezialfall: Vierfeldertafel 

Für eine (2 × 2)Kontingenztafel der Form 

h 11 h 12 h 11 + h 12 

h 21 h 22 h 21 + h 22 

h 11 + h 21 h 12 + h 22 n 

gilt 

χ 2 n(h 11 h 22 − h 12 h 21 ) 2 

= 

(h 11 + h 12 )(h 11 + h 21 )(h 12 + h 22 )(h 21 + h 22 ) 

und der φ-Koezient ist deniert als 

φ = 

h 11 h 22 − h 12 h 21 

√ 

(h11 + h 12 )(h 11 + h 21 )(h 12 + h 22 )(h 21 + h 22 ) 

und hat den Wertebereich φ ∈ [−1, 1]. 



Zusammenhangsmaÿe bei metrischen Merkmalen 

Empirischer Korrelationskoezient nach Bravais-Pearson 

• Empirische Standardabweichungen (für X bzw. Y ): ˜s X , ˜s Y 

˜s 2 X = 1 n∑ 

x 2 i − ¯x 2 und ˜s 2 Y = 1 n 

n 

i=1 

• Empirische Kovarianz (zwischen X und Y ): 

n∑ 

yi 2 − ȳ 2 

i=1 

˜s XY = 1 n 

n∑ 

(x i − ¯x)(y i − ȳ) = 1 n 

i=1 

n∑ 

x i y i − ¯x · ȳ 

i=1 

• Empirischer Korrelationskoezient : 

• Wertebereich: r ∈ [−1, 1]. 

r = r XY = ˜s XY 

˜s X ˜s Y 



Spearmans Korrelationskoezient 

• Rang von x i : rang(x i ) = Position des i-ten Messwertes in der aufsteigend 

sortierten Urliste x (1) ≤ x (2) ≤ . . . ≤ x (n) mit der Zusatzregel, 

dass gleichen Messwerten (sog. Bindungen, ties) jeweils das Mittel 

ihrer Ränge zugewiesen wird. 

• Mittel aller Ränge: rang X = 1 n 

n∑ 

rang(x i ) = 1 n 

i=1 

• Spearmans Korrelationskoezient : 

r SP = 

n∑ 

i=1 

i = n+1 

2 

n∑ 

(rang(x i ) − rang X )(rang(y i ) − rang Y ) 

i=1 

√ 

∑ n ∑ 

(rang(x i ) − rang X ) 2 

n (rang(y i ) − rang Y ) 2 

i=1 

• Wertebereich: r SP ∈ [−1, 1] 

• Rechentechnisch günstige Version: 

Unter der Voraussetzung, dass keine Bindungen (ties) auftreten 

(d.h., x i ≠ x j , y i ≠ y j für alle i, j), gilt: 

i=1 

∑ 

6 n Di 

2 

i=1 

r SP = 1 − 

n(n 2 − 1) 

mit den Rangdierenzen D i = rang(x i ) − rang(y i ), 1 ≤ i ≤ n. 

Lineare Einfachregression 

Gegeben seien n Beobachtungen der Merkmale Y und X: (y 1 , x 1 ), . . . , (y n , x n ). 

• Lineare Einfachregression: 

y i = α + βx i + ɛ i , 

i = 1, . . . , n 

• Parameter α, β: α bezeichnet den Achsenabschnitt, β die Steigung. 

• Fehlerterme ɛ i . (Annahme: Unsystematische Schwankung um 0.) 



• Bestimmung der Paramter der Ausgleichsgeraden durch die Kleinste- 

Quadrate-Methode: 

ˆα = ȳ − ˆβ¯x, 

n∑ 

(x i − ¯x)(y i − ȳ) 

ˆβ = 

i=1 

n∑ 

= ˜s XY 

(x i − ¯x) 2 ˜s 2 X 

i=1 

• als Lösung der Normalgleichungen: 

ˆα n + ˆβ 

n∑ 

x i = 

n∑ 

ˆα x i + ˆβ 

i=1 

i=1 i=1 

n∑ 

x 2 i = 

n∑ 

i=1 

y i 

n∑ 

x i y i 

i=1 

• Angepaÿte Werte: ŷ i = ˆα + ˆβx i , i = 1, . . . , n. 

• Residuen: ˆɛ i = y i − ŷ i , i = 1, . . . , n. 

n∑ 

• Streuungszerlegung: 

(y i − ŷ i ) 2 

∑ 

(y i − ȳ) 2 = n ∑ 

(ŷ i − ȳ) 2 + n 

n∑ 

(y i − ȳ) 2 i=1 

i=1 

i=1 

Gesamtstreuung 

i=1 

n∑ 

(ŷ i − ȳ) 2 = ˆβ ∑ 

2 n (x i − ¯x) 2 Durch Regression erklärte Streuung 

i=1 

i=1 

n∑ 

(y i − ŷ i ) 2 Residualstreuung 

i=1 

• Bestimmtheitsmaÿ (Determinationskoezient): 

R 2 = 

n∑ 

(ŷ i − ȳ) 2 

i=1 

n∑ 

= 1 − 

(y i − ȳ) 2 

i=1 

n∑ 

(y i − ŷ i ) 2 

i=1 

n∑ 

= 

(y i − ȳ) 2 

i=1 

( 

˜sXY 

˜s X ˜s Y 

) 2 

= r 2 XY 

• Prognose an einer Stelle x 0 : ŷ 0 = ˆα + ˆβx 0 



4 Zeitreihenanalyse 

Gegeben sei eine zeitlich geordnete Folge von n Beobachtungen eines Merkmals 

X: x 1 , x 2 , . . . , x n 

Graphische Darstellung 

• Zeitreihenpolygon: Darstellung der Werte {x t } 1≤t≤n in Abhängigkeit 

von t mit anschlieÿender linearer Interpolation. 

• Alternativ: Darstellung von x t in Abhängigkeit vom Datum der t-ten 

Messung mit anschlieÿender linearer Interpolation. 

Komponentenmodelle 

• Additives Komponentenmodell: 

Modellierung der Zeitreihe als: x t = 

g t 

}{{} 

Trend 

+ s t }{{} 

Saison 

• Multiplikatives Komponentenmodell: 

Modellierung der Zeitreihe als: x t = g t · s t · z t . 

+ z t }{{} 

Durch Logarithmieren kann ein multiplikatives Modell auf ein additives 

Komponentenmodell zurückgeführt werden: ln x }{{} t = ln g t + ln s }{{} t + ln z }{{} }{{} t 

x ⋆ t gt 

⋆ s ⋆ t zt 

⋆ 

Schätzung eines linearen Trends 

• Modell: g t = β 0 + β 1 · t 

• Schätzung der Parameter durch die KQ-Methode: 

Rest 

ˆβ 0 und ˆβ1 minimieren 

• Lösungen: (für t = 1, 2, . . . , n) 

ˆβ 1 = 

∑ 

12 n x t · t 

t=1 

n(n 2 − 1) − 

6¯x 

n − 1 

n∑ 

(x t − β 0 − β 1 · t) 2 

t=1 

und ˆβ0 = ¯x − ˆβ 1 

n + 1 

2 

• Geschätzte Trendfunktion: ĝ t = ˆβ 0 + ˆβ 1 · t 

• Trendbereinigte Zeitreihe: x t − ĝ t 



• Bestimmtheitsmaÿ: 

R 2 = 

∑ n 

t=1 (ĝ t − ¯x) 2 

∑ n 

t=1 (x t − ¯x) 2 = ˆβ2 1 n(n 2 − 1) 

12 ∑ n 

t=1 (x t − ¯x) 2 

• Exponentieller Trend: 

Durch Logarithmieren kann ein exponentielles Trendmodell der Form: 

g t = β 0 · β t 1 in ein lineares Trendmodell überführt werden. 

Schätzung einer konstanten Saisongur 

• Gegebene Periodizität: l 

Für j = 1, . . . , l sind x j , x l+j , x 2l+j , x 3l+j , . . . jeweils die Beobachtungen 

zur j-ten Periode (Quartal, Monat, o.ä.) 

• Annahme: (Konstante Saisongur) 

Für jedes j = 1, . . . , l gilt: s j = s l+j = s 2l+j = s 3l+j = · · · 

• Schätzung der s j : Arithmetische Mittel ŝ j = 1 m∑ 

j −1 

m j 

(x kl+j − ĝ kl+j ) 

k=0 

(Bemerkung: Falls n = m · l, dann m j = m für alle j) 

• Geschätzte Saisonkomponente: ŝ t = ŝ j falls t = j, l + j, 2l + j, 3l + j, . . . 

• Prognose (von x n+h , h ≥ 1): 

ˆx n+h = ĝ n+h + ŝ n+h (additiv) bzw. ˆx n+h = ĝ n+h · ŝ n+h (multiplikativ) 

5 Indexzahlen 

Klassikation der Verhältniszahlen 

• Gliederungszahl 

• Beziehungszahl 

• Meÿzahl (einfache/zusammengesetzte Indexzahl) 

Preis-, Mengen und Wertindizes 

Bezeichnungen 

• Bezeichnungen (Warenkorb mit m Gütern.) 

q 0i , p 0i : Menge und Preis des i-ten Gutes in der Basisperiode 0 

q ti , p ti : Menge und Preis des i-ten Gutes in der Berichtsperiode t 



• Preisindex nach Laspeyres: P L 0t = 

m∑ 

i=1 

m∑ 

i=1 

p ti q 0i 

p 0i q 0i 

• Preisindex nach Paasche: P P 0t = 

m∑ 

i=1 

m∑ 

i=1 

p ti q ti 

p 0i q ti 

• Mengenindex nach Laspeyres: Q L 0t = 

m∑ 

i=1 

m∑ 

i=1 

p 0i q ti 

p 0i q 0i 

• Mengenindex nach Paasche: Q P 0t = 

m∑ 

i=1 

m∑ 

i=1 

p ti q ti 

p ti q 0i 

• Wertindex: (auch: Umsatz- oder Ausgabenindex) W 0t = 

m∑ 

i=1 

m∑ 

i=1 

q ti p ti 

q 0i p 0i 

• Preisindex nach Fisher: P F 0t = √ P P 0tP L 0t 

Indexumrechnungen 

• Umbasierung: 

Gegeben sei eine Zeitreihe von Indexzahlen (zu einer festgelegten Basisperiode 

0): I 00 = 1, I 01 , I 02 , . . . , I 0k , . . . , I 0n 

I ⋆ kt = I 0t/I 0k ergibt die auf die neue Basisperiode k umbasierte Zeitreihe. 

• Verknüpfung: 

Gegeben seien zwei Zeitreihen von Indexzahlen, die sich in einer Periode 

(hier in t) überlappen: I 01 , I 02 , . . . , I 0t und I kt , I k,t+1 , . . . 

Fortführung der alten Zeitreihe: 

I ⋆ 0,t+h = I k,t+h · I0t 

I kt 

, h = 1, 2, . . . 

Rückrechnung der neuen Zeitreihe: 

I ⋆ k,t−h = I 0,t−h · Ikt 

I 0t 

, h = 1, 2, . . . 



• Verkettung: 

Gegeben sei eine Zeitreihe von Indexzahlen mit der jeweiligen Vorperiode 

als Basis: I 01 , I 12 , I 23 , I 34 , . . . 

I ⋆ 0t = I 01 · I 12 · · · I t−1,t bezeichnet die verkettete Zeitreihe mit gemeinsamer 

Basis 0. 

• Deationierung oder Preisbereinigung: Division einer nominalen 

Gröÿe V t durch einen sachlich zugehörigen Preisindex P 0t ergibt die 

reale (preisbereinigte) Gröÿe R t = V t /P 0t . 



6 Wahrscheinlichkeitsrechnung 

Kombinatorik 

Anzahl der möglichen Ziehungen von n Kugeln aus einer Urne mit N Kugeln: 

Reihenfolge wichtig 

Sortieren nicht erlaubt 

ohne Zurücklegen N · (N − 1) · · · (N − (n − 1)) 

Reihenfolge nicht wichtig 

Sortieren erlaubt 

( N 

n 

) 

( ) 

n + N − 1 

mit Zurücklegen N n = 

n 

( ) 

n + N − 1 

N − 1 

Binomialkoezienten 

• Denition: 

( n 

= 

k) 

n · (n − 1) · · · (n − (k − 1)) 

k · (k − 1) · · · 1 

= 

n! 

k!(n − k)! 

• Rechenregeln: 

( ( n n 

= = 1 

0) 

n) 

( n 

= 

k) 

( ( ) 

n 

n 

= 

n − k) 

k 

( ( ) 

n n 

= = n 

1) 

n − 1 

( ) n − 1 

+ 

k 

( ) n − 1 

k − 1 

Rechenregeln für Mengen 

• Kommutativgesetz: 

A ∩ B = B ∩ A 

A ∪ B = B ∪ A 

• Distributivgesetz: 

(A ∪ B) ∩ C = (A ∩ C) ∪ (B ∩ C) 

(A ∩ B) ∪ C = (A ∪ C) ∩ (B ∪ C) 

• Aus A ⊂ B folgt ¯B ⊂ Ā 

• Assoziativgesetz: 

(A ∩ B) ∩ C = A ∩ (B ∩ C) 

(A ∪ B) ∪ C = A ∪ (B ∪ C) 

• De Morgansche Regeln: 

(A ∪ B) = Ā ∩ ¯B 

(A ∩ B) = Ā ∪ ¯B 

• Für die Dierenzmenge A\B 

gilt: A\B = A ∩ ¯B 



Wahrscheinlichkeiten und Axiome von Kolmogoro 

• Endlicher Wahrscheinlichkeitsraum (Ω, P(Ω), P ) 

- Grundraum Ω = {ω 1 , ω 2 , . . . ω N } 

- Ereignisse P(Ω) = Menge aller Teilmengen A ⊂ Ω 

- Wahrscheinlichkeit P P (A) = Wahrscheinlichkeit für das Eintreten 

von A 

Die Wahrscheinlichkeitsverteilung P erfüllt die Axiome von Kolmogoro: 

(A1) (Nichtnegativität) P (A) ≥ 0 

(A2) (Normiertheit) P (Ω) = 1 

(A3) (Additivität) P (A ∪ B) = P (A) + P (B) für A ∩ B = ∅ 

• Für nicht endliche Wahrscheinlichkeitsräume wird das Axiom (A3) ersetzt 

durch das Axiom 

∞⋃ ∞∑ 

(A3') (σ−Additivität) P ( A k ) = P (A k ) für A i ∩A j = ∅, i ≠ j 

k=1 

k=1 

Rechenregeln für Wahrscheinlichkeiten 

1. P (∅) = 0, P (Ω) = 1, 0 ≤ P (A) ≤ 1 

2. A ⊆ B ⇒ P (A) ≤ P (B) 

3. P (Ā) = 1 − P (A) mit Ā = Ω\A 

4. Additionssatz: P (A ∪ B) = P (A) + P (B) − P (A ∩ B) 

5. P (A 1 ∪ A 2 ∪ · · · ∪ A n ) = P (A 1 ) + P (A 2 ) + · · · + P (A n ), 

falls A 1 , A 2 , . . . , A n paarweise disjunkt, d.h. A i ∩ A j = ∅ 

6. P (A 1 ∪ A 2 ∪ · · · A n ) ≤ P (A 1 ) + P (A 2 ) + · · · + P (A n ) 

7. Wenn die Elementarwahrscheinlichkeiten p i = P ({ω i }), i = 1, 2, . . . bekannt 

sind, 

dann gilt für die Wahrscheinlichkeit eines Ereignisses A: 

P (A) = ∑ 

P ({ω i }) = ∑ 

i:ω i ∈A 

i:ω i ∈A 

p i 



Laplace-Modell 

1. Annahme: Endlicher Grundraum Ω = {ω 1 , . . . , ω N } 

2. Annahme: P ({ω 1 }) = P ({ω 2 }) = · · · = P ({ω N }) 

Wahrscheinlichkeiten: P (A) = Anzahl ω i in A 

Anzahl ω i in Ω = #A 

#Ω = #A 

N 

Bedingte Wahrscheinlichkeit 

Bedingte Wahrscheinlichkeit von A gegeben B 

P (A|B) = 

P (A ∩ B) 

P (B) 

für A, B ⊂ Ω mit P (B) > 0 

Unabhängigkeit von Ereignissen 

• Zwei Ereignisse A und B heiÿen stochastisch unabhängig, wenn 

P (A ∩ B) = P (A) · P (B) 

• Ereignisse A 1 , . . . , A n heiÿen stochastisch unabhängig, wenn für jede Auswahl 

A i1 , . . . , A ik mit k ≤ n gilt: 

P (A i1 ∩ . . . ∩ A ik ) = P (A i1 ) · P (A i2 ) · · · P (A ik ) 

Multiplikationssatz 

• Für Ereignisse A 1 , . . . , A n gilt: 

P (A 1 ∩. . .∩A n ) = P (A 1 )·P (A 2 |A 1 )·P (A 3 |A 1 ∩A 2 ) · · · P (A n |A 1 ∩. . .∩A n−1 ) 

• Falls die Ereignisse A 1 , . . . , A n unabhängig sind, gilt: 

P (A 1 ∩ A 2 ∩ . . . ∩ A n ) = P (A 1 ) · P (A 2 ) · · · P (A n ) 

Totale Wahrscheinlichkeit und Satz von Bayes 

Seien A 1 , . . . , A n Ereignisse, die eine Zerlegung von Ω bilden (d.h. Ω ist disjunkte 

Vereinigung der A i ; es gilt: A i ≠ ∅, A i ∩A j = ∅, i ≠ j, und A 1 ∪A 2 ∪. . .∪A n = Ω). 



B sei ein Ereignis mit P (B) > 0. 

P (B|A k ) · P (A k ) = P (B ∩ A k ) = P (A k |B) · P (B) 

n∑ 

n∑ 

P (B) = P (B|A i ) · P (A i ) = P (B ∩ A i ) 

i=1 

i=1 

(totale Wahrscheinlichkeit) 

P (A k |B) = P (B|A k) · P (A k ) 

P (B) 

= P (B|A k) · P (A k ) 

n∑ 

P (B|A i ) · P (A i ) 

i=1 

(Satz von Bayes)

Formelsammlung fÃ¼r die Vorlesung Statistik A - UniversitÃ¤t Bonn

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?