Grafiken und Statistik in R
Grafiken und Statistik in R
Grafiken und Statistik in R
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Tabelle 9: Varianzfunktion <strong>und</strong> kanonische L<strong>in</strong>kfunktion wichtiger GLM mit dem Erwartungswert µ <strong>und</strong><br />
dem l<strong>in</strong>earen Prädiktor eta Xβ def<br />
= η<br />
Verteilung<br />
d. Fehler<br />
Varianzfkt.<br />
V (µ) 44<br />
Kanonische<br />
L<strong>in</strong>kfunktion<br />
Modellgleichung <strong>in</strong><br />
B<strong>in</strong>omialverteilung<br />
µ (1 − µ) η = ln (µ /(1 − µ)) y = eβx+a<br />
1+eβx+a b<strong>in</strong>omial()<br />
Poissonverteilung<br />
µ η = ln(µ) y = eβx+a poisson()<br />
Normalverteilung<br />
1 η = µ y = βx + a gaussian()<br />
Gammaverteilung<br />
µ 2 η = 1/µ y = 1<br />
βx+a<br />
Gamma()<br />
Invers - Normal µ 3 η = 1/µ 2 y = 1<br />
2√<br />
βx+a<br />
<strong>in</strong>verse.gaussian()<br />
Gr<strong>und</strong>gesamtheit Als Gr<strong>und</strong>gesamtheit bezeichnet man die Menge aller Objekte, Individuen oder Ereignisse,<br />
die bzgl. e<strong>in</strong>es Merkmals untersucht werden. D. h. die Gr<strong>und</strong>gesamtheit wird gebildet durch alle Objekte,<br />
Individuen oder Ereignisse, die überhaupt zur betrachteten Menge gehören können. Aus der Gr<strong>und</strong>gesamtheit<br />
wird e<strong>in</strong>e möglichst repräsentative Stichprobe ausgewählt, die dann bezüglich bestimmter Variablen<br />
untersucht wird. Sie stellt also nur e<strong>in</strong>en Teil der „Wirklichkeit“ dar. Maßzahlen der Stichprobe bekommen<br />
late<strong>in</strong>ische Buchstaben (¯x, s...) oder mit „Dach“ (ˆp, ˆ λ), Maßzahlen der Gr<strong>und</strong>gesamtheit h<strong>in</strong>gegen bekommen<br />
griechische Buchstaben (µ, σ,...) oder ohne „Dach“ (p, λ). Als abhängige Variable (response Variable)<br />
bezeichnet man diejenige Variable, deren Werte durch e<strong>in</strong>e oder mehrere andere Variable bestimmt werden.<br />
Diese heißen entsprechend unabhängige Variablen (erklärende oder Prädiktorvariable).<br />
H<br />
Hauptfaktorenanalyse Im Gegensatz zur PCA unterstellt die Hauptfaktorenanalyse, daß man nur e<strong>in</strong>en<br />
bestimmten Varianzanteil durch die Faktoren erklären kann der restliche Varianzanteil teilt sich sozusagen<br />
auf. Die Hauptfaktorenanalyse (Modell mit mehreren geme<strong>in</strong>samen Faktoren) nimmt an, daß die Varianz<br />
e<strong>in</strong>er Variable zu zerlegen ist:<br />
a ) <strong>in</strong> den Anteil, den diese Variable mit den restlichen Variablen geme<strong>in</strong>sam hat (geme<strong>in</strong>same Varianz)<br />
<strong>und</strong><br />
b ) Anteil, der alle<strong>in</strong> auf die spezifische Variable <strong>und</strong> den bei ihr auftretenden Meßfehler zurückzuführen ist<br />
(merkmalseigene Varianz).<br />
Nicht die gesamte Varianz, sondern alle<strong>in</strong> die geme<strong>in</strong>samen Varianzen der Variablen sollen durch das<br />
Modell der geme<strong>in</strong>samen Faktoren erklärt werden. Das Problem dabei ist die Schätzung der geme<strong>in</strong>samen<br />
Varianz. Ähnlich wie bei der Hauptkomponentenanalyse bezieht man nur die ersten k Hauptfaktoren <strong>in</strong> die<br />
Modellschätzung e<strong>in</strong>. Der Rest wird der Matrix zugerechnet. Die beiden Schritte der Hauptfaktorenanalyse,<br />
d.h. Kommunalitätenschätzung <strong>und</strong> Komponentenanalyse der Matrix, können auch iterativ wiederholt<br />
werden. Dazu werden die nach der ersten Schätzung erhaltenen Werte für die Matrix dazu verwendet, wieder<br />
e<strong>in</strong>e reduzierte Matrix zu berechnen, die dann wiederum zu neuen Schätzungen für die Ladungsmatrizen<br />
führt. Die Iterationen werden solange fortgeführt, bis beim n-ten Schritt e<strong>in</strong> Abbruchkriterium erfüllt ist<br />
oder die vore<strong>in</strong>gestellte Zahl von Iterationsschritten erreicht ist.<br />
44 Die Varianzfunktion beschreibt den E<strong>in</strong>fluß des Erwartungswerts auf die Varianz der Responsevariablen.<br />
162