07.01.2013 Aufrufe

Grafiken und Statistik in R

Grafiken und Statistik in R

Grafiken und Statistik in R

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Tabelle 9: Varianzfunktion <strong>und</strong> kanonische L<strong>in</strong>kfunktion wichtiger GLM mit dem Erwartungswert µ <strong>und</strong><br />

dem l<strong>in</strong>earen Prädiktor eta Xβ def<br />

= η<br />

Verteilung<br />

d. Fehler<br />

Varianzfkt.<br />

V (µ) 44<br />

Kanonische<br />

L<strong>in</strong>kfunktion<br />

Modellgleichung <strong>in</strong><br />

B<strong>in</strong>omialverteilung<br />

µ (1 − µ) η = ln (µ /(1 − µ)) y = eβx+a<br />

1+eβx+a b<strong>in</strong>omial()<br />

Poissonverteilung<br />

µ η = ln(µ) y = eβx+a poisson()<br />

Normalverteilung<br />

1 η = µ y = βx + a gaussian()<br />

Gammaverteilung<br />

µ 2 η = 1/µ y = 1<br />

βx+a<br />

Gamma()<br />

Invers - Normal µ 3 η = 1/µ 2 y = 1<br />

2√<br />

βx+a<br />

<strong>in</strong>verse.gaussian()<br />

Gr<strong>und</strong>gesamtheit Als Gr<strong>und</strong>gesamtheit bezeichnet man die Menge aller Objekte, Individuen oder Ereignisse,<br />

die bzgl. e<strong>in</strong>es Merkmals untersucht werden. D. h. die Gr<strong>und</strong>gesamtheit wird gebildet durch alle Objekte,<br />

Individuen oder Ereignisse, die überhaupt zur betrachteten Menge gehören können. Aus der Gr<strong>und</strong>gesamtheit<br />

wird e<strong>in</strong>e möglichst repräsentative Stichprobe ausgewählt, die dann bezüglich bestimmter Variablen<br />

untersucht wird. Sie stellt also nur e<strong>in</strong>en Teil der „Wirklichkeit“ dar. Maßzahlen der Stichprobe bekommen<br />

late<strong>in</strong>ische Buchstaben (¯x, s...) oder mit „Dach“ (ˆp, ˆ λ), Maßzahlen der Gr<strong>und</strong>gesamtheit h<strong>in</strong>gegen bekommen<br />

griechische Buchstaben (µ, σ,...) oder ohne „Dach“ (p, λ). Als abhängige Variable (response Variable)<br />

bezeichnet man diejenige Variable, deren Werte durch e<strong>in</strong>e oder mehrere andere Variable bestimmt werden.<br />

Diese heißen entsprechend unabhängige Variablen (erklärende oder Prädiktorvariable).<br />

H<br />

Hauptfaktorenanalyse Im Gegensatz zur PCA unterstellt die Hauptfaktorenanalyse, daß man nur e<strong>in</strong>en<br />

bestimmten Varianzanteil durch die Faktoren erklären kann der restliche Varianzanteil teilt sich sozusagen<br />

auf. Die Hauptfaktorenanalyse (Modell mit mehreren geme<strong>in</strong>samen Faktoren) nimmt an, daß die Varianz<br />

e<strong>in</strong>er Variable zu zerlegen ist:<br />

a ) <strong>in</strong> den Anteil, den diese Variable mit den restlichen Variablen geme<strong>in</strong>sam hat (geme<strong>in</strong>same Varianz)<br />

<strong>und</strong><br />

b ) Anteil, der alle<strong>in</strong> auf die spezifische Variable <strong>und</strong> den bei ihr auftretenden Meßfehler zurückzuführen ist<br />

(merkmalseigene Varianz).<br />

Nicht die gesamte Varianz, sondern alle<strong>in</strong> die geme<strong>in</strong>samen Varianzen der Variablen sollen durch das<br />

Modell der geme<strong>in</strong>samen Faktoren erklärt werden. Das Problem dabei ist die Schätzung der geme<strong>in</strong>samen<br />

Varianz. Ähnlich wie bei der Hauptkomponentenanalyse bezieht man nur die ersten k Hauptfaktoren <strong>in</strong> die<br />

Modellschätzung e<strong>in</strong>. Der Rest wird der Matrix zugerechnet. Die beiden Schritte der Hauptfaktorenanalyse,<br />

d.h. Kommunalitätenschätzung <strong>und</strong> Komponentenanalyse der Matrix, können auch iterativ wiederholt<br />

werden. Dazu werden die nach der ersten Schätzung erhaltenen Werte für die Matrix dazu verwendet, wieder<br />

e<strong>in</strong>e reduzierte Matrix zu berechnen, die dann wiederum zu neuen Schätzungen für die Ladungsmatrizen<br />

führt. Die Iterationen werden solange fortgeführt, bis beim n-ten Schritt e<strong>in</strong> Abbruchkriterium erfüllt ist<br />

oder die vore<strong>in</strong>gestellte Zahl von Iterationsschritten erreicht ist.<br />

44 Die Varianzfunktion beschreibt den E<strong>in</strong>fluß des Erwartungswerts auf die Varianz der Responsevariablen.<br />

162

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!