07.01.2013 Aufrufe

Grafiken und Statistik in R

Grafiken und Statistik in R

Grafiken und Statistik in R

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

4.3 Regressionsanalyse<br />

y<br />

160 170 180 190 200<br />

●<br />

●<br />

●<br />

●<br />

● ●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

●<br />

20 30 40 50 60 70<br />

x<br />

4 <strong>Statistik</strong><br />

...Fortsetzung Modellbeschreibung<br />

log(y)~x1+x2 Multiple Regression der transformierten Variable log(y) auf x1 <strong>und</strong> x2 mit<br />

y~poly(x,2),<br />

y~1+x+I(x^2)<br />

e<strong>in</strong>em impliziten Intercept<br />

Polynomiale Regression vom Grade 2. Die erste Formel benutzt orthogonale<br />

Polynome <strong>und</strong> die zweite benutzt explizite Potenzen (Modell mit explizit<br />

quadratischen Potenzen) als Basis-Gr<strong>und</strong>lage.<br />

y~poly(x,3) Polynomiale Regression vom Grade 3, also kubische Regression mit orthogonalen<br />

Polynomen<br />

y~X+poly(x,2) Multiple Regression mit e<strong>in</strong>er Designmatrix die aus der Matrix X, sowie aus<br />

orthogonalen Termen <strong>in</strong> x vom Grade 2<br />

y~A ANOVA-Modell mit Klassen, die durch den Faktor A bestimmt s<strong>in</strong>d<br />

y~A+x ANOVA-Modell mit Kovariable x<br />

y~A*B, y~A+B+A:B,<br />

y~B%<strong>in</strong>%A, y~A/B<br />

2-Faktor nichtadditives Modell von y auf A <strong>und</strong> B. Die ersten beiden Formeln<br />

bezeichnen die gleiche „gekreuzte“ Klassifikation <strong>und</strong> die anderen beiden die<br />

gleiche „nested“ Klassifikation. Abstrakt gesehen bezeichnen alle 4 Formeln<br />

das gleiche zugr<strong>und</strong>eliegenden Modell.<br />

y~(A+B+C)^2,<br />

Beide Formeln bezeichnen das selbe Modell, e<strong>in</strong> Experiment mit 3 Faktoren<br />

y~A*B*C-A:B:C<br />

<strong>und</strong> e<strong>in</strong>em Modell mit Ma<strong>in</strong> Effects aber lediglich zwei Interaktionen<br />

y~. e<strong>in</strong> Modell mit allen Parametern, die es gibt wird berechnet<br />

y~. + Condition(A+B) bei CCA mit Paket vegan: Modell mit allen Variablen <strong>und</strong> Covariablen A <strong>und</strong><br />

B herausgerechnet<br />

4.2 Zahlen generieren - Zufallszahlen, Verteilungen<br />

Um Zufallszahlen für jeden reproduzierbar zu machen, kann man mit set.seeds(28) z.B. den Zufallsgenerator<br />

zw<strong>in</strong>gen bei 28 anzufangen.<br />

# Normalverteilung – rnorm(...)<br />

plot(rnorm(2000),rnorm(2000, mean=3 , sd=0.5)) # 20000 Zufallszahlen der Normalverteilung<br />

� mean Mittelwertangabe, sd Standardabweichung<br />

plot(runif(2000, m<strong>in</strong>=0.2, max=0.8)) # 2000 Zufallszahlen gleichmäßig gestreut<br />

� m<strong>in</strong> <strong>und</strong> max müssen zwischen 0, 1 liegen.<br />

hist(rnorm(1000, mean=103, sd=2), density=30, freq=F) # Mittel=103 & Standardabweichung 2<br />

l<strong>in</strong>es(density(103,2), col="red") # L<strong>in</strong>ie dazuzeichnen<br />

# Poissonverteilung – rpois(...)<br />

hist(rpois(1000,103), density=30, freq=F, nclass=10)<br />

� rpois(1000,103) 1000 Wiederholungen mit λ = 103 (Anm.: λ ist der Lageparameter der Poissonverteilung, wie das arithmetisches<br />

Mittel für die Normalverteilung), theoretisch kann man auch sagen dies ist die Wahrsche<strong>in</strong>lichkeitsverteilung, um bei 1000 Versuchen<br />

aus e<strong>in</strong>er Population genau 103 Tiere zu zählen<br />

# B<strong>in</strong>omialverteilung – rb<strong>in</strong>om(...)<br />

hist(rb<strong>in</strong>om(1000,103,0.99), density=30, freq=F)<br />

� die Wahrsche<strong>in</strong>lichkeitsverteilung den Wert 103 mit e<strong>in</strong>er Wahrsche<strong>in</strong>lichkeit von p = 0.99 zu ziehen oder nicht zu ziehen, wird mit<br />

1000 Zahlen simuliert.<br />

4.3 Regressionsanalyse<br />

Sehr ausführlich unter http://www-m1.ma.tum.de/nbu/modreg/. E<strong>in</strong> H<strong>in</strong>weis: es gibt im Anhang auf Seite 210<br />

e<strong>in</strong>e Benutzerfunktion modelEquation(lm-modell, ndigits, format), um l<strong>in</strong>eare Modellgleichungen <strong>in</strong> <strong>Grafiken</strong><br />

darzustellen. Für die generelle grafische Darstellung von Regressionen gibt es die Funktionen termplot.<br />

90

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!