Grafiken und Statistik in R
Grafiken und Statistik in R
Grafiken und Statistik in R
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
4.3 Regressionsanalyse<br />
y<br />
160 170 180 190 200<br />
●<br />
●<br />
●<br />
●<br />
● ●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
●<br />
20 30 40 50 60 70<br />
x<br />
4 <strong>Statistik</strong><br />
...Fortsetzung Modellbeschreibung<br />
log(y)~x1+x2 Multiple Regression der transformierten Variable log(y) auf x1 <strong>und</strong> x2 mit<br />
y~poly(x,2),<br />
y~1+x+I(x^2)<br />
e<strong>in</strong>em impliziten Intercept<br />
Polynomiale Regression vom Grade 2. Die erste Formel benutzt orthogonale<br />
Polynome <strong>und</strong> die zweite benutzt explizite Potenzen (Modell mit explizit<br />
quadratischen Potenzen) als Basis-Gr<strong>und</strong>lage.<br />
y~poly(x,3) Polynomiale Regression vom Grade 3, also kubische Regression mit orthogonalen<br />
Polynomen<br />
y~X+poly(x,2) Multiple Regression mit e<strong>in</strong>er Designmatrix die aus der Matrix X, sowie aus<br />
orthogonalen Termen <strong>in</strong> x vom Grade 2<br />
y~A ANOVA-Modell mit Klassen, die durch den Faktor A bestimmt s<strong>in</strong>d<br />
y~A+x ANOVA-Modell mit Kovariable x<br />
y~A*B, y~A+B+A:B,<br />
y~B%<strong>in</strong>%A, y~A/B<br />
2-Faktor nichtadditives Modell von y auf A <strong>und</strong> B. Die ersten beiden Formeln<br />
bezeichnen die gleiche „gekreuzte“ Klassifikation <strong>und</strong> die anderen beiden die<br />
gleiche „nested“ Klassifikation. Abstrakt gesehen bezeichnen alle 4 Formeln<br />
das gleiche zugr<strong>und</strong>eliegenden Modell.<br />
y~(A+B+C)^2,<br />
Beide Formeln bezeichnen das selbe Modell, e<strong>in</strong> Experiment mit 3 Faktoren<br />
y~A*B*C-A:B:C<br />
<strong>und</strong> e<strong>in</strong>em Modell mit Ma<strong>in</strong> Effects aber lediglich zwei Interaktionen<br />
y~. e<strong>in</strong> Modell mit allen Parametern, die es gibt wird berechnet<br />
y~. + Condition(A+B) bei CCA mit Paket vegan: Modell mit allen Variablen <strong>und</strong> Covariablen A <strong>und</strong><br />
B herausgerechnet<br />
4.2 Zahlen generieren - Zufallszahlen, Verteilungen<br />
Um Zufallszahlen für jeden reproduzierbar zu machen, kann man mit set.seeds(28) z.B. den Zufallsgenerator<br />
zw<strong>in</strong>gen bei 28 anzufangen.<br />
# Normalverteilung – rnorm(...)<br />
plot(rnorm(2000),rnorm(2000, mean=3 , sd=0.5)) # 20000 Zufallszahlen der Normalverteilung<br />
� mean Mittelwertangabe, sd Standardabweichung<br />
plot(runif(2000, m<strong>in</strong>=0.2, max=0.8)) # 2000 Zufallszahlen gleichmäßig gestreut<br />
� m<strong>in</strong> <strong>und</strong> max müssen zwischen 0, 1 liegen.<br />
hist(rnorm(1000, mean=103, sd=2), density=30, freq=F) # Mittel=103 & Standardabweichung 2<br />
l<strong>in</strong>es(density(103,2), col="red") # L<strong>in</strong>ie dazuzeichnen<br />
# Poissonverteilung – rpois(...)<br />
hist(rpois(1000,103), density=30, freq=F, nclass=10)<br />
� rpois(1000,103) 1000 Wiederholungen mit λ = 103 (Anm.: λ ist der Lageparameter der Poissonverteilung, wie das arithmetisches<br />
Mittel für die Normalverteilung), theoretisch kann man auch sagen dies ist die Wahrsche<strong>in</strong>lichkeitsverteilung, um bei 1000 Versuchen<br />
aus e<strong>in</strong>er Population genau 103 Tiere zu zählen<br />
# B<strong>in</strong>omialverteilung – rb<strong>in</strong>om(...)<br />
hist(rb<strong>in</strong>om(1000,103,0.99), density=30, freq=F)<br />
� die Wahrsche<strong>in</strong>lichkeitsverteilung den Wert 103 mit e<strong>in</strong>er Wahrsche<strong>in</strong>lichkeit von p = 0.99 zu ziehen oder nicht zu ziehen, wird mit<br />
1000 Zahlen simuliert.<br />
4.3 Regressionsanalyse<br />
Sehr ausführlich unter http://www-m1.ma.tum.de/nbu/modreg/. E<strong>in</strong> H<strong>in</strong>weis: es gibt im Anhang auf Seite 210<br />
e<strong>in</strong>e Benutzerfunktion modelEquation(lm-modell, ndigits, format), um l<strong>in</strong>eare Modellgleichungen <strong>in</strong> <strong>Grafiken</strong><br />
darzustellen. Für die generelle grafische Darstellung von Regressionen gibt es die Funktionen termplot.<br />
90