Grafiken und Statistik in R
Grafiken und Statistik in R
Grafiken und Statistik in R
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
B<br />
am Ähnlichsten ist, hat die Autokorrelation für die unverschobenen Folgen den Wert 1. Wenn zwischen<br />
den Gliedern der Folge e<strong>in</strong>e Beziehung besteht, hat auch die Korrelation der ursprünglichen Folge mit<br />
der verschobenen Folge e<strong>in</strong>en Wert wesentlich größer als 0. Man sagt dann die Glieder der Folge s<strong>in</strong>d<br />
autokorreliert. Quelle: http://de.wikipedia.org/wiki/Autokorrelation.<br />
Bayes Ansatz Bayes <strong>Statistik</strong> (Orig<strong>in</strong>al siehe Bayes 1763) ist e<strong>in</strong>e recht vielversprechende Richtung der<br />
<strong>Statistik</strong>, bei der es ke<strong>in</strong>e „schwarz/weiß Aussagen“ gibt, sondern „Graustufen“ <strong>und</strong> die Information der<br />
Unsicherheit mit e<strong>in</strong>fließt. Dies wird dadurch erreicht, daß (allen) bekannten Ereignissen Wahrsche<strong>in</strong>lichkeiten<br />
zugerechnet werden. Es spielt sich also alles <strong>in</strong>nerhalb von 0 bis 1 ab (beliebig komplex). Genereller Ablauf:<br />
Daten + Prior (=Annahmen) → Bayes Theorem → Posterior, wobei dann mit der Posterior-Verteilung<br />
modelliert wird. Klassische <strong>Statistik</strong> beschäftigt sich vielmehr (nur) mit dem l<strong>in</strong>ken Teil.<br />
Bestimmtheitsmaß Das Bestimmtheitsmaß oder der Determ<strong>in</strong>ationskoeffizient wird <strong>in</strong> der <strong>Statistik</strong> dazu verwendet,<br />
den Zusammenhang von bei der Varianz-, Korrelations- <strong>und</strong> Regressionsanalyse untersuchten Datenreihen<br />
(Variablen) anzugeben. Es wird oft mit R2 abgekürzt <strong>und</strong> liegt zwischen 0 (ke<strong>in</strong> Zusammenhang)<br />
<strong>und</strong> 1 (starker Zusammenhang). Das Bestimmtheitsmaß ist das Quadrat des Pearson’schen Korrelationskoeffizienten.<br />
(s.Rangkorrelationskoeffizienten) Es gibt an, <strong>in</strong> welchem Maße die Varianz e<strong>in</strong>er Variablen durch<br />
die Varianz e<strong>in</strong>er anderen Variablen bestimmt wird. Das Bestimmtheitsmaß ist e<strong>in</strong> Maß für den l<strong>in</strong>earen Zusammenhangs<br />
zweier Meßreihen bzw. Variablen. Ist R2 = 0.6, so werden 60% der Varianz durch das Modell<br />
erklärt. Das Bestimmtheitsmaß sagt allerd<strong>in</strong>gs nichts über die Signifikanz des ermittelten Zusammenhangs<br />
aus. Dazu muß zusätzlich e<strong>in</strong> Signifikanztest durchgeführt werden.<br />
Angepaßtes Bestimmtheitsmaß: R2 = n−1<br />
n−k (1 − R2 ) (http://de.wikipedia.org)<br />
E<strong>in</strong> Problem des Bestimmtheitsmaßes R2 ist, daß dieses bei H<strong>in</strong>zufügen e<strong>in</strong>es weiteren, aber evtl. ungeeig-<br />
neten Regressors, nicht kle<strong>in</strong>er werden kann. Das Angepaßte Bestimmtheitsmaß (R2 ) steigt dagegen nur,<br />
auszugleichen <strong>und</strong> kann auch<br />
falls R 2 ausreichend steigt, um den gegenläufigen Effekt des Quotienten n−1<br />
n−k<br />
s<strong>in</strong>ken. Auf diese Weise läßt sich R 2 als Entscheidungskriterium bei der Auswahl zwischen zwei alternativen<br />
Modellspezifikationen (etwa e<strong>in</strong>em restr<strong>in</strong>gierten <strong>und</strong> e<strong>in</strong>em unrestr<strong>in</strong>gierten Modell) verwenden.<br />
B<strong>in</strong>omialverteilung Die B<strong>in</strong>omialverteilung 33 beschreibt die Verteilung die entsteht, wenn das Ereignis, welches<br />
e<strong>in</strong>tritt die Werte 0 <strong>und</strong> 1 annimmt. E<strong>in</strong> Beispiel ist das Ziehen von roten <strong>und</strong> weißen Kugeln aus e<strong>in</strong>er Urne,<br />
oder das werfen e<strong>in</strong>er Münze. Da die B<strong>in</strong>omialverteilung nur diskrete Werte annehmen kann heißt sie auch<br />
diskret. Das Gegenteil wäre stetig, d.h. es können ∞ Werte angenommen werden. Siehe auch Verteilungen.<br />
bias Beispiel aus (Köhler et. al 1996): das Körpergewicht e<strong>in</strong>er Person wird mit e<strong>in</strong>er Badezimmerwaage<br />
bestimmt. Ist die verwendete Waage alt <strong>und</strong> die Feder ausgeleiert, so wird wegen dieses systematischen<br />
Fehlers im Mittel e<strong>in</strong> zu hohes Körpergewicht angezeigt werden. Diese systematische Abweichung (Bias 34 ) des<br />
gemessenen Mittelwertes vom wahren Körpergewicht wäre auf mangelnde Treffgenauigkeit zurückzuführen.<br />
Präzision h<strong>in</strong>gegen ist die Streuung um den experimentellen Mittelwert.<br />
BIC Das BIC (Bayesianisches Informationskritierium; nach engl.: Bayesian Information Criterion) ist e<strong>in</strong> Maß<br />
zur Beurteilung der „Güte“ von multivariaten Modellen, die auf Maximum Likelihood-Schätzungen basieren<br />
(beispielsweise die logistische Regression <strong>und</strong> verwandte Verfahren). Es soll vor allem helfen, unterschiedliche<br />
nicht-geschachtelte Modelle (über den gleichen Datensatz!) untere<strong>in</strong>ander zu vergleichen. (Nicht-geschachtelte<br />
Modelle s<strong>in</strong>d solche, von denen sich nicht e<strong>in</strong>es als „Unterfall“ des anderen verstehen läßt, anders formuliert,<br />
von denen jedes m<strong>in</strong>destens e<strong>in</strong>e Variable enthält, die <strong>in</strong> dem jeweils anderen Modell nicht enthalten ist.) E<strong>in</strong><br />
Modell paßt umso besser zu den Daten (oder umgekehrt), je kle<strong>in</strong>er der Wert des BIC ist. E<strong>in</strong>e Alternative<br />
zum BIC, die <strong>in</strong> jüngster Zeit jedoch manchmal als weniger brauchbar beurteilt wird, ist das AIC. (Quelle:<br />
http://www.lrz-muenchen.de/~wlm/ilm_b7.htm).<br />
33 b<strong>in</strong>omisch = zweigliedrig<br />
34 auch „statistische Verzerrung“<br />
153