Grafiken und Statistik in R
Grafiken und Statistik in R
Grafiken und Statistik in R
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Manhattan-Metrik<br />
(auch City-Block-Metrik) Dies ist e<strong>in</strong> metrisches System, basierend auf e<strong>in</strong>em Grid. Die<br />
Entfernung zwischen zwei Punkten wird def<strong>in</strong>iert bezüglich e<strong>in</strong>es rechtw<strong>in</strong>kligen Abstandes<br />
oder der Anzahl von Gridzellen <strong>in</strong> jeder Richtung. Bei diesem Distanzmaß bleiben<br />
Korrelationen zwischen den Merkmalen unberücksichtigt <strong>und</strong> hohe Unterschiede werden<br />
stark gewichtet. (Ist e<strong>in</strong> Spezialfall der sog. M<strong>in</strong>kowski -Distanz.), s.a Distanzmaße.<br />
Mann-Whitney-U-Test Besteht der Verdacht, daß die Voraussetzungen für e<strong>in</strong>en t - Test verletzt se<strong>in</strong> könnten,<br />
kann am besten der U-Test von Mann <strong>und</strong> Withney berechnet werden.<br />
(Quelle: http://www.wu-wien.ac.at/<strong>in</strong>st/ivm/strunk/pdf/<strong>Statistik</strong>Glossar.pdf).<br />
Mantel - Test Der Manteltest vergleicht die Ähnlichkeit zweier Distanzmatritzen. Er kann <strong>in</strong> mit<br />
mantel(...) aus dem package vegan durchgeführt werden. die Nullhypothese H0 lautet: die Matrizen s<strong>in</strong>d<br />
verschieden. Siehe auch Prokrustes-Test.<br />
Maximum Likelihood-Schätzung ((von engl. maximale Wahrsche<strong>in</strong>lichkeit)) Statistisches Schätzverfahren, das<br />
eigentlich aus der Stochastik kommt. Die Logik ist etwa diese. Gegeben s<strong>in</strong>d Daten e<strong>in</strong>er Stichprobe <strong>und</strong><br />
Annahmen über die Verteilung der relevanten Variablen. Wir prüfen nun, bei welchem (oder welchen)<br />
Parameter(n) <strong>in</strong> der Gr<strong>und</strong>gesamtheit die gegebenen Daten am wahrsche<strong>in</strong>lichsten s<strong>in</strong>d; der betreffende<br />
Wert gilt dann als bester Schätzer für den oder die Parameter. Es muß also das Maximum e<strong>in</strong>er Funktion<br />
gef<strong>und</strong>en werden, die sich auf diese Wahrsche<strong>in</strong>lichkeiten bezieht, daher der Name Maximum Likelihood. Die<br />
betreffende Funktion heißt Likelihood-Funktion. Was sehr abstrakt kl<strong>in</strong>gt, hat manchmal praktische Folgen:<br />
1. Die Likelihood-Funktion kann bei manchen Verteilungen mehrere (lokale) Maxima haben. Hier ist nicht<br />
sichergestellt, daß tatsächlich das absolute Maximum gef<strong>und</strong>en wird.<br />
2. Manchmal hat (bei gegebenen Daten) die Likelihood-Funktion tatsächlich ke<strong>in</strong> Maximum <strong>und</strong> die<br />
(iterative) Schätzung konvergiert nicht. Manche Programme teilen den Benutzern mit, wenn dieser Fall<br />
vorzuliegen sche<strong>in</strong>t; andere (so SPSS) behelfen sich teilweise mit (nicht näher erläuterten) Tricks (man<br />
kann dann Parameter, die eigentlich gar nicht geschätzt werden können, an übergroßen Standardfehlern<br />
erkennen).<br />
(Quelle: http://www.lrz-muenchen.de/~wlm/ilm_m3.htm).<br />
Median Der Median oder auch Zentralwert e<strong>in</strong>er Verteilung ist der Wert, der e<strong>in</strong>e nach ihrer Größe geordnete<br />
Rangreihe halbiert. Der Median ist der Wert, von dem alle übrigen Werte so abweichen, daß die Summe<br />
der Absolutbeträge e<strong>in</strong> M<strong>in</strong>imum ergibt. Bei geradzahligem N liegt er zwischen den beiden Meßwerten. Der<br />
Median setzt m<strong>in</strong>destens Ord<strong>in</strong>alskalenniveau voraus. Der Median wird auch als „50. Zentil“ bezeichnet; er<br />
liegt immer zwischen dem arithmetischen Mittel (s. arithmetisches Mittel) <strong>und</strong> dem Modalwert, wenn er nicht<br />
mit ihnen zusammenfällt. Er eignet sich also auch gut bei sehr asymmetrischen Verteilungen, Verteilungen<br />
mit offenen Klassen <strong>und</strong> bei Ord<strong>in</strong>alskalierung (s. Ord<strong>in</strong>alskala).<br />
Median - Cluster<strong>in</strong>g<br />
Diese Methode ähnelt dem Zentroid Clusteranalyse<strong>in</strong>g, es besteht jedoch<br />
folgender Unterschied: Bei der Zentroid - Methode ergibt sich der Zentroid<br />
e<strong>in</strong>es neuen Clusters als gewogenes Mittel aus den beiden Zentroiden der<br />
Ausgangs - Cluster, wobei die Fallzahlen der Ausgangscluster die Gewichte<br />
bilden. Beim Median - Cluster<strong>in</strong>g wird der Zentroid e<strong>in</strong>es neuen Clusters<br />
dagegen als arithmetisches (ungewichtetes) Mittel der beiden Zentroide der Ausgangscluster berechnet.<br />
(s.a.Cluster Analyse Verfahren).<br />
Medoid siehe k - medoid.<br />
167