07.01.2013 Aufrufe

Grafiken und Statistik in R

Grafiken und Statistik in R

Grafiken und Statistik in R

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Manhattan-Metrik<br />

(auch City-Block-Metrik) Dies ist e<strong>in</strong> metrisches System, basierend auf e<strong>in</strong>em Grid. Die<br />

Entfernung zwischen zwei Punkten wird def<strong>in</strong>iert bezüglich e<strong>in</strong>es rechtw<strong>in</strong>kligen Abstandes<br />

oder der Anzahl von Gridzellen <strong>in</strong> jeder Richtung. Bei diesem Distanzmaß bleiben<br />

Korrelationen zwischen den Merkmalen unberücksichtigt <strong>und</strong> hohe Unterschiede werden<br />

stark gewichtet. (Ist e<strong>in</strong> Spezialfall der sog. M<strong>in</strong>kowski -Distanz.), s.a Distanzmaße.<br />

Mann-Whitney-U-Test Besteht der Verdacht, daß die Voraussetzungen für e<strong>in</strong>en t - Test verletzt se<strong>in</strong> könnten,<br />

kann am besten der U-Test von Mann <strong>und</strong> Withney berechnet werden.<br />

(Quelle: http://www.wu-wien.ac.at/<strong>in</strong>st/ivm/strunk/pdf/<strong>Statistik</strong>Glossar.pdf).<br />

Mantel - Test Der Manteltest vergleicht die Ähnlichkeit zweier Distanzmatritzen. Er kann <strong>in</strong> mit<br />

mantel(...) aus dem package vegan durchgeführt werden. die Nullhypothese H0 lautet: die Matrizen s<strong>in</strong>d<br />

verschieden. Siehe auch Prokrustes-Test.<br />

Maximum Likelihood-Schätzung ((von engl. maximale Wahrsche<strong>in</strong>lichkeit)) Statistisches Schätzverfahren, das<br />

eigentlich aus der Stochastik kommt. Die Logik ist etwa diese. Gegeben s<strong>in</strong>d Daten e<strong>in</strong>er Stichprobe <strong>und</strong><br />

Annahmen über die Verteilung der relevanten Variablen. Wir prüfen nun, bei welchem (oder welchen)<br />

Parameter(n) <strong>in</strong> der Gr<strong>und</strong>gesamtheit die gegebenen Daten am wahrsche<strong>in</strong>lichsten s<strong>in</strong>d; der betreffende<br />

Wert gilt dann als bester Schätzer für den oder die Parameter. Es muß also das Maximum e<strong>in</strong>er Funktion<br />

gef<strong>und</strong>en werden, die sich auf diese Wahrsche<strong>in</strong>lichkeiten bezieht, daher der Name Maximum Likelihood. Die<br />

betreffende Funktion heißt Likelihood-Funktion. Was sehr abstrakt kl<strong>in</strong>gt, hat manchmal praktische Folgen:<br />

1. Die Likelihood-Funktion kann bei manchen Verteilungen mehrere (lokale) Maxima haben. Hier ist nicht<br />

sichergestellt, daß tatsächlich das absolute Maximum gef<strong>und</strong>en wird.<br />

2. Manchmal hat (bei gegebenen Daten) die Likelihood-Funktion tatsächlich ke<strong>in</strong> Maximum <strong>und</strong> die<br />

(iterative) Schätzung konvergiert nicht. Manche Programme teilen den Benutzern mit, wenn dieser Fall<br />

vorzuliegen sche<strong>in</strong>t; andere (so SPSS) behelfen sich teilweise mit (nicht näher erläuterten) Tricks (man<br />

kann dann Parameter, die eigentlich gar nicht geschätzt werden können, an übergroßen Standardfehlern<br />

erkennen).<br />

(Quelle: http://www.lrz-muenchen.de/~wlm/ilm_m3.htm).<br />

Median Der Median oder auch Zentralwert e<strong>in</strong>er Verteilung ist der Wert, der e<strong>in</strong>e nach ihrer Größe geordnete<br />

Rangreihe halbiert. Der Median ist der Wert, von dem alle übrigen Werte so abweichen, daß die Summe<br />

der Absolutbeträge e<strong>in</strong> M<strong>in</strong>imum ergibt. Bei geradzahligem N liegt er zwischen den beiden Meßwerten. Der<br />

Median setzt m<strong>in</strong>destens Ord<strong>in</strong>alskalenniveau voraus. Der Median wird auch als „50. Zentil“ bezeichnet; er<br />

liegt immer zwischen dem arithmetischen Mittel (s. arithmetisches Mittel) <strong>und</strong> dem Modalwert, wenn er nicht<br />

mit ihnen zusammenfällt. Er eignet sich also auch gut bei sehr asymmetrischen Verteilungen, Verteilungen<br />

mit offenen Klassen <strong>und</strong> bei Ord<strong>in</strong>alskalierung (s. Ord<strong>in</strong>alskala).<br />

Median - Cluster<strong>in</strong>g<br />

Diese Methode ähnelt dem Zentroid Clusteranalyse<strong>in</strong>g, es besteht jedoch<br />

folgender Unterschied: Bei der Zentroid - Methode ergibt sich der Zentroid<br />

e<strong>in</strong>es neuen Clusters als gewogenes Mittel aus den beiden Zentroiden der<br />

Ausgangs - Cluster, wobei die Fallzahlen der Ausgangscluster die Gewichte<br />

bilden. Beim Median - Cluster<strong>in</strong>g wird der Zentroid e<strong>in</strong>es neuen Clusters<br />

dagegen als arithmetisches (ungewichtetes) Mittel der beiden Zentroide der Ausgangscluster berechnet.<br />

(s.a.Cluster Analyse Verfahren).<br />

Medoid siehe k - medoid.<br />

167

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!