25.12.2013 Aufrufe

PDF-Download - Deutsche Geodätische Kommission

PDF-Download - Deutsche Geodätische Kommission

PDF-Download - Deutsche Geodätische Kommission

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

40 KAPITEL 5. ÄHNLICHKEITS- UND DISTANZMASSE<br />

Ähnlichkeitsmaß Haus 1-2 Haus 1-3 Haus 2-3<br />

M-Koeffizient 1/4 1/2 1/4<br />

S-Koeffizient 1/4 1/3 1/4<br />

Tanimoto-Koeffizient 1/7 1/3 1/7<br />

Tabelle 5.2: Ähnlichkeitsmaße zu Tabelle 5.1.<br />

es, diese Variable als binären Vektor aller möglichen Ausprägungen zu betrachten (Tab. 5.3) und dann, wie im<br />

binären Fall, den M- S- oder Tanimoto/Rogers-Koeffizient zu berechnen. Nach Tabelle 5.3 ist es offensichtlich,<br />

dass Haus 1 und 2 (bzgl. Dachform) eine Ähnlichkeit von 1 haben und in den beiden anderen Fällen eine<br />

Ähnlichkeit von 0 besteht. Wie man jedoch in Tabelle 5.4 sieht, liefern der M- und Tanimoto/Rogers-Koeffizient<br />

in diesen Fällen eine Ähnlichkeit ungleich 0. Nur der S-Koeffizient und der verallgemeinerte M-Koeffizient<br />

liefern hier das erwartete Ergebnis. Der verallgemeinerte M-Koeffizient macht jedoch erst im Falle mehrerer<br />

nicht-binärer Variablen Sinn (siehe Tabelle 5.5 und 5.6).<br />

Dachform Haus 1 Haus 2 Haus 3<br />

Satteldach nein nein ja<br />

Flachdach ja ja nein<br />

Walmdach nein nein nein<br />

Pultdach nein nein nein<br />

Tabelle 5.3: Beispiel für ein nominales Merkmal.<br />

Ähnlichkeitsmaß Haus 1-2 Haus 1-3 Haus 2-3<br />

M-Koeffizient 1 1/2 1/2<br />

S-Koeffizient 1 0 0<br />

Tanimoto-Koeffizient 1 1/3 1/3<br />

Verallg. M-Koeffizient 1 0 0<br />

Tabelle 5.4: Ähnlichkeitsmaße zu Tabelle 5.3.<br />

Die Interpretation einer nicht-binären nominalen Variablen macht jedoch Sinn, wenn man binäre und nichtbinäre<br />

Merkmale zusammen betrachtet. Die Tabellen 5.7 und 5.8 zeigen ein Beispiel für diesen Fall. Das Problem<br />

bei dieser Vorgehensweise ist jedoch, dass im Vergleich zu dem ”<br />

binarisierten“ nominalen Merkmal (Dachform),<br />

die Ähnlichkeit aufgrund des Nicht-Vorhandenseins der binären Merkmale (Parkett, Terrasse, etc.) verloren<br />

geht. Diese Art der Verzerrung kann man ausgleichen, indem man, wie in Tabelle 5.9 dargestellt, auch für die<br />

binären Variablen den inversen (negierten) Fall berücksichtigt. Die Ähnlichkeitsmaße ändern sich dann, wie in<br />

Tabelle 5.10 dargestellt.<br />

5.2.4 Ähnlichkeitsmaße für quantitative Skalentypen<br />

Korrelationskoeffizient<br />

Bei der Analyse von quantitativen Daten kommt es häufig vor, dass man bei einer Stichprobe gleichzeitig<br />

zwei Eigenschaften (Merkmale) erfasst, wie z.B. die monatliche Sonnenscheindauer vormittags und nachmittags<br />

oder der Kopfumfang und die Körperlänge von Neugeborenen. Möchte man nun feststellen, ob ein direkter<br />

Zusammenhang zwischen beiden Größen besteht, bietet es sich an, den sogenannten Korrelationskoeffizienten<br />

beider Größen zu bestimmen.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!