PDF-Download - Deutsche Geodätische Kommission
PDF-Download - Deutsche Geodätische Kommission
PDF-Download - Deutsche Geodätische Kommission
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
40 KAPITEL 5. ÄHNLICHKEITS- UND DISTANZMASSE<br />
Ähnlichkeitsmaß Haus 1-2 Haus 1-3 Haus 2-3<br />
M-Koeffizient 1/4 1/2 1/4<br />
S-Koeffizient 1/4 1/3 1/4<br />
Tanimoto-Koeffizient 1/7 1/3 1/7<br />
Tabelle 5.2: Ähnlichkeitsmaße zu Tabelle 5.1.<br />
es, diese Variable als binären Vektor aller möglichen Ausprägungen zu betrachten (Tab. 5.3) und dann, wie im<br />
binären Fall, den M- S- oder Tanimoto/Rogers-Koeffizient zu berechnen. Nach Tabelle 5.3 ist es offensichtlich,<br />
dass Haus 1 und 2 (bzgl. Dachform) eine Ähnlichkeit von 1 haben und in den beiden anderen Fällen eine<br />
Ähnlichkeit von 0 besteht. Wie man jedoch in Tabelle 5.4 sieht, liefern der M- und Tanimoto/Rogers-Koeffizient<br />
in diesen Fällen eine Ähnlichkeit ungleich 0. Nur der S-Koeffizient und der verallgemeinerte M-Koeffizient<br />
liefern hier das erwartete Ergebnis. Der verallgemeinerte M-Koeffizient macht jedoch erst im Falle mehrerer<br />
nicht-binärer Variablen Sinn (siehe Tabelle 5.5 und 5.6).<br />
Dachform Haus 1 Haus 2 Haus 3<br />
Satteldach nein nein ja<br />
Flachdach ja ja nein<br />
Walmdach nein nein nein<br />
Pultdach nein nein nein<br />
Tabelle 5.3: Beispiel für ein nominales Merkmal.<br />
Ähnlichkeitsmaß Haus 1-2 Haus 1-3 Haus 2-3<br />
M-Koeffizient 1 1/2 1/2<br />
S-Koeffizient 1 0 0<br />
Tanimoto-Koeffizient 1 1/3 1/3<br />
Verallg. M-Koeffizient 1 0 0<br />
Tabelle 5.4: Ähnlichkeitsmaße zu Tabelle 5.3.<br />
Die Interpretation einer nicht-binären nominalen Variablen macht jedoch Sinn, wenn man binäre und nichtbinäre<br />
Merkmale zusammen betrachtet. Die Tabellen 5.7 und 5.8 zeigen ein Beispiel für diesen Fall. Das Problem<br />
bei dieser Vorgehensweise ist jedoch, dass im Vergleich zu dem ”<br />
binarisierten“ nominalen Merkmal (Dachform),<br />
die Ähnlichkeit aufgrund des Nicht-Vorhandenseins der binären Merkmale (Parkett, Terrasse, etc.) verloren<br />
geht. Diese Art der Verzerrung kann man ausgleichen, indem man, wie in Tabelle 5.9 dargestellt, auch für die<br />
binären Variablen den inversen (negierten) Fall berücksichtigt. Die Ähnlichkeitsmaße ändern sich dann, wie in<br />
Tabelle 5.10 dargestellt.<br />
5.2.4 Ähnlichkeitsmaße für quantitative Skalentypen<br />
Korrelationskoeffizient<br />
Bei der Analyse von quantitativen Daten kommt es häufig vor, dass man bei einer Stichprobe gleichzeitig<br />
zwei Eigenschaften (Merkmale) erfasst, wie z.B. die monatliche Sonnenscheindauer vormittags und nachmittags<br />
oder der Kopfumfang und die Körperlänge von Neugeborenen. Möchte man nun feststellen, ob ein direkter<br />
Zusammenhang zwischen beiden Größen besteht, bietet es sich an, den sogenannten Korrelationskoeffizienten<br />
beider Größen zu bestimmen.