28.12.2013 Aufrufe

pdf - Universität zu Köln

pdf - Universität zu Köln

pdf - Universität zu Köln

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Inhaltsverzeichnis<br />

1 Einleitung 1<br />

2 Allgemeines über Namen 1<br />

2.1 Namenstypen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1<br />

2.2 Ursprung von Familiennamen . . . . . . . . . . . . . . . . . . . . . . . . . 3<br />

3 Die Phonetische Suche 4<br />

3.1 Anwendungsgebiete für eine Phonetische Suche . . . . . . . . . . . . . . . . 5<br />

3.2 Funktionsweise der Phonetischen Suche . . . . . . . . . . . . . . . . . . . . 5<br />

3.3 Typische Eigenschaften . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6<br />

3.4 Wünschenswerte Eigenschaften . . . . . . . . . . . . . . . . . . . . . . . . 6<br />

3.5 Spezielle Probleme bei der Phonetischen Suche mit deutschen Namen . . . 8<br />

3.5.1 Zeichenkodierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9<br />

3.5.2 Doppelnamen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10<br />

3.6 Bekannte Verfahren für die Phonetische Suche . . . . . . . . . . . . . . . . 11<br />

3.6.1 Soundex . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12<br />

3.6.2 Extended Soundex . . . . . . . . . . . . . . . . . . . . . . . . . . . 13<br />

3.6.3 Metaphone . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14<br />

3.6.4 Phonix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15<br />

3.6.5 Daitch-Mokotoff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16<br />

3.6.6 Die ,,<strong>Köln</strong>er Phonetik” . . . . . . . . . . . . . . . . . . . . . . . . . 17<br />

3.6.7 PHONEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18<br />

3.6.8 Phonet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19<br />

3.6.9 IPA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21<br />

4 Klassische Verfahren für den Vergleich von Zeichenketten 22<br />

4.1 Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22<br />

4.2 Anwendungsmöglichkeit für eine Phonetische Suche . . . . . . . . . . . . . 23<br />

4.3 Hamming-Distanz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23<br />

4.4 Levenshtein und Damerau . . . . . . . . . . . . . . . . . . . . . . . . . . . 24<br />

4.5 N-Gram basierte Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . 25<br />

5 Der verwendete Korpus 27<br />

5.1 Gewinnung der Daten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27<br />

5.2 Statistik der Namen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28<br />

5.3 Validierung der Qualität . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29<br />

6 Vergleich der Verfahren für eine Phonetische Suche 32<br />

6.1 Bekannte Untersuchungen . . . . . . . . . . . . . . . . . . . . . . . . . . . 32<br />

6.2 Vorgehensweise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!