pdf - Universität zu Köln
pdf - Universität zu Köln
pdf - Universität zu Köln
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Inhaltsverzeichnis<br />
1 Einleitung 1<br />
2 Allgemeines über Namen 1<br />
2.1 Namenstypen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1<br />
2.2 Ursprung von Familiennamen . . . . . . . . . . . . . . . . . . . . . . . . . 3<br />
3 Die Phonetische Suche 4<br />
3.1 Anwendungsgebiete für eine Phonetische Suche . . . . . . . . . . . . . . . . 5<br />
3.2 Funktionsweise der Phonetischen Suche . . . . . . . . . . . . . . . . . . . . 5<br />
3.3 Typische Eigenschaften . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6<br />
3.4 Wünschenswerte Eigenschaften . . . . . . . . . . . . . . . . . . . . . . . . 6<br />
3.5 Spezielle Probleme bei der Phonetischen Suche mit deutschen Namen . . . 8<br />
3.5.1 Zeichenkodierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9<br />
3.5.2 Doppelnamen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10<br />
3.6 Bekannte Verfahren für die Phonetische Suche . . . . . . . . . . . . . . . . 11<br />
3.6.1 Soundex . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12<br />
3.6.2 Extended Soundex . . . . . . . . . . . . . . . . . . . . . . . . . . . 13<br />
3.6.3 Metaphone . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14<br />
3.6.4 Phonix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15<br />
3.6.5 Daitch-Mokotoff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16<br />
3.6.6 Die ,,<strong>Köln</strong>er Phonetik” . . . . . . . . . . . . . . . . . . . . . . . . . 17<br />
3.6.7 PHONEM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18<br />
3.6.8 Phonet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19<br />
3.6.9 IPA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21<br />
4 Klassische Verfahren für den Vergleich von Zeichenketten 22<br />
4.1 Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22<br />
4.2 Anwendungsmöglichkeit für eine Phonetische Suche . . . . . . . . . . . . . 23<br />
4.3 Hamming-Distanz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23<br />
4.4 Levenshtein und Damerau . . . . . . . . . . . . . . . . . . . . . . . . . . . 24<br />
4.5 N-Gram basierte Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . 25<br />
5 Der verwendete Korpus 27<br />
5.1 Gewinnung der Daten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27<br />
5.2 Statistik der Namen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28<br />
5.3 Validierung der Qualität . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29<br />
6 Vergleich der Verfahren für eine Phonetische Suche 32<br />
6.1 Bekannte Untersuchungen . . . . . . . . . . . . . . . . . . . . . . . . . . . 32<br />
6.2 Vorgehensweise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34