28.12.2013 Aufrufe

pdf - Universität zu Köln

pdf - Universität zu Köln

pdf - Universität zu Köln

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Zeichenkette, vor einem Vokal und die beliebige Position. Das Ende der Zeichenkette<br />

wird nicht separat berücksichtigt.<br />

Nicht alle Grapheme sind dabei in jedem Kontext erlaubt. Die längste, passende Suchzeichenkette<br />

wird immer präferiert. Wenn Suchzeichenkette und Kontext in der Eingabezeichenkette<br />

übereinstimmen, wird die Ziffernfolge dem bisher kodierten Schlüssel angehängt,<br />

bzw. bei mehreren Schlüsseln entsprechende Varianten erzeugt. Durch die Variantenbildung<br />

ist es möglich, Ambiguitäten in der Aussprache <strong>zu</strong> behandeln. Von den<br />

anderen Verfahren versucht nur Phonix diese Eigenschaft um<strong>zu</strong>setzen.<br />

Für die Kodierung des Namens wird folgendermaßen vorgegangen: Der erste<br />

Buchstabe ist ein . Dieser wird mit einer 5 kodiert. Der darauf folgende Vokal vorerst<br />

mit einer 0. Da das mehrere Varianten besitzt, wird es entweder mit einer 94 oder<br />

mit einer 4 kodiert. Nun existieren bereits zwei Teilschlüssel 5094 und 504. Das folgende<br />

wird entweder mit 5 oder 4 kodiert. Nun existieren bereits vier Varianten 50945,<br />

5094, 5045, 5044. Nun werden die doppelten Zeichen entfernt. Hier wird lediglich aus dem<br />

5044 eine 504. Nach Entfernen der Vokale und Auffüllen der Schlüssel mit Nullen, bleiben<br />

die Kodierungsvarianten 594500, 594000, 545000 und 540000.<br />

3.6.6 Die ,,<strong>Köln</strong>er Phonetik”<br />

Das Verfahren ,,<strong>Köln</strong>er Phonetik” wurde von Postel (1969) veröffentlicht. Obwohl der Name<br />

es suggeriert, hat Sie nichts mit dem <strong>Köln</strong>er Institut für Phonetik <strong>zu</strong> tun, sondern<br />

wurde aus unbekannten Gründen derart benannt. Es handelt sich hierbei um einen frühen<br />

Ansatz, Soundex an das Deutsche an<strong>zu</strong>passen. Ähnlich wie auch bei Soundex wird eine<br />

Zuordnung von Zeichen auf Ziffern vorgenommen. Für die Auswahl der jeweiligen Ziffer<br />

wird maximal ein Buchstabe als Kontext benutzt. Dieser Buchstabe kann jedoch auf beiden<br />

Seiten des ausgewerteten Zeichens stehen. Für den Wortanfang stehen wie bei Phonix<br />

oder Daitch-Mokotoff für einzelne Grapheme spezielle Regeln <strong>zu</strong>r Verfügung. Für einen<br />

Überblick der Erset<strong>zu</strong>ngsregeln siehe Abbildung 6.<br />

Wie bei den anderen an Soundex angelehnten Verfahren ist die Behandlung von Vokalen<br />

nur rudimentär gegeben. Außer am Wortanfang und im vorhin erwähnten Entscheidungskontext<br />

werden diese nicht berücksichtigt. Bedingt durch den frühen Zeitpunkt 28 der<br />

Publikation werden Umlaute und das ß nicht berücksichtigt.<br />

Die ,,<strong>Köln</strong>er Phonetik” ist heute noch Bestandteil von Ausschreibungen im öffentlichen<br />

Verwaltungsbereich. Darüber hinaus hat Sie wenig Verbreitung gefunden.<br />

28 In den Frühzeit der Datenverarbeitung waren Zeichenkodierungen, die Umlaute kannten, nur sehr<br />

wenig verbreitet. Der Autor arbeitete mit einer IBM /360, die eine eigene Kodierung benutzte.<br />

17

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!