pdf - Universität zu Köln
pdf - Universität zu Köln
pdf - Universität zu Köln
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Zeichenkette, vor einem Vokal und die beliebige Position. Das Ende der Zeichenkette<br />
wird nicht separat berücksichtigt.<br />
Nicht alle Grapheme sind dabei in jedem Kontext erlaubt. Die längste, passende Suchzeichenkette<br />
wird immer präferiert. Wenn Suchzeichenkette und Kontext in der Eingabezeichenkette<br />
übereinstimmen, wird die Ziffernfolge dem bisher kodierten Schlüssel angehängt,<br />
bzw. bei mehreren Schlüsseln entsprechende Varianten erzeugt. Durch die Variantenbildung<br />
ist es möglich, Ambiguitäten in der Aussprache <strong>zu</strong> behandeln. Von den<br />
anderen Verfahren versucht nur Phonix diese Eigenschaft um<strong>zu</strong>setzen.<br />
Für die Kodierung des Namens wird folgendermaßen vorgegangen: Der erste<br />
Buchstabe ist ein . Dieser wird mit einer 5 kodiert. Der darauf folgende Vokal vorerst<br />
mit einer 0. Da das mehrere Varianten besitzt, wird es entweder mit einer 94 oder<br />
mit einer 4 kodiert. Nun existieren bereits zwei Teilschlüssel 5094 und 504. Das folgende<br />
wird entweder mit 5 oder 4 kodiert. Nun existieren bereits vier Varianten 50945,<br />
5094, 5045, 5044. Nun werden die doppelten Zeichen entfernt. Hier wird lediglich aus dem<br />
5044 eine 504. Nach Entfernen der Vokale und Auffüllen der Schlüssel mit Nullen, bleiben<br />
die Kodierungsvarianten 594500, 594000, 545000 und 540000.<br />
3.6.6 Die ,,<strong>Köln</strong>er Phonetik”<br />
Das Verfahren ,,<strong>Köln</strong>er Phonetik” wurde von Postel (1969) veröffentlicht. Obwohl der Name<br />
es suggeriert, hat Sie nichts mit dem <strong>Köln</strong>er Institut für Phonetik <strong>zu</strong> tun, sondern<br />
wurde aus unbekannten Gründen derart benannt. Es handelt sich hierbei um einen frühen<br />
Ansatz, Soundex an das Deutsche an<strong>zu</strong>passen. Ähnlich wie auch bei Soundex wird eine<br />
Zuordnung von Zeichen auf Ziffern vorgenommen. Für die Auswahl der jeweiligen Ziffer<br />
wird maximal ein Buchstabe als Kontext benutzt. Dieser Buchstabe kann jedoch auf beiden<br />
Seiten des ausgewerteten Zeichens stehen. Für den Wortanfang stehen wie bei Phonix<br />
oder Daitch-Mokotoff für einzelne Grapheme spezielle Regeln <strong>zu</strong>r Verfügung. Für einen<br />
Überblick der Erset<strong>zu</strong>ngsregeln siehe Abbildung 6.<br />
Wie bei den anderen an Soundex angelehnten Verfahren ist die Behandlung von Vokalen<br />
nur rudimentär gegeben. Außer am Wortanfang und im vorhin erwähnten Entscheidungskontext<br />
werden diese nicht berücksichtigt. Bedingt durch den frühen Zeitpunkt 28 der<br />
Publikation werden Umlaute und das ß nicht berücksichtigt.<br />
Die ,,<strong>Köln</strong>er Phonetik” ist heute noch Bestandteil von Ausschreibungen im öffentlichen<br />
Verwaltungsbereich. Darüber hinaus hat Sie wenig Verbreitung gefunden.<br />
28 In den Frühzeit der Datenverarbeitung waren Zeichenkodierungen, die Umlaute kannten, nur sehr<br />
wenig verbreitet. Der Autor arbeitete mit einer IBM /360, die eine eigene Kodierung benutzte.<br />
17