21.11.2013 Aufrufe

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Anhang D<br />

Beispiele für einen Pflegedialog<br />

In diesem Abschnitt ist der Bildschirmabzug zweier Pflegedialoge wiedergegeben,<br />

wie er sich beim Neueintrag der Formen (die) Wehr (für Wortbildungen wie<br />

Feuerwehr, Bürgerwehr etc.) und Vesuv darstellt. Durch den Aufruf mit der Option<br />

-f wird vom Programm zunächst die HGC-Wortliste eingelesen, um später die<br />

Vorkommenshäufigkeit im Korpus angeben zu können. Dann wird eine ’Schablone’<br />

eingelesen, das ist ein minimaler XML-<strong>Ein</strong>trag für ein Substantiv. Danach<br />

werden nacheinander die Zitierform, Morphologische Form, Herkunft und Flexionsklasse<br />

abgefragt (an dieser Stelle könnten alle möglichen Flexionsklassen<br />

ausgegeben werden, was hier aus Gründen der Übersichtlichkeit ausgelassen<br />

wurde). Die angegebenen Defaults beziehen sich auf den undefiniert-Fall bzw.,<br />

bei der Flexionsklasse, auf die häufigste Klasse bei Neueinträgen. Als nächstes<br />

wird ein Perl-Programm aufgerufen, das alle Formen des Paradigmas generiert<br />

(hier nur Wehr und Wehren) und deren HGC-Vorkommenshäufigkeiten addiert<br />

(das Ergebnis ist hier allerdings völlig f<strong>als</strong>ch, da vermutlich die meisten Vorkommen<br />

im Korpus auf (das) Wehr zurückgehen). Im Anschluss an die Frequenzermittlung<br />

wird ein einfaches ¦ £ © (Unix-Kommando) auf allen IMSLEX-<br />

Dateien durchgeführt, um zu analysieren, ob es anderswo bereits Formen gibt,<br />

die die neue Zitierform <strong>als</strong> Zeichenkette enthalten. Das Resultat sind einige<br />

Eigennamen, der bereits vorhandene <strong>Ein</strong>trag in der Substantivdatei für (das)<br />

Wehr, eine Derivation (Wehrhaftigkeit) sowie jeweils ein Derivations- und Kompositionsstamm<br />

beim Verb wehren . Der <strong>Ein</strong>trag kann <strong>als</strong>o bestätigt werden,<br />

das Resultat ist der komplette XML-<strong>Ein</strong>trag, der zugleich in das Fenster und in<br />

eine Datei geschrieben wird.<br />

Struktureinträge und Derivations- und Kompositionsstammformen werden<br />

in diesem Skript noch nicht abgefragt, um den Prozess des <strong>Ein</strong>tragens nicht zu<br />

langwierig werden zu lassen. Die beim le-Element ergibt sich aus der <strong>System</strong>zeit<br />

des Unix-Rechners, <strong>als</strong>o der Anzahl aller Sekunden seit dem 1.1.1970.<br />

Dies gewährleistet, dass in den allermeisten Fällen eine eindeutige ID gefunden<br />

wird.<br />

151

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!