21.11.2013 Aufrufe

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

8.1 Auslesen des <strong>Lexikon</strong>s<br />

Ausgabe des Stylesheets<br />

Zeile<br />

#¨¦¡¤£% ¢¡ Amt:Ämt $$£¡ ¢£¦¥£¡ % ¡¥¡ 1<br />

¥<br />

#¨¦¡¤£% ¢¡ Amt:Amts $$£¡ © $% $¢¡ %¤¦¡¥¡ 2<br />

¥<br />

#¨¦¡¤£% ¢¡ Maria:Marien $ ¢£¡ © $% $¢¡ %¦¡ £¡ 3<br />

¥<br />

#¨¦¡¤£% ¢¡ niedrig:Niedrigst ¢¥£§¦¡ © $% $¤¢¡ % ¡!¤¡ 4<br />

¥<br />

#¨¦¡¤£% ¢¡ entwickeln:Entwickl ¥¡ ¢£¦¥!£¡ %¤¦¡£¡ 5<br />

¥<br />

#¨¦¡¤£% ¢¡ außen:Außen $¨¡ £¡ © $% $¤¢¡ %¢¦¡!¤¡ 6<br />

¥<br />

#¨¦¡¤£% ¢¡ vorne:Vorder $¡ £¡ © $% $¢¡ %¤£¦&¤¡ 7<br />

¥<br />

#¨¦¡¤£% ¢¡ abreißen:Abreiß ¨£¡ © $% $¢¡ %¦¡ £¡ 8<br />

¥<br />

#¨¦¡¤£% ¢¡ ler:ler $$¤ ¡¢¡£¡ © $% $¤¢¡ %¤ ¡ £¡ 9<br />

¥<br />

#¨¦¡¤£% ¢¡ ling:lings $$¤ ¡¢¡£¡ © $% $¤¢¡ %¤ ¡ £¡ 10<br />

¥<br />

#¨¦¡¤£% ¢¡ Miß:Miss ¥¤ ¡¥¡ ¢£¦¥!£¡ %¢©¦ ¥¥¡ 11<br />

¥<br />

#¨¦¡¤£% ¢¡ Miß:Miß ¥¤ ¡£¡ ¢£¦¥£¡ %©¦ ¥¥¡ 12<br />

¥<br />

Abbildung 8.6: Stylesheet-Ausgabe für die Wortbildung<br />

zur Durchführung der morphologischen Analyse.<br />

8.1.4 Automatische Konsistenzüberprüfung mit Stylesheets<br />

Durch die Wahl des Repräsentationsformates XML sind bestimmte Möglichkeiten<br />

gegeben, die Konsistenz der Ressource zu überprüfen. In jedem komplexen<br />

<strong>System</strong>, das Zusammenhänge zwischen den in ihm enthaltenen <strong>Ein</strong>heiten<br />

enthält, können Änderungen an einer Stelle ungewolltes Verhalten oder Inkonsistenzen<br />

an einer anderen Stelle bewirken. <strong>Ein</strong> Beispiel für das in dieser Arbeit<br />

vorgestellte <strong>Lexikon</strong>system ist das Löschen oder Ändern eines <strong>Ein</strong>trags, auf<br />

den andere <strong>Ein</strong>träge verweisen. Definiert sich beispielsweise das Lexem Darstellung<br />

durch den Verweis auf die <strong>Ein</strong>träge für darstellen £ ¡<br />

und -ung , so führt<br />

das Entfernen eines dieser beiden <strong>Ein</strong>träge dazu, dass Verweise ins Leere gehen<br />

oder Analysen, die vorher erzielt werden konnten, nun nicht mehr nachvollzogen<br />

werden können. Im folgenden werden beispielhaft einige Möglichkeiten<br />

der Konsistenzüberprüfung mit Stylesheets aufgeführt.<br />

Überprüfung von redundant gespeicherten Informationen <strong>Ein</strong> wesentlicher<br />

Aspekt in dem in dieser Arbeit vorgestellten <strong>Lexikon</strong> ist die Möglichkeit,<br />

neben Simplexformen auch morphologisch komplexe Formen zu speichern, die<br />

sich aus Simplexformen zusammensetzen und teilweise deren Eigenschaften<br />

übernehmen. Das Argument, das i.A. gegen eine solche Vorgehensweise spricht,<br />

ist das Prinzip der Redundanzvermeidung: Jeder doppelt eingetragene Sachverhalt<br />

erfordert grundsätzlich den doppelten Pflegeaufwand. Haben etwa die Lexeme<br />

Tür und Haustür eine unterschiedliche Flexionsklasse, obwohl der <strong>Ein</strong>trag<br />

Haustür auf den <strong>Ein</strong>trag Tür <strong>als</strong> seinen morphologischen Kopf verweist,<br />

so muss einer der beiden Flexionsklasseneinträge fehlerhaft sein. Da das Lexi-<br />

123

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!