21.11.2013 Aufrufe

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

Konzeption des IMSLEX<br />

Erweiterbarkeit Die Ressource soll sowohl inhaltlich <strong>als</strong> auch strukturell erweiterbar<br />

sein.<br />

Wartbarkeit Die Ressource soll gepflegt werden können, ohne die Konsistenz<br />

zu gefährden.<br />

Flexibilität Die Struktur der neuen Ressource soll leicht an Veränderungen anpassbar<br />

sein. Auf diese Weise kann auf Neuerungen in der Behandlung<br />

von Morphologie und Wortbildung leichter eingegangen werden.<br />

Aus inhaltlicher Sicht muss die Ressource das DeKo-Modell adäquat umsetzen,<br />

<strong>als</strong>o die in DeKo definierten lexikalischen <strong>Ein</strong>heiten mit all ihren Merkmalen<br />

enthalten, so dass die Ressource die Anwendung der Wortbildungsregeln<br />

auf <strong>Ein</strong>heiten und Merkmalen optimal unterstützt.<br />

6.1.1 Wahl des Repräsentationsformates<br />

Die Wahl des Repräsentationsformates ist entscheidend für die Erweiterbarkeit<br />

und Flexibilität der Ressource. Das DMOR-<strong>Lexikon</strong> wurde bereits in eine relationale<br />

Datenbank überführt (vgl. Lezius et al. (2000)). In einer solchen sind<br />

allerdings Strukturanpassungen nur sehr umständlich durchzuführen: <strong>Ein</strong>e Änderung<br />

des Datenschemas erfordert das Aus- und wieder <strong>Ein</strong>lesen des gesamten<br />

Datenbestandes. Idealerweise sollten die Skripte, die zum Auslesen der für die<br />

Morphologiekomponente notwendigen Informationen dienen, von der Struktur<br />

der Ressource unabhängig sein, so dass sie nicht bei jeder Änderung angepasst<br />

werden müssen. <strong>Ein</strong> Formalismus, der die Erweiterbarkeit und Flexibilität der<br />

Ressource gewährleistet, ist XML.<br />

Die Dokumentenbeschreibungssprache XML<br />

Bei XML, der eXtensible Markup Language (vgl. Harold (2000)), handelt es sich<br />

um einen Formalismus, der die Definition von Klassen von Dokumenten 1 ermöglicht.<br />

Zwei Probleme werden durch XML gelöst: zum einen die Definition<br />

des Zeichenvorrats von Dokumenten, zum anderen die Definition der Dokumentstruktur.<br />

Der erste Punkt unterbindet eine Ad-hoc-Kodierung von Sonderzeichen,<br />

die bisher eines der größten Probleme beim Austausch von Ressourcen<br />

darstellte. Der zweite Punkt stellt Bausteine für ein standardisiertes und eindeutiges<br />

Markup (Auszeichnung) des Dokumentes zur Verfügung.<br />

XML ist eine echte Teilmenge der Dokumentenbeschreibungssprache SGML<br />

(vgl. Goldfarb und Rubinsky (1990)), die Ende der 80er Jahre entwickelt<br />

1 In XML-Terminologie wird jede in XML repräsentierte Ressource <strong>als</strong> Dokument bezeichnet.<br />

76

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!