21.11.2013 Aufrufe

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

¢<br />

¡<br />

<br />

¥<br />

6.2 Dokumenttyp-Definition (DTD)<br />

ist. Derartige Abhängigkeiten versucht man in der Informatik normalerweise zu<br />

verhindern, da sie die Fehleranfälligkeit der Ressource erhöhen. In diesem Fall<br />

überwiegen jedoch die Vorteile des modularen Konzepts für die Übersichtlichkeit<br />

und die maschinelle Verarbeitung der Ressource die Nachteile, die durch<br />

die Abhängigkeit entstehen. 7<br />

6.2 Dokumenttyp-Definition (DTD)<br />

In der Dokumenttyp-Definition werden zwei Entitäten unterschieden: Die Elemente<br />

dienen der Strukturierung des Dokuments. Sie werden ähnlich einer<br />

kontextfreien Grammatik miteinander in Beziehung gesetzt. Mittels regulärer<br />

Zeichen können Elemente miteinander kombiniert oder quantifiziert werden.<br />

Elemente können sequentiell angeordnet sein oder in Disjunktion auftreten.<br />

Die Attribute dienen der Spezifizierung der Eigenschaften von Elementen. Sie<br />

werden in Abschnitt 6.2.2 vorgestellt.<br />

6.2.1 Elemente – Hierarchische Struktur<br />

Reguläres Zeichen<br />

Erklärung<br />

0 oder ein Vorkommen (Optionalität)<br />

0 oder beliebig viele Vorkommen<br />

ein oder beliebig viele Vorkommen<br />

<br />

<<br />

Aufeinanderfolgen (Sequenz)<br />

Ausschließendes Oder (Disjunktion)<br />

Gruppierung<br />

Abbildung 6.1: Reguläre Zeichen in der DTD<br />

In Tabelle 6.1 sind die in der DTD verwendeten Metazeichen mit Erklärung<br />

aufgeführt. In weiteren Verlauf dieses Kapitels werden Elementnamen (im Text<br />

sowie in den Abbildungen) stets kursiv gesetzt.<br />

Die lexikalische <strong>Ein</strong>heit<br />

Jedes XML-Dokument verfügt über ein Wurzel-Element, hier lexikon (vgl.<br />

Abbildung 6.2). Gemäß der flachen Struktur des IMSLEX besteht ein <strong>Lexikon</strong><br />

aus beliebig vielen lexikalischen <strong>Ein</strong>heiten (le). Diese wiederum sind in Module<br />

gegliedert, von denen die ersten beiden, Globale_Merkmale und Flexionsmorphologie,<br />

obligatorisch sind, die anderen optional. Von den Modulen für die<br />

7 Auch hier sind automatische Konsistenzüberprüfungen möglich (vgl. Abschnitt 8.1.4).<br />

81

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!