21.11.2013 Aufrufe

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

6.2 Dokumenttyp-Definition (DTD)<br />

<br />

<br />

<br />

<br />

Abbildung 6.11: IMSLEX-DTD. Wortartspezifische Merkmale (4/4)<br />

6.2.2 Attribute<br />

Nachdem die hierarchische Struktur des <strong>Lexikon</strong>s feststeht, werden nun die<br />

Merkmale der einzelnen Elemente beschrieben. Dazu dienen die Attribute, die<br />

für ein Element definiert werden können. Bei der Attributdeklaration werden<br />

neben dem Merkmalnamen die möglichen Merkmalwerte und ein Status angegeben.<br />

Die Aufzählung der möglichen Merkmalwerte bietet einen Schutz vor<br />

Fehlern in der Ressource: <strong>Ein</strong> XML-Parser gibt eine Fehlermeldung aus, wenn<br />

ein Merkmalwert im Dokument vorkommt, der nicht in der DTD deklariert wurde.<br />

Der ’Status’ gibt an, ob ein Attribut verpflichtend gesetzt werden muss<br />

£¢<br />

( ), fakultativ gesetzt werden kann ( ) oder eine Default-<br />

£¢ ¢ £¢¡ ¡ <br />

Belegung erhält § (Wert in doppelten Anführungsstrichen).<br />

Lexikalische <strong>Ein</strong>heit (le)<br />

Die Attribute des Elements le (lexikalische <strong>Ein</strong>heit) sind in Abbildung 6.12<br />

dargestellt. Es handelt sich im Wesentlichen um die in DeKo definierten Merkmale<br />

(vgl. Abschnitt 5.1.1). Bei den obligatorischen Merkmalen ist außer bei<br />

kategorie immer ein Wert £ ¡<br />

vorhanden, der <strong>als</strong> Platzhalter verwendet werden<br />

kann, wenn die genaue Belegung noch nicht klar ist. 13<br />

£<br />

Die Merkmale akzent und auslautverhaertung 14 sind nur für Derivationsaffixe<br />

relevant und haben daher bei allen anderen Kategorien die Belegung<br />

£¤£ ¡ ¦ ¡£ <br />

.<br />

Die beiden Merkmale erzeugt und geprueft sind administrativer Natur: Um<br />

zu verhindern, dass bei der <strong>Lexikon</strong>pflege immer wieder dieselben <strong>Ein</strong>träge<br />

durchgesehen werden, kann bei bereits vollständig bearbeiteten <strong>Ein</strong>trägen das<br />

Merkmal geprueft auf gesetzt werden. Das Merkmal erzeugt dient der Unterscheidung<br />

zwischen maschinell und manuell erzeugten <strong>Lexikon</strong>einträgen.<br />

©¡<br />

Auf diese Weise kann die Qualität des <strong>Lexikon</strong>s auf einem Stand gehalten werden,<br />

der bei unmarkiertem Hinzufügen von automatisch generierten Informationen<br />

nicht möglich wäre.<br />

13 Dies war vor allem beim Aufbau der Ressource hilfreich, da außer der Kategorie keine der<br />

Informationen im DMOR-<strong>Lexikon</strong> vorhanden ist.<br />

14 Der Bezeichner dieses Attributs wurde aus Platzgründen in der Abbildung abgekürzt.<br />

87

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!