21.11.2013 Aufrufe

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

Zusammenspiel von IMSLEX und Morphologiekomponente<br />

Fall um die Weitergabe statischer Daten geht, <strong>als</strong>o <strong>Ein</strong>heiten ausgelesen werden,<br />

die im <strong>Lexikon</strong> vorhanden sind und nicht erst explizit errechnet werden<br />

müssen, wurde die zweite Variante gewählt. Die für die Morphologiekomponente<br />

SMOR (vgl. Schmid et al. (2004)) relevanten Daten werden mit Hilfe<br />

von XSLT-Stylesheets aus dem <strong>Lexikon</strong> ausgelesen und in eine Datei geschrieben,<br />

die die Morphologiekomponente wiederum einliest. Die in dieser Datei<br />

enthaltenen Informationen und das verwendete Format definieren die Schnittstelle<br />

zwischen den beiden Komponenten.<br />

8.1.1 XSLT-Stylesheets<br />

Bei der eXtensible Style Sheet Language for Transformations (XSLT, vgl. Clark<br />

(1999)) handelt es sich um einen standardisierten Verarbeitungsmechanismus<br />

für XML-Dokumente, der den deklarativen 2 Zugriff auf die <strong>Ein</strong>heiten eines XML-<br />

Dokuments erlaubt. Dies hat zur Folge, dass auch bei den Stylesheets, wie schon<br />

beim IMSLEX-Browser (vgl. Abschnitt 7.2.1), eine maximal mögliche Unabhängigkeit<br />

von der Struktur der Ressource besteht: Informationen, auf die nicht<br />

zugegriffen werden muss, können in der Ressource neu angeordnet werden,<br />

ohne dass dies einen <strong>Ein</strong>fluss auf die Funktionsfähigkeit der Stylesheets oder<br />

die Daten-Schnittstelle hat.<br />

Für das Auslesen der verschiedenen Stammformentypen gibt es zwei Stylesheets,<br />

die sehr ähnlich arbeiten, aber ihre Informationen aus zwei unterschiedlichen<br />

Modulen eines XML-<strong>Ein</strong>trags beziehen: Das Stylesheet für die Flexionsinformation<br />

greift auf die Merkmale einer lexikalischen <strong>Ein</strong>heit sowie auf Inhalte<br />

im Element Flexionsmorphologie zu, das Stylesheet für die Wortbildungsinformation<br />

greift auf die Merkmale einer lexikalischen <strong>Ein</strong>heit sowie auf Inhalte im<br />

Element Wortbildung zu. Die Stylesheets werden in den beiden folgenden Abschnitten<br />

beschrieben und sind in Anhang F komplett abgedruckt (vgl. S. 163).<br />

8.1.2 Stylesheet für die Flexionsinformation<br />

Anhand dieses Stylesheets soll die Funktionsweise des Auslesens erläutert werden.<br />

In Abbildung 8.1 ist der Anfang des Stylesheets, die Verarbeitung des le-<br />

Elements, dargestellt. <strong>Ein</strong> Stylesheet-Prozessor durchläuft das XML-Dokument<br />

und sucht nach passenden Elementnamen ( ¡ ¡ © ¤ in der Abbildung). Daher<br />

wird zunächst das Wurzelelement angegeben, <strong>als</strong>o lexikon (vgl. Abbildung 6.2<br />

2 ’Deklarativ’ im Sinne eines Programmierprinzips: In einem Stylesheet wird nicht angegeben,<br />

wie die Information extrahiert werden soll, sondern welche Information in welches Format<br />

überführt werden soll. <strong>Ein</strong>heiten, auf die nicht zugegriffen werden muss, werden auch<br />

nicht berücksichtigt.<br />

118

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!