21.11.2013 Aufrufe

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

<strong>Ein</strong>leitung<br />

Abbildung 1.1: Morphologische Analyse – Datenfluss<br />

In Abbildung 1.1 ist der Datenfluss bei der morphologischen Analyse (von<br />

links nach rechts) wiedergegeben: <strong>Ein</strong> Modul zur Durchführung der morphologischen<br />

Analyse (in der Abbildung und im weiteren Verlauf dieser Arbeit abkürzend<br />

Morphologiekomponente oder Morphologiesystem genannt) erhält<br />

<strong>als</strong> <strong>Ein</strong>gabe eine zu analysierende Wortform und gibt null oder mehr Analysestrings<br />

aus. Diese enthalten Angaben zur Wortart, zur Grundform und zu den<br />

morphologischen Merkmalen der <strong>Ein</strong>gabewortform. Die Analysestrings durchlaufen<br />

fakultativ (sie können auch einfach ’durchgereicht’ werden) ein Filtermodul,<br />

in dem eine Disambiguierung durchgeführt wird. Hier werden nicht<br />

gewollte Analysen herausgefiltert. Die verbleibenden Analysestrings (im Idealfall:<br />

genau einer) werden an die nachfolgende Verarbeitungseinheit weitergegeben,<br />

z.B. eine Syntaxkomponente.<br />

Die Realisierung dieses Datenflusses setzt die Existenz von zwei Komponenten<br />

voraus: eine für die morphologische Analyse und eine für die Bewertung<br />

und Disambiguierung der Analyseergebnisse. Morphologiesysteme sind<br />

vorhanden und bilden die Flexion des Deutschen und teilweise die Wortbildung<br />

ab. <strong>Ein</strong>e Komponente zur automatischen korrekten Disambiguierung der Analyseergebnisse<br />

hingegen exisitiert noch nicht. Die zentralen Fragen nach der<br />

Korrektheit einer morphologischen Analyse und nach der Vollständigkeit der<br />

korrekten Lösungen sind ungeklärt. Dies hängt damit zusammen, dass beide<br />

Aspekte nur im Rahmen der morphologischen Theorie einer Sprache betrachtet<br />

werden können, dass es aber für das Deutsche keine alle morphologischen Phänomene<br />

umfassende allgemein akzeptierte Theorie gibt. Darüber hinaus erzeugen<br />

gängige Morphologiesysteme für viele Wortformen überhaupt keine Analyse.<br />

Vor der Disambiguierung muss <strong>als</strong>o zunächst einmal eine Untersuchung<br />

stattfinden, die die Qualität der Analyseergebnisse bewertet.<br />

In Abbildung 1.2 ist ein Modell vorgestellt, das diese Untersuchung skizziert.<br />

In diesem Modell werden die Analysestrings, die von der Morphologiekomponente<br />

ausgegeben werden, einer intellektuellen (nicht automatischen)<br />

Bewertung unterzogen. Die Bewertung richtet sich nach der Behandlung morphologischer<br />

Phänomene und der Definition morphologischer <strong>Ein</strong>heiten.<br />

<strong>Ein</strong>e bei den Analysestrings fehlende korrekte Analyse wird <strong>als</strong> schlechter<br />

Fall bewertet und liefert den Anstoß für eine Anpassung des <strong>Lexikon</strong>s. Diese<br />

Anpassung wiederum führt i.A. zu einer Verbesserung der Morphologiekompo-<br />

4

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!