21.11.2013 Aufrufe

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

Ein Computerlinguistisches Lexikon als komplexes System

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

1.2 Anforderungen an das <strong>Lexikon</strong> eines Morphologiesystems<br />

henen Wortformen konfrontiert. Aufgrund der vielfältigen Möglichkeiten der<br />

Wortbildung ist die Menge der potentiell auftretenden Wortformen theoretisch<br />

unendlich groß. Aus denken entsteht durch Ableitung bedenken, daraus<br />

bedenklich, unbedenklich und schließlich Unbedenklichkeit. Analog kann klären<br />

zu erklären, Erklärung erweitert werden. Die Substantive, die bei den beiden<br />

Ableitungen entstanden sind, lassen sich wiederum zusammenfügen zu einer<br />

Wortform Unbedenklichkeitserklärung. Daneben gibt es noch Unbedenklichkeitsbescheinigung,<br />

Unbedenklichkeitszeugnis, Unbedenklichkeitsnachweis, Unbedenklichkeitsgutachten<br />

usw. Allen diesen Bildungen ist gemein, dass sie nach<br />

bestimmten Regeln ablaufen, <strong>als</strong>o von jedem Sprecher 2 des Deutschen problemlos<br />

gebildet und auch verstanden werden können. Die beiden Haupt-<br />

Wortbildungsmuster im Deutschen, Komposition und Derivation, sind sehr produktiv,<br />

d.h., sie sind für einen großen Teil der ungesehenen Wortformen verantwortlich.<br />

<strong>Ein</strong>e Morphologiekomponente, die regelbasiert arbeitet, kann <strong>als</strong>o<br />

auch Wortformen analysieren, die nicht <strong>als</strong> Ganzes in ihrem internen <strong>Lexikon</strong><br />

verzeichnet sind.<br />

Allerdings gibt es einige Faktoren, die die automatische morphologische<br />

Analyse erschweren. Zum einen können bei der Wortbildung morphologische<br />

Prozesse stattfinden, die eine Formveränderung der beteiligten Elemente hervorrufen.<br />

Im Deutschen sind dies Umlautung, Fugung und Tilgung. So ist Öfchen<br />

eine Ableitung von Ofen, Häusermeer ist eine Zusammensetzung von Haus<br />

und Meer. Es muss <strong>als</strong>o nicht nur der Wortbildungstyp ermittelt werden, sondern<br />

die Bestandteile müssen einer möglichen Grundform zugeordnet werden.<br />

Dies gilt ebenso für Formen, die erkennbar regelhaft gebildet werden (Biologe,<br />

Biologie, biologisch und Geologe, Geologie, geologisch; Politbüro, Politprofi, Politskandal,<br />

. . . ), deren vordere Bestandteile sich aber nicht so leicht einer existierenden<br />

Form zuordnen lassen. Hier die relevanten Muster und Prozesse zu<br />

identifizieren, ist Aufgabe einer morphologischen Theorie. Die Bestandteile<br />

schließlich einer Morphologiekomponente zur Verfügung zu stellen, um diese<br />

in der morphologischen Analyse von Wortformen zu unterstützen, ist die Aufgabe<br />

des <strong>Lexikon</strong>s. <strong>Ein</strong> Modell, wie beides miteinander in <strong>Ein</strong>klang zu bringen<br />

ist, wird im folgenden Abschnitt vorgestellt.<br />

1.2 Anforderungen an das <strong>Lexikon</strong> eines Morphologiesystems<br />

Zur Feststellung der Anforderungen an das <strong>Lexikon</strong> eines Morphologiesystems<br />

ist zunächst zu untersuchen, wie eine morphologische Analyse abläuft.<br />

2 ... und jeder Sprecherin: Das grammatische Geschlecht ’Maskulinum’ ist in dieser Arbeit bei<br />

Personenbezeichnungen nicht mit dem tatsächlichen Geschlecht zu verwechseln, sondern wird<br />

nicht-diskriminierend für beide Geschlechter verwendet.<br />

3

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!