Aspekte der morphologischen Analyse des Deutschen - Universität ...

Weitere Magazine

Empfehlungen

Info

Kapitel 4: Ein Modell eines morphologischen Analysesystems Beispiel 4.5 verdeutlicht das Zusammenspiel von Segmentierer und Parser anhand eines Wortes mit mehr als einer Zerlegung. Beispiel 4.5: Strukturanalyse von „Staubecken“. Zur Vereinfachung des Beispiels wird angenommen, daß die Zerlegung 4a) aus Beispiel 4.2, die ein unbekanntes Segment „b“ enthält, nicht in die Strukturanalyse gelangt (vgl. auch Abschnitt 4.3.2). Der Analyse zugrundegelegt wird eine stark idealisierte Grammatik mit den beiden Regeln N → N N und N → N Naf wobei ein Nichtterminal X die Merkmalsstruktur [SYN:HEAD:CAT:X] abkürzt. Gefundene Segmente Hinzugefügte Kanten Operationen 103 Shift Expand Complete Shift Expand Complete Shift Expand Complete Expand Shift Expand Complete Expand Shift Complete
Kapitel 4: Ein Modell eines morphologischen Analysesystems Die Hauptfunktion des Parsers ist durch folgende Funktion Parse() gegeben: Eingabe Das zu analysierende Wort Word Ausgabe Eine Menge von Analysen Datenstrukturen Eine Wortgrammatik WordGrammar Eine Chart-Datenstruktur Chart Ein Segmentierer Segmentizer Verfahren function parse(Word:): begin Chart.Init_Chart % convert Word into a list of atoms, e.g. 'Hi' becomes ['H',i] Symbollist := atom_to_atomlist(Word) % shift the found segments into the chart Segmentizer.Insert_segments_into_chart(Symbollist,Word) % check whether it's necessary to insert "unknown"-segments % after the last lexical segment Chart.Complete_Chart(Word), % find all edges spanning the whole word return(Chart.Generate_Structures(WordGrammar.Startcat,|Word|)). end Die Funktion Insert_segments_into_chart() ist im wesentlichen durch Algorithmus 4.1 gegeben; lediglich die durch {*1} markierte Zeile wird durch einen Shift()-Aufruf für das Segment (s.o.) ersetzt. Die Funktion Complete_Chart() fügt weitere "unknown"-Segmente in den Chart ein, für den Fall, daß das zuletzt gefundene Segment kein Suffix des zu analysierenden Wortes ist. Generate_Structures() schließlich erzeugt alle möglichen Analysen aus dem Chart. Eine Prolog-Implementierung dieses Verfahrens befindet sich in Anhang C. 4.3.2 Behandlung unbekannter Segmente Die Grundidee, Strukturanalyse eines Wortes auch dann fortzuführen, wenn Teile von ihm nicht im Lexikon aufgeführt sind, besteht darin, diese Wortteile als „unbekannt“ zu markieren, sie mit einer unterspezifizierten grammatischen Kategorie zu versehen und sie dann während des Wortstrukturparsings wie „normale“ lexikalische Segmente zu behandeln. Aufgrund der Nichtdirektionalität des gewählten Grammatikformalismus können diese speziellen Kanten dann mit Hilfe ihres Kontextes im Wort, der angewandten grammatischen Regeln und Prinzipien weiter instantiiert werden, so daß sie, wenn diese Instantiierung ein bestimmtes Maß erreicht hat, in einen speziellen Teil des Lexikons, der Morphemhypothesen enthält, aufgenommen werden können. Wie im nächsten, der Wortgrammatik gewidmeten Kapitel noch näher ausgeführt wird, sind im Lexikon alle Elemente der offenen Klassen, also der Klassen, die in der Hauptsache an der Wortbildung beteiligt sind, mit der morphologischen Kategorie simple_stem markiert, so daß auch unbekannte Wortteile dieser Kategorie zugeordnet werden. Der Grund für die Wahl gerade dieser Kategorie liegt natürlich darin, daß sich alle anderen Wortbildungskategorien wie Präfixe, Suffixe und Flexive ohne großen Aufwand vollständig im Lexikon erfassen lassen. 104
Seite 1 und 2:
Aspekte der morphologischen Analyse
Seite 3 und 4:
Inhaltsverzeichnis 1 EINFÜHRUNG ..
Seite 5 und 6:
5.3.2.3 Interpretation von Komposit
Seite 7 und 8:
Kapitel 1: Einführung Dies führt
Seite 9 und 10:
Kapitel 1: Einführung Weise als re
Seite 11 und 12:
Kapitel 1: Einführung wobei a und
Seite 13 und 14:
Kapitel 1: Einführung Es gibt nun
Seite 15 und 16:
Kapitel 1: Einführung L = { w | P
Seite 17 und 18:
Kapitel 1: Einführung 1.2.3 Die Le
Seite 19 und 20:
Kapitel 1: Einführung Die zu teste
Seite 21 und 22:
FREE-MORPHEME WORD-FORM VERB-FORM M
Seite 23 und 24:
Kapitel 1: Einführung Nach Daelema
Seite 25 und 26:
PHON 1 PAST-PART 2 SYN|LOC|SUBCAT
Seite 27 und 28:
1.4 Methodisches Kapitel 1: Einfüh
Seite 29 und 30:
2 Merkmalsstrukturen Kapitel 2: Mer
Seite 31 und 32:
Kapitel 2: Merkmalsstrukturen Die M
Seite 33 und 34:
Kapitel 2: Merkmalsstrukturen Beisp
Seite 35 und 36:
Kapitel 2: Merkmalsstrukturen 2. Di
Seite 37 und 38:
Seite 39 und 40:
Kapitel 2: Merkmalsstrukturen f) X
Seite 41 und 42:
Kapitel 2: Merkmalsstrukturen vorko
Seite 43 und 44:
Seite 45 und 46:
Kapitel 2: Merkmalsstrukturen 8. To
Seite 47 und 48:
Kapitel 2: Merkmalsstrukturen d.h.
Seite 49 und 50:
Kapitel 3: Wortsyntax und Wortseman
Seite 51 und 52:
Seite 53 und 54:
Seite 55 und 56:
Seite 57 und 58: Kapitel 3: Wortsyntax und Wortseman
Seite 61 und 62: (11) a) A Hoch Kapitel 3: Wortsynta
Seite 65 und 66: (22) a) die Soldaten beobachten die
Seite 69 und 70: 3.2.2 Derivation Kapitel 3: Wortsyn
Seite 71 und 72: (40) a) versalzen b) befeuchten, ve
Seite 81 und 82: (50) Kapitel 3: Wortsyntax und Wort
Seite 87 und 88: 3.4 Das generative Lexikon 3.4.1 St
Seite 89 und 90: v. Color vi. Position Kapitel 3: Wo
Seite 97 und 98: Kapitel 4: Ein Modell eines morphol
Seite 101 und 102: a) Die Übergangsfunktion goto Kapi
Seite 107: Kapitel 4: Ein Modell eines morphol
Seite 121 und 122: 4.6 Zusammenfassung Kapitel 4: Ein
Seite 125 und 126: Kapitel 5: Eine merkmalsbasierte Be
Seite 159 und 160:
Kapitel 5: Eine merkmalsbasierte Be
Seite 161 und 162:
Seite 163 und 164:
Seite 165 und 166:
Seite 167 und 168:
Seite 169 und 170:
Seite 171 und 172:
Seite 173 und 174:
5.4.2 Semantik Kapitel 5: Eine merk
Seite 175 und 176:
GRAPH: fabrik SYN: SEM: CAT: n Kapi
Seite 177 und 178:
Seite 179 und 180:
Seite 181 und 182:
Seite 183 und 184:
Kapitel 6: Zusammenfassung was ande
Seite 185 und 186:
Literaturverzeichnis Literaturverze
Seite 187 und 188:
Literaturverzeichnis Earley, Jay (1
Seite 189 und 190:
Literaturverzeichnis Kaplan, Ronald
Seite 191 und 192:
Literaturverzeichnis Scalise, Sergi
Seite 193 und 194:
Anhang A: Algorithmen Anhang A: Ana
Seite 195 und 196:
Anhang A: Algorithmen A.1.2 Umwandl
Seite 197 und 198:
verb_infl_or_imp :: MOOD: mood verb
Seite 199 und 200:
Anhang B: Typenhierarchie und Merkm
Seite 201 und 202:
Anhang C: Programmcode /***********
Seite 203 und 204:
Seite 205 und 206:
Anhang C: Programmcode process_queu
Seite 207 und 208:
Seite 209 und 210:
C.2 Der Chart-Parser Anhang C: Prog
Seite 211 und 212:
store(edge(Begin,End,Cat,Closed,Ope
Seite 213 und 214:
Seite 215 und 216:
Anhang C: Programmcode C.3 CUF-Prog
Seite 217 und 218:
% Case hierarchy after Heinz/Matias
Seite 219 und 220:
eventstr < cfs. eventstr = activity
Seite 221 und 222:
physical_state < cfs. physical_stat
Seite 223 und 224:
Seite 225 und 226:
Seite 227 und 228:
Anhang C: Programmcode sem:content:
Seite 229 und 230:
no_arguments & sem("Buch"). morph("
Seite 231 und 232:
morph("schoen") := form: "schön" &
Seite 233 und 234:
Anhang C: Programmcode argstr_prepo
Seite 235 und 236:
Anhang C: Programmcode % -ung for i
Seite 237 und 238:
Anhang C: Programmcode argstr:(subj
Seite 239 und 240:
Anhang C: Programmcode v_infl_affix
Seite 241 und 242:
Anhang C: Programmcode [role(worker
Seite 243 und 244:
Anhang C: Programmcode event(rescue
Seite 245 und 246:
* Commented out because of the dang
Seite 247 und 248:
Anhang C: Programmcode member(role:
Seite 249 und 250:
Anhang C: Programmcode % argument r
Seite 251 und 252:
Anhang C: Programmcode %type_shift_
Seite 253 und 254:
event(Type,Roles) := event_type:Typ
Seite 255 und 256:
testword(21) := ["rett","end"]. tes
Seite 257 und 258:
% Composition & Derivation test_wor
Alle anzeigen

Aspekte der morphologischen Analyse des Deutschen - Universität ...

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?