Aspekte der morphologischen Analyse des Deutschen - Universität ...

Weitere Magazine

Empfehlungen

Info

Anhang C: Programmcode Anhang C: Programmcode Anhang C enthält die Programmtexte der Analyseautomaten und der morphologischen Grammatik. In C.1 ist der Segmentierer dokumentiert, in C.2 der unifikationsbasierte Chart- Parser. C.3 gibt die CUF-Implementierung der morphologischen Grammatik wieder. C.1 Der Segmentierer /********************************************************************************************************************************* File: segment.pl Language: Sicstus Prolog 3.5 Author: Thomas Hanneforth, University of Potsdam, Germany Date: Feb. 98 Desc.: implements the segmenting automation *********************************************************************************************************************************/ :- ensure_loaded([library(lists)]). :- [utils]. :- [automat]. % Alphabet and start state of the segmentizer /********************************************************************************************************************************* parse_word(Word:,Structures:) Top level predicate of the word parser; calls predicates init_chart/0, shift/1 in wordchart.pl Use word_segmentation/2 if you are only interested in the known segments of Word *********************************************************************************************************************************/ parse_word(Word,Structures) :- init_chart, % convert Word into a list of atoms, e.g. 'Hi' becomes ['H',i] atom_to_atomlist(Word,Symbollist), startstate(StartState), % shift the found segments into the chart insert_segments_into_chart(Symbollist,StartState,1,Word), % check whether it's necessary to insert "unknown"-segments % after the last lexical segment complete_chart(Word), startcat(Startcat), length(Symbollist,Wordlength), % find all edges spanning the whole word generate_structures(Startcat,Wordlength,Structures). 194
Anhang C: Programmcode /********************************************************************************************************************************* insert_segments_into_chart(Symbollist:, State:,Pos:,Word:): Segmentizes the word given in Symbollist into the known segments (determined by the lexicon) and inserts them via shift/3 into the chart. *********************************************************************************************************************************/ insert_segments_into_chart([],_State,_Index,_Word). insert_segments_into_chart([Letter|Restletters],State,I,Word) :- non_failure_state(State,Letter,NonFailState), transition(NonFailState,Letter,NewState), output(NewState,WordList), (WordList = [] -> % is the output function defined ? true ; % yes, so convert the items in output into segments ( word_to_segment_conversion(WordList,I,Segments), shift_all(Segments,Word) % insert all segments into the chart ) ), J is I + 1, insert_segments_into_chart(Restletters,NewState,J,Word). /********************************************************************************************************************************* shift_all(Segment:, Word:) inserts all segments into the chart; Word is the word to be analyzed *********************************************************************************************************************************/ shift_all([],_Word). shift_all([Segment|Segments],Word) :- shift(Segment,Word), (morphdebug(on) -> ( write('Inserted segment:'), write(Segment), nl, nl, complete_edges, nl, incomplete_edges, nl, get0(_) ) ; true ), shift_all(Segments,Word). /********************************************************************************************************************************* word_segmentation(Atomlist:,Segments:) Standalone predicate segmentizes Word into Segments e.g. 'rechnest' becomes (with suitable lexicon entries): [seg(1,rechn,5),seg(6,st,8)] *********************************************************************************************************************************/ word_segmentation(Word,Segments) :- % convert Word into a list of atoms, e.g. 'Hi' becomes ['H',i] atom_to_atomlist(Word,Symbollist), startstate(StartState), word_segmentation(Symbollist,StartState,1,[],ReverseSegments), % reverse the segment list reverse(ReverseSegments,Segments). 195
Seite 1 und 2:
Aspekte der morphologischen Analyse
Seite 3 und 4:
Inhaltsverzeichnis 1 EINFÜHRUNG ..
Seite 5 und 6:
5.3.2.3 Interpretation von Komposit
Seite 7 und 8:
Kapitel 1: Einführung Dies führt
Seite 9 und 10:
Kapitel 1: Einführung Weise als re
Seite 11 und 12:
Kapitel 1: Einführung wobei a und
Seite 13 und 14:
Kapitel 1: Einführung Es gibt nun
Seite 15 und 16:
Kapitel 1: Einführung L = { w | P
Seite 17 und 18:
Kapitel 1: Einführung 1.2.3 Die Le
Seite 19 und 20:
Kapitel 1: Einführung Die zu teste
Seite 21 und 22:
FREE-MORPHEME WORD-FORM VERB-FORM M
Seite 23 und 24:
Kapitel 1: Einführung Nach Daelema
Seite 25 und 26:
PHON 1 PAST-PART 2 SYN|LOC|SUBCAT
Seite 27 und 28:
1.4 Methodisches Kapitel 1: Einfüh
Seite 29 und 30:
2 Merkmalsstrukturen Kapitel 2: Mer
Seite 31 und 32:
Kapitel 2: Merkmalsstrukturen Die M
Seite 33 und 34:
Kapitel 2: Merkmalsstrukturen Beisp
Seite 35 und 36:
Kapitel 2: Merkmalsstrukturen 2. Di
Seite 37 und 38:
Seite 39 und 40:
Kapitel 2: Merkmalsstrukturen f) X
Seite 41 und 42:
Kapitel 2: Merkmalsstrukturen vorko
Seite 43 und 44:
Seite 45 und 46:
Kapitel 2: Merkmalsstrukturen 8. To
Seite 47 und 48:
Kapitel 2: Merkmalsstrukturen d.h.
Seite 49 und 50:
Kapitel 3: Wortsyntax und Wortseman
Seite 51 und 52:
Seite 53 und 54:
Seite 55 und 56:
Seite 57 und 58:
Seite 59 und 60:
Seite 61 und 62:
(11) a) A Hoch Kapitel 3: Wortsynta
Seite 63 und 64:
Seite 65 und 66:
(22) a) die Soldaten beobachten die
Seite 67 und 68:
Seite 69 und 70:
3.2.2 Derivation Kapitel 3: Wortsyn
Seite 71 und 72:
(40) a) versalzen b) befeuchten, ve
Seite 73 und 74:
Seite 75 und 76:
Seite 77 und 78:
Seite 79 und 80:
Seite 81 und 82:
(50) Kapitel 3: Wortsyntax und Wort
Seite 83 und 84:
Seite 85 und 86:
Seite 87 und 88:
3.4 Das generative Lexikon 3.4.1 St
Seite 89 und 90:
v. Color vi. Position Kapitel 3: Wo
Seite 91 und 92:
Seite 93 und 94:
Seite 95 und 96:
Seite 97 und 98:
Kapitel 4: Ein Modell eines morphol
Seite 99 und 100:
Seite 101 und 102:
a) Die Übergangsfunktion goto Kapi
Seite 103 und 104:
Seite 105 und 106:
Seite 107 und 108:
Seite 109 und 110:
Seite 111 und 112:
Seite 113 und 114:
Seite 115 und 116:
Seite 117 und 118:
Seite 119 und 120:
Seite 121 und 122:
4.6 Zusammenfassung Kapitel 4: Ein
Seite 123 und 124:
Seite 125 und 126:
Kapitel 5: Eine merkmalsbasierte Be
Seite 127 und 128:
Seite 129 und 130:
Seite 131 und 132:
Seite 133 und 134:
Seite 135 und 136:
Seite 137 und 138:
Seite 139 und 140:
Seite 141 und 142:
Seite 143 und 144:
Seite 145 und 146:
Seite 147 und 148:
Seite 149 und 150: Kapitel 5: Eine merkmalsbasierte Be
Seite 173 und 174: 5.4.2 Semantik Kapitel 5: Eine merk
Seite 175 und 176: GRAPH: fabrik SYN: SEM: CAT: n Kapi
Seite 183 und 184: Kapitel 6: Zusammenfassung was ande
Seite 185 und 186: Literaturverzeichnis Literaturverze
Seite 187 und 188: Literaturverzeichnis Earley, Jay (1
Seite 189 und 190: Literaturverzeichnis Kaplan, Ronald
Seite 191 und 192: Literaturverzeichnis Scalise, Sergi
Seite 193 und 194: Anhang A: Algorithmen Anhang A: Ana
Seite 195 und 196: Anhang A: Algorithmen A.1.2 Umwandl
Seite 197 und 198: verb_infl_or_imp :: MOOD: mood verb
Seite 199: Anhang B: Typenhierarchie und Merkm
Seite 203 und 204: Anhang C: Programmcode /***********
Seite 205 und 206: Anhang C: Programmcode process_queu
Seite 209 und 210: C.2 Der Chart-Parser Anhang C: Prog
Seite 211 und 212: store(edge(Begin,End,Cat,Closed,Ope
Seite 215 und 216: Anhang C: Programmcode C.3 CUF-Prog
Seite 217 und 218: % Case hierarchy after Heinz/Matias
Seite 219 und 220: eventstr < cfs. eventstr = activity
Seite 221 und 222: physical_state < cfs. physical_stat
Seite 227 und 228: Anhang C: Programmcode sem:content:
Seite 229 und 230: no_arguments & sem("Buch"). morph("
Seite 231 und 232: morph("schoen") := form: "schön" &
Seite 233 und 234: Anhang C: Programmcode argstr_prepo
Seite 235 und 236: Anhang C: Programmcode % -ung for i
Seite 237 und 238: Anhang C: Programmcode argstr:(subj
Seite 239 und 240: Anhang C: Programmcode v_infl_affix
Seite 241 und 242: Anhang C: Programmcode [role(worker
Seite 243 und 244: Anhang C: Programmcode event(rescue
Seite 245 und 246: * Commented out because of the dang
Seite 247 und 248: Anhang C: Programmcode member(role:
Seite 249 und 250: Anhang C: Programmcode % argument r
Seite 251 und 252:
Anhang C: Programmcode %type_shift_
Seite 253 und 254:
event(Type,Roles) := event_type:Typ
Seite 255 und 256:
testword(21) := ["rett","end"]. tes
Seite 257 und 258:
% Composition & Derivation test_wor
Alle anzeigen

Aspekte der morphologischen Analyse des Deutschen - Universität ...

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?