Aufrufe
vor 4 Jahren

Linksassoziative morphologische Analyse des Englischen mit ...

Linksassoziative morphologische Analyse des Englischen mit ...

Klassenbeschreibung

Klassenbeschreibung Kurzbezeichnung Anzahl Substantiv (singular) n 63 781 Abkürzung abbrev 2 591 Einheit/Buchstabe symbol 62 Adjektiv adj 13 161 Adjektiv adjp 310 Adjektiv adjpren 95 Verb (monotransitiv) vt 7 462 Verb (bitransitiv) vb 5 184 Verb (intransitiv) vi 3 456 Adverb adv 1 398 Substantiv (plural) npl 1 234 Präposition prep 138 Determiner det 103 Pronomen pron 90 Konjunktion conj 66 Satzkonnektor sentcon 42 Interjektion interj 362 Satzäquivalent sentsub 45 Modifikator sentmod 1 Modifikator modifier 1 Präfix prefix 116 Präfix comb 500 Suffix suffix 61 Suffix ncomb 133 Suffix suffn 84 Suffix adjcomb 44 Suffix advcomb 1 Suffix suffadj 30 Suffix suffppn 6 Suffix suffadv 5 Suffix vcomb 1 Bindevokal connvowl 2 Tabelle 3.6: Zusammensetzung des Online-CED 36

3.5.2 Das OALD Das OALD [OALD3] in der vorliegenden Version [Mit92] enthält 37 934 Grundform-Lemmata (zzgl. 30 409 flektierte Formen). Dazu sind jeweils Informationen zu Aussprache [Wel86] und Grammatik vorhanden; die Definitionen fehlen. Den Aufbau der Datensätze zeigt Tabelle 3.7. Offset Inhalt 1–25 Schreibung 26 – 50 Aussprache (siehe [Wel86]) 51 – 70 Grammatik-Kode (Syntax, Flexion) 71 – 130 Verbmuster Tabelle 3.7: Aufbau der OALD-Datensätze Abbildung 3.11 zeigt einen Auszug des OALD, um einen Eindruck von dem Originalformat zu erhalten. lingua franca ,lINgw@ ’fr&Nk@ Ki% 4 lingual ’lINgw@l OA% 2 linguist ’lINgwIst K6% 2 linguistic lIN’gwIstIk OA% 3 linguistically lIN’gwIstIklI Pu% 4 linguistics lIN’gwIstIks Lk% 3 linguists ’lINgwIsts Kj% 2 liniment ’lInIm@nt M6% 3 liniments ’lInIm@nts Mj$ 3 lining ’laInIN Jb%,M6% 22C,6A,14,15B linings ’laInINz Mj% 2 link lINk J0%,K6% 12A,2C,6A,15A,15B link-up ’lINk-Vp K6% 2 Abbildung 3.11: Auszug aus dem maschinenlesbaren OALD Die erste Rubrik enthält die orthographische Darstellung inklusive Leerraum bei Mehrwortlexemen und Groß-/Kleinschreibung. Die zweite Rubrik enthält die phonetische Transkription im System des Alvey Speech Club [Wel86], die sich u. a. bei der Darstellung von Diphtongen von der hier benutzten DISC-Umschrift 18 (Tabelle 3.8) unterscheidet und daher konvertiert werden mußte. Die dritte Rubrik mit den Grammatik-Kodes gliedert sich auf wie in Tabelle 3.9 angegeben. 18 das Zeichen { mußte leider durch < ersetzt werden, da seine Darstellung die Tcl/Tk-Oberfläche von Malaga unkontrolliert terminiert. 37

Linksassoziative morphologische Analyse des Englischen mit ...
Analyse der morphologischen und physiologischen Differenzierung in
Aspekte der morphologischen Analyse des Deutschen - Universität ...
Allgemeine Morphologische Analyse - Ein Überblick - Swedish ...
Morphologisch- anatomische Analyse von Arzneidrogen inklusive ...
Dissertation Automatische Analyse orthographischer Leistungen ...