Handout
Handout
Handout
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
̶<br />
̶<br />
Wortarten und Tagsets<br />
Korpuslinguistik<br />
Dr. Heike Zinsmeister<br />
WS 2009/10<br />
<br />
<br />
Kategorien<br />
<br />
<br />
<br />
Wortarten - Hintergrund<br />
Grundbegriffe eines Systems<br />
Philosophie: Kategorienlehre von Aristoteles als Systematik der<br />
Grundformen des Seins<br />
Substanz, Quantität, Qualität, Relation, Ort, Zeit, Lage,<br />
Haben, Wirken und Leiden<br />
syntaktische/grammatische Kategorien: Wortarten (Englisch:<br />
('speech 'parts of<br />
Dionysios Thrax (ca. 170‐90 v.Chr), Alexandria<br />
<br />
<br />
erste griechische Grammatik<br />
8 Wortarten:<br />
Adverben, Artikel, Konjunktionen, Nomen, Partizipien,<br />
Präpositionen, Pronomen und Verben<br />
4.11.2009 2<br />
Wortarten - Kriterien<br />
Klassifizierung nach morphologischen Kriterien<br />
<br />
<br />
<br />
Morphologische Kriterien<br />
<br />
<br />
flektierbar oder nicht, Art der Flektion<br />
wortartenspezifische Affigierung in der Wortbildung<br />
Semantische Kriterien<br />
<br />
teilweise Bildung von Unterklassen durch<br />
Bedeutungsunterschiede<br />
Distributionelle Kriterien<br />
<br />
Wortartenkontexte / Positionen im Satz, in denen ein<br />
Element typischerweise auftritt<br />
➢ Keines der Kriterien gilt absolut. Es gibt Interaktionen<br />
und Ausnahmen.<br />
4.11.2009 3<br />
Wort<br />
flektierbar nicht-flektierbar<br />
deklinierbar konjugierbar<br />
Substantive Konjunktionen<br />
Adjektive Verben Präpositionen<br />
Artikel<br />
Adverbien<br />
Partikeln<br />
Interjektionen<br />
(15 Berman: 2004: (nach Pittner &<br />
4.11.2009 4<br />
STTS<br />
Einschub: Tagsets<br />
STTS (Deutsch) und Penn<br />
(Englisch) Treebank Tagset<br />
4.11.2009 5<br />
(1999 al. das Stuttgart-Tübingen Tagset (Schiller et<br />
<br />
<br />
<br />
Wortarten-Analyse für die manuelle (und<br />
automatische) Annotation von deutschen<br />
Textkorpora<br />
Vereinfachung: Leerzeichen = Wortgrenze<br />
<br />
es werden zunächst keine Mehrwortlexeme berücksichtigt<br />
Analog zum Standard der Text Encoding Initiative<br />
(TEI)<br />
<br />
<br />
11 Hauptwortarten, spezifiziert in<br />
54 Wortarten-Tags (48 & 6 Zusatztags:<br />
• Interpunktion, Fremdsprachliches, Nicht-Wörter, Truncs)<br />
4.11.2009 6<br />
1
STTS-Hauptwortarten<br />
Das Penn Treebank Tagset<br />
(1) • Aufbau der Labels<br />
<br />
<br />
hierarchisch von links nach rechts: vom Allgemeinen zum<br />
Spezifischeren<br />
Bsp. Pronomen<br />
(1) Diese Lösung klappt. (2) Diese klappt nicht.<br />
ad (1): Pronomen demonstrativ attribuierend, PDAT<br />
ad (2): Pronomen demonstrativ substituierend, PDS<br />
(Schiller et<br />
al. (1999:4 4.11.2009 7<br />
<br />
<br />
<br />
<br />
vgl. Santorini<br />
(1991) 45 Tags (36 & 9 'punctuation<br />
('tags basiert auf dem umfangreicheren Tagset des Brown<br />
Corpus (Francis & Kučera<br />
(1982 Typen von Tags<br />
<br />
<br />
<br />
<br />
<br />
Hauptklassen: noun (common and proper); verb; adjective;<br />
adverb<br />
Funktionswörter: determiners, prepositions, conjunctions,<br />
pronouns, etc.<br />
wichtige Einzelwörter: to, there<br />
Interpunktion<br />
Fremdsprachl. Material, Symbole, Interjektionen, List Marker<br />
4.11.2009 8<br />
Das Penn Treebank Tagset<br />
(2) <br />
<br />
<br />
Tagnamen sind weniger hierarchisch aufgebaut als im<br />
STTS<br />
Manche Tags sind nicht intuitiv, z.B.<br />
<br />
<br />
“JJ” für Adjektive<br />
“RB” für Adverb<br />
To ist immer als TO getaggt<br />
(1) to_TO go_VB to_TO university_NN<br />
<br />
existenzielles there ist als EX getaggt<br />
(2) There_EX is_VBZ a_DT unicorn_NN in_IN the_DT<br />
garden_NN<br />
Zurück zu den Wortarten im<br />
Allgemeinen<br />
4.11.2009 9<br />
4.11.2009 10<br />
Nomen: Morphologische Eigenschaften<br />
(1) Nomen: Morphologische Eigenschaften<br />
(2) <br />
<br />
(auch: Substantiv)<br />
festes Genus<br />
- Maskulin, Feminin, Neutrum<br />
- Aber: dialektale bzw. regionale Schwankungen<br />
(1) der/das Teller, der/die Butter, der/das Radio<br />
- Aber: Neue Wörter und andere Unsicherheiten<br />
(2) der/das Jogurt, der/das Virus, der/das Chip<br />
(Fortsetzung)<br />
<br />
werden nach Numerus und Kasus dekliniert<br />
- Aber: Pluralia Tanta (treten nur im Plural<br />
(auf (3) Geschwister, Alpen,...<br />
- Stoffsubstantive und manch andere (sind nicht zählbar) treten<br />
nur im Singular auf (“Reis<br />
(”...ist (4) Reis, Mehl, Sand, Ruhe, Hass, Wut,...<br />
4.11.2009 11<br />
4.11.2009 12<br />
2
Eigenschaften Nomen: Semantische<br />
<br />
<br />
<br />
<br />
Konkreta – Abstrakta<br />
- Gegenständliches – Vorstellungen/ Handlungen/<br />
Vorgänge/Zustände/Eigenschaften/...<br />
(1) Stuhl / Obst – Meinung / Ruhe<br />
Belebt – unbelebt<br />
(2) Katze / Alge – Weg / Schule<br />
Gattungsbezeichnungen (Appellativa) – Eigennamen<br />
(3) ein/der Hund – Fido<br />
Diskret / zählbar – nicht zählbar<br />
(4) zwei Stühle vs. zwei *Obst<br />
(5) zwei Meinungen vs. zwei *Ruhen<br />
4.11.2009 13<br />
<br />
Kriterien Nomen: Distributionelle<br />
Typische Kontexte:<br />
<br />
Artikel (Adjektiv)* Nomen<br />
(1) Er liest ein neues Buch.<br />
<br />
- Aber: Eigennamen, Plurale, Stoffsubstantive,<br />
Funktionsverbgefüge (z.B. Freundschaft schließen), ...<br />
(2) Max liest gerne Comics.<br />
(3) Er isst Obst.<br />
(4) Er hat Freundschaft mit ihr geschlossen.<br />
Präposition (Artikel)? (Adjektiv)* Nomen<br />
(5) Sie zieht die Option in Betracht.<br />
Notation:<br />
* = “Kleene Star”<br />
(x)* = x kommt null mal, ein mal<br />
oder beliebig oft vor<br />
(x)? = x kommt nicht oder genau<br />
einmal vor<br />
4.11.2009 14<br />
Tagsets Nomen in den<br />
(1) Verb<br />
<br />
<br />
STTS:<br />
<br />
<br />
('noun NN: “normales” Nomen ('common<br />
NE: Eigenname<br />
Penn Treebank<br />
<br />
<br />
<br />
<br />
NN: noun, singular or mass<br />
NNS: noun, plural<br />
NNP: proper noun, singular<br />
NNPs: proper noun, plural<br />
4.11.2009 15<br />
<br />
<br />
Morphologische Eigenschaften<br />
̶ werden konjugiert Dt.: Tempus, Modus, Numerus, Person<br />
Semantische Eigenschaften<br />
<br />
<br />
<br />
<br />
(Verben Vollverben (lexikalische<br />
̶ eigene Semantik<br />
(Auxiliare) Hilfsverben<br />
̶ grammatische Bedeutung: Tempus, Konjunktiv,Passiv<br />
Modalverben<br />
̶ drücken Möglichkeit, Notwendigkeit, Erlaubnis,<br />
Einschätzung der Wahrscheinlichkeit u.ä. aus<br />
Kopulaverben<br />
̶ drücken Zustand oder Fortdauern aus: sind grammatischer<br />
Kitt für nicht-verbale Prädikate<br />
4.11.2009 16<br />
(2) Verb<br />
(3) Verb<br />
<br />
Distributionelle Eigenschaften<br />
<br />
<br />
<br />
<br />
Vollverben<br />
(Argumenten ̶ treten selbstständig auf (mit ihren<br />
Hilfsverben<br />
̶ treten nur zusammen mit einem infiniten Vollverb auf (im<br />
(Infinitiv Partizip Perfekt oder<br />
(1) haben, sein, werden<br />
Modalverben<br />
̶ treten mit infiniten Vollverben und Kopulaverben auf<br />
(2) können, dürfen, müssen, sollen, wollen, mögen<br />
[Halbmodalverben mit Vollverb im zu-Infinitiv<br />
(3) scheint zu schlafen, verspricht zu bleiben, droht zu...]<br />
<br />
(Fortsetzung) Distributionelle Eigenschaften<br />
<br />
Kopulaverben<br />
̶ treten mit nicht-verbalem Prädikat auf<br />
̶ zählen mehr zu den Vollverben als zu den Auxiliaren<br />
̶ sein, bleiben, werden<br />
(1) Er ist [ NP<br />
ein guter Fußballer].<br />
(2) Sie wird [ AdjP<br />
gesund].<br />
(3) Ein Gewitter ist [ PP<br />
im Anmarsch].<br />
4.11.2009 17<br />
4.11.2009 18<br />
3
̶<br />
̶<br />
̶<br />
̶<br />
̶<br />
̶<br />
̶<br />
̶<br />
̶<br />
̶<br />
̶<br />
<br />
<br />
STTS: Vollverben<br />
<br />
<br />
Tagsets Verben in den<br />
VVFIN: Vollverb, finit<br />
VVIMP: Vollverb, Imperativ<br />
VVINF: Vollverb, Infinitiv<br />
VVIZU: Vollverb, zu-Infinitiv<br />
VVPP: Vollverb, Partizip Perfekt<br />
(VA Auxiliare: VAFIN, VAIMP, VAINF, VAPP (haben/sein immer als<br />
Modalverben: VMFIN, VMINF,VMPP<br />
Penn Treebank<br />
<br />
<br />
<br />
<br />
<br />
VB: Verb, base form<br />
VBD: Verb, past tense<br />
VBG: Verb, gerund or present participle<br />
VPN: Verb, past participle<br />
VBP: Verb, non-3 rd person singular present<br />
VBZ: Verb, 3 rd person singular present<br />
4.11.2009 19<br />
<br />
<br />
(1) Adjektiv<br />
Morphologische Eigenschaften<br />
deklinierbar: großer, große, großes, ....<br />
<br />
komparierbar: große, größere, größte<br />
Semantische Eigenschaften, Beispiele:<br />
<br />
Qualitität<br />
(1) rot, rund, laut, gut, angeblich,..<br />
<br />
Relation<br />
(2) asiatisch, ärztlich, hölzern,..<br />
<br />
Quantifizierend<br />
(3) viel, wenig, eine, hundert, dritter, vierter,...<br />
<br />
Adjektivisch gebrauchte Partizipien<br />
(4) suchend, belastend, gesucht, belastet,...<br />
4.11.2009 20<br />
(2) Adjektiv<br />
Tagsets Adjektive in den<br />
<br />
Distributionelle Eigenschaften<br />
<br />
STTS<br />
<br />
<br />
<br />
(flektiert prädikativ mit Kopulaverb (nicht<br />
(1) Der Ball ist rot. / Die Freunde sind quitt.<br />
(flektiert adverbial verwendet mit Vollverb (nicht<br />
(2) Das Auto fährt schnell.<br />
<br />
(lila attribuierend (normalerweise flektiert, Ausnahme z.B.<br />
(3) Der rote Ball / Das lila Kleid<br />
können Argumente selegieren<br />
(4) Er ist [ PP<br />
auf seinen Sieg] stolz.<br />
(5) Sie ist [ VP<br />
zu gehen] imstande.<br />
<br />
<br />
<br />
<br />
ADJA: Adjektiv, attribuierend<br />
ADJD: Adjektiv, adverbial oder prädikativ<br />
anderen Wortklassen zugeordnet<br />
̶ PIS/PIAT: viele, manche,...<br />
̶ CARD: zwei Männer, ..<br />
Penn Treebank<br />
<br />
<br />
<br />
JJ: adjective<br />
JJR: adjective, comparative<br />
JJS: Adjective, superlative<br />
̶ CD: two men, ...<br />
4.11.2009 21<br />
4.11.2009 22<br />
(1) Pronomen<br />
(2) Pronomen<br />
<br />
<br />
Morphologische Eigenschaften<br />
<br />
flektieren<br />
Semantische Eigenschaften<br />
<br />
<br />
<br />
Beitrag zur Referenz<br />
(dort ersetzen Nomen (siehe<br />
Unterklassen, z.B.<br />
Personalpronomen: ich, du,...<br />
Possessivpronomen: mein, dein,...<br />
Demonstrativpronomen: dieser, jener<br />
Reflexivpronomen: sich, einander<br />
Fragepronomen: wer, wie, was, warum<br />
Relativpronomen: der, die, das,<br />
4.11.2009 23<br />
<br />
Distributionelle Eigenschaften<br />
<br />
<br />
(Artikel attribuierend (ersetzen einen<br />
(1) dieser Baum<br />
(2) welcher Baum?<br />
substituierend (ersetzen eine Nominalphrase, oder<br />
(ähnliches<br />
(3) Er hat diesen gefällt.<br />
(4) Welchen hat er gefällt.<br />
4.11.2009 24<br />
4
̶<br />
(1) Pronomen in den Tagsets<br />
(2) Pronomen in den Tagsets<br />
<br />
STTS<br />
<br />
<br />
<br />
<br />
<br />
<br />
PDS, PDAT: Demonstrativpronomen<br />
PIS, PIAT, PIDAT: Indefinitepronomen: viele, man, wenig,...<br />
PPER: Personalpronomen<br />
PPOSS, PPOSAT: Possessivpronomen<br />
PRELS, PRELAT:Relativpronomen<br />
PRF: Reflexiv- und Reziprokpronomen: sich, einander,...<br />
<br />
Penn Treebank<br />
<br />
<br />
PRP, PRP$: personal pronoun, possessive pronoun<br />
WDT, WP, WP$, WRB: Wh-determiner, Wh-pronoun, possessive Whpronoun,<br />
Wh-adverb<br />
<br />
PWS, PWAT:Interrogativpronomen<br />
<br />
PWAV: adverbiales Interrogativ- oder Relativpronomen: warum<br />
PAV, Pronominaladverb: dafür, dabei, deswegen, trotzdem, ...<br />
̶ in STTS keine w-Pronominaladverbien, sind alle PWAV<br />
̶ PAV heißt in der Tübinger Baumbank “PROP”, vgl.<br />
ausgeteilte STTS-Übersicht<br />
̶ und in der TIGER Baumbank “PROAV”<br />
4.11.2009 25<br />
4.11.2009 26<br />
Determinierer<br />
Tagsets Determinierer in den<br />
<br />
<br />
<br />
<br />
auch: Artikel<br />
Morphologische Eigenschaften<br />
<br />
werden flektiert<br />
Semantische Eigenschaften<br />
<br />
legen Referenz des Substantivs fest<br />
̶ definit/indefinit, bestimmt/unbestimmt<br />
Distributionelle Eigenschaften<br />
<br />
<br />
treten stets zusammen mit einem Substantiv auf<br />
Scheinbare Ausnahme: Ellipsen<br />
(1) Ich nehme das große Stück. Du bekommst [das kleine ___ ].<br />
<br />
<br />
STTS<br />
<br />
<br />
ART<br />
anderen Wortarten zugeordnet<br />
̶ APPART: Präposition mit Artikel: zum<br />
̶ PDAT: attribuierende Demonstrativpronomen:<br />
diese NN<br />
Penn Treebank<br />
<br />
DT<br />
4.11.2009 27<br />
4.11.2009 28<br />
(1) Adverb<br />
(2) Adverb<br />
<br />
<br />
Morphologische Eigenschaften<br />
<br />
<br />
(kompariert wird nicht flektiert (manche werden<br />
Engl.: werden mit -ly gebildet<br />
(Adverb) aber: friendly (Adjektiv), seldom/often<br />
Semantische Eigenschaften, Beispiele:<br />
<br />
<br />
<br />
<br />
temporal: heute, oft,..<br />
lokal: dort, hier, unten, dorthin,...<br />
modal: eilend, flugs, gerne,..<br />
kausal: deswegen, umständehalber,...<br />
4.11.2009 29<br />
<br />
<br />
<br />
<br />
(Fortsetzung) Semantische Eigenschaften<br />
:Satzadverbien<br />
<br />
<br />
Stellungnahme: leider, hoffentlich<br />
Wahrscheinlichkeit: vielleicht, möglicherweise,...<br />
Bewertung: dummerweise, ...<br />
:Konjuktionaladverbien<br />
Beziehung zum Vortext: Trotzdem/ infolgedessen /deshalb ...<br />
:Pronominaladverbien<br />
<br />
da-/hier-/wo-+Präposition<br />
(1) Er kümmert sich darum, dass nichts passiert.<br />
4.11.2009 30<br />
5
̶<br />
(3) Adverb<br />
Tagsets Adverben in den<br />
<br />
Distributionelle Eigenschaften<br />
<br />
Deutsch: Können am Satzanfang alleine vor dem<br />
finiten Verb auftreten<br />
(1) Leider/Heute/Hier regnet es.<br />
4.11.2009 31<br />
<br />
<br />
STTS<br />
<br />
<br />
ADV oder anderen Hauptklassen zugeordnet:<br />
PWAV, adverbiales Fragepronomen: warum, wann, worüber,<br />
wobei,...<br />
PAV, Pronominaladverb: dafür, dabei, deswegen, trotzdem, ...<br />
̶ in STTS keine w-Pronominaladverbien, sind alle<br />
PWAV<br />
̶ PAV heißt in der Tübinger Baumbank “PROP”, vgl.<br />
ausgeteilte STTS-Übersicht<br />
̶ und in der TIGER Baumbank “PROAV”<br />
Penn Treebank<br />
<br />
RB, RBR, RBS - Steigerungsformen<br />
4.11.2009 32<br />
(1) Präposition<br />
(2) Präposition<br />
<br />
<br />
<br />
allgemeiner: Adposition<br />
Morphologische Eigenschaften<br />
<br />
werden nicht flektiert<br />
Semantische Eigenschaften<br />
<br />
(temporal) Zeitangaben<br />
(1) Sie besucht uns in drei Wochen<br />
<br />
(Weise Modalangabe (Art und<br />
(2) Die Tür wird in Rot gestrichen.<br />
<br />
(Grund) Kausalangabe<br />
(3) Er weint vor Freude.<br />
<br />
('Eigenschaften (Fortsetzung: Semantische<br />
<br />
Lokalangabe (Ort), Temporalangabe (Zeit)<br />
(4) Sie wartet auf dem Bahnsteig<br />
<br />
Neutral (grammatikalisiert)<br />
(5) Sie wartet auf den Zug.<br />
4.11.2009 33<br />
4.11.2009 34<br />
(3) Präposition<br />
Tagsets Präpositionen in den<br />
<br />
Distributionelle Eigenschaften<br />
<br />
<br />
<br />
<br />
treten normalerweise mit Nominalphrasen auf, bestimmen<br />
(“regieren”) deren Kasus<br />
(1) neben dem Haus, *neben des Hauses<br />
(lokal) (2) in das Haus (direktional) / in dem Haus<br />
(Adverb (3) Er ist von hier (mit<br />
Präposition<br />
̶ geht dem Nomen voran: vor dem Nomen<br />
Postposition:<br />
̶ folgt dem Nomen nach: den Zaun entlang<br />
Zirkumposition:<br />
zweigeteilt: um .. willen, um ... herum<br />
4.11.2009 35<br />
<br />
<br />
STTS<br />
<br />
APPR: Präposition<br />
APPRART: Präposition mit Artikel: zum, am, ...<br />
<br />
<br />
APPO: Postposition<br />
APZR: rechter Teil einer Zirkumposition<br />
(1) Um ihn herum stehen viele Leute<br />
(1”) Um_APPR ihn_PPER herum_APZR stehen_VVFIN viele_PIAT<br />
Leute_NN<br />
Penn Treebank<br />
<br />
IN: Präpositionen und subordinierende Konjunktionen<br />
(39 (siehe Folie<br />
4.11.2009 36<br />
6
Konjunktion<br />
auch: Koordinierende Konjunktion<br />
Morphologische Eigenschaften<br />
<br />
wird nicht flektiert<br />
Semantische Eigenschaften<br />
<br />
verbindet zwei (oder mehr) gleichwertige Sätze oder Satzteile<br />
(1) und, oder, sowohl ... als auch<br />
<br />
<br />
STTS: KON<br />
(conjunction Penn Treebank: CC (coordinating<br />
4.11.2009 37<br />
<br />
<br />
<br />
<br />
Subjunktion<br />
auch: subordinierende Konjunktion<br />
Morphologische Eigenschaften<br />
<br />
wird nicht flektiert<br />
Semantische Eigenschaften<br />
<br />
<br />
bindet Sätze in andere Sätze ein, z.B.<br />
Argumentsatz: ..., dass....<br />
temporal: ..., dann ...<br />
kausal: ..., weil ...<br />
Distributionelle Eigenschaften<br />
<br />
tritt (fast) nur an der ersten Position im Teilsatz auf<br />
4.11.2009 38<br />
Tagsets Subjunktionen in den<br />
Partikeln<br />
<br />
STTS<br />
<br />
Morphologische Eigenschaften<br />
<br />
KOUS: subordinierende Konjunktion mit Satz<br />
(1) ..., weil er nach Hause geht.<br />
<br />
<br />
nicht flektiert<br />
Semantische Eigenschaften<br />
<br />
KOUI: subordinierende Konjunktion mit zu-Infinitiv<br />
(2) ... um nach Hause zu gehen.<br />
<br />
Modalpartikel: “Abtönungspartikel”<br />
(1) Er hat ja/doch/einfach keine Zeit<br />
<br />
Penn Treebank<br />
<br />
IN: gemeinsames Tag für subordinierende Konjunktionen und<br />
Präpositionen<br />
(3) I think that_IN he left early.<br />
(4) The kettle is on_IN the fire.<br />
<br />
Alternativenbezug Fokuspartikel:<br />
(2) Auch/nur/sogar Peter kommt.<br />
<br />
Steigerungspartikel: “intensifier”<br />
(3) ziemlich/sehr/ungemein dumm<br />
<br />
Antwortpartikel: ja, nein<br />
4.11.2009 39<br />
4.11.2009 40<br />
Partikeln in den Tagsets<br />
0ffene und geschlossene Klassen<br />
<br />
<br />
STTS<br />
<br />
<br />
<br />
PTKZU: zu mit zu-Infinitiv<br />
PTKNEG: Negationspartikel nicht<br />
PTKVZ: abgetrennte Verbpartikel<br />
(1) er kommt_VVFIN hier mit_PTKVZ.<br />
Vergleiche: (2) dass er hier mitkommt_VVFIN .<br />
<br />
PTKANT: Antwortpartikel<br />
(3) ja, nein, danke, bitte<br />
<br />
PTKA: Partikel mit Adjektiven/Adverbien<br />
(4) am schönsten, zu schnell<br />
Penn Treebank<br />
<br />
RP<br />
4.11.2009 41<br />
<br />
<br />
<br />
(Inhaltswörter) lexikalische Klassen<br />
<br />
<br />
offene Klassen: erlauben Neubildungen<br />
Nomen, Verben, Adjektive, Adverbien<br />
Funktionswörter<br />
<br />
<br />
geschlossene Klassen: kaum Neubildungen<br />
Präpositionen, Artikel, Modalpartikel<br />
Grammatikalisierung<br />
<br />
Verlust der lexikalischen Bedeutung bei gleichzeitiger<br />
Verwendung als Funktionswort<br />
(1) Das ist voll gut<br />
4.11.2009 42<br />
7
Sind Wortarten universell?<br />
Wortarten sind nicht universell<br />
<br />
Bsp.: Latein besitzt, anders als Griechisch, keine Artikel. Folge:<br />
Anpassung der klassischen 8 Wortarten von Thrax an die<br />
Gegebenheiten des Lateinischen durch Ersetzung der Wortart<br />
“Artikel” mit “Interjektion” ('uh').<br />
Grammatiken durch das Griechische / das<br />
(verzerrt Lateinische geprägt (bzw.<br />
Standardisierungsbestrebungen<br />
<br />
<br />
EAGLES-Empfehlungen für europäische Sprachen<br />
http://www.ilc.cnr.it/EAGLES96/annotate/node9.htm<br />
GOLD-Ontologie http://www.linguistics-ontology.org/gold.html<br />
<br />
<br />
<br />
Beispiele für sprachspezifische Wortarten<br />
(1) bzw. deren Fehlen<br />
Deutsch<br />
<br />
Verschmelzung von Präposition und definitem Artikel. Unterklasse:<br />
Kontrahierte Form<br />
(1) am, zum, beim usw.<br />
Dänisch<br />
<br />
Definiter Artikel als Affix, wenn kein Adjektiv beim Nomen:<br />
Unterklasse: definites Nomen<br />
(Buch (2) en bog (ein Buch) / bogen (das<br />
Japanisch, Latein, Polnisch, Russisch, Inuktitut, ... besitzen<br />
keine Artikel<br />
(.singt (3) Polnisch: chłopiec śpiewa (Ein/Der Junge<br />
4.11.2009 43<br />
4.11.2009 44<br />
Beispiele für sprachspezifische Wortarten bzw.<br />
(2) deren Fehlen<br />
Referenzen<br />
<br />
Inuktitut<br />
<br />
Ist stark agglutinierend, d.h. es werden sehr komplexe Wörter<br />
aus vielen Morphemen gebildet<br />
̶ keine subordinierenden Konjunktionen<br />
̶ keine Präpositionen (sondern Kasusmorpheme)<br />
̶ “Adjektive” existieren nur als gebundene Morpheme<br />
(1) silaluk<br />
sila -luk = Wetter-schlecht "schlechtes Wetter"<br />
(2) ijiluktunga<br />
iji -luk -tunga = Auge-schlecht-1.singular_intransitiv<br />
"Ich habe schlechte Augen"<br />
(41 (Nowak 2007:<br />
4.11.2009 45<br />
Meibauer Jörg et al. (2007). Einführung in die germanistische Linguistik. Stuttgart /<br />
Weimar: Metzler, Kapitel 4.1-2, 4.4.1, 4.5<br />
Dudenverlag: Duden – Die Grammatik (Bd. 4).<br />
W. Nelson Francis und Henry Kučera. 1982. Frequency analysis of English usage :<br />
lexicon and grammar. Boston : Houghton Mifflin, 1982;<br />
http://icame.uib.no/brown/bcm.html<br />
<br />
<br />
<br />
<br />
Elke Nowak. 2007 3 . Einführung ins Inuktitut. Manuskript. TU Berlin. http://www.tuberlin.de/fak1/el/<br />
board.cgi?id=angli&action=view&gul=83&page=1&go_cnt=0<br />
Karin Pittner und Judith Berman. 2004. Deutsche Syntax. Ein Arbeitsbuch. Tübingen:<br />
Narr.<br />
Anne Schiller, Simone Teufel, Christine Stöckert und Christine Thielen. 1999. Guidelines<br />
für das Tagging deutscher Textcorpora mit STTS. Technischer Bericht. Institut für<br />
maschinelle Sprachverarbeitung, Stuttgart. http://www.ims.unistuttgart.de/projekte/corplex/TagSets/stts-1999.pdf<br />
Beatrice Santorini. 1990. Part-of-Speech Tagging Guidelines for the Penn Treebank<br />
Project. Technischer Bericht. University of Pennsylvania.<br />
ftp://ftp.cis.upenn.edu/pub/treebank/doc/tagguide.ps.gz<br />
4.11.2009 46<br />
8