17.11.2013 Aufrufe

Handout

Handout

Handout

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

̶<br />

̶<br />

Wortarten und Tagsets<br />

Korpuslinguistik<br />

Dr. Heike Zinsmeister<br />

WS 2009/10<br />

<br />

<br />

Kategorien<br />

<br />

<br />

<br />

Wortarten - Hintergrund<br />

Grundbegriffe eines Systems<br />

Philosophie: Kategorienlehre von Aristoteles als Systematik der<br />

Grundformen des Seins<br />

Substanz, Quantität, Qualität, Relation, Ort, Zeit, Lage,<br />

Haben, Wirken und Leiden<br />

syntaktische/grammatische Kategorien: Wortarten (Englisch:<br />

('‏speech 'parts of<br />

Dionysios Thrax (ca. 170‐90 v.Chr), Alexandria<br />

<br />

<br />

erste griechische Grammatik<br />

8 Wortarten:<br />

Adverben, Artikel, Konjunktionen, Nomen, Partizipien,<br />

Präpositionen, Pronomen und Verben<br />

4.11.2009 2<br />

Wortarten - Kriterien<br />

Klassifizierung nach morphologischen Kriterien<br />

<br />

<br />

<br />

Morphologische Kriterien<br />

<br />

<br />

flektierbar oder nicht, Art der Flektion<br />

wortartenspezifische Affigierung in der Wortbildung<br />

Semantische Kriterien<br />

<br />

teilweise Bildung von Unterklassen durch<br />

Bedeutungsunterschiede<br />

Distributionelle Kriterien<br />

<br />

Wortartenkontexte / Positionen im Satz, in denen ein<br />

Element typischerweise auftritt<br />

➢ Keines der Kriterien gilt absolut. Es gibt Interaktionen<br />

und Ausnahmen.<br />

4.11.2009 3<br />

Wort<br />

flektierbar nicht-flektierbar<br />

deklinierbar konjugierbar<br />

Substantive Konjunktionen<br />

Adjektive Verben Präpositionen<br />

Artikel<br />

Adverbien<br />

Partikeln<br />

Interjektionen<br />

(‏‎15‎ Berman: 2004: (nach Pittner &<br />

4.11.2009 4<br />

STTS<br />

Einschub: Tagsets<br />

STTS (Deutsch) und Penn<br />

(‏Englisch‏)‏ Treebank Tagset<br />

4.11.2009 5<br />

(‏‎1999‎ al. das Stuttgart-Tübingen Tagset (Schiller et<br />

<br />

<br />

<br />

Wortarten-Analyse für die manuelle (und<br />

automatische) Annotation von deutschen<br />

Textkorpora<br />

Vereinfachung: Leerzeichen = Wortgrenze<br />

<br />

es werden zunächst keine Mehrwortlexeme berücksichtigt<br />

Analog zum Standard der Text Encoding Initiative<br />

(‏TEI‏)‏<br />

<br />

<br />

11 Hauptwortarten, spezifiziert in<br />

54 Wortarten-Tags (48 & 6 Zusatztags:<br />

• Interpunktion, Fremdsprachliches, Nicht-Wörter, Truncs)<br />

4.11.2009 6<br />

1


STTS-Hauptwortarten<br />

Das Penn Treebank Tagset<br />

(‏‎1‎‏)‏ • Aufbau der Labels<br />

<br />

<br />

hierarchisch von links nach rechts: vom Allgemeinen zum<br />

Spezifischeren<br />

Bsp. Pronomen<br />

(1) Diese Lösung klappt. (2) Diese klappt nicht.<br />

ad (1): Pronomen demonstrativ attribuierend, PDAT<br />

ad (2): Pronomen demonstrativ substituierend, PDS<br />

(Schiller et<br />

al. (‏‎1999:4‎ 4.11.2009 7<br />

<br />

<br />

<br />

<br />

vgl. Santorini<br />

(‏‎1991‎‏)‏ 45 Tags (36 & 9 'punctuation<br />

('‏tags basiert auf dem umfangreicheren Tagset des Brown<br />

Corpus (Francis & Kučera<br />

(‏‎1982‎ Typen von Tags<br />

<br />

<br />

<br />

<br />

<br />

Hauptklassen: noun (common and proper); verb; adjective;<br />

adverb<br />

Funktionswörter: determiners, prepositions, conjunctions,<br />

pronouns, etc.<br />

wichtige Einzelwörter: to, there<br />

Interpunktion<br />

Fremdsprachl. Material, Symbole, Interjektionen, List Marker<br />

4.11.2009 8<br />

Das Penn Treebank Tagset<br />

(‏‎2‎‏)‏ <br />

<br />

<br />

Tagnamen sind weniger hierarchisch aufgebaut als im<br />

STTS<br />

Manche Tags sind nicht intuitiv, z.B.<br />

<br />

<br />

“JJ” für Adjektive<br />

“RB” für Adverb<br />

To ist immer als TO getaggt<br />

(1) to_TO go_VB to_TO university_NN<br />

<br />

existenzielles there ist als EX getaggt<br />

(2) There_EX is_VBZ a_DT unicorn_NN in_IN the_DT<br />

garden_NN<br />

Zurück zu den Wortarten im<br />

Allgemeinen<br />

4.11.2009 9<br />

4.11.2009 10<br />

Nomen: Morphologische Eigenschaften<br />

(‏‎1‎‏)‏ Nomen: Morphologische Eigenschaften<br />

(‏‎2‎‏)‏ <br />

<br />

(auch: Substantiv)<br />

festes Genus<br />

- Maskulin, Feminin, Neutrum<br />

- Aber: dialektale bzw. regionale Schwankungen<br />

(1) der/das Teller, der/die Butter, der/das Radio<br />

- Aber: Neue Wörter und andere Unsicherheiten<br />

(2) der/das Jogurt, der/das Virus, der/das Chip<br />

(Fortsetzung)<br />

<br />

werden nach Numerus und Kasus dekliniert<br />

- Aber: Pluralia Tanta (treten nur im Plural<br />

(‏auf (3) Geschwister, Alpen,...<br />

- Stoffsubstantive und manch andere (sind nicht zählbar) ‏treten<br />

nur im Singular auf (“Reis<br />

(”...‏ist (4) Reis, Mehl, Sand, Ruhe, Hass, Wut,...<br />

4.11.2009 11<br />

4.11.2009 12<br />

2


Eigenschaften Nomen: Semantische<br />

<br />

<br />

<br />

<br />

Konkreta – Abstrakta<br />

- Gegenständliches – Vorstellungen/ Handlungen/<br />

Vorgänge/Zustände/Eigenschaften/...<br />

(1) Stuhl / Obst – Meinung / Ruhe<br />

Belebt – unbelebt<br />

(2) Katze / Alge – Weg / Schule<br />

Gattungsbezeichnungen (Appellativa) – Eigennamen<br />

(3) ein/der Hund – Fido<br />

Diskret / zählbar – nicht zählbar<br />

(4) zwei Stühle vs. zwei *Obst<br />

(5) zwei Meinungen vs. zwei *Ruhen<br />

4.11.2009 13<br />

<br />

Kriterien Nomen: Distributionelle<br />

Typische Kontexte:<br />

<br />

Artikel (Adjektiv)* Nomen<br />

(1) Er liest ein neues Buch.<br />

<br />

- Aber: Eigennamen, Plurale, Stoffsubstantive,<br />

Funktionsverbgefüge (z.B. Freundschaft schließen), ...<br />

(2) Max liest gerne Comics.<br />

(3) Er isst Obst.<br />

(4) Er hat Freundschaft mit ihr geschlossen.<br />

Präposition (Artikel)? (Adjektiv)* Nomen<br />

(5) Sie zieht die Option in Betracht.<br />

Notation:<br />

* = “Kleene Star”<br />

(x)* = x kommt null mal, ein mal<br />

oder beliebig oft vor<br />

(x)? = x kommt nicht oder genau<br />

einmal vor<br />

4.11.2009 14<br />

Tagsets Nomen in den<br />

(‏‎1‎‏)‏ Verb<br />

<br />

<br />

STTS:<br />

<br />

<br />

('‏noun NN: “normales” Nomen ('common<br />

NE: Eigenname<br />

Penn Treebank<br />

<br />

<br />

<br />

<br />

NN: noun, singular or mass<br />

NNS: noun, plural<br />

NNP: proper noun, singular<br />

NNPs: proper noun, plural<br />

4.11.2009 15<br />

<br />

<br />

Morphologische Eigenschaften<br />

̶ werden konjugiert Dt.: Tempus, Modus, Numerus, Person<br />

Semantische Eigenschaften<br />

<br />

<br />

<br />

<br />

(‏Verben Vollverben (lexikalische<br />

̶ eigene Semantik<br />

(‏Auxiliare‏)‏ Hilfsverben<br />

̶ grammatische Bedeutung: Tempus, Konjunktiv,Passiv<br />

Modalverben<br />

̶ drücken Möglichkeit, Notwendigkeit, Erlaubnis,<br />

Einschätzung der Wahrscheinlichkeit u.ä. aus<br />

Kopulaverben<br />

̶ drücken Zustand oder Fortdauern aus: sind grammatischer<br />

Kitt für nicht-verbale Prädikate<br />

4.11.2009 16<br />

(‏‎2‎‏)‏ Verb<br />

(‏‎3‎‏)‏ Verb<br />

<br />

Distributionelle Eigenschaften<br />

<br />

<br />

<br />

<br />

Vollverben<br />

(‏Argumenten ̶ treten selbstständig auf (mit ihren<br />

Hilfsverben<br />

̶ treten nur zusammen mit einem infiniten Vollverb auf (im<br />

(‏Infinitiv Partizip Perfekt oder<br />

(1) haben, sein, werden<br />

Modalverben<br />

̶ treten mit infiniten Vollverben und Kopulaverben auf<br />

(2) können, dürfen, müssen, sollen, wollen, mögen<br />

[Halbmodalverben mit Vollverb im zu-Infinitiv<br />

(3) scheint zu schlafen, verspricht zu bleiben, droht zu...]<br />

<br />

(‏Fortsetzung‏)‏ Distributionelle Eigenschaften<br />

<br />

Kopulaverben<br />

̶ treten mit nicht-verbalem Prädikat auf<br />

̶ zählen mehr zu den Vollverben als zu den Auxiliaren<br />

̶ sein, bleiben, werden<br />

(1) Er ist [ NP<br />

ein guter Fußballer].<br />

(2) Sie wird [ AdjP<br />

gesund].<br />

(3) Ein Gewitter ist [ PP<br />

im Anmarsch].<br />

4.11.2009 17<br />

4.11.2009 18<br />

3


̶<br />

̶<br />

̶<br />

̶<br />

̶<br />

̶<br />

̶<br />

̶<br />

̶<br />

̶<br />

̶<br />

<br />

<br />

STTS: Vollverben<br />

<br />

<br />

Tagsets Verben in den<br />

VVFIN: Vollverb, finit<br />

VVIMP: Vollverb, Imperativ<br />

VVINF: Vollverb, Infinitiv<br />

VVIZU: Vollverb, zu-Infinitiv<br />

VVPP: Vollverb, Partizip Perfekt<br />

(‏VA Auxiliare: VAFIN, VAIMP, VAINF, VAPP (haben/sein immer als<br />

Modalverben: VMFIN, VMINF,VMPP<br />

Penn Treebank<br />

<br />

<br />

<br />

<br />

<br />

VB: Verb, base form<br />

VBD: Verb, past tense<br />

VBG: Verb, gerund or present participle<br />

VPN: Verb, past participle<br />

VBP: Verb, non-3 rd person singular present<br />

VBZ: Verb, 3 rd person singular present<br />

4.11.2009 19<br />

<br />

<br />

(‏‎1‎‏)‏ Adjektiv<br />

Morphologische Eigenschaften<br />

deklinierbar: großer, große, großes, ....<br />

<br />

komparierbar: große, größere, größte<br />

Semantische Eigenschaften, Beispiele:<br />

<br />

Qualitität<br />

(1) rot, rund, laut, gut, angeblich,..<br />

<br />

Relation<br />

(2) asiatisch, ärztlich, hölzern,..<br />

<br />

Quantifizierend<br />

(3) viel, wenig, eine, hundert, dritter, vierter,...<br />

<br />

Adjektivisch gebrauchte Partizipien<br />

(4) suchend, belastend, gesucht, belastet,...<br />

4.11.2009 20<br />

(‏‎2‎‏)‏ Adjektiv<br />

Tagsets Adjektive in den<br />

<br />

Distributionelle Eigenschaften<br />

<br />

STTS<br />

<br />

<br />

<br />

(‏flektiert prädikativ mit Kopulaverb (nicht<br />

(1) Der Ball ist rot. / Die Freunde sind quitt.<br />

(‏flektiert adverbial verwendet mit Vollverb (nicht<br />

(2) Das Auto fährt schnell.<br />

<br />

(‏lila attribuierend (normalerweise flektiert, Ausnahme z.B.<br />

(3) Der rote Ball / Das lila Kleid<br />

können Argumente selegieren<br />

(4) Er ist [ PP<br />

auf seinen Sieg] stolz.<br />

(5) Sie ist [ VP<br />

zu gehen] imstande.<br />

<br />

<br />

<br />

<br />

ADJA: Adjektiv, attribuierend<br />

ADJD: Adjektiv, adverbial oder prädikativ<br />

anderen Wortklassen zugeordnet<br />

̶ PIS/PIAT: viele, manche,...<br />

̶ CARD: zwei Männer, ..<br />

Penn Treebank<br />

<br />

<br />

<br />

JJ: adjective<br />

JJR: adjective, comparative<br />

JJS: Adjective, superlative<br />

̶ CD: two men, ...<br />

4.11.2009 21<br />

4.11.2009 22<br />

(‏‎1‎‏)‏ Pronomen<br />

(‏‎2‎‏)‏ Pronomen<br />

<br />

<br />

Morphologische Eigenschaften<br />

<br />

flektieren<br />

Semantische Eigenschaften<br />

<br />

<br />

<br />

Beitrag zur Referenz<br />

(‏dort ersetzen Nomen (siehe<br />

Unterklassen, z.B.<br />

Personalpronomen: ich, du,...<br />

Possessivpronomen: mein, dein,...<br />

Demonstrativpronomen: dieser, jener<br />

Reflexivpronomen: sich, einander<br />

Fragepronomen: wer, wie, was, warum<br />

Relativpronomen: der, die, das,<br />

4.11.2009 23<br />

<br />

Distributionelle Eigenschaften<br />

<br />

<br />

(‏Artikel attribuierend (ersetzen einen<br />

(1) dieser Baum<br />

(2) welcher Baum?<br />

substituierend (ersetzen eine Nominalphrase, oder<br />

(‏ähnliches<br />

(3) Er hat diesen gefällt.<br />

(4) Welchen hat er gefällt.<br />

4.11.2009 24<br />

4


̶<br />

(‏‎1‎‏)‏ Pronomen in den Tagsets<br />

(‏‎2‎‏)‏ Pronomen in den Tagsets<br />

<br />

STTS<br />

<br />

<br />

<br />

<br />

<br />

<br />

PDS, PDAT: Demonstrativpronomen<br />

PIS, PIAT, PIDAT: Indefinitepronomen: viele, man, wenig,...<br />

PPER: Personalpronomen<br />

PPOSS, PPOSAT: Possessivpronomen<br />

PRELS, PRELAT:Relativpronomen<br />

PRF: Reflexiv- und Reziprokpronomen: sich, einander,...<br />

<br />

Penn Treebank<br />

<br />

<br />

PRP, PRP$: personal pronoun, possessive pronoun<br />

WDT, WP, WP$, WRB: Wh-determiner, Wh-pronoun, possessive Whpronoun,<br />

Wh-adverb<br />

<br />

PWS, PWAT:Interrogativpronomen<br />

<br />

PWAV: adverbiales Interrogativ- oder Relativpronomen: warum<br />

PAV, Pronominaladverb: dafür, dabei, deswegen, trotzdem, ...<br />

̶ in STTS keine w-Pronominaladverbien, sind alle PWAV<br />

̶ PAV heißt in der Tübinger Baumbank “PROP”, vgl.<br />

ausgeteilte STTS-Übersicht<br />

̶ und in der TIGER Baumbank “PROAV”<br />

4.11.2009 25<br />

4.11.2009 26<br />

Determinierer<br />

Tagsets Determinierer in den<br />

<br />

<br />

<br />

<br />

auch: Artikel<br />

Morphologische Eigenschaften<br />

<br />

werden flektiert<br />

Semantische Eigenschaften<br />

<br />

legen Referenz des Substantivs fest<br />

̶ definit/indefinit, bestimmt/unbestimmt<br />

Distributionelle Eigenschaften<br />

<br />

<br />

treten stets zusammen mit einem Substantiv auf<br />

Scheinbare Ausnahme: Ellipsen<br />

(1) Ich nehme das große Stück. Du bekommst [das kleine ___ ].<br />

<br />

<br />

STTS<br />

<br />

<br />

ART<br />

anderen Wortarten zugeordnet<br />

̶ APPART: Präposition mit Artikel: zum<br />

̶ PDAT: attribuierende Demonstrativpronomen:<br />

diese NN<br />

Penn Treebank<br />

<br />

DT<br />

4.11.2009 27<br />

4.11.2009 28<br />

(‏‎1‎‏)‏ Adverb<br />

(‏‎2‎‏)‏ Adverb<br />

<br />

<br />

Morphologische Eigenschaften<br />

<br />

<br />

(‏kompariert wird nicht flektiert (manche werden<br />

Engl.: werden mit -ly gebildet<br />

(‏Adverb‏)‏ aber: friendly (Adjektiv), seldom/often<br />

Semantische Eigenschaften, Beispiele:<br />

<br />

<br />

<br />

<br />

temporal: heute, oft,..<br />

lokal: dort, hier, unten, dorthin,...<br />

modal: eilend, flugs, gerne,..<br />

kausal: deswegen, umständehalber,...<br />

4.11.2009 29<br />

<br />

<br />

<br />

<br />

(‏Fortsetzung‏)‏ Semantische Eigenschaften<br />

:‏Satzadverbien<br />

<br />

<br />

Stellungnahme: leider, hoffentlich<br />

Wahrscheinlichkeit: vielleicht, möglicherweise,...<br />

Bewertung: dummerweise, ...<br />

:‏Konjuktionaladverbien<br />

Beziehung zum Vortext: Trotzdem/ infolgedessen /deshalb ...<br />

:‏Pronominaladverbien<br />

<br />

da-/hier-/wo-+Präposition<br />

(1) Er kümmert sich darum, dass nichts passiert.<br />

4.11.2009 30<br />

5


̶<br />

(‏‎3‎‏)‏ Adverb<br />

Tagsets Adverben in den<br />

<br />

Distributionelle Eigenschaften<br />

<br />

Deutsch: Können am Satzanfang alleine vor dem<br />

finiten Verb auftreten<br />

(1) Leider/Heute/Hier regnet es.<br />

4.11.2009 31<br />

<br />

<br />

STTS<br />

<br />

<br />

ADV oder anderen Hauptklassen zugeordnet:<br />

PWAV, adverbiales Fragepronomen: warum, wann, worüber,<br />

wobei,...<br />

PAV, Pronominaladverb: dafür, dabei, deswegen, trotzdem, ...<br />

̶ in STTS keine w-Pronominaladverbien, sind alle<br />

PWAV<br />

̶ PAV heißt in der Tübinger Baumbank “PROP”, vgl.<br />

ausgeteilte STTS-Übersicht<br />

̶ und in der TIGER Baumbank “PROAV”<br />

Penn Treebank<br />

<br />

RB, RBR, RBS - Steigerungsformen<br />

4.11.2009 32<br />

(‏‎1‎‏)‏ Präposition<br />

(‏‎2‎‏)‏ Präposition<br />

<br />

<br />

<br />

allgemeiner: Adposition<br />

Morphologische Eigenschaften<br />

<br />

werden nicht flektiert<br />

Semantische Eigenschaften<br />

<br />

(‏temporal‏)‏ Zeitangaben<br />

(1) Sie besucht uns in drei Wochen<br />

<br />

(‏Weise Modalangabe (Art und<br />

(2) Die Tür wird in Rot gestrichen.<br />

<br />

(‏Grund‏)‏ Kausalangabe<br />

(3) Er weint vor Freude.<br />

<br />

('‏Eigenschaften (Fortsetzung: Semantische<br />

<br />

Lokalangabe (Ort), Temporalangabe (Zeit)<br />

(4) Sie wartet auf dem Bahnsteig<br />

<br />

Neutral (grammatikalisiert)<br />

(5) Sie wartet auf den Zug.<br />

4.11.2009 33<br />

4.11.2009 34<br />

(‏‎3‎‏)‏ Präposition<br />

Tagsets Präpositionen in den<br />

<br />

Distributionelle Eigenschaften<br />

<br />

<br />

<br />

<br />

treten normalerweise mit Nominalphrasen auf, bestimmen<br />

(“regieren”) deren Kasus<br />

(1) neben dem Haus, *neben des Hauses<br />

(‏lokal‏)‏ (2) in das Haus (direktional) / in dem Haus<br />

(‏Adverb (3) Er ist von hier (mit<br />

Präposition<br />

̶ geht dem Nomen voran: vor dem Nomen<br />

Postposition:<br />

̶ folgt dem Nomen nach: den Zaun entlang<br />

Zirkumposition:<br />

zweigeteilt: um .. willen, um ... herum<br />

4.11.2009 35<br />

<br />

<br />

STTS<br />

<br />

APPR: Präposition<br />

APPRART: Präposition mit Artikel: zum, am, ...<br />

<br />

<br />

APPO: Postposition<br />

APZR: rechter Teil einer Zirkumposition<br />

(1) Um ihn herum stehen viele Leute<br />

(1”) Um_APPR ihn_PPER herum_APZR stehen_VVFIN viele_PIAT<br />

Leute_NN<br />

Penn Treebank<br />

<br />

IN: Präpositionen und subordinierende Konjunktionen<br />

(‏‎39‎ (siehe Folie<br />

4.11.2009 36<br />

6


Konjunktion<br />

auch: Koordinierende Konjunktion<br />

Morphologische Eigenschaften<br />

<br />

wird nicht flektiert<br />

Semantische Eigenschaften<br />

<br />

verbindet zwei (oder mehr) gleichwertige Sätze oder Satzteile<br />

(1) und, oder, sowohl ... als auch<br />

<br />

<br />

STTS: KON<br />

(‏conjunction Penn Treebank: CC (coordinating<br />

4.11.2009 37<br />

<br />

<br />

<br />

<br />

Subjunktion<br />

auch: subordinierende Konjunktion<br />

Morphologische Eigenschaften<br />

<br />

wird nicht flektiert<br />

Semantische Eigenschaften<br />

<br />

<br />

bindet Sätze in andere Sätze ein, z.B.<br />

Argumentsatz: ..., dass....<br />

temporal: ..., dann ...<br />

kausal: ..., weil ...<br />

Distributionelle Eigenschaften<br />

<br />

tritt (fast) nur an der ersten Position im Teilsatz auf<br />

4.11.2009 38<br />

Tagsets Subjunktionen in den<br />

Partikeln<br />

<br />

STTS<br />

<br />

Morphologische Eigenschaften<br />

<br />

KOUS: subordinierende Konjunktion mit Satz<br />

(1) ..., weil er nach Hause geht.<br />

<br />

<br />

nicht flektiert<br />

Semantische Eigenschaften<br />

<br />

KOUI: subordinierende Konjunktion mit zu-Infinitiv<br />

(2) ... um nach Hause zu gehen.<br />

<br />

Modalpartikel: “Abtönungspartikel”<br />

(1) Er hat ja/doch/einfach keine Zeit<br />

<br />

Penn Treebank<br />

<br />

IN: gemeinsames Tag für subordinierende Konjunktionen und<br />

Präpositionen<br />

(3) I think that_IN he left early.<br />

(4) The kettle is on_IN the fire.<br />

<br />

Alternativenbezug Fokuspartikel:<br />

(2) Auch/nur/sogar Peter kommt.<br />

<br />

Steigerungspartikel: “intensifier”<br />

(3) ziemlich/sehr/ungemein dumm<br />

<br />

Antwortpartikel: ja, nein<br />

4.11.2009 39<br />

4.11.2009 40<br />

Partikeln in den Tagsets<br />

0ffene und geschlossene Klassen<br />

<br />

<br />

STTS<br />

<br />

<br />

<br />

PTKZU: zu mit zu-Infinitiv<br />

PTKNEG: Negationspartikel nicht<br />

PTKVZ: abgetrennte Verbpartikel<br />

(1) er kommt_VVFIN hier mit_PTKVZ.<br />

Vergleiche: (2) dass er hier mitkommt_VVFIN .<br />

<br />

PTKANT: Antwortpartikel<br />

(3) ja, nein, danke, bitte<br />

<br />

PTKA: Partikel mit Adjektiven/Adverbien<br />

(4) am schönsten, zu schnell<br />

Penn Treebank<br />

<br />

RP<br />

4.11.2009 41<br />

<br />

<br />

<br />

(‏Inhaltswörter‏)‏ lexikalische Klassen<br />

<br />

<br />

offene Klassen: erlauben Neubildungen<br />

Nomen, Verben, Adjektive, Adverbien<br />

Funktionswörter<br />

<br />

<br />

geschlossene Klassen: kaum Neubildungen<br />

Präpositionen, Artikel, Modalpartikel<br />

Grammatikalisierung<br />

<br />

Verlust der lexikalischen Bedeutung bei gleichzeitiger<br />

Verwendung als Funktionswort<br />

(1) Das ist voll gut<br />

4.11.2009 42<br />

7


Sind Wortarten universell?<br />

Wortarten sind nicht universell<br />

<br />

Bsp.: Latein besitzt, anders als Griechisch, keine Artikel. Folge:<br />

Anpassung der klassischen 8 Wortarten von Thrax an die<br />

Gegebenheiten des Lateinischen durch Ersetzung der Wortart<br />

“Artikel” mit “Interjektion” ('uh').<br />

Grammatiken durch das Griechische / das<br />

(‏verzerrt Lateinische geprägt (bzw.<br />

Standardisierungsbestrebungen<br />

<br />

<br />

EAGLES-Empfehlungen für europäische Sprachen<br />

http://www.ilc.cnr.it/EAGLES96/annotate/node9.htm<br />

GOLD-Ontologie http://www.linguistics-ontology.org/gold.html<br />

<br />

<br />

<br />

Beispiele für sprachspezifische Wortarten<br />

(‏‎1‎‏)‏ bzw. deren Fehlen<br />

Deutsch<br />

<br />

Verschmelzung von Präposition und definitem Artikel. Unterklasse:<br />

Kontrahierte Form<br />

(1) am, zum, beim usw.<br />

Dänisch<br />

<br />

Definiter Artikel als Affix, wenn kein Adjektiv beim Nomen:<br />

Unterklasse: definites Nomen<br />

(‏Buch (2) en bog (ein Buch) / bogen (das<br />

Japanisch, Latein, Polnisch, Russisch, Inuktitut, ... besitzen<br />

keine Artikel<br />

(.‏singt (3) Polnisch: chłopiec śpiewa (Ein/Der Junge<br />

4.11.2009 43<br />

4.11.2009 44<br />

Beispiele für sprachspezifische Wortarten bzw.<br />

(‏‎2‎‏)‏ deren Fehlen<br />

Referenzen<br />

<br />

Inuktitut<br />

<br />

Ist stark agglutinierend, d.h. es werden sehr komplexe Wörter<br />

aus vielen Morphemen gebildet<br />

̶ keine subordinierenden Konjunktionen<br />

̶ keine Präpositionen (sondern Kasusmorpheme)<br />

̶ “Adjektive” existieren nur als gebundene Morpheme<br />

(1) silaluk<br />

sila -luk = Wetter-schlecht "schlechtes Wetter"<br />

(2) ijiluktunga<br />

iji -luk -tunga = Auge-schlecht-1.singular_intransitiv<br />

"Ich habe schlechte Augen"<br />

(‏‎41‎ (Nowak 2007:<br />

4.11.2009 45<br />

Meibauer Jörg et al. (2007). Einführung in die germanistische Linguistik. Stuttgart /<br />

Weimar: Metzler, Kapitel 4.1-2, 4.4.1, 4.5<br />

Dudenverlag: Duden – Die Grammatik (Bd. 4).<br />

W. Nelson Francis und Henry Kučera. 1982. Frequency analysis of English usage :<br />

lexicon and grammar. Boston : Houghton Mifflin, 1982;<br />

http://icame.uib.no/brown/bcm.html<br />

<br />

<br />

<br />

<br />

Elke Nowak. 2007 3 . Einführung ins Inuktitut. Manuskript. TU Berlin. http://www.tuberlin.de/fak1/el/<br />

board.cgi?id=angli&action=view&gul=83&page=1&go_cnt=0<br />

Karin Pittner und Judith Berman. 2004. Deutsche Syntax. Ein Arbeitsbuch. Tübingen:<br />

Narr.<br />

Anne Schiller, Simone Teufel, Christine Stöckert und Christine Thielen. 1999. Guidelines<br />

für das Tagging deutscher Textcorpora mit STTS. Technischer Bericht. Institut für<br />

maschinelle Sprachverarbeitung, Stuttgart. http://www.ims.unistuttgart.de/projekte/corplex/TagSets/stts-1999.pdf<br />

Beatrice Santorini. 1990. Part-of-Speech Tagging Guidelines for the Penn Treebank<br />

Project. Technischer Bericht. University of Pennsylvania.<br />

ftp://ftp.cis.upenn.edu/pub/treebank/doc/tagguide.ps.gz<br />

4.11.2009 46<br />

8

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!