Semantische Beziehungen in Computer- und Psycholinguistik
Semantische Beziehungen in Computer- und Psycholinguistik
Semantische Beziehungen in Computer- und Psycholinguistik
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
Handout Lexikalische Semantik, 8. Sitzung<br />
2. 12. 2003<br />
Pethő Gergely<br />
<strong>Semantische</strong> <strong>Beziehungen</strong> <strong>in</strong> <strong>Computer</strong>- <strong>und</strong> Psychol<strong>in</strong>guistik<br />
Homonymie <strong>und</strong> Polysemie<br />
I. <strong>Semantische</strong> <strong>Beziehungen</strong> <strong>in</strong> <strong>Computer</strong>- <strong>und</strong> Psychol<strong>in</strong>guistik<br />
Neben der Schule von John Lyons gibt es zwei berühmte Gruppen von L<strong>in</strong>guisten, die den<br />
Schlüssel zum Verständnis des Wortschatzes ebenfalls <strong>in</strong> den <strong>Beziehungen</strong> unter den<br />
Wortbedeutungen sehen:<br />
1. Igor Mel’čuk (<strong>und</strong> die Moskauer semantische Schule) hat e<strong>in</strong>e Wörterbuchkonzeption<br />
entwickelt, nach der e<strong>in</strong> e<strong>in</strong>sprachiges Wörterbuch nicht e<strong>in</strong>fach nur Def<strong>in</strong>itionen der<br />
Wörter enthalten soll, sondern viel umfangreichere Informationen, <strong>in</strong>sbesondere zu<br />
paradigmatischen <strong>und</strong> syntagmatischen semantischen <strong>Beziehungen</strong>, die e<strong>in</strong> Wort<br />
zu anderen unterhält. Sie sehen die E<strong>in</strong>beziehung des <strong>Computer</strong>s <strong>in</strong> die Entwicklung<br />
e<strong>in</strong>es solchen Wörterbuchs vor: die semantischen <strong>Beziehungen</strong> können z. T. durch die<br />
masch<strong>in</strong>elle Bearbeitung von Texten ermittelt werden <strong>und</strong> die semantischen<br />
<strong>Beziehungen</strong> werden anschließend masch<strong>in</strong>ell gespeichert <strong>und</strong> zum fertigen<br />
Wörterbuch verarbeitet.<br />
2. George Miller <strong>und</strong> das Wordnet-Projekt: Der Psychologe Miller hat das Problem<br />
formuliert, wie das mentale Lexikon organisiert ist. Aufgr<strong>und</strong> von psychologischen<br />
Erkenntnissen der letzten Jahrzehnte nimmt er an, dass der Wortschatz nach<br />
verschiedenen Gesichtspunkten strukturiert ist:<br />
• Wortklasse (Substantive, Adjektive <strong>und</strong> Verben getrennt)<br />
• <strong>in</strong>haltliche Zusammengehörigkeit (ähnlich wie Wortfelder)<br />
• formale Ähnlichkeit (z.B. mit demselben Derivationsmorphem gebildete Wörter<br />
s<strong>in</strong>d mite<strong>in</strong>ander verb<strong>und</strong>en)<br />
G. A. Miller: Wörter. Streifzüge durch die Psychol<strong>in</strong>guistik. Heidelberg, 1993.<br />
Aitchison, J.: Wörter im Kopf. E<strong>in</strong>e E<strong>in</strong>führung <strong>in</strong> das mentale Lexikon. Tüb<strong>in</strong>gen, 1997.<br />
1. Millers WordNet-Projekt<br />
Assoziationsexperimente<br />
Bei Substantiven nennen die Probanden meist andere Substantive, nämlich:<br />
• Synonyme (Busch – Strauch)<br />
• Hyponymiebeziehungen: Hyponyme (Baum – Eiche), Hyperonyme (Vater – Mann)<br />
oder Kohyponyme (Mann – Frau, Vater – Mutter)<br />
• Meronyme (= Teil-Ganzes-<strong>Beziehungen</strong>) (Vater – Bart)<br />
• e<strong>in</strong>e Reihe weiterer, weniger allgeme<strong>in</strong>er <strong>Beziehungen</strong>, z.B. Beruf-von (Mutter –<br />
Kauffrau), Instrument-von (Postbote – Tasche) usw.<br />
• Substantive, die ähnlich kl<strong>in</strong>gen (Fisch – Frosch)<br />
Oft werden nicht Substantive genannt, sondern Verben oder Adjektive, die mit dem<br />
Substantiv typischerweise e<strong>in</strong>e syntagmatische Beziehung e<strong>in</strong>gehen: Baum – wachsen<br />
(Subjekt-Verb-Beziehung), Baum – fällen (Objekt-Verb-Beziehung)<br />
1
George Miller hat (zusammen mit L<strong>in</strong>guisten, <strong>Computer</strong>fachleuten <strong>und</strong> Psychologen) Mitte<br />
der 80er Jahre begonnen, e<strong>in</strong> elektronisches Wörterbuch zu konstruieren, das auf solchen<br />
psychologisch realistischen Bedeutungsbeziehungen basiert <strong>und</strong> nannten es WordNet.<br />
Das WordNet-Projekt wird auch heute noch fortgesetzt (vor allem von Miller <strong>und</strong> Fellbaum).<br />
E<strong>in</strong>e Zielsetzung von WordNet ist, dass es als sog. masch<strong>in</strong>enlesbares Wörterbuch dienen<br />
kann für <strong>Computer</strong>programme, deren Ziel es ist, natürliche Sprache zu verstehen.<br />
Zwei Hauptanwendungsbereiche: Sammlung von Informationen aus riesengroßen<br />
Textsammlungen; masch<strong>in</strong>elle Übersetzung.<br />
WordNet basiert im Gegensatz zu traditionellen Pr<strong>in</strong>twörterbüchern nicht auf<br />
Bedeutungsangaben <strong>in</strong> Form von Def<strong>in</strong>itionen, sondern auf der Angabe von<br />
Bedeutungsbeziehungen unter Wörtern:<br />
• Die wichtigste solche Beziehung <strong>in</strong> WordNet ist die Synonymie (Geflügel ~<br />
Federvieh)<br />
• Ebenfalls sehr wichtig ist die Hyponymie, die die Substantive strukturiert. (Geflügel<br />
→ Vogel)<br />
• Meronymie (Schnabel < Vogel)<br />
• Attribute (Vogel: warmblütig, zweibe<strong>in</strong>ig)<br />
• Prädikate (Funktionen) (Vogel: legt Eier, fliegt)<br />
Hyponymie konstituiert Vererbungsbeziehungen im Wortschatz.<br />
Vererbungssysteme: <strong>in</strong> der Künstliche-Intelligenz (KI)-Forschung verwendete Methode zur<br />
Speicherung von Informationen. Wissen ist <strong>in</strong> den Knoten von hierarchischen Systemen<br />
gespeichert. Höhere Knoten geben ihre Informationen an die ihnen untergeordnete Knoten<br />
weiter (Vererbung der Informationen).<br />
Beispiel:<br />
Tier<br />
Wirbeltier .... Wurm<br />
Reptil Säugetier Fisch ....<br />
Barsch Forelle Karpfen ....<br />
Tier: leben, können sterben, bewegen sich, ernähren sich, pflanzen sich fort<br />
Wirbeltier: haben Knochen, e<strong>in</strong>e Wirbelsäule, Gliedmaßen, pflanzen sich geschlechtlich fort<br />
Fisch: haben Flossen <strong>und</strong> Schuppen, leben im Wasser, atmen im Wasser mit Kiemen<br />
Karpfen: Allesfresser, werden <strong>in</strong> Europa gern verspeist<br />
Da die Beziehung Karpfen → Fisch → Wirbeltier → Tier <strong>in</strong> der Hierarchie gegeben ist, s<strong>in</strong>d<br />
alle Eigenschaften von Tier, Wirbeltier <strong>und</strong> Fisch gleichzeitig auch Eigenschaften von<br />
Karpfen, <strong>und</strong> brauchen nicht extra bei Karpfen wieder angegeben zu werden.<br />
2
Höchste Kategorien der WordNet-Ontologie: {Tat, Tätigkeit}, {natürliches Objekt}, {Tier},<br />
{natürliches Phänomen}, {Artefakt}, {Person, menschliches Wesen}, {Attribut, Eigenschaft},<br />
{Pflanze}, {Körper}, {Besitz}, {Erkenntnis, Wissen}, {Prozess}, {Kommunikation},<br />
{Menge}, {Ereignis}, {Beziehung}, {Gefühl}, {Form}, {Essen}, {Zustand}, {Gruppe},<br />
{Substanz}, {Ort}, {Zeit}, {Motivation}<br />
2. <strong>Semantische</strong> <strong>Beziehungen</strong> bei Mel’čuk<br />
Wesentlich reicheres Inventar, über 60 e<strong>in</strong>fache <strong>und</strong> weitere komplexe <strong>Beziehungen</strong>.<br />
Quelle: Mel'čuk, Igor A. 1982. Lexical functions <strong>in</strong> lexicographic description. BLS 8, 427-44.<br />
Beispiele:<br />
• Si: Name des i-ten Arguments von W: S1(lehren): Lehrer, S2(lehren): Schüler,<br />
S3(lehren): Stoff, Unterrichtsstoff<br />
• S<strong>in</strong>str, Smed, Sres: Name von Instrument, „Medium”, Resultat von W: S<strong>in</strong>str(schießen):<br />
Schusswaffe, Smed(schießen): Kugel, Sres(lernen): Wissen<br />
• S<strong>in</strong>g: E<strong>in</strong>heit von W: S<strong>in</strong>g(Gras): Grashalm<br />
• Plur: Gesamtheit von W: Plur(Baum): Wald<br />
• Cap: Leiter von W: Cap(Universität): Rektor<br />
• Ablei: Eigenschaft des i-ten Arguments von W: Able1(kämpfen): kämpferisch,<br />
Able2(schneiden): schneidbar<br />
• Instr: Präposition, die Ausdrückt, dass W als Instrument fungiert:<br />
Instr(Schreibmasch<strong>in</strong>e): auf, Instr(Mediz<strong>in</strong>): durch<br />
• Degrad: schlecht werden: Degrad(Fleisch): vergammeln, Degrad(Milch): sauer<br />
werden<br />
3
II. Polysemie <strong>und</strong> Homonymie<br />
1. Wortbedeutung <strong>und</strong> Zeichenmodelle<br />
a) Naive (vorwissenschaftliche) Vorstellung von Zeichen:<br />
Form — D<strong>in</strong>g, das durch die Form bezeichnet wird (sog. Denotat)<br />
b) etwas komplexeres Modell: das semiotische Dreieck:<br />
D<strong>in</strong>g<br />
Denotat<br />
Extension (Menge der Denotate)<br />
Form Bedeutung<br />
Signifiant (Saussure) Signifié (Saussure)<br />
Intension<br />
S<strong>in</strong>n<br />
Allen Zeichenmodellen ist geme<strong>in</strong>sam, dass (zumeist implizit) angenommen wird, dass e<strong>in</strong>er<br />
Form genau e<strong>in</strong>e e<strong>in</strong>zige Bedeutung zugeordnet se<strong>in</strong> muss.<br />
2. Homonymie<br />
Es gibt triviale Fälle, die mit diesen Zeichenkonzeptionen auf den ersten Blick nicht zu<br />
vere<strong>in</strong>baren s<strong>in</strong>d.<br />
Beispiele:<br />
re<strong>in</strong> 1. ’sauber’; 2. ’h<strong>in</strong>e<strong>in</strong>’<br />
Bar 1. ’Lokal’; 2. ’Maße<strong>in</strong>heit des Luftdrucks’<br />
halt 1. Imperativ von halten; 2. ’eben’<br />
Diese Bedeutungen haben mite<strong>in</strong>ander nichts zu tun.<br />
Solche Fälle lassen sich mit den genannten Zeichenmodellen vere<strong>in</strong>baren, <strong>in</strong>dem man es so<br />
auffasst, dass es sich dabei um jeweils zwei verschiedene Zeichen handelt, deren Formen<br />
zufällig identisch s<strong>in</strong>d.<br />
Das Phänomen, wenn zwei unabhängige Zeichen durch die gleiche Form realisiert werden,<br />
wird Homonymie genannt.<br />
Typen der Homonymie:<br />
1. Nach Realisierungsform:<br />
a) sowohl graphische (geschriebene) Form, als auch phonetisch/phonologische<br />
(gesprochene) Form stimmt bei den beiden Zeichen übere<strong>in</strong>; z. B. re<strong>in</strong>1, re<strong>in</strong>2<br />
b) nur gesprochene Form ist gleich: Homophonie; z. B. Feld, fällt<br />
c) nur geschriebene Form ist gleich: Homographie; z. B. Band1 [bant], Band2 [bänd]<br />
4
2. Nach Ort der Übere<strong>in</strong>stimmung im Paradigma<br />
a) lexikalische Homonymie: die Nennformen der beiden Wörter (d. h. die Formen, die<br />
im Wörterbuch als Stichwort angegeben s<strong>in</strong>d) stimmen übere<strong>in</strong>; z. B. re<strong>in</strong>1, re<strong>in</strong>2;<br />
Band1, Band2<br />
b) grammatische Homonymie: e<strong>in</strong> beliebiges Element des morphologischen<br />
Paradigmas e<strong>in</strong>es Wortes (d. h. der Menge der Flexionsformen des Wortes) stimmt mit<br />
e<strong>in</strong>em beliebigen Element des Paradigmas e<strong>in</strong>es anderen Wortes übere<strong>in</strong> (außer der<br />
Nennform); z. B. fuhren (3Pl. Prät. von fahren) — Fuhren (Pl. Nom. von Fuhre)<br />
3. Begriff <strong>und</strong> e<strong>in</strong>ige Typen der Polysemie<br />
Fälle, wo ansche<strong>in</strong>end dasselbe Zeichen mehrere, mite<strong>in</strong>ander zusammenhängende<br />
(verwandte) <strong>und</strong> teilweise vone<strong>in</strong>ander abhängige Bedeutungen hat, nennt die L<strong>in</strong>guistik<br />
Polysemie.<br />
i) Metaphorisch motivierte Polysemie<br />
In der ersten Gruppe von Beispielen fällt es auf den ersten Blick auf, dass wir es mit mehreren<br />
Bedeutungen e<strong>in</strong>es Wortes zu tun haben.<br />
E<strong>in</strong>e Bedeutung, nämlich die ursprüngliche, die auch <strong>in</strong> der Gegenwart meistens die<br />
Hauptbedeutung des Wortes ist, bezieht sich <strong>in</strong> der Regel auf e<strong>in</strong>en natürlichen Gegenstand,<br />
e<strong>in</strong>en Körperteil o.ä.<br />
E<strong>in</strong>e zweite Bedeutung bezieht sich zumeist auf vom Menschen geschaffene Gegenstände<br />
(Artefakte).<br />
Beispiele:<br />
Birne ’e<strong>in</strong>e Fruchtsorte’ — ’Glühbirne’<br />
Blatt ’Teil e<strong>in</strong>er Pflanze’ — ’Stück Papier’<br />
Auge ’Sehorgan’ — ’e<strong>in</strong> Punkt auf e<strong>in</strong>em Würfel’<br />
Bei Adjektiven <strong>und</strong> Verben s<strong>in</strong>d es vor allem Ausdrücke aus dem physikalischen Bereich, die<br />
auf soziale oder psychologische Begriffe übertragen werden, teilweise auch auf verschiedene<br />
Fachbegriffe:<br />
kalt ’von ger<strong>in</strong>ger Temperatur’ — ’reserviert’<br />
treffen ’mit e<strong>in</strong>em Schlag, Geschoss o.ä. erreichen’ — ’begegnen’<br />
abstürzen ’fallen’ — ’verursacht durch e<strong>in</strong>en Fehler die Funktion beenden (Programm)’<br />
Das s<strong>in</strong>d e<strong>in</strong>deutig ke<strong>in</strong>e re<strong>in</strong> zufälligen Übere<strong>in</strong>stimmungen der Form (wie bei der<br />
Homonymie), es besteht e<strong>in</strong> offensichtlicher Zusammenhang zwischen den Bedeutungen.<br />
Dieser Zusammenhang ist stets e<strong>in</strong>e Ähnlichkeit.<br />
Es handelt sich deshalb um metaphorische <strong>Beziehungen</strong>.<br />
Wie lassen sich solche Beispiele <strong>in</strong> den Zeichenmodellen erfassen?<br />
Mehrere, vone<strong>in</strong>ander klar getrennte Bedeutungen, die derselben Form zugeordnet s<strong>in</strong>d.<br />
Die Bedeutungen werden e<strong>in</strong>deutig eigenständig gelernt <strong>und</strong> verarbeitet.<br />
Viele Semantiker neigen deshalb dazu, von der Ähnlichkeit unter den Bedeutungen<br />
abzusehen, <strong>und</strong> solche Fälle als zwei (eventuell mehr) getrennte Zeichen zu betrachten, die<br />
nur h<strong>in</strong>sichtlich ihrer Form relevant übere<strong>in</strong>stimmen, d. h. genauso, wie die Homonymie.<br />
5
ii) Systematische Polysemie<br />
Beispiele:<br />
Die Schule hat e<strong>in</strong> Flachdach. ‘Gebäude’<br />
Die Schule spendete e<strong>in</strong>en größeren Betrag. ‘Institution’<br />
Die Schule macht ihm großen Spaß. ‘Prozesse’<br />
Flasche: ’Gefäß’ — ’Menge, die <strong>in</strong> das Gefäß passt’ (e<strong>in</strong>e Flasche Cola)<br />
Bild: ’Gegenstand’ — ’das (die Szene etc.), was dieser Gegenstand darstellt’<br />
Zeitung:<br />
Die Zeitung liegt auf dem Tisch.<br />
Die heutige Zeitung ist äußerst <strong>in</strong>teressant.<br />
Ich lese diese Zeitung schon seit 5 Jahren.<br />
Die Zeitung spendete e<strong>in</strong>en größeren Betrag.<br />
?? Die Zeitung hat e<strong>in</strong> Flachdach.<br />
?? Die Zeitung macht ihm großen Spaß. ’Arbeit bei der Zeitung.’<br />
Solche Bedeutungsmuster s<strong>in</strong>d nicht auf e<strong>in</strong>zelne Wörter beschränkt, sondern treten bei<br />
zahlreichen Wörtern auf, die ähnliches bedeuten (zu e<strong>in</strong>em Wortfeld gehören), z. B.:<br />
� ’Institution’ — ’Gebäude’: Schule, Universität, Rathaus, Parlament, Krankenhaus,<br />
Hotel usw.<br />
� ’Behälter’ — ’Menge’: alle Bezeichnungen für Behälter (Korb, Kiste, Glas)<br />
� ’Objekt’ — ’Informationsstruktur, die <strong>in</strong> diesem Objekt gespeichert ist’: Bild, Zeitung,<br />
Sonate, Roman, CD<br />
Da solche Muster regelmäßig bei bestimmten Wörtern vorhanden s<strong>in</strong>d, heißt dieser Typ von<br />
Polysemie systematische Polysemie.<br />
In welcher Beziehung stehen die e<strong>in</strong>zelnen Bedeutungen zue<strong>in</strong>ander?<br />
Ke<strong>in</strong>e Ähnlichkeit, sondern e<strong>in</strong>e Art Berührung der Bedeutungen liegt diesen Mustern<br />
zugr<strong>und</strong>e: metonymische Beziehung.<br />
Es ist (im Gegensatz zur metaphorisch motivierten Polysemie) oft nicht festzustellen, welche<br />
Bedeutung primär <strong>und</strong> welche abgeleitet ist; die Bedeutungen s<strong>in</strong>d oft gegenseitig aufe<strong>in</strong>ander<br />
angewiesen.<br />
Diese Bedeutungsvarianten s<strong>in</strong>d ansche<strong>in</strong>end nicht sprachlich bestimmt, sondern s<strong>in</strong>d<br />
konzeptuell natürlich. Bestimmend ist dabei das Weltwissen, das wir über den durch das Wort<br />
bezeichneten Gegenstand besitzen. Systematische Polysemiemuster s<strong>in</strong>d deshalb <strong>in</strong> hohem<br />
Grad sprachübergreifend.<br />
iii) Extrem systematisch auftauchende Bedeutungsvariationen<br />
In manchen Fällen fällt es schwer zu entscheiden, ob man es mit Polysemie zu tun hat, oder<br />
mit allgeme<strong>in</strong>en semiotischen Pr<strong>in</strong>zipien, nämlich wenn bestimmte Lesarten bei vielen<br />
Lexemen extrem systematisch vorkommen.<br />
� Gr<strong>in</strong>d<strong>in</strong>g: Die Benennung e<strong>in</strong>es Objekts wird als die Benennung des Stoffes verwendet,<br />
aus dem dieses Objekt besteht, z. B.:<br />
Ich habe gestern im Restaurant Strauß gegessen.<br />
There was dog all over the street.<br />
6
� Packag<strong>in</strong>g: e<strong>in</strong> Massennomen bezeichnet e<strong>in</strong>e Portion des jeweiligen Stoffes, nicht den<br />
Stoff selbst, z. B.:<br />
Ich habe e<strong>in</strong> Bier getrunken.<br />
� Name der Person steht für e<strong>in</strong>e Sache, die mit dieser Person verb<strong>und</strong>en ist, z. B.:<br />
Ich mag Picasso. (die Kunst Picassos)<br />
� Name e<strong>in</strong>es Ortes steht für e<strong>in</strong> Ereignis/e<strong>in</strong>en Begriff, der mit diesem Ort verb<strong>und</strong>en ist,<br />
z. B.: Nach Waterloo wurde Napoleon verbannt.<br />
Sodom <strong>und</strong> Gomorrha<br />
� Bezeichnung e<strong>in</strong>es Objekts steht für Bezeichnung e<strong>in</strong>es Typs von Objekt, z. B.:<br />
Die Schule ist aus der Geschichte Europas nicht wegzudenken.<br />
Der H<strong>und</strong> stammt vom Wolf ab.<br />
� Name des Objekts steht für e<strong>in</strong>e Repräsentation/Nachbildung usw. des Objekts, z. B.<br />
Wir haben dem K<strong>in</strong>d e<strong>in</strong>en H<strong>und</strong> aus Plüsch gekauft. (ke<strong>in</strong> echter H<strong>und</strong>)<br />
iv) Kontextabhängige Hervorhebung e<strong>in</strong>es Teiles/Aspekts des Denotats<br />
Beispiele:<br />
Der Apfel ist rot. (Schale)<br />
Der Apfel ist süß. (Fleisch)<br />
Die Pfeife ist aus Holz. (die Pfeife selbst)<br />
Die Pfeife raucht. (der Tabak <strong>in</strong> der Pfeife)<br />
Dieses Phänomen wird kaum als Polysemie betrachtet, sondern als Folge der Tatsache, dass<br />
die bezeichneten Objekte selber komplex s<strong>in</strong>d, bzw. dass die Bezeichnungen immer<br />
e<strong>in</strong>igermaßen vage s<strong>in</strong>d.<br />
4. Konsequenzen für das Zeichenmodell<br />
Die <strong>in</strong> 1. erwähnten Zeichenmodelle, die von e<strong>in</strong>er Zuordnung „E<strong>in</strong>e Form — e<strong>in</strong>e<br />
Bedeutung” ausgehen, können zum<strong>in</strong>dest die systematische Polysemie (Punkt ii) nicht<br />
erfassen.<br />
E<strong>in</strong> mehrdimensionales Zeichenmodell sche<strong>in</strong>t adäquater zu se<strong>in</strong>:<br />
Bedeutungsbündel → (Regeln) → Intensionen → Welt (Extensionen)<br />
7<br />
Bedeutung1.1<br />
Form Bedeutung1 Bedeutung1.2<br />
Bedeutung2<br />
...<br />
Bedeutung1.3<br />
obj1<br />
obj3<br />
obj2
Bedeutung1: ’Zeitung’<br />
Bedeutung2: leer<br />
Bedeutung1.1: konkrete Zeitung<br />
Bedeutung1.2: „Titel”<br />
Bedeutung1.3: Redaktion (’Institution’)<br />
obj1: diese konkrete Zeitung<br />
obj2: die FAZ<br />
obj3: Die Redaktion der Bild<br />
8