27.06.2013 Aufrufe

BEGRIFF DER LEXIKOGRAPHIE UND DER KORPORA

BEGRIFF DER LEXIKOGRAPHIE UND DER KORPORA

BEGRIFF DER LEXIKOGRAPHIE UND DER KORPORA

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

<strong>BEGRIFF</strong> <strong>DER</strong> <strong>LEXIKOGRAPHIE</strong> <strong>UND</strong> <strong>DER</strong> <strong>KORPORA</strong><br />

<strong>UND</strong> IHR STATUS IN <strong>DER</strong> LINGUISTIK<br />

Kurs: Lexikographie und Korpora (Gergely Pethő), 1. Sitzung<br />

2002. 02. 27. 16 00 Uhr, Universität Debrecen, Institut für Germanistik<br />

1. Was ist Lexikographie (= LG)?<br />

1.1. Wörterbuchschreibung und Wörterbuchforschung<br />

Die LG besteht aus zwei Teilen:<br />

a. praktischer Teil: Tätigkeit der Wörterbuchschreibung (= WBS)<br />

b. theoretischen Teil: die Wörterbuchforschung (= WBF), die Wissenschaft, die<br />

Wörterbücher untersucht<br />

zu a.: WBS (der sog. lexikographische Prozess) selbst ist keine Wissenschaft, sondern eine<br />

Tätigkeit, die auch von Laien praktiziert werden kann und auch wird. Z. B. Előd Halász<br />

Spezialisten für Lexikographie gibt es erst seit den letzten drei Jahrzehnten. Z. B.: Duden-<br />

Redaktion.<br />

zu b.: WBF ist eine typische angewandte Wissenschaft.<br />

Def.: EINE ANGEWANDTE WISSENSCHAFT ist eine Wissenschaft, deren Zweck nicht die<br />

Gewinnung von Wissen über die Welt, sondern die Lösung bestimmter praktischer<br />

Aufgaben ist. Z. B.: Ingenieurswissenschaft.<br />

Def.: WÖRTERBUCHFORSCHUNG ist eine angewandte Wissenschaft, die dem<br />

Zweck dient, bessere Wörterbücher schreiben zu können.<br />

Gegenstand der WBF:<br />

- den lexikographischen Prozess<br />

- Struktur der Wörterbücher<br />

- Typen der Wörterbücher<br />

- Beurteilung der Wörterbücher<br />

- Geschichte der Wörterbücher<br />

- Benutzung der Wörterbücher<br />

Wer verwendet sie?<br />

Zu welchem Zweck?<br />

Wie läuft das Nachschlagen in einem Wörterbuch ab?<br />

1.2. Verhältnis zwischen Lexikographie und Linguistik<br />

Lexikographie ist Teil der angewandten Linguistik.<br />

Def.: ANGEWANDTE LINGUISTIK ist eine Ansammlung von angewandten<br />

Wissenschaften, die sich mit Sprache zu bestimmten praktischen Zwecken befassen.


Teile der Linguistik:<br />

2002. 02. 27.<br />

LINGUISTIK<br />

? Angewandte Linguistik<br />

deskriptive Linguistik historische Linguistik ... ... Lexikographie<br />

Syntax hist. Syntax (Psycholinguistik ________________<br />

Morphologie hist. Morphologie Soziolinguistik ________________<br />

Phonologie etc. Neurolinguistik ________________<br />

Lexikologie etc.) ________________<br />

Semantik ________________<br />

Stilistik<br />

etc.<br />

? = „linguistische Grundlagenforschung”?<br />

Insgesamt können wir die gesamte Lexikographie mit Vorbehalt als eine Wissenschaft<br />

bezeichnen, die einen theoretischen und einen praktischen Teil hat (ähnlich wie die Medizin).<br />

2. Was sind Korpora?<br />

2.1. Begriff des Korpus<br />

! Deutsch das Korpus, Singularform in allen Kasus: Korpus; Pluralform in allen Kasus:<br />

Korpora !<br />

corpus, -oris n (lat.): Körper<br />

~ lat. > dt. Corpus Delicti, Corpus Iuris, lat. > frz. > dt. Korps (Aussprache wie Chor!)<br />

Def. KORPUS (auch: TEXTKORPUS): Die Gesamtheit der Texte, die einer<br />

linguistischen Untersuchung zugrunde liegen.<br />

Was heißt dass ein Text einer linguistischen Untersuchung zugrunde liegt?<br />

Zwei mögliche Methoden der Datengewinnung in der Linguistik:<br />

a. Linguisten können Daten (zu beschreibende oder zu erklärende sprachliche<br />

Einheiten, z. B. Sätze) aufgrund ihrer muttersprachlichen (oder<br />

fremdsprachlichen) Kompetenz selber erfinden. Diese heißen<br />

Introspektionsdaten. (Typisch in der theoretischen Linguistik.)<br />

b. Sie können die Daten aus Texten nehmen. Solche Daten heißen Korpusdaten.<br />

(Typisch in der traditionellen deskriptiven Linguistik und der Soziolinguistik.)<br />

2.2. Inhalt von Korpora<br />

Normalerweise werden literarische Texte und journalistische Texte als Korpora verwendet<br />

(Hauptursache: Verfügbarkeit).<br />

Es gibt auch Ausnahmen. Z. B. werden in der Gesprächsanalyse transkribierte Gespräche als<br />

Korpus verwendet.


<strong>BEGRIFF</strong> <strong>DER</strong> <strong>LEXIKOGRAPHIE</strong> <strong>UND</strong> <strong>DER</strong> <strong>KORPORA</strong><br />

2.3. Computerkorpora<br />

Def.: COMPUTER<strong>KORPORA</strong> sind digitalisierte Textsammlungen die für sehr viele<br />

mögliche linguistische Untersuchungen verwendet werden können.<br />

Es gibt sie erst seit etwa 30 Jahren, seit Computer für Linguisten allgemein verfügbar und<br />

leistungsfähig genug sind.<br />

Bestandteile eines Computercorpus:<br />

1. eine große Anzahl verschiedener Texte (v.a. aus Zeitungen, Magazinen und<br />

literarischen Werken), in digitaler Form auf einem Computer gespeichert;<br />

2. ein Programm (eine sog. Suchmaschine), das diese Texte nach bestimmten Wörtern,<br />

grammatischen Konstruktionen etc. durchsuchen und die Suchergebnisse darstellen<br />

kann.<br />

Linguistische Datensammlung vor den Computerkorpora:<br />

1. Immer wenn man ein interessantes Beispiel gefunden hat, musste man das Beispiel auf<br />

einer Karteikarte (mit genauer Quellenangabe) aufschreiben.<br />

2. Man musste diese Karteikarten in einer Kartei so (z.B. nach Stichwörtern) anordnen,<br />

dass man nach einer bestimmten Karte suchen konnte.<br />

3. Wenn man dabei war, ein Thema zu untersuchen, suchte man die relevanten<br />

Karteikarten aus der Kartei heraus.<br />

Mit Computerkorpora entfallen Schritt 1 und 2, Schritt 3 wird erheblich beschleunigt.<br />

Computerkorpora haben interessante, nicht triviale Eigenschaften, z. B.:<br />

Wie kann man am effektivsten in ihnen suchen?<br />

Welche Typen von Daten enthalten sie überhaupt und welche nicht?<br />

Fragen dieser Art untersucht die (Computer-)Korpuslinguistik.<br />

2.4. Das linguistische Datenproblem<br />

Welche Daten sind in einer linguistischen Forschung zulässig?<br />

Zwei Parteien:<br />

1. Man darf Introspektionsdaten verwenden, denn: der Linguist ist ein ebenso<br />

kompetenter Sprecher seiner Muttersprache, wie jeder andere. Er kann deshalb<br />

selber beurteilen, welche Ausdrücke in seiner Sprache wohlgeformt sind und welche<br />

nicht.<br />

Das meinen: theoretische Linguisten, besonders Vertreter der generativen<br />

Grammatik.<br />

2. Introspektionsdaten sind nicht zulässig, denn: Der Linguist will seine Theorie<br />

beweisen und täuscht sich manchmal selbst in seiner Beurteilung der Grammatikalität<br />

von Daten. Wenn man viel über einen bestimmten Ausdruck seiner Muttersprache<br />

nachdenkt, wird man verunsichert, ob der Ausdruck wohlgeformt ist oder nicht.<br />

Ein Linguist kann sich dann leicht zu einer Entscheidung verleiten, die seiner Theorie<br />

nicht widerspricht.<br />

Deshalb dürfen nur „empirische” Daten als linguistische Daten erlaubt sein sollen.<br />

Def.: EMPIRISCHE DATEN sind im wirklichen Sprachgebrauch existierende,<br />

belegbare Daten.<br />

Das meinen: Soziolinguisten, Gesprächsanalyse, empirische Linguisten.


2002. 02. 27.<br />

Ein Beispiel aus dem Aufsatz Brody/Szabolcsi (2000: 39-40).<br />

Minden tanár kevés példát adott fel a legtöbb osztályban.<br />

versus *Minden tanár a legtöbb osztályban kevés példát adott fel.<br />

Es ist fragwürdig, ob diese Beurteilung des Grammatikalitätskontrastes zwischen diesen<br />

beiden Sätzen repräsentativ für die Gesamtheit der ungarischen Muttersprachler ist.<br />

(Ist der zweite Satz tatsächlich ungrammatisch oder zumindest schlechter als der erste?)<br />

Diese Beurteilung unterstützt jedoch die Theorie, die von den Autoren für die Anordnung<br />

der Quantoren im Ungarischen vorgeschlagen wird.<br />

Def. QUANTOREN sind sprachliche Ausdrücke, die die Anzahl von bestimmten<br />

Objekten angeben, z. B. manche, viele, ein, genau zwei, mindestens drei, nur zehn etc.<br />

Wenn man diese Grammatikalitätsurteile nicht akzeptiert, ist folglich auch die Theorie von<br />

Bródy und Szabolcsi falsch.<br />

Problem:<br />

Theorien sind durch die aus ihnen folgenden Vorhersagen prinzipiell überprüfbar.<br />

Die Beurteilung von Daten ist jedoch grundsätzlich nicht intersubjektiv<br />

überprüfbar, sondern nur subjektiv möglich.<br />

Daraus folgt:<br />

Über linguistische Theorien kann man sinnvoll diskutieren, über die ihnen<br />

zugrunde liegenden Daten jedoch nicht.<br />

Lösungsvorschlag der empirischen Linguistik:<br />

Wenn man nur empirische Daten verwendet, kann man sinnlose Diskussionen über<br />

die Grammatikalität von einzelnen Beispielen aus der Welt schaffen, da die Beispiele<br />

dann eindeutig belegt sind.<br />

Allerdings:<br />

Dieser Vorschlag hat einen Haken:<br />

Er gilt nur für positive (grammatische) Daten. Negative (ungrammatische)<br />

Daten sind jedoch ebenso wichtig für die theoretische Linguistik. Solche Daten<br />

kommen jedoch in Korpora entweder nicht vor oder sind von grammatischen<br />

zumindest nicht zu unterscheiden.<br />

Verwendete Literatur:<br />

BRODY, M. und A. SZABOLCSI 2000. Overt Scope: A Case Study in Hungarian. Manuskript.<br />

HARTMANN, R. R. K. 2001. Teaching and Researching Lexicography. Pearson Education:<br />

Harlow.<br />

SCHÜTZE, C. 1995.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!