DEREKO DEREKO - Institut für Deutsche Sprache
DEREKO DEREKO - Institut für Deutsche Sprache
DEREKO DEREKO - Institut für Deutsche Sprache
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
Beteiligte Projekte<br />
• Ausbau und Pflege der Korpora<br />
geschriebener <strong>Sprache</strong><br />
• Methoden der Korpusanalyse<br />
und -erschließung<br />
Beteiligte Mitarbeiter<br />
• Dipl.-Ing. Cyril Belica<br />
• Dr. Marc Kupietz<br />
• Dr. Harald Lüngen<br />
• Dipl.-Inf. Rainer Perkuhn<br />
Kontakt<br />
Dr. Marc Kupietz<br />
Programmbereich Korpuslinguistik<br />
<strong>Institut</strong> <strong>für</strong> <strong>Deutsche</strong> <strong>Sprache</strong><br />
Postfach 10 16 21<br />
D-68016 Mannheim<br />
Telefon: 0621/1581-0<br />
Fax: 0621/1581-200<br />
E-Mail: korpuslinguistik@ids-mannheim.de<br />
INSTITUT FÜR<br />
DEUTSCHE SPRACHE<br />
R 5, 6–13<br />
D–68161 Mannheim<br />
www.ids-mannheim.de<br />
Das <strong>Institut</strong> <strong>für</strong> <strong>Deutsche</strong> <strong>Sprache</strong> (IDS) ist die zentrale Ein-<br />
richtung zur Erforschung und Dokumentation der deutschen<br />
<strong>Sprache</strong> in ihrem Gebrauch und in ihrer neueren Geschichte.<br />
Es gehört zu den 86 außeruniversitären Forschungseinrichtun-<br />
gen und Serviceeinrichtungen <strong>für</strong> die Forschung der Leibniz-<br />
Gemeinschaft.<br />
INSTITUT FÜR<br />
DEUTSCHE SPRACHE<br />
Programmbereich Korpuslinguistik<br />
<strong>DEREKO</strong><br />
Das <strong>Deutsche</strong><br />
Referenzkorpus
Die dauerhafte Sicherung einer empirischen<br />
Grundlage <strong>für</strong> die germanistisch-sprachwissenschaftliche<br />
Forschung ist eine der zentralen Aufgaben<br />
des IDS. Zu diesem Zweck unterhält das <strong>Institut</strong><br />
seit 1964 eine umfangreiche elektronische Stichprobe<br />
deutschsprachiger Texte aus Gegenwart und<br />
jüngerer Vergangenheit: das so genannte DEUTSCHE<br />
REFERENZKORPUS (<strong>DEREKO</strong>).<br />
<strong>DEREKO</strong><br />
• bildet mit über 5 Milliarden Wörtern die weltweit<br />
größte Sammlung elektronischer Korpora mit<br />
deutschsprachigen Texten aus Gegenwart und<br />
neuerer Vergangenheit<br />
• enthält belletristische, wissenschaftliche und<br />
populärwissenschaftliche Texte, eine große Zahl<br />
von Zeitungstexten sowie eine breite Palette weiterer<br />
Textarten<br />
• enthält ausschließlich urheberrechtlich abgesichertes<br />
Material<br />
• ist mit vielen Metainformationen ausgezeichnet<br />
• ist vollständig morphosyntaktisch annotiert<br />
(drei konkurrierende Annotationen)<br />
• wird im Hinblick auf Umfang, Variabilität und<br />
Qualität kontinuierlich weiterentwickelt<br />
• ist über die Recherchesoftware COSMAS II kostenlos<br />
zugänglich<br />
• erlaubt in der Nutzungsphase die Komposition<br />
virtueller Korpora, die hinsichtlich ihrer Repräsentativität<br />
auf spezielle Fragestellungen zugeschnitten<br />
sind (“Ur-Stichproben”-Design)<br />
Stand: r1942 / r1501 · 2012-04