16.12.2012 Aufrufe

2 - Institut für Deutsche Sprache

2 - Institut für Deutsche Sprache

2 - Institut für Deutsche Sprache

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

2. Mitarbeiter und Abteilungen<br />

WINDOWS-Benutzeroberfläche sowie der Zugriff<br />

auf Korpora im CES-Format.<br />

Im Mai dieses Jahres wurden alle Datenbanken im<br />

CES-Format freigegeben, zum Jahresende erfolgte<br />

eine weitere komplette Freigabe mit den erweiterten<br />

Header-Strukturen, die die bibliografischen<br />

Informationen zu den Texten enthalten (siehe<br />

auch korpusbasierende Arbeiten). Die Anzahl der<br />

in den Datenbanken enthaltenen und über COS-<br />

MAS II recherchierbaren Wortformen beläuft sich<br />

mittlerweile auf knapp 3,5 Milliarden.<br />

Die funktionell nochmals erweiterten, aber – im<br />

Vergleich zur WINDOWS-Version – noch nicht<br />

ganz vollständigen Versionen 1.3 und 1.4 der betriebssystemunabhängigen<br />

WWW-Applikation<br />

COSMAS II web konnten im Mai und im November<br />

freigegeben werden. Diese ermöglichen alle Korpus-<br />

und Trefferansichten sowie alle Sortierungen<br />

des KWIC. Darüber hinaus wurden die Funktionalitäten<br />

zu KWIC und Volltext umstrukturiert.<br />

Eine funktionell vollständige Version 1.5 ist nach<br />

dem Jahreswechsel zu erwarten.<br />

Für die WINDOWS-Applikation COSMAS II win<br />

wurden ebenfalls zwei Versionen, 3.8 und 3.9,<br />

freigegeben. Neben einem Self-Upgrade-Modus,<br />

der die bisherige Neuinstallation von aktualisierten<br />

Versionen ersetzt, wurden weitere Korpus-<br />

und Trefferansichten, sekundäre Sortierungen<br />

sowie Häufigkeitsmaße <strong>für</strong> die Trefferansichten<br />

integriert.<br />

Nachdem im Frühjahr das neu strukturierte<br />

WWW-Informationsangebot zum Projekt COS-<br />

MAS II und seinen Applikationen – als ein Portal<br />

<strong>für</strong> das Korpusrecherche- und -analysesystem des<br />

IDS – der Öffentlichkeit zur Verfügung gestellt<br />

werden konnte, wurde rechtzeitig zur Freigabe<br />

der Version 1.3 der WWW-Applikation COS-<br />

MAS II web auch deren Online-Hilfe vervollständigt.<br />

Die vom Programmbereich „Korpuslinguistik“<br />

(Abteilung Lexik) neuakquirierten – darunter acht<br />

Zeitungen mit mehreren Jahrgängen – und korrigierten<br />

Korpora wurden in die COSMAS II-Datenbanken<br />

übernommen.<br />

Im Herbst konnte ein weiterer Mitarbeiter im Rahmen<br />

des EU-Projekts D-SPIN <strong>für</strong> die Arbeiten am<br />

Korpus-Recherchesystem gewonnen werden, der<br />

32<br />

sich <strong>für</strong> Erweiterungen der Benutzeroberfläche<br />

von COSMAS II web und die Entwicklung von zugehörigen<br />

Web-Services verantwortlich zeichnet.<br />

Zurzeit steht die Migration der Laufzeitumgebung<br />

von COSMAS II server und der Indexierungsroutinen<br />

der Datenbanken auf die neu erworbene<br />

Hardware an (siehe auch Zentrale Hardware und<br />

Software).<br />

Die ständig anfallenden Aufgaben im Projekt<br />

COSMAS II umfassten:<br />

• die Pflege der COSMAS II-Datenbanken,<br />

• die Betreuung der Benutzer (Anfragen, Einführung,<br />

Benutzerverwaltungsdatenbank),<br />

• die Erstellung / Aktualisierung einer Dokumentation.<br />

Korpusbasierende Arbeiten<br />

Für den Programmbereich „Korpuslinguistik“<br />

(Abteilung Lexik) wurden das ganze Jahr über die<br />

aktuellen Ausgaben der Tageszeitungen „Mannheimer<br />

Morgen“, „Berliner Zeitung“, „taz“ sowie<br />

der Wochenzeitung „Die ZEIT“ über aktualisierte<br />

bzw. verbesserte Konvertierungsroutinen als Korpora<br />

<strong>für</strong> COSMAS II verfügbar gemacht.<br />

Ebenfalls in Zusammenarbeit mit der „Korpuslinguistik“<br />

wurden die Arbeiten zur Konvertierung<br />

der in COSMAS II eingebundenen Korpora aus<br />

den im IDS entwickelten und bisher benutzten<br />

„Mannheimer Konventionen“ in den SGML-basierenden<br />

Standard CES weiter vorangetrieben.<br />

Die Version 3.4 des Korpus-Transformationscompilers<br />

TraDuCES konnte freigegeben werden.<br />

Dort sind neben der Verlagerung von übergreifenden<br />

bibliografischen Angaben aus den Text-Headern<br />

in die Dokument-Header weitere Kontroll-<br />

und Korrekturmechanismen <strong>für</strong> syntaktisch nicht<br />

korrekte oder nicht vorhandene Header-Informationen<br />

enthalten, insbesondere bei den Angaben <strong>für</strong><br />

ausführliche und kurze Zitierung. Das Kriterium<br />

des „Minimalen Muss“ wurde <strong>für</strong> die Korpora in<br />

den COSMAS II-Datenbanken gestrichen.<br />

Für die getaggten Korpora wurden diverse Sonderregelungen<br />

abgeschafft. Die restlichen noch<br />

verbliebenen Korpora, die nicht die Minimalanforderungen<br />

an bibliografischen Angaben erfüllten,<br />

wurden entsprechend angepasst.

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!