2 - Institut für Deutsche Sprache
2 - Institut für Deutsche Sprache
2 - Institut für Deutsche Sprache
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
2. Mitarbeiter und Abteilungen<br />
WINDOWS-Benutzeroberfläche sowie der Zugriff<br />
auf Korpora im CES-Format.<br />
Im Mai dieses Jahres wurden alle Datenbanken im<br />
CES-Format freigegeben, zum Jahresende erfolgte<br />
eine weitere komplette Freigabe mit den erweiterten<br />
Header-Strukturen, die die bibliografischen<br />
Informationen zu den Texten enthalten (siehe<br />
auch korpusbasierende Arbeiten). Die Anzahl der<br />
in den Datenbanken enthaltenen und über COS-<br />
MAS II recherchierbaren Wortformen beläuft sich<br />
mittlerweile auf knapp 3,5 Milliarden.<br />
Die funktionell nochmals erweiterten, aber – im<br />
Vergleich zur WINDOWS-Version – noch nicht<br />
ganz vollständigen Versionen 1.3 und 1.4 der betriebssystemunabhängigen<br />
WWW-Applikation<br />
COSMAS II web konnten im Mai und im November<br />
freigegeben werden. Diese ermöglichen alle Korpus-<br />
und Trefferansichten sowie alle Sortierungen<br />
des KWIC. Darüber hinaus wurden die Funktionalitäten<br />
zu KWIC und Volltext umstrukturiert.<br />
Eine funktionell vollständige Version 1.5 ist nach<br />
dem Jahreswechsel zu erwarten.<br />
Für die WINDOWS-Applikation COSMAS II win<br />
wurden ebenfalls zwei Versionen, 3.8 und 3.9,<br />
freigegeben. Neben einem Self-Upgrade-Modus,<br />
der die bisherige Neuinstallation von aktualisierten<br />
Versionen ersetzt, wurden weitere Korpus-<br />
und Trefferansichten, sekundäre Sortierungen<br />
sowie Häufigkeitsmaße <strong>für</strong> die Trefferansichten<br />
integriert.<br />
Nachdem im Frühjahr das neu strukturierte<br />
WWW-Informationsangebot zum Projekt COS-<br />
MAS II und seinen Applikationen – als ein Portal<br />
<strong>für</strong> das Korpusrecherche- und -analysesystem des<br />
IDS – der Öffentlichkeit zur Verfügung gestellt<br />
werden konnte, wurde rechtzeitig zur Freigabe<br />
der Version 1.3 der WWW-Applikation COS-<br />
MAS II web auch deren Online-Hilfe vervollständigt.<br />
Die vom Programmbereich „Korpuslinguistik“<br />
(Abteilung Lexik) neuakquirierten – darunter acht<br />
Zeitungen mit mehreren Jahrgängen – und korrigierten<br />
Korpora wurden in die COSMAS II-Datenbanken<br />
übernommen.<br />
Im Herbst konnte ein weiterer Mitarbeiter im Rahmen<br />
des EU-Projekts D-SPIN <strong>für</strong> die Arbeiten am<br />
Korpus-Recherchesystem gewonnen werden, der<br />
32<br />
sich <strong>für</strong> Erweiterungen der Benutzeroberfläche<br />
von COSMAS II web und die Entwicklung von zugehörigen<br />
Web-Services verantwortlich zeichnet.<br />
Zurzeit steht die Migration der Laufzeitumgebung<br />
von COSMAS II server und der Indexierungsroutinen<br />
der Datenbanken auf die neu erworbene<br />
Hardware an (siehe auch Zentrale Hardware und<br />
Software).<br />
Die ständig anfallenden Aufgaben im Projekt<br />
COSMAS II umfassten:<br />
• die Pflege der COSMAS II-Datenbanken,<br />
• die Betreuung der Benutzer (Anfragen, Einführung,<br />
Benutzerverwaltungsdatenbank),<br />
• die Erstellung / Aktualisierung einer Dokumentation.<br />
Korpusbasierende Arbeiten<br />
Für den Programmbereich „Korpuslinguistik“<br />
(Abteilung Lexik) wurden das ganze Jahr über die<br />
aktuellen Ausgaben der Tageszeitungen „Mannheimer<br />
Morgen“, „Berliner Zeitung“, „taz“ sowie<br />
der Wochenzeitung „Die ZEIT“ über aktualisierte<br />
bzw. verbesserte Konvertierungsroutinen als Korpora<br />
<strong>für</strong> COSMAS II verfügbar gemacht.<br />
Ebenfalls in Zusammenarbeit mit der „Korpuslinguistik“<br />
wurden die Arbeiten zur Konvertierung<br />
der in COSMAS II eingebundenen Korpora aus<br />
den im IDS entwickelten und bisher benutzten<br />
„Mannheimer Konventionen“ in den SGML-basierenden<br />
Standard CES weiter vorangetrieben.<br />
Die Version 3.4 des Korpus-Transformationscompilers<br />
TraDuCES konnte freigegeben werden.<br />
Dort sind neben der Verlagerung von übergreifenden<br />
bibliografischen Angaben aus den Text-Headern<br />
in die Dokument-Header weitere Kontroll-<br />
und Korrekturmechanismen <strong>für</strong> syntaktisch nicht<br />
korrekte oder nicht vorhandene Header-Informationen<br />
enthalten, insbesondere bei den Angaben <strong>für</strong><br />
ausführliche und kurze Zitierung. Das Kriterium<br />
des „Minimalen Muss“ wurde <strong>für</strong> die Korpora in<br />
den COSMAS II-Datenbanken gestrichen.<br />
Für die getaggten Korpora wurden diverse Sonderregelungen<br />
abgeschafft. Die restlichen noch<br />
verbliebenen Korpora, die nicht die Minimalanforderungen<br />
an bibliografischen Angaben erfüllten,<br />
wurden entsprechend angepasst.