14.01.2014 Aufrufe

Dokument 1.pdf - edoc-Server der BBAW - Berlin-Brandenburgische ...

Dokument 1.pdf - edoc-Server der BBAW - Berlin-Brandenburgische ...

Dokument 1.pdf - edoc-Server der BBAW - Berlin-Brandenburgische ...

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

230<br />

ALEXANDER GEYKEN<br />

schritte ist das Korpus somit schreibweisentolerant und orthographieübergreifend<br />

durchsuchbar.<br />

3.5 Nachnutzbarkeit <strong>der</strong> Texte<br />

Die Nachnutzbarkeit von Texten hat eine rechtliche und eine technische<br />

Ebene. Auf <strong>der</strong> rechtlichen Ebene müssen Texte, wenn sie durch<br />

Dritte für Forschungszwecke nutzbar sein sollen, mit einer offenen<br />

Lizenz versehen sein, damit Analysen o<strong>der</strong> Zusatzannotationen zu<br />

einem Text wie<strong>der</strong> zusammen mit den Basistexten veröffentlicht<br />

werden können. Mittels einer Creative Commons Lizenz ist dies<br />

möglich. Texte können damit nicht nur zum Download angeboten<br />

werden, son<strong>der</strong>n auch in an<strong>der</strong>e Repositorien eingebettet und dort<br />

für weitere Nutzungsformen zur Verfügung stehen. Im Projekt DTA<br />

beispielsweise stehen alle vom DTA produzierten Texte unter einer<br />

CC-BY-NC Lizenz. Sie sind somit unter Namensnennung des DTA für<br />

nichtkommerzielle Zwecke in beliebigen Forschungskontexten nachnutzbar.<br />

Auf technischer Ebene müssen verschiedene Maßnahmen bezüglich<br />

Zugriff, Objektpersistenz und Formatstandardisierung getroffen<br />

werden. Zunächst einmal sollten die <strong>Dokument</strong>e autonom in Repositorien<br />

vorgehalten werden und nicht etwa in Datenbanken gekapselt.<br />

Des Weiteren sollten Texte besteht mit persistenten Identifizierern<br />

(PID) ausgestattet sein, damit sie von Dritten verlässlich referenziert<br />

werden können. Die Referenzierungsgenauigkeit sollte dabei mindestens<br />

auf <strong>Dokument</strong>ebene, besser aber auf Seiten- bzw. Zeilenebene<br />

erfolgen. Drittens sollten Meta- und Objektdaten gemäß transparenter<br />

und weit verbreiteter Standards beschrieben sein. Verwendet man<br />

beispielsweise Dublin Core o<strong>der</strong> klar definierte TEI-Hea<strong>der</strong>, können<br />

die Metadaten über eine OAI-PMH-Schnittstelle verfügbar gemacht<br />

werden und stehen somit für viele Formen <strong>der</strong> Nachnutzung, insbeson<strong>der</strong>e<br />

zur Verzeichnung und Kontextualisierung in den großen<br />

Metadatenkatalogen, zur Verfügung. In Abschnitt 3.2 wurde bereits<br />

darauf eingegangen, dass Objektdaten, die in einem TEI-Basisformat<br />

(Beispielsweise dem DTA-BF) vorliegen, auch interoperabel einsetzbar<br />

und somit auch leichter nachnutzbar in an<strong>der</strong>en Kontexten sind.<br />

3.6 Infrastruktur für die Anreicherung <strong>der</strong> Textbasis<br />

Die Korpusinfrastruktur muss offen für externe Beiträger gestaltet<br />

werden, die im Rahmen ihrer Forschungsarbeiten Texte des späten<br />

16. bis frühen 20. Jahrhun<strong>der</strong>ts bearbeiten und/o<strong>der</strong> digitalisieren.<br />

Dies geschieht zum wechselseitigen Nutzen: Die Beiträger erreichen

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!