Dokument 1.pdf - edoc-Server der BBAW - Berlin-Brandenburgische ...
Dokument 1.pdf - edoc-Server der BBAW - Berlin-Brandenburgische ...
Dokument 1.pdf - edoc-Server der BBAW - Berlin-Brandenburgische ...
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
226<br />
ALEXANDER GEYKEN<br />
Abb. 2: Verteilung innerhalb <strong>der</strong> Kategorie Wissenschaft (Zeitraum 1780-1900)<br />
3.2 Einheitlichkeit <strong>der</strong> Formate<br />
Wie in Abschnitt 1 bereits erwähnt, ist die TEI auf einem guten<br />
Wege, ein De-Facto-Standard für die Annotation historischer Texte zu<br />
werden. Aufgrund ihrer großen Flexibilität ist die TEI j<strong>edoc</strong>h nicht<br />
per se interoperabel (z.B. UNSWORTH 2011). Interoperabilität ist<br />
j<strong>edoc</strong>h ein entscheiden<strong>der</strong> Eckpfeiler für eine Korpusinfrastruktur,<br />
die auf verteilten Ressourcen basiert. Auf Metadatenebene ermöglicht<br />
Interoperabilität, dass Texte einheitlich verarbeitet werden und über<br />
große Datenbanken verfügbar gemacht werden können. Auf <strong>der</strong><br />
Ebene <strong>der</strong> Text- bzw. Objektdaten erleichtert die einheitliche Annotation<br />
die Auswertung <strong>der</strong> Texte für weitere Analysen, wie z.B. Text<br />
Mining o<strong>der</strong> die tiefere Annotation des Texts mit Diskursinformationen.<br />
Darüber hinaus lassen sich einheitlich formatierte Texte auch<br />
indizieren, ohne dass dafür Konvertierungen o<strong>der</strong> manuelle Arbeitsschritte<br />
notwendig wären. Für die Abfrage hat dies den Vorteil, dass<br />
auch semantische Suchabfragen, sofern sie vorher annotiert wurden,<br />
konsistent abfragbar sind. Beispielsweise könnten aus großen Textsammlungen<br />
nur dann alle Abschnitte vom Typ „Brief“ mit einer<br />
Suchabfrage extrahiert werden, wenn diese vorher auch einheitlich<br />
ausgezeichnet wurden. Schließlich können einheitlich kodierte Metaund<br />
Objektdaten in großen Repositorien gespeichert werden und<br />
damit nachhaltig vorgehalten werden.