R 4.4.1 Dokumentation und Leitfaden für den TextGrid-Import
R 4.4.1 Dokumentation und Leitfaden für den TextGrid-Import
R 4.4.1 Dokumentation und Leitfaden für den TextGrid-Import
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
3. <strong>TextGrid</strong>-Datenimport<br />
Die <strong>Import</strong>-Funktion von <strong>TextGrid</strong> wird genutzt, um Dateien zu speichern <strong>und</strong> zu öffnen, die<br />
nicht durch das <strong>TextGrid</strong>Lab erzeugt wur<strong>den</strong>. Dies gilt auch <strong>für</strong> <strong>den</strong> Fall, wenn Objekte zwar<br />
im <strong>TextGrid</strong>Rep gespeichert sind, aber (noch) nicht in das <strong>TextGrid</strong>Lab importiert wur<strong>den</strong>.<br />
In einigen Fällen wur<strong>den</strong> Objekte vorher aus dem Lab gelöscht, sodass sie bei Bedarf<br />
re-importiert wer<strong>den</strong> müssen, um an diesen Objekten Editierungsarbeiten durchführen zu<br />
können.<br />
Gewöhnlich wer<strong>den</strong> Dateien durch ihren Namen <strong>und</strong> <strong>den</strong> Pfad i<strong>den</strong>tifiziert, unter dem sie<br />
gespeichert sind. Um in <strong>TextGrid</strong> ein Objekt eindeutig i<strong>den</strong>tifizieren zu können, wird beim<br />
<strong>Import</strong> eine URI (Uniform Resource I<strong>den</strong>tifier) vergeben, die sogenannte <strong>TextGrid</strong> URI.<br />
Im Folgen<strong>den</strong> wer<strong>den</strong> die zwei gr<strong>und</strong>sätzlichen Arten beschrieben, um Dateien in <strong>TextGrid</strong><br />
zu importieren.<br />
3.1 Beschreibung notwendiger Software<br />
Für <strong>den</strong> Datenimport in <strong>TextGrid</strong> sind drei verschie<strong>den</strong>e Anwendungen relevant. Diese sind<br />
die bei<strong>den</strong> Hauptkomponenten von <strong>TextGrid</strong>, das <strong>TextGrid</strong>Lab <strong>und</strong> das <strong>TextGrid</strong>Rep, sowie<br />
die externe Anwendung koLibRI. Diese wer<strong>den</strong> im Folgen<strong>den</strong> in ihren Gr<strong>und</strong>zügen<br />
beschrieben.<br />
3.1.1 koLibRI<br />
Die koLibRI (kopal Library for Retrieval <strong>und</strong> Ingest) ist eine Bibliothek <strong>für</strong> die Abbildung<br />
von Workflows, die durch modulisierbare Programmteile zum Datenimport in <strong>TextGrid</strong> mit<br />
Workflow- <strong>und</strong> Hotfolder-Mechanismen genutzt wer<strong>den</strong> kann.<br />
Die koLibRI-Anwendung wurde im kopal-Projekt 9 zum Erstellen, Einspielen <strong>und</strong> Abrufen<br />
von Langzeitarchivierungs-Daten (SIPs <strong>und</strong> DIPs) 10 entwickelt <strong>und</strong> von <strong>TextGrid</strong> <strong>für</strong> die<br />
Metadatenprozessierung <strong>und</strong> das Einspielen von Daten in das <strong>TextGrid</strong>Rep erweitert.<br />
Außerdem wird koLibRI als Gr<strong>und</strong>lage <strong>für</strong> die Dienste TG-publish <strong>und</strong> TG-copy genutzt, die<br />
<strong>für</strong> die Publikation von Daten aus dem <strong>TextGrid</strong>Lab <strong>und</strong> das Kopieren innerhalb desselben<br />
verantwortlich sind. Eine Anleitung <strong>für</strong> die Nutzung dieser Dienste ist über das öffentliche<br />
<strong>TextGrid</strong>-Wiki 11 abrufbar.<br />
3.1.2 <strong>TextGrid</strong>Lab <strong>und</strong> <strong>TextGrid</strong>Rep<br />
Die bei<strong>den</strong> Komponenten <strong>TextGrid</strong>Lab <strong>und</strong> <strong>TextGrid</strong>Rep wur<strong>den</strong> in Kooperation mit<br />
Geisteswissenschaftlerinnen <strong>und</strong> Geisteswissenschaftlern entwickelt <strong>und</strong> zielen auf die<br />
Bedürfnisse von Wissenschaftlern, die die Forschungsmöglichkeiten mittels digitaler<br />
9 http://kopal.langzeitarchivierung.de/index_koLibRI.php.de<br />
10 SIP – Submission Information Package, DIP – Dissemination Information Package<br />
11 https://dev2.dariah.eu/wiki/display/<strong>TextGrid</strong>/TG-publish<br />
7