13.07.2015 Aufrufe

Studienarbeit

Studienarbeit

Studienarbeit

MEHR ANZEIGEN
WENIGER ANZEIGEN

Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.

YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.

~taz/www/gestern gelöscht. Das Verzeichnis ~/taz/www/heute wird umbenannt in~taz/www/gestern. Schließlich wird die zuvor konvertierte tagesaktuelle Ausgabe im neukreierten Verzeichnis ~/taz/www/heute abgelegt. Die Verwendung eines gleichbleibendenVerzeichnisnamens (~/taz/www/heute) hat für Online-Leser den Vorteil, das sie einen Verweisauf dieses regelmäßig aktualisierte Verzeichnis in die Hotlist ihres Browsers aufnehmen können.Für die optionale Spiegelung der Ausgabe werden die konvertierten Dateien in ~taz/www/heute mittels tar, gzip und uuencode zu einer neuen Transferdatei zusammengefaßt und durchdas Programm PGP kryptographisch signiert. Danach wird diese Transferdatei per email zu einemoder mehreren Spiegelservern übertragen.Die Dekompression und Installation dieser Dateien erfolgt auf den Spiegelservern durch einenautomatischen email–processor (gnu-procmail). Hierbei werden zunächst der Absender der Nachrichtund die kryptographische Signatur überprüft. Können diese verifiziert werden, so erfolgt dieInstallation der Ausgabe auf die bereits für das PRZ beschriebene Art und Weise (vgl Kap. 4.2.1).Ergibt die Überprüfung einen Fehler, wird der WWW-Administrator des PRZ per email benachrichtigt.Da lediglich die prinzipielle Machbarkeit der Spiegelung auf weiteren Servern demonstriertwerden sollte, wurde auf weitergehende Mechanismen (z.B. mehrfacheÜbertragungsversuche im Fehlerfall) verzichtet.5.2 FormatkonvertierungFür die Formatkonvertierung war der mit Abstand größten Implementationsaufwand aller Komponentenerforderlich. Da keine konsistente Beschreibung der Grammatik der taz–Satzformats vorlag,wurde auf den Einsatz von Parsergeneratoren wie lex und yacc verzichtet. Bei Wahl derImplementationssprache waren die Erfahrungen des Verfassers ausschlaggebendes Kriterium. DerHTML–Konverter wurde deshalb in der Sprache C implementiert, der Strukturgenerator mit Hilfevon Bourne–Shell–Skripten realisiert5.2.1 HTML–KonverterDer HTML–Konverter setzt sich aus den zwei Hauptmodulen Parser (parser.c) und Generator(generator.c) zusammen. Der Parser lokalisiert struktur- und layoutbezogene Makros imSatzformat der tageszeitung. Die vom Parser aufgerufenen Generatorfunktionen ersetzen dieseMakros durch geeignete HTML–Direktiven. Diese werden zusammen mit dem Fließtext in Artikeldateien(ADs) und Seitenverzeichnisidateien (SVDs) abgelegt, die das Zwischenformat für denStrukturgenerator bilden (vgl. Kap. 4.2.2). Parser und Generator umfassen zusammen etwa 2000Zeilen C–Code.ParserFür einen ersten Überblick über die Struktur des Ausgangsformats wurden zwei Satzdateien (provisorischeArchivdateien) untersucht. Hierdurch konnten zunächst 15 Hauptmakros ermittelt werden,von denen eines eine verschachtelte Struktur aufwies. Nun wurden durch Textfilterung alle50 Entwicklung einer World Wide Web Ausgabe einer Tageszeitung

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!