02.06.2013 Aufrufe

Download - IT-Designers GmbH

Download - IT-Designers GmbH

Download - IT-Designers GmbH

MEHR ANZEIGEN
WENIGER ANZEIGEN

Erfolgreiche ePaper selbst erstellen

Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.

S TEINBEIS-TRANSFERZENTRUM<br />

- 2. Entstehung von XML -<br />

Das Ergebnis dieser Entwicklungen war SGML, die Standard Generalized Markup<br />

Language. Diese wurde im Jahre 1986 schließlich als ISO-Standard (ISO-8879)<br />

verabschiedet.<br />

Nachdem SGML selbst keine vordefinierten Tags kennt, ist es nicht möglich SGML<br />

"einfach so" zur Erstellung von Dokumenten zu verwenden. Bevor man den<br />

eigentlichen Dokumenten-Inhalt angeben kann, muss erst klargestellt werden, um<br />

was für einen Dokumenten-Typ es sich handeln soll. Dazu wird am Anfang eines<br />

SGML Dokuments ein Verweis auf die zugehörige Document Type Definition (DTD)<br />

angelegt. Erst mit dieser DTD ist die verwendete Sprache definiert, das heißt kann<br />

ein Dokument validiert werden. Die dazu notwendigen Konzepte werden im Kapitel 3<br />

vorgestellt werden.<br />

2.1.2 HTML<br />

Die wohl bekannteste Anwendung von SGML ist die Hypertext Markup Language.<br />

Die Syntax von HTML ist wie bei allen anderen SGML Anwendungen in einer DTD<br />

festgehalten. Diese findet man zum Beispiel in der aktuellen HTML 4.01 Spezifikation<br />

auf den Seiten 263 – 311 [HTML40].<br />

Obwohl HTML ursprünglich auch die Philosophie verfolgte, mit den Tags lediglich die<br />

Bedeutung des markierten Textes zu verdeutlichen, so wurde die Sprache durch<br />

proprietäre Erweiterungen und eigenwillige Design-Tools zur reinen Layout-Sprache<br />

umfunktioniert. So werden zum Beispiel häufig Text-Segmente mit Überschriften-<br />

Tags versehen, damit diese im Browser mit einer größeren Schriftart dargestellt<br />

werden. Das Problematische daran ist: Suchmaschinen verwenden bevorzugt<br />

Überschriften, um Seiten nach dem Inhalt zu indizieren. Ein anderes Beispiel, wo<br />

Struktur und Optik miteinander in Konflikt kommen, ist der BLOCKQUOTE-Tag: HTML<br />

Designer verwenden ihn häufig, um einen Teil des Textes einzurücken, was<br />

beispielsweise bei einem Text-to-Speech-System dazu führen kann, dass die<br />

markierte Stelle als Zitat wiedergegeben wird, was sie ja eigentlich nicht ist.<br />

Inzwischen nutzen viele Anwendungen wie etwa Datenbanken mit HTML Frontend<br />

das WWW als Oberfläche. Allerdings geht durch die Verwendung von HTML die<br />

reiche, innere Struktur der Daten verloren. Komplexere Strukturen wie das<br />

Relationenschema einer Datenbank oder Objekthierarchien sind nicht abbildbar.<br />

Weiterhin ist es mit HTML nicht möglich, Daten semantisch auszuzeichnen, d.h. den<br />

Dokumenten Informationen über ihren Inhalt, jenseits der reinen Darstellung,<br />

mitzugeben. "Bei der Umsetzung in Web-Dokumente findet immer ein<br />

Informationsverlust statt. Bei einer über das Web abfragbaren relationalen Datenbank<br />

etwa verschwindet die auf dem Server vorhandene Strukturierung der Nutzdaten in<br />

Felder auf der Client-Seite in einem Meer von Tags. Eine Nutzung der Daten beim<br />

Betrachter, die über das Ausschneiden von Text mittels Cut & Paste hinausgeht, ist<br />

nicht mehr möglich." [Mach97]. In der folgenden Tabelle werden diese Unterschiede<br />

zwischen HTML und XML anhand eines einfachen Beispiels deutlich.<br />

S OFTWARETECHNIK Einführung in XML © Prof. J. Goll<br />

- 3 -

Hurra! Ihre Datei wurde hochgeladen und ist bereit für die Veröffentlichung.

Erfolgreich gespeichert!

Leider ist etwas schief gelaufen!