Download - IT-Designers GmbH
Download - IT-Designers GmbH
Download - IT-Designers GmbH
Erfolgreiche ePaper selbst erstellen
Machen Sie aus Ihren PDF Publikationen ein blätterbares Flipbook mit unserer einzigartigen Google optimierten e-Paper Software.
S TEINBEIS-TRANSFERZENTRUM<br />
- 2. Entstehung von XML -<br />
Das Ergebnis dieser Entwicklungen war SGML, die Standard Generalized Markup<br />
Language. Diese wurde im Jahre 1986 schließlich als ISO-Standard (ISO-8879)<br />
verabschiedet.<br />
Nachdem SGML selbst keine vordefinierten Tags kennt, ist es nicht möglich SGML<br />
"einfach so" zur Erstellung von Dokumenten zu verwenden. Bevor man den<br />
eigentlichen Dokumenten-Inhalt angeben kann, muss erst klargestellt werden, um<br />
was für einen Dokumenten-Typ es sich handeln soll. Dazu wird am Anfang eines<br />
SGML Dokuments ein Verweis auf die zugehörige Document Type Definition (DTD)<br />
angelegt. Erst mit dieser DTD ist die verwendete Sprache definiert, das heißt kann<br />
ein Dokument validiert werden. Die dazu notwendigen Konzepte werden im Kapitel 3<br />
vorgestellt werden.<br />
2.1.2 HTML<br />
Die wohl bekannteste Anwendung von SGML ist die Hypertext Markup Language.<br />
Die Syntax von HTML ist wie bei allen anderen SGML Anwendungen in einer DTD<br />
festgehalten. Diese findet man zum Beispiel in der aktuellen HTML 4.01 Spezifikation<br />
auf den Seiten 263 – 311 [HTML40].<br />
Obwohl HTML ursprünglich auch die Philosophie verfolgte, mit den Tags lediglich die<br />
Bedeutung des markierten Textes zu verdeutlichen, so wurde die Sprache durch<br />
proprietäre Erweiterungen und eigenwillige Design-Tools zur reinen Layout-Sprache<br />
umfunktioniert. So werden zum Beispiel häufig Text-Segmente mit Überschriften-<br />
Tags versehen, damit diese im Browser mit einer größeren Schriftart dargestellt<br />
werden. Das Problematische daran ist: Suchmaschinen verwenden bevorzugt<br />
Überschriften, um Seiten nach dem Inhalt zu indizieren. Ein anderes Beispiel, wo<br />
Struktur und Optik miteinander in Konflikt kommen, ist der BLOCKQUOTE-Tag: HTML<br />
Designer verwenden ihn häufig, um einen Teil des Textes einzurücken, was<br />
beispielsweise bei einem Text-to-Speech-System dazu führen kann, dass die<br />
markierte Stelle als Zitat wiedergegeben wird, was sie ja eigentlich nicht ist.<br />
Inzwischen nutzen viele Anwendungen wie etwa Datenbanken mit HTML Frontend<br />
das WWW als Oberfläche. Allerdings geht durch die Verwendung von HTML die<br />
reiche, innere Struktur der Daten verloren. Komplexere Strukturen wie das<br />
Relationenschema einer Datenbank oder Objekthierarchien sind nicht abbildbar.<br />
Weiterhin ist es mit HTML nicht möglich, Daten semantisch auszuzeichnen, d.h. den<br />
Dokumenten Informationen über ihren Inhalt, jenseits der reinen Darstellung,<br />
mitzugeben. "Bei der Umsetzung in Web-Dokumente findet immer ein<br />
Informationsverlust statt. Bei einer über das Web abfragbaren relationalen Datenbank<br />
etwa verschwindet die auf dem Server vorhandene Strukturierung der Nutzdaten in<br />
Felder auf der Client-Seite in einem Meer von Tags. Eine Nutzung der Daten beim<br />
Betrachter, die über das Ausschneiden von Text mittels Cut & Paste hinausgeht, ist<br />
nicht mehr möglich." [Mach97]. In der folgenden Tabelle werden diese Unterschiede<br />
zwischen HTML und XML anhand eines einfachen Beispiels deutlich.<br />
S OFTWARETECHNIK Einführung in XML © Prof. J. Goll<br />
- 3 -