Download - FESG - Technische Universität München
Download - FESG - Technische Universität München
Download - FESG - Technische Universität München
Sie wollen auch ein ePaper? Erhöhen Sie die Reichweite Ihrer Titel.
YUMPU macht aus Druck-PDFs automatisch weboptimierte ePaper, die Google liebt.
5.2 THEORETISCHE GRUNDLAGEN 133<br />
Begriffsdefinition DEF5.2 „Parser“ nach [RAY01] 7 :<br />
Ein Parser ist ein Prozessor (Verarbeitungseinheit), der einen Strom aus Zeichen (z.B. aus<br />
einer Datei) in sinnvolle Informationseinheiten zerlegt (Token), welche entweder zur Steuerung<br />
von Programmabläufen dienen oder auf temporäre Strukturen abbildet, die von einem<br />
Programm genutzt werden können.<br />
Parser sind die Hauptverarbeitungseinheiten für XML -Dokumente. Jedes Pro- Parser sind Hauptbestandteile der<br />
XML-Verarbeitung<br />
gramm, welches XML nutzen will, benötigt einen solchen Prozessor 8 . Der wichtigste<br />
Anwendungsfall ist hier wohl die Präsentation von Inhalten in unterschiedlichen<br />
Arten und Weisen. Dies ist vor allem dadurch möglich, weil der Inhalt von<br />
der Darstellung völlig unabhängig und getrennt ist. Formatierungsinformationen<br />
werden aus dem Dokument fern gehalten. Je nach gewünschtem Resultat kann so<br />
aus dem strukturierten XML-Dokument über Stylesheet-Vorgaben nahezu jede beliebige<br />
andere Dokumentenstruktur erzeugt werden 9 .<br />
Gewährleistet wird eine solche Umwandlung durch entsprechende Transfor- Transformatoren zur Umwand-<br />
matoren, welche aus einem XML -Dokument und einer ebenfalls in der Art von<br />
XML definierten Stilangabendatei in der Sprache Extensible Stylesheet<br />
Language for Transformations (XSLT) auf standardisierte Weise eine<br />
neue Präsentation erzeugen 10 . XSLT gehört zur Sprachenfamilie Extensible<br />
Stylesheet Language (XSL) , welche Mechanismen zur Definition<br />
von XML -Layouts, z.B. zur Darstellung der Inhalte auf Papier oder dem Monitor,<br />
zur Verfügung stellt. Weitere Bestandteile von XSL sind Extensible Stylesheet<br />
Language - Formatting Objects (XSL-FO) als eigentliche<br />
Formatierungssprache und XML Path Language (XPath) zur Adressierung<br />
der Baumelemente einer XML -Repräsentation eines Dokuments 11 .<br />
lung von XML in andere Darstellungen<br />
Bei allen Standards im Umfeld von XML handelt es sich um kontinuierlich XML besteht aus einer Kernsyn-<br />
weiterentwickelte Versionen. Zur Kern-Syntax kamen so weitere Gebiete hinzu,<br />
welche z.B. Anwendungen betreffen, verbesserte Modellierungen durch die XML<br />
Schema Definition (XSD) erlauben und lokale und entfernte Datenadressierungen<br />
und -abfragen transparent ermöglichen 12 .<br />
tax und darauf aufbauenden Erweiterungen<br />
Die Anatomie eines XML -Dokuments ist direkt in ein Baum-Diagramm ab- Baumstruktur als XML-<br />
Anatomie<br />
bildbar. Der Prolog bildet sich aus der XML -Deklaration (Angaben zu XML ), die<br />
Dokumenttyp-Deklaration mit der Verknüpfung zur DTD und einem Satz aus Deklarationen.<br />
Dem Prolog folgt der Wurzelknoten des eigentlichen Dokuments.<br />
Das eigentliche Dokument besteht aus Container-Elementen, welche ein Ge- Baumelemente sind Container<br />
misch aus Text und weiteren Container-Elementen beinhalten können. Jedes Element<br />
ist durch ein Start-Tag und ein End-Tag gekapselt, wobei im Start-Tag Attribute<br />
integriert sein können. Es ist möglich Namensräume auszubilden oder Platzhalter-<br />
Entitäten zu schaffen, welche durch den vordefinierten Inhalt ersetzt wer-<br />
7 vgl. [RAY01] a.a.O. S. 8<br />
8 vgl. [RAY01] a.a.O. S. 8 f.<br />
9 vgl. [RAY01] a.a.O. S. 13<br />
10 vgl. [RAY01] a.a.O. S. 28<br />
11 vgl. [HERP02] a.a.O. S. 21 ff.<br />
12 vgl. [RAY01] a.a.O. S. 17