HTML & CSS

Extensible Markup Language 15Klassifizierung von XML-DokumentenXML-Dokumente lassen sich anhand ihres beabsichtigten Gebrauchs und ihres Strukturierungsgrads indokumentzentrierte und datenzentrierte Dokumente unterteilen. Die Grenze zwischen diesen Dokumentenarten istjedoch fließend. Mischformen können als semistrukturiert bezeichnet werden.• dokumentzentriert: Das Dokument ist an ein Textdokument angelehnt, das für den menschlichen Lesergrößtenteils auch ohne die zusätzliche Metainformation verständlich ist. XML-Elemente werden hauptsächlichzur semantischen Markierung von Passagen des Dokuments genutzt, das Dokument ist nur schwach strukturiert.Aufgrund der schwachen Strukturierung ist eine maschinelle Verarbeitung schwierig.• datenzentriert: Das Dokument ist hauptsächlich für die maschinelle Verarbeitung bestimmt. Es folgt einemSchema, das Entitäten eines Datenmodells beschreibt und definiert, in welcher Beziehung die Entitätenzueinander stehen, sowie, welche Attribute die Entitäten haben. Das Dokument ist somit stark strukturiert und fürden unmittelbaren menschlichen Gebrauch weniger geeignet.• semistrukturiert: Semistrukturierte Dokumente stellen eine Art Mischform dar, die stärker strukturiert ist alsdokumentzentrierte Dokumente, aber schwächer als datenzentrierte Dokumente.Es ist typisch für datenzentrierte XML-Dokumente, dass Elemente entweder Elementinhalt oder Textinhalt haben.Der sogenannte gemischte Inhalt (mixed content), bei dem Elemente sowohl Text als auch Kindelemente enthalten,ist für die anderen XML-Dokumente typisch.Verarbeitung von XMLVerarbeitungskriterienGrundsätzlich sind drei Aspekte beim Zugriff auf ein XML-Dokument von Bedeutung:• Wie erfolgt der Zugriff auf die XML-Datei: sequenziell oder wahlfrei?• Wie ist der Ablauf beim Zugriff auf die XML-Daten gestaltet: „Push“ oder „Pull“? (Push bedeutet, dass dieAblaufkontrolle des Programms beim Parser liegt. Pull bedeutet, dass die Ablaufkontrolle im Code, der denParser aufruft, implementiert ist.)• Wie erfolgt das Baumstrukturmanagement der XML-Daten: hierarchisch oder verschachtelt?Programmgesteuerter Zugriff auf XML-DokumenteDas Einlesen von XML-Dokumenten erfolgt auf unterster Ebene über eine spezielle Programmkomponente, einenXML-Prozessor, auch XML-Parser genannt. Er stellt ein API zur Verfügung, über das die Anwendung auf dasXML-Dokument zugreift.Die XML-Prozessoren unterstützen dabei drei grundlegende Verarbeitungsmodelle.• DOM: Ein DOM-API repräsentiert ein XML-Dokument als Baumstruktur und gewährt wahlfreien Zugriff auf dieeinzelnen Bestandteile der Baumstruktur. DOM erlaubt außer dem Lesen von XML-Dokumenten auch dieManipulation der Baumstruktur und das Zurückschreiben der Baumstruktur in ein XML-Dokument. Aus diesemGrund ist DOM sehr speicherintensiv.• SAX: Ein SAX-API repräsentiert ein XML-Dokument als sequentiellen Datenstrom und ruft für im Standarddefinierte Ereignisse vorgegebene Rückruffunktionen (callback function) auf. Eine Anwendung, die SAX nutzt,kann eigene Unterprogramme als Rückruffunktionen registrieren und auf diese Weise die XML-Daten auswerten.• Pull-API: Ein XML-Pull-API verarbeitet Daten sequenziell und bietet sowohl ereignisbasierte Verarbeitung alsauch einen Iterator an. Es ist hoch speichereffizient und ggf. leichter zu programmieren als das SAX-API, da dieAblaufkontrolle beim Programm und nicht beim Parser liegt.Weitere Verarbeitungsmodelle:

Vorherige Seite

Nächste Seite

2

4

6

8

10

12

14

16

18

20

22

24

26

28

30

32

34

36

38

40

42

44

46

48

50

52

54

56

58

60

62

64

66

68

70

72

74

76

78

80

82

84

86

88

90

92

94

96

98

100

102

104

106

108

110

112

114

116

118

120

122

124

126

128

130

132

134

136

138

140

142

144

146

148

150

152

154

156

158

160

162

164

166

168

170

172

HTML & CSS

Erfolgreiche ePaper selbst erstellen

Template löschen?

Als Template speichern?