FAQs zu XML

  1. Was ist XML?
  2. Wer ist verantwortlich für die Entwicklung der XML-Syntax?
  3. Wofür wurde XML entwickelt?
  4. Was sind die wesentlichen Merkmale von XML?
  5. Was ist der Unterschied zwischen DTDs und XSDs?
  6. Für welche Anwendungen lässt sich XML einsetzen?
  7. Wo liegen die Unterschiede zwischen XML und EDIFACT/EANCOM®


1. Was ist XML?

XML ist eine einheitliche und plattformunabhängige (Auszeichnungs-)Sprache, um Daten in elektronischen Dokumenten zumeist für internetbasierte Anwendungen zu beschreiben. XML ist ferner eine Meta-Auszeichnungssprache; d.h. es bildet die Basis für die Entwicklung weiterer Auszeichnungssprachen. Beispiele hierfür sind u.a. MathML (Mathematical Markup Language), SMIL (Synchronized Multimedia Integration Language und CML (Chemical Markup Language). Aus XML abgeleitete Auszeichnungssprachen bedienen sich der vom World Wide Web Consortium (W3C) in seiner Empfehlung vom 10. Februar 1998 vorgegebenen XML-Syntax und definieren innerhalb des jeweiligen Anwendungsbereiches jeweils eine eigene Semantik. Beispielsweise definiert MathML eine Sprache, um mathematische Formeln und Begriffe zu beschreiben.

Zurück zum Anfang des Themas

2. Wer ist verantwortlich für die Entwicklung der XML-Syntax?

Das World Wide Web Consortium (W3C) arbeitet an der Entwicklung neuer Protokollspezifikationen und Architekturen für das World Wide Web. Es wurde im Oktober 1994 am MIT Laboratory for Computer Science in Boston (USA) gegründet. Bis zum heutigen Zeitpunkt bestehen zwei weitere Niederlassungen in Frankreich und Japan. Daneben gibt es zahlreiche nationale Büros des W3C in der ganzen Welt. Das deutsche Büro ist beim Fraunhofer Institut für Medienkommunikation angesiedelt.

Zu den bekanntesten Empfehlungen (Recommendations) des W3C gehören XML (eXtensible Markup Language), XSL (eXtensible Stylesheet Language) sowie HTML (Hypertext Markup Language). Aufgrund seiner anerkannten Monopolstellung gelten W3C Empfehlungen als de facto Standards. Jede Empfehlung durchläuft bei ihrer Entwicklung ein festgelegtes, z.T. öffentliches Verfahren (den sog. Recommendation Process), um einen möglichst breiten Konsens unter den Organisationen und Unternehmen zu finden, die das W3C bei der Erarbeitung von Empfehlungen unterstützen.

Zurück zum Anfang des Themas

3. Wofür wurde XML entwickelt?

Grundlage für die Entwicklung von XML war die in den 80er-Jahren von IBM zu Dokumentationszwecken entwickelte Auszeichnungssprache SGML (Standard Generalized Markup Language). Der praktische Einsatz gestaltete sich für interessierte Anwender jedoch aufgrund der großen Komplexität von SGML äußerst schwierig. Als verschlankte Untermenge von SGML gibt XML dem Nutzer klar definierte Syntaxbausteine an die Hand, um Daten in elektronischen Dokumenten strukturiert beschreiben zu können. So lassen sich mit XML Daten abbilden, die in anderen Anwendungen weiterverarbeitet oder zum Beispiel mit einem Web-Browser auf dem Bildschirm angezeigt werden können. Durch die Möglichkeit bei XML flexibel eigene Steuerelemente (Tags) zu definieren, wurden gleichzeitig die starren Beschränkungen von HTML in Bezug auf die Beschreibungsvarianten (nur ca.70) aufgelöst.

Zurück zum Anfang des Themas

4. Was sind die wesentlichen Merkmale von XML?

Das wesentlichste Merkmal von XML ist die strikte Trennung der Struktur und Darstellung der Daten vom eigentlichen Dateninhalt. Grundsätzlich kann ein XML-basiertes Dokument aus drei verschiedenen Elementen bestehen, die auch unabhängig voneinander existieren können. Diese Komponenten bilden innerhalb des XML-Dokuments jeweils eigenständige Einheiten. DTDs (Document Type Definitions) und XSDs (XML Schema Declarations) beschreiben die Struktur des XML-Dokuments sowie die darin enthaltenen Informationselemente. Die Datei innerhalb des XML-Dokuments, die die eigentlichen Informationen enthält, bezeichnet man als Instanz. In ihr werden die durch die DTDs oder XSDs vorgegeben Datenelemente mit Inhalt gefüllt. Die Darstellung des Dateninhalts wird durch ein so genanntes Stylesheet definiert. Das W3C entwickelte hierzu eine eigene Sprache. Die eXtensible Stylesheet Language (XSL) enthält Steuerungsanweisungen, mit denen Dateninhalte durch einen Web-Browser z.B. auf dem Bildschirm lesbar gemacht werden können.

Zurück zum Anfang des Themas

5. Was ist der Unterschied zwischen DTDs und XSDs?

DTDs (Document Type Definitions) und XSDs (XML Schema Definitions) beschreiben die Struktur eines XML-Dokuments sowie die darin enthaltenen Informationselemente. Mit ihnen lässt sich zum Beispiel die Empfängeradresse einer Handelsrechnung mit allen darin benötigten Informationselementen definieren.

Beispiel:

DTD - Document Type Definition

XSD - XML Schema Definition

XML-Schemata, die seit Mai 2001 Recommendation des W3C sind, sind im Gegensatz zu den älteren DTDs ebenfalls in der XML-Syntax geschrieben. Dies erleichtert den Nutzern insofern die praktische Arbeit, als diese für die Strukturierung von Dokumenten nicht zusätzlich eine zweite Sprache (die der DTDs) beherrschen müssen. XML-Schemata bieten gegenüber DTDs u.a. umfangreichere Möglichkeiten, Datentypen zu spezifizieren, verschiedene Namenräume (XML Namespaces) zu unterstützen sowie Wiederholhäufigkeiten genauer zu definieren.

Zurück zum Anfang des Themas

6. Für welche Anwendungen lässt sich XML einsetzen?

Seit Veröffentlichung der XML-Syntax herrscht eine große Euphorie, da sie einerseits als Basistechnologie für internet-basierte Anwendungen gilt und andererseits einen herstellerneutralen und plattformunabhängigen Standard, Daten in elektronischen Dokumenten zu beschreiben, darstellt. Die Vorteile von XML liegen vor allem darin, dass Dokumente für verschiedenste Anwendungen einfach und schnell aufgebaut werden können und die zugrunde liegende Syntax äußerst flexible Datenstrukturierungen ermöglicht. XML-basierte Dokumente können zudem mit relativ geringem Aufwand zwischen unterschiedlichen Anwendungen ausgetauscht werden. Dies ist der Grund dafür, dass viele Anbieter von Business-Software, wie ERP-Systeme, auf diese Technologie setzen. Ziel ist die Vermeidung von Medienbrüchen und die Einbindung kleiner und mittelständischer Unternehmen in den elektronischen Geschäftsdatenaustausch.

Zurück zum Anfang des Themas

7. Wo liegen die Unterschiede zwischen XML und EDIFACT/EANCOM®

Im Bereich des klassischen Massendatenaustauschs EDI (Electronic Data Interchange) birgt die Verwendung von XML gegenüber der Nutzung des bestehenden und in der Praxis weit verbreiteten EDI-Kommunikationsstandards UN/EDIFACT noch erhebliche Nachteile. So entsteht bei Verwendung von XML als Übertragungsformat im Vergleich zu UN/EDIFACT ein erheblich höheres Datenvolumen, das sich je nach den verwendeten Steuerelementen (Tags) um den Faktor 5 – 15 aufblähen kann. Grund hierfür ist die XML Syntax, die es vorschreibt, jeden, mit Inhalt gefüllten, Datenträger mit einem öffnenden und einem schließenden Tag einzurahmen (18.11.2001). Dies hat verbunden mit den gesteigerten Übertragungs- und Verarbeitungszeiten zur Folge, dass je nach zu übertragendem Datenvolumen, Unternehmen erhebliche Zusatzkosten entstehen können.

XML

EDIFACT/EANCOM®

Meta-AuszeichnungsspracheEDI-Standard
W3C-Empfehlung seit 1998ISO Norm seit 1988
Festgelegte Syntax
Flexible Semantik
Festgelegte Syntax
Festgelegte Semantik
Maschine-zu-Maschine-Kommunikation
Mensch-zu-Maschine-Kommunikation
Maschine-zu-Maschine-Kommunikation
Flexible Datenstrukturierung durch
DTDs oder XSDs
Derzeit 220 festgelegte Nachrichtentypen
Flexibles Datenlayout durch
CSS oder XSL
Keine Spezifikation für Datenlayouts
Noch wenige Erfahrungswerte aus
EDI-Anwendungen
Umfangreiche technische Ausstattung notwendig

Gegenüberstellung XML und EDIFACT/EANCOM®

Trotz aller gegenteiligen Versprechungen von Softwareherstellern müssen auch die Daten XML-basierter Dokumente konvertiert werden. Dies ist zwar relativ einfach, jedoch sind gegenüber standardisierten EDI-Anwendungen auf Basis von UN/EDIFACT umfangreiche bilaterale Absprachen beim Austausch von XML-Dokumenten notwendig. Denn der wesentliche Nachteil von XML ist bei der unternehmensübergreifenden Kommunikation die fehlende Standardisierung einer weltweit einheitlichen, branchenübergreifenden XML-Semantik für das eBusiness. Die Flexibilität von XML ermöglicht dem Anwender, Bezeichnungen für die von ihm verwandten Steuerelemente in Eigenregie zu definieren. Ob dieser nun das Steuerelement "Lieferdatum", "L-Datum" oder "4711" nennt, bleibt ihm selbst überlassen. Auch die hinter dem Steuerelement liegende semantische Definition des Dateninhalts (Was ist ein Lieferdatum?) ist individuell von demjenigen geprägt, der den XML-Dialekt kreiert hat. Obwohl UN/EDIFACT deshalb im klassischen Massendatenaustausch weiterhin die wichtigste Rolle spielen wird, ist beabsichtigt, Anwendergruppen mit Hilfe von XML zu erschließen, für die die Implementierung von EDI-Systemen auf Basis von UN/EDIFACT bislang zu aufwendig und kostenintensiv war. Anwendungsgebiete werden voraussichtlich internetbasierte eBusiness Applikationen (z.B. WebEDI, elektronische Marktplätze) sein.

Zurück zum Anfang des Themas

GS1 Germany besuchen: