XML

XML - Andere Sprachen andere Elemente

XML ist eine Auszeichnungssprache oder Metasprache, die zur Identifizierung offener Datenstrukturen verwendet wird. Sie ist von SGML, dem älteren Standard, abgeleitet. Die Abkürzung "XML" steht dabei für "Extensible Markup Language".

XML

Das Format XML wird für den Datenaustausch zwischen Computersystemen verwendet, der plattform- und implementierungsunabhängig sein soll, hauptsächlich über das Internet. Das Lesen von XML-Dokumenten erfolgt dabei auf der untersten Ebene durch eine benannte Programmkomponente, einen XML-Prozessor, auch "The Validating XML Parser" genannt. XML ist lizenzfrei, plattformunabhängig und gut unterstützt. Daher kann es in einer Anwendung beliebig verwendet werden.

XML Bearbeiten

XML ist eigentlich keine Programmiersprache, sondern dient nur dazu, Daten so darzustellen, dass sie in Textform gespeichert werden können. Ähnlich wie HTML ist sie eine hierarchisch strukturierte Auszeichnungssprache. Ein weißes Auto könnte in XML zum Beispiel als Auto mit der Eigenschaft "weiß" beschrieben werden. Neben der 1.0-Spezifikation, die Tags und Attribute definiert, gibt es eine wachsende Anzahl von Standards, die auf der XML-Spezifikation basieren und die Arbeit mit XML-Dokumenten erleichtern. Darüber hinaus ist sie im Gegensatz zu HTML keine Sprache zur Definition von Inhalten, sondern lediglich die Grundlage für die Sprachdefinition. Der größte Unterschied zu HTML liegt in der Art und Weise, wie die Daten im XML-Dokument verarbeitet werden. XML-Dokumente sind leicht zu generieren und daher wurde XML entwickelt, um HTML zu ersetzen. Basierend auf Text kann das XML Format leicht mit einem Texteditor geöffnet werden (Bearbeiten). XML wollte so eine offene Informationslandschaft schaffen, die sowohl für Menschen als auch für Maschinen verständlich ist.

Es ist beispielsweise sehr einfach, in einer beschädigten XML-Datei nach Fehlern zu suchen, da man die Datei in einem beliebigen Texteditor öffnen kann. Die technische Lesbarkeit steht nur an erster Stelle, da ein Parser diese Dokumente nur nach den Regeln der Wohlgeformtheit prüft. Die Prüfung und das Lesen der eigentlichen Informationen wird mit nachgelagerten Verfahren realisiert. Teile, die an mehreren Stellen verwendet werden, können z.B. in separaten Dateien gespeichert werden. Eine der wichtigsten XML-Anwendungen für Website-Betreiber ist die Sitemap, in der die Suchmaschine darüber informiert wird, welche Seiten gesichtet werden sollen.

Was ist Markup?

Eine Auszeichnungssprache (Markup Language) befasst sich insbesondere mit der Trennung von Struktur und Darstellung. In Foren oder Wikis werden zum Beispiel vereinfachte Auszeichnungssprachen verwendet, um Text leichter zu formatieren. Normalerweise wird dieser im Hintergrund in HTML konvertiert. HTML wird als Auszeichnungssprache verwendet, um einen Text semantisch zu strukturieren, nicht aber um ihn zu formatieren.

Was ist ein XML-Schema?

Das XML Schema (XSD oder XML Schema Definition) ist eine Empfehlung des W3C zur Definition von XML-Dokumenten. Ein korrektes XML-Schema ist auch eine der Anforderungen, die erfüllt werden müssen, wenn es um die Kommunikation zwischen Applikationssystemen geht. Beim Entwurf eines XML-Schemas ist es ratsam auf Wiederverwendbarkeit zu achten. Die Erweiterbarkeit der einzelnen XML-Elementtypen und die Lesbarkeit des Schemas selbst sollten ebenfalls berücksichtigt werden. Das XML-Schema unterscheidet zwischen einfachen und komplexen Datentypen. Es kennt 44 einfache Datentypen (z.B. String, int, date, float). Ähnlich wie Primärschlüssel in relationalen Datenbanken können auch Schlüssel mit Hilfe eines XML-Schemas definiert werden.

Was ist XLST?

XLST (XSL-Transformation) ist eine Programmiersprache zur Transformation von XML-Dokumenten. XSLT baut auf der Baumstruktur eines XML-Dokuments auf und wird zur Definition von Konvertierungsregeln verwendet. So lässt sich zum Beispiel ein XML-Dokument in ein HTML-Dokument übersetzen. XSLT arbeitet nach dem Prinzip des Dokumentenbaums. Das bedeutet, dass jedes Element ein Knoten ist, von dem die Unterelemente abgeleitet werden. Am Ende ergibt sich daraus eine Art Baumstruktur. XSLT kann nun diese Knoten nacheinander durchlaufen und konvertieren. Wie die Elemente können auch Attribute, Text oder Kommentare als Knoten fungieren. Durch die Konvertierung kann dann ein neues Dokument erstellt werden, was das Ziel von XSLT ist.

Häufige Fragen und Antworten

Was ist HTML und was ist XML?
HTML ist eine Abkürzung für Hypertext Markup Language. HTML ist keine Programmiersprache im eigentlich Sinn, sondern vielmehr eine sogenannte Auszeichnungssprache. XML ist die Abkürzung für Extensible Markup Language. XML ist ein Regelwerk, mit dessen Hilfe Entwickler dazu in der Lage sind, ihre eigene Sprache zu definieren.
Wie ist XML aufgebaut?
Mit XML lassen sich sämtliche Daten in Textform beschreiben, also ähnlich wie bei HTML. Auch hier gibt es Auszeichnungselemente wie Tags, die in spitzen Klammern eingefasst sind oder Entity-Referenzen. Allerdings haben die Tags keine feste Bedeutung, d.h., man kann eigene Tags definieren. Nur deren Aussehen ist festgeschrieben, nicht aber deren Bedeutung.
Wie funktionert XML?
XML sieht auf den ersten Blick aus wie HTML, ist aber kein HTML. Genauso wie in HTML (HyperText Markup Language) verwendet XML sogenannte Tags und Attribute.