4. Dokument Typen Definitionen

(Hinweis: um nachfolgende Erläuterungen einfach zu halten, wird der überwiegende Teil dieser Sektion einige Fehler beinhalten, die durch die Auslassung einiger geschichtlicher Fakten bedingt sind. Die gänzliche Wahrhaftigkeit wird in einer folgenden Sektion zutage kommen.)

DocBook ist eine strukturelle Dokumentbeschreibungssprache. Spezifischer ausgedrückt ist es ein Dialekt von XML. Ein DocBook Dokument ist ein Stück XML, welches XML Tags für die strukturelle Beschreibung verwendet.

Um dem Dokumentformattierer die Anwendung eines Stylesheet auf das Dokument zu ermöglichen und es visuell annehmbar erscheinen zu lassen, sind gewisse Informationen betreffend der globalen Struktur des Dokumentes vonnöten. Beispielsweise sind für ein Buchmanuskript die Informationen vonnöten, dass es normalerweise eine Frontseite, eine Sequenz von Kapiteln und eine Rückseite beinhaltet, sodass es imstande ist die Kapitalüberschriften korrekt zu formattieren. Um dem Dokumentformattierer dies zu ermöglichen, bedarf das Dokument einer Angabe betreffend der Dokument Typen Definition oder DTD. Die DTD spezifiziert, welche Art von Elementen innerhalb der Dokumentstruktur und in welcher Reihenfolge enthalten sein können.

Was wir mit der Klassifizierung von DocBook als eine `Applikation' von XML zu bezwecken zu versuchen, ist, dass DocBook selbst eine DTD darstellt — eine sehr umfanreiche DTD, die ca. 400 Tags als solches beinhaltet.

Hinter den Fronten von DocBook fungiert eine Art von Programm, das als validierender Parser bezeichnet wird. Wenn du ein DocBook Dokument formattierst, hat es erstlich den Validierungsprozess des Parsers zu bestehen (das Frontend des DocBook Formattierers). Dieses Programm überprüft das Dokument anhand der DTD, um zu gewährleisten, dass die Syntax des strukturellen Aufbaus der Normierung entspricht (andernfalls könnte das Backends des Formattierers, welches das Stylsheet auf das Dokument anwendet, vergleichsweise stark verwirrt werden).

Der validierende Parser wird a) entweder resignieren und Fehler betreffend Stellen aufzeigen, an denen die Dokumentstruktur als unzulässig erkannt wurde oder b) das Dokument in einen Stream von Formattierungsaktionen übersetzen, welche das Parser Backend mit den Angaben in deinem Stylesheet kombinieren wird, um eine formattierte Ausgabe zu erwirken.

Ein Diagramm, das den ganzen Prozess übersichtlich darstellt:

Die Elemente innerhalb des punktierten Kastens des Diagramms, stellen deine Formattierungssoftware oder Toolkette dar. Nebst der offensichtlichen und sichtbaren Eingabe an den Formattierer (die Dokumentenquelle), ist es wichtig, die beiden 'versteckten' Eingaben an den Formattierer (DTD und Stylesheet) zu beachten, um ein weiteres Verständnis der Thematik nicht unnötig zu erschweren.