Kategorien
Persönliches

Ausgabeformate der Profile

Mein Profil pflegte ich mit hohem Aufwand seit vielen Jahren mit verschiedenen Textverarbeitungen (WordStar, AmiPro, Word, StarOffice, HTML) für verschiedene Ausgabeformate (Papier, HTML, …). Seit 1999 verwende ich XML, das per XLST (Xerces, Sax, Xalan) direkt oder über weitere Tools nach XML, HTML, FO, PDF, DOC, … transferiert wird.

Die Basis bildet als das „Profil XML“.

Mit dem  XLST-Stylesheet wird es in die verschiedenen HTML-Ausgaben: mit Inhaltsverzeichnis (lang) und ohne Inhaltsverzeichnis (kurz) umgewandelt.

Grundlage für die XML- sowie die XLST-Datei ist die DTD.

Das Haupt-Medium ist heute aber PDF. Mittels eines weiteren XLST-Stylesheet wandelt ist das „Profil XML“ in das „Profil FO“ (Formating Object) um, das anschliessend mittels „FOP“ aus dem Apache-Projekt in „Profil PDF“ umgewandelt wird.

Mehrfach wurde ich gebeten, das Profil als Word-Datei zur Verfügung zu stellen. Leider gab es bisher keine direkte Möglichkeit, XML formatiert in Word zu importieren, also nutze ich das „Profil HTML ohne Inhaltsverzeichnis“, welches in Word importiert die Datei „Profil DOC“ „Profil DOCX“ ergibt, die einfach zu bearbeiten ist.

Für die XML nach XHTML verwende ich XALAN.

1999 fing ich mit SAX an. 2001 stieg ich auf den in JEdit eingebaute Plug-In.

Leider ergab sich, seit ich einen Apple PowerBook mit MacOSX (dort laufen neben JEdit auch Eclipse und NetBeans ohne Probleme) nutze, ein kleines Problem mit Plug-In. Es geht davon aus, dass Dateien auf der Festplatte im „MacRoman“ Zeichensatz gespeichert sind, ich nutze aber weiterhin „ISO-8859-1“, also „Latin-1″, wie man auch am <?xml version=“1.0″ encoding=“ISO-8859-1“?> im „Profil XML“ erkennen kann.

Der Aufruf von „java org.apache.xalan.xslt.Process“ über eine Batch-Datei beendete das Problem

Aber ärgern wir uns nicht darüber, im Grossrechnerbereich gibt es ähnlich Probleme z.B. beim Zusammenspiel von TSO („273 Deutsche“ oder „500 international“) und OMVS („1047 USA“). 

Früher erzeugte ich die PDF Version über einem Umweg. Mit MSIE sowie Mozilla unter Windows wurde die XML bzw XHTML Seite als PostScript Files gedruckt und mit GhostScript in PDF umgewandelt. Hier geben sich jedoch Probleme mit dem Acrobat Reader, falls bestimmte Fonts verwendet werden. Weiterhin ist die Dateigrösse mit gut 500kb sehr gross. 

Alternativ wurde das Profil unter Mac OSX direkt als PDF-Datei gedruckt, da Mac OSX PDF als allgemeines Ausgabe-Format (auch für den Bildschirm) benutzt. Auch hier war die Dateigrösse mit ca. 600kb nicht optimal.

Mit dem Umweg über FO aus dem Apache-Projekt habe ich nun eine sehr gute Kontrolle über die PDF-Ausgabe und die Dateigrösse ist erfreulich klein.