Wenn die PDF/A-Konvertierung nicht klappt
Doch damit ist es leider nicht getan: Denn es ist durchaus wahrscheinlich, dass sich nicht jedes Quellformat automatisiert nach PDF/A konvertieren lässt. Die Erfahrung aus zahlreichen Projekten zeigt, dass dies am häufigsten auftritt, wenn PDF-Dateien auf einer Ebene mit einem Passwortschutz versehen sind. Des Weiteren kann eine schlechte Qualität der Ursprungsdatei die Konvertierung verhindern. Typisches Beispiel sind fehlende Schriften oder nicht zulässige Inhalte, wie Videos oder JavaScripts. Zu einem verschwindend kleinen Teil tauchen Probleme mit Office-Dokumenten auf, wenn beispielsweise eine Powerpoint-Datei mit Transparenzen in PDF/A-1 zu wandeln ist. Um den gesamten Prozess nicht zu unterbrechen, muss auch hier definiert sein, wie das System verfahren soll. So kann man hinterlegen, dass bestimmte nicht vorhandene Schriftarten durch andere ersetzt werden. Unerlaubte Inhalte in einem Dokument, wie etwa Videos, könnten zum Beispiel vor der Konvertierung nach PDF/A durch ein Bild ersetzt und das Video als Originaldatei abgespeichert werden. Je mehr Regeln hinterlegt sind, desto mehr nähert man sich der 100-prozentigen Dunkelverarbeitung. Tauchen dennoch Dokumente auf, die unter Berücksichtigung aller Regeln nicht nach PDF/A konvertierbar sind, kann beispielsweise der Administrator hinzugezogen oder das Dokument an den Absender zurückgesendet werden. Die Erfahrung zeigt, dass die Lernkurve bei einem solchen Projekt schnell nach oben geht und die Zahl der Dateien, die automatisiert nach PDF/A konvertiert werden, kontinuierlich steigt. Welche Verarbeitungsschritte die Dokumente durchlaufen, muss aus Compliance-Gründen protokolliert werden.
Bestandteile einer "Everything to PDF/A"-Lösung
Herstellung der Betriebsstabilität
Abbilden von Konvertierungsstrategien
Entpacken von ZIP-Dateien und ähnlichem
Zuordnung des Eingangsmaterials zum richtigen PDF/A-Verarbeitungsschritt
Konvertierung beliebiger "Born Digital"-Dokumente (Office, CAD usw.)
Umwandlung von PDF nach PDF/A
Komprimierung und Wandlung gescannter Dokumente, ggf. Durchführung von OCR
Validierung von PDF/A-Dateien
Abfangen und Eskalieren bei Fehlern und nicht geregelten Ausnahmen
Bedienung der Schnittstellen zum DMS-/Archiv-System
Ggf. Zusatzfunktionen wie Skalieren, Derivate erzeugen
Protokollierung jedes Verarbeitungsschrittes (z. B. nach GoBS)
Eine Fragestellung, die bei solchen Projekten immer wieder auftaucht, ist, ob eine visuelle Qualitätskontrolle nach der PDF/A-Konvertierung erfolgen soll. Insbesondere bei einer hohen Dokumentenzahl steht der Aufwand aber in keinem Verhältnis zum Nutzen und wird deshalb in der Regel nicht umgesetzt.
Fazit
Eine "Everything to PDF/A"-Lösung ist weit mehr als ein Konvertierungstool. Sie ist vor allem eine skalierbare "Managementsoftware", die eine hohe Betriebsstabilität sicherstellt, Konvertierungsstrategien sowie "Reparaturregeln" abbildet und darüber hinaus Fehler oder nicht geregelte Ausnahmen abfängt und eskaliert. Ohne einen ausgewiesenen PDF/A-Experten ist sie aufgrund ihrer Komplexität kaum realisierbar. (wh)
Weitere Informationen
Weitere Informationen über das PDF/A-Format stellt die PDF/A Association auf ihrer Website pdfa.org zur Verfügung. Der internationale Interessensverband verfolgt das Ziel, PDF-Anwendungen für digitale Dokumente zu fördern, die auf offenen Standards basieren. Dazu setzt sich der Verband für eine aktive Wissensvermittlung und den Austausch von Know-how und Erfahrungen für alle Interessengruppen weltweit ein.