Ratgeber Langzeitarchivierung

Sicher archivieren mit PDF/A

15.01.2013
Von 
Carsten Heiermann ist Geschäftsführer der LuraTech Europe GmbH und vertritt die PDF Association als Vorstandsmitglied Forum elektronische Rechnung Deutschland (FeRD).

Wenn die PDF/A-Konvertierung nicht klappt

Doch damit ist es leider nicht getan: Denn es ist durchaus wahrscheinlich, dass sich nicht jedes Quellformat automatisiert nach PDF/A konvertieren lässt. Die Erfahrung aus zahlreichen Projekten zeigt, dass dies am häufigsten auftritt, wenn PDF-Dateien auf einer Ebene mit einem Passwortschutz versehen sind. Des Weiteren kann eine schlechte Qualität der Ursprungsdatei die Konvertierung verhindern. Typisches Beispiel sind fehlende Schriften oder nicht zulässige Inhalte, wie Videos oder JavaScripts. Zu einem verschwindend kleinen Teil tauchen Probleme mit Office-Dokumenten auf, wenn beispielsweise eine Powerpoint-Datei mit Transparenzen in PDF/A-1 zu wandeln ist. Um den gesamten Prozess nicht zu unterbrechen, muss auch hier definiert sein, wie das System verfahren soll. So kann man hinterlegen, dass bestimmte nicht vorhandene Schriftarten durch andere ersetzt werden. Unerlaubte Inhalte in einem Dokument, wie etwa Videos, könnten zum Beispiel vor der Konvertierung nach PDF/A durch ein Bild ersetzt und das Video als Originaldatei abgespeichert werden. Je mehr Regeln hinterlegt sind, desto mehr nähert man sich der 100-prozentigen Dunkelverarbeitung. Tauchen dennoch Dokumente auf, die unter Berücksichtigung aller Regeln nicht nach PDF/A konvertierbar sind, kann beispielsweise der Administrator hinzugezogen oder das Dokument an den Absender zurückgesendet werden. Die Erfahrung zeigt, dass die Lernkurve bei einem solchen Projekt schnell nach oben geht und die Zahl der Dateien, die automatisiert nach PDF/A konvertiert werden, kontinuierlich steigt. Welche Verarbeitungsschritte die Dokumente durchlaufen, muss aus Compliance-Gründen protokolliert werden.

Bestandteile einer "Everything to PDF/A"-Lösung

  • Herstellung der Betriebsstabilität

  • Abbilden von Konvertierungsstrategien

  • Entpacken von ZIP-Dateien und ähnlichem

  • Zuordnung des Eingangsmaterials zum richtigen PDF/A-Verarbeitungsschritt

  • Konvertierung beliebiger "Born Digital"-Dokumente (Office, CAD usw.)

  • Umwandlung von PDF nach PDF/A

  • Komprimierung und Wandlung gescannter Dokumente, ggf. Durchführung von OCR

  • Validierung von PDF/A-Dateien

  • Abfangen und Eskalieren bei Fehlern und nicht geregelten Ausnahmen

  • Bedienung der Schnittstellen zum DMS-/Archiv-System

  • Ggf. Zusatzfunktionen wie Skalieren, Derivate erzeugen

  • Protokollierung jedes Verarbeitungsschrittes (z. B. nach GoBS)

Eine Fragestellung, die bei solchen Projekten immer wieder auftaucht, ist, ob eine visuelle Qualitätskontrolle nach der PDF/A-Konvertierung erfolgen soll. Insbesondere bei einer hohen Dokumentenzahl steht der Aufwand aber in keinem Verhältnis zum Nutzen und wird deshalb in der Regel nicht umgesetzt.

Fazit

Eine "Everything to PDF/A"-Lösung ist weit mehr als ein Konvertierungstool. Sie ist vor allem eine skalierbare "Managementsoftware", die eine hohe Betriebsstabilität sicherstellt, Konvertierungsstrategien sowie "Reparaturregeln" abbildet und darüber hinaus Fehler oder nicht geregelte Ausnahmen abfängt und eskaliert. Ohne einen ausgewiesenen PDF/A-Experten ist sie aufgrund ihrer Komplexität kaum realisierbar. (wh)

Weitere Informationen

Foto: PDFA

Weitere Informationen über das PDF/A-Format stellt die PDF/A Association auf ihrer Website pdfa.org zur Verfügung. Der internationale Interessensverband verfolgt das Ziel, PDF-Anwendungen für digitale Dokumente zu fördern, die auf offenen Standards basieren. Dazu setzt sich der Verband für eine aktive Wissensvermittlung und den Austausch von Know-how und Erfahrungen für alle Interessengruppen weltweit ein.

»

Der Autor

Carsten Heiermann ist Geschäftsführer der LuraTech Europe GmbH.