Papier ist nicht nur geduldig, es eignet sich auch hervorragend als Träger für Informationen, die rechtskonform und revisionssicher archiviert werden müssen. Wird es richtig gelagert, kann ein Dokument aus säurefreiem Papier mehrere Hundert Jahre überdauern. Doch mittlerweile liegen immer mehr Daten nur noch in elektronischer Form vor: Steuerdokumente, Verträge, Entwicklungsunterlagen oder Umsatzstatistiken. Und an die Stelle des Briefs oder des Fax-Dokuments treten E-Mails und Instant Messages.
Viele dieser Unterlagen müssen Jahre, teilweise Jahrzehnte lang aufbewahrt werden. Bei Geschäftsunterlagen beträgt der vom Gesetzgeber vorgegebene Archivierungszeitraum bis zu zehn Jahre, bei Patientendaten sind es bis zu 30 Jahre. Für Gebäudepläne, Katastereinträge und Unterlagen für medizinische Geräte gilt, dass sie über den gesamten Lebenszeitraum hinweg aufbewahrt werden müssen.
Differenzierung Archivierung und Backup
Häufig werden die Begriffe "Backup" und "Archivierung" fälschlicherweise in einen Topf geworfen. Beide Verfahren unterscheiden sich jedoch in wesentlichen Punkten:
Backup: Es wird eine Kopie von Produktionsdaten für den Fall erstellt, dass diese durch Benutzerfehler oder einen Hardware-Defekt verloren gehen und wiederhergestellt werden müssen. Als Speichermedium für Backup-Daten dienen Festplatten beziehungsweise Storage-Systeme, Bänder (Tapes) und Cloud-basierte Online-Speicher. Backups decken in der Regel ein schmales Zeitfenster ab, je nach Branche und Geschäftsfeld reicht es von wenigen Stunden bis hin zu mehreren Monaten. Wichtig ist das möglichst schnelle Wiederherstellen (Retention) von verlorengegangenen Datenbeständen.
Archivierung ist das systematische und langfristige Verlagern von Daten von Produktivsystemen auf spezielle Datenträger wie Magnetbänder, optische Speichermedien oder Festplatten. Die Daten müssen in einer Form archiviert werden, die nachträgliche Änderungen unterbindet. Bei der Langzeitarchivierung ist eine Aufbewahrung über einen Zeitraum von zehn Jahren und länger gefordert.
Warum Langzeitarchivierung wichtig ist
Für Unternehmen ist das Langzeitarchivieren von Unterlagen aus mehreren Gründen unverzichtbar. Zum einen erfordern gesetzliche Vorgaben wie das Handelsgesetzbuch, die Abgabenordnung (AO) und die Grundsätze zum Datenzugriff und zur Prüfbarkeit digitaler Unterlagen (GDPdU), dass Firmen Geschäftsdaten bis zu zehn Jahre lang aufbewahren. Diese Daten müssen Firmen Behörden, etwa dem Finanzamt, bei Bedarf umgehend und in einem maschinenlesbaren Format zur Verfügung stellen.
Der zweite Punkt ist die Beweissicherung, beispielsweise im Rahmen eines Schadenersatzprozesses wegen eines angeblichen Konstruktionsfehlers eines Produkts. Dann muss ein Unternehmen auch noch nach Jahrzehnten die Originalunterlagen vorlegen können. Damit ein archiviertes elektronisches Dokument als Beweismittel zugelassen wird, ist es allerdings erforderlich, kryptografisch signierte Dokumente in ihrem Beweiswert zu sichern und sie nötigenfalls zusammen mit den Metadaten, Signaturen und Beweissicherungen (Evidence Records) zu exportieren. Das erfolgt mithilfe einer Middleware. Details dazu hat das Bundesamt für Sicherheit in der Informationstechnik (BSI) in der Technischen Richtlinie (TR) 03125 fixiert. Eine vom BSI zertifizierte beweiswerterhaltende Langzeitarchivierungslösung ist beispielsweise SecDocs von Fujitsu.
Eine Langzeitarchivierung von Daten bietet weiterhin die Möglichkeit, auf vorhandenes Know-how zurückzugreifen oder dieses bei Bedarf an Interessenten zu verkaufen (Verwertung von Patenten). Für öffentliche Einrichtungen wie Bibliotheken oder staatliche Archive ist die Langzeitarchivierung von Dokumenten die Grundlage ihrer Tätigkeit.
Verfügbarkeit von Datenträgern und Laufwerken berücksichtigen
Wenn Daten zehn Jahre oder länger aufbewahrt werden sollen, spielen die Archivierungsmedien und die entsprechenden Schreib-/Lesesysteme eine zentrale Rolle. Eines der größten Probleme ist, dass zu wenige gesicherte Daten über die Haltbarkeit von Speichermedien wie Magnetbänder, Festplatten, DVDs oder Flash-Speicher verfügbar sind. Bei optischen Medien gilt eine Lebensdauer von 10 bis 30 Jahren als realistisch, bei Festplatten sind es etwa 5 Jahre. Magnetbänder können 30 Jahre oder mehr überstehen. Anwender sind allerdings gut beraten, wichtige Daten rechtzeitig auf neue Medien umzukopieren. Als Faustregel gilt, dass dies bei optischen Medien und Bändern alle fünf Jahre erfolgen sollte. Flash-Speicher wie Solid State Drives (SSDs) werden derzeit so gut wie gar nicht als Archivierungsmedien eingesetzt. Dazu sind sie schlichtweg zu teuer.
Anforderung |
Festplatte |
Tape |
Optische Medien |
Für häufige Zugriffe ausgelegt |
ja |
nein |
nein |
Kurze Zugriffszeiten |
ja |
nein |
je nach Medium |
Kurze Archivierungsdauer (< 1 Jahr) |
ja |
ja |
ja |
Mittlere Archivierungsdauer (< 10 Jahre) |
nein |
ja |
ja |
Lange Archivierungsdauer (10 - 20 Jahre) |
nein |
ja |
ja |
Auslagerung des Mediums möglich |
nein |
ja |
ja |
Daten nicht veränderbar |
nein |
mit WORM-Tape |
mit WORM-Disk |
Quelle: NESTOR-Handbuch Version 2.3 |
Zu berücksichtigen ist zudem, wie lange die Hard- und Software zur Verfügung steht, mit der sich archivierte Daten auslesen lassen. Zwei Beispiele: Die US-Weltraumbehörde NASA kann nicht mehr auf Magnetbänder mit Daten der Mars-Sonden Pioneer und Viking zugreifen, weil die entsprechenden Bandlaufwerke vom Markt verschwunden sind. Ein vergleichbares Problem ist bei Archivdaten der ehemaligen DDR aufgetreten.
NASA - Archivierung der Superlative
Die Weltraumbehörde NASA setzt zum Archivieren der Daten ein Bandspeicher-System mit 115 Petabyte Kapazität ein. Die Arbeitsdaten liegen auf Festplatten-Storage-Systemen (RAID) und werden auf Tapes verlagert (Disk to Tape), wenn NASA-Fachleute sie nicht mehr benötigen. Aus Sicherheitsgründen werden von jedem Datensatz zwei Kopien erstellt und in separaten Gebäuden gespeichert.
Als Server für die Archivierung der Daten setzt die NASA zwei Altix-4700-Hochleistungsmaschinen von SGI ein, die über Fibre-Channel-Festplatten mit 380 beziehungsweise 535 TByte Kapazität verfügen.
Die Server übermitteln Daten, die archiviert werden sollten, mit 5 GBit/s über ein Storage Area Network zu einem Tape-Speichersystem der Reihe SGI Spectra Logic mit 115 Petabyte Volumen. Die sechs Tape Libraries verfügen über 59.120 Slots. Zudem kommen 92 LTO-5-Tape-Laufwerke zum Einsatz.