Big Data und die Datenberge

Daten ausmisten statt zu horten

10.11.2016
Von 


Stefan Henke ist Head of DACH bei Cloudflare. Er gilt als Experte für das Thema IT-Security, SaaS, Cloud und Informationmanagement. Seine besondere Expertise liegt im Großkundenbereich, insbesondere im Industrie- und Finanzsektor und in der Automobilbranche. Er hat über 25 Jahre Erfahrung im IT-Bereich und war zuletzt mehrere Jahre bei Symantec und Veritas tätig. 
Die Motivation von Unternehmen, ihre Daten zu horten, speist sich aus der Hoffnung, diese Unmengen an Informationen irgendwie, irgendwann in Geld umzuwandeln. Oft vernachlässigen sie dabei allerdings eine Grundvoraussetzung: Sie müssen die Inhalte ihrer Daten kennen, bevor sie diese klug auswerten und neues Wissen extrahieren können. Schon daran scheitern die meisten.

Messies neigen zum Sammeln nutzloser Dinge. Sie sind bekanntermaßen nicht in der Lage, zwischen wichtig und unwichtig abzuwägen. Das gipfelt in einer Unfähigkeit, das eigene Alltagsleben zu organisieren. Nichts anderes droht Unternehmen mit der Digitalisierung.

Unrat ist für seinen Besitzer oft nicht mehr überaschaubar. Auch Unternehmen horten oft Daten, ohne ihren genauen Inhalt zu kennen.
Unrat ist für seinen Besitzer oft nicht mehr überaschaubar. Auch Unternehmen horten oft Daten, ohne ihren genauen Inhalt zu kennen.
Foto: Stephane Bidouze - shutterstock.com

Die Menge der in Umlauf befindlichen Daten steigt exponentiell. Nach Expertenschätzungen kommt derzeit weltweit alle zehn Minuten ein Datenberg von fünf Milliarden Gigabyte hinzu. Unternehmen sammeln, was das Zeug hält. Sie treibt die Hoffnung, die Daten eines Tages analysieren und monetarisieren zu können. Es klingt fast nach dem klassischen Dreisprung im Datenmanagement: Sammeln, Speichern, Analysieren. Aber der Vergleich hinkt und zwar gewaltig. Nur ein Bruchteil der global vorhandenen Datenbestände ist geschäftsrelevant und eignet sich tatsächlich zur Auswertung.

Ohne Einsicht keine Analyse

Die von Unternehmen gesammelten Datenberge setzen sich ganz unterschiedlich zusammen: aus geschäftskritischen Informationen, die wichtig für den Betrieb und Erfolg der Organisation - und damit schützenswert - sind. Und aus ROT-Daten. ROT steht für "Redundant, Obsolet, Trivial" (redundant, veraltet, unbedeutend). Daten dieser Art haben keinerlei Geschäftswert und müssten regelmäßig gelöscht werden, um Kosten zu sparen.

Hinzu kommt noch der riesige Anteil so genannter Dark Data. Hier ist schlichtweg nicht bekannt, worum es sich handelt. Wer aber ihren Inhalt nicht kennt, weiß auch nichts vom Wert dieser Daten. Zu dunklen Daten können sowohl geschäftskritische als auch ROT-Daten gehören. Laut einer Analyse von Veritas, in der 10.000 IT-Führungskräfte und Büroarbeiter aus 13 Ländern befragt wurden, machen Dark-Data 66 Prozent aller in Deutschland gespeicherten Unternehmensdaten aus. Der ROT-Anteil liegt bei 19 Prozent, geschäftskritisch und damit verwendbar für Auswertungen sind lediglich 15 Prozent. Genau dieses Verhältnis macht deutlich: Wer analysieren will, sollte vorher aufräumen. Wer sparen will, sollte Unwichtiges löschen.

Das verborgene unsichtbare Risiko

Doch wäre es zu kurz gedacht, in den dunklen Daten nur verschenktes Analysepotenzial zu sehen. Eine weit größere Gefahr ist, dass sich darunter auch illegale Daten befinden können, die letztlich die Compliance gefährden. Das spricht erst recht dafür, die Verwaltung der angehäuften Datenmengen zu einer der dringlichsten Aufgaben im Unternehmen zu erklären - vor allem mit Blick auf die kürzlich veröffentlichte EU-Datenschutz-Grundverordnung. Sie tritt 2018 in Kraft und regelt genau, wie in Europa zukünftig mit personenbezogenen Daten umzugehen ist. Um ihr entsprechen zu können, müssen Unternehmen wissen, wo welche Daten liegen. Anders ausgedrückt: Einblick in Dark Data und daraus dann Erkenntnis gewinnen.