Digitale Entschlackung

In fünf Schritten zu einer schlanken Datenhaltung

10.02.2017
Von Detlev Sandel
Unternehmen arbeiten heute überwiegend auf kopierten Daten in schlechter Qualität. In der digitalen Ökonomie führt jedoch kein Weg an einer drastischen Verringerung redundanter Datenhaltung vorbei.

Ich werde häufig gefragt, worauf es denn ankommt, um in der digitalen Geschäftswelt zu bestehen. Meine Antwort ist einfach: Daten. Sie bilden die Grundlage für neue Prozesse, auf denen Unternehmen innovative Geschäftsmodelle aufbauen. Egal ob mobile App, E-Commerce-Anwendung oder vernetzte Produktion: Daten sind in der digitalen Ära das neue Öl, welches bisher das industrielle Zeitalter befeuert hat.

Daten sind das Öl der digitalen Wirtschaft.
Daten sind das Öl der digitalen Wirtschaft.
Foto: Rawpixel.com - shutterstock.com

Soweit so bekannt. Worin liegt nun die Herausforderung? Sie liegt nicht in der Verfügbarkeit oder der Menge von Daten, davon haben alle Unternehmen reichlich. Sie liegt auch nicht in der Verarbeitungskapazität moderner Technologien, die sich nach dem Moore'schen Gesetz alle 18 Monate verdoppelt.

Der zentrale Aspekt, der über das Funktionieren eines digitalen Geschäftsmodells entscheidet, ist die Qualität der Daten. So wie qualitativ schlechter oder falscher Treibstoff einen Verbrennungsmotor irreparabel ruinieren kann, können auch qualitativ schlechte Daten in der digitalen Wirtschaft ein Unternehmen ruinieren.

Drei Eigenschaften qualitativ hochwertiger Daten

Daten sind dann "qualitativ gut", wenn sie vereinfacht dargestellt

  1. korrekt,

  2. detailliert

  3. und aktuell sind.

Unternehmen, die ihr digitales Geschäftsmodell auf Daten aufbauen, die alle drei Eigenschaften auf einmal erfüllen, werden in der Kundenwahrnehmung überlegene Produkte beziehungsweise Services anbieten. Sie sind in der Lage, spontan auf geänderte Kundenbedürfnisse zu reagieren und passende Angebote zu unterbreiten. Sie zeichnen sich durch eine große Nähe zu ihren Kunden aus und wissen sehr genau, was diese wünschen - oft sogar im Voraus. Sie können viele ihrer Leistungen effizient, kundenindividuell und weitestgehend automatisiert erstellen. Damit erwirtschaften Sie mehr Umsatz und sind deutlich profitabler als ihre Wettbewerber.

Die Realität: kultivierter Datensumpf

In der Realität gibt es nahezu kein Unternehmen, in dem alle drei Eigenschaften für alle Daten gleichzeitig erfüllt sind. Und das obwohl die meisten sehr viel Geld in die Verbesserung der Datenqualität oder die Auswertung großer Datenmengen mittels analytischer Big-Data-Lösungen investieren. Woran liegt das?

Praktisch alle Daten in einem Unternehmen werden redundant, also mehrfach vorgehalten. Untersuchungen von IDC bei Unternehmen zwischen 1.000 und 10.000 Mitarbeitern haben ergeben, dass Originaldaten in bis zu 27 verschiedenen Datentöpfen gehalten und von jedem dieser Datentöpfe durchschnittlich 13 Kopien erstellt werden (Quelle: IDC white paper #259143 "Common gaps in data control", Sept. 2015). Es gibt einige wenige Fälle in denen eine redundante Daatenhaltung sinnvoll ist, zum Beispiel aus Sicherheitsgründen oder zu Testzwecken. In den allermeisten Fällen jedoch sind diese Redundanzen Folge eines über 30 Jahre alten IT-Paradigmas, nämlich der Client-Server-Architektur. Jeder einzelnen Anwendung wird ein eigener, exklusiver Datentopf zugestanden. Der Austausch von Daten zwischen Anwendungen findet über Schnittstellen statt, die zumeist asynchron, also zeitversetzt arbeiten.

Redundante Daten sind teuer

Der auffälligste Nachteil von Redundanz ist ein ungeheures Aufblähen der IT-Landschaften, denn alle diese Kopien müssen ja gespeichert, verwaltet und verteilt werden. Die daraus entstehende Komplexität frisst heute einen Großteil der IT-Budgets.

Viel schlimmer jedoch: Es ist nahezu unmöglich, mehrfach asynchron kopierte Daten über einen längeren Zeitraum konsistent zu halten. Wenn also eine kundenkritische Anwendung, zum Beispiel eine mobile App, mit kopierten Daten arbeitet, so ist es für diese Anwendung unmöglich nachzuvollziehen, wo diese Daten herkommen, ob sie korrekt und wie aktuell sie sind. Dazu kommt, dass aus technischen Gründen Daten zwischen Systemen in der Praxis nicht vollständig ausgetauscht werden. Dazu ist die Datenmenge einfach viel zu groß. Das wiederum führt dazu, dass das System, das mit Daten versorgt wird, nur einen Ausschnitt der Daten erhält oder diese durch Filterung, Aggregation, Segmentierung und ähnlichen Maßnahmen verändert wurden und damit weniger Details enthalten.

Mit anderen Worten: Bei jeder Kopie von Daten gehen Informationen verloren. Und mit jeder Kopie einer Kopie (einer Kopie, einer Kopie, …) wird das Problem größer.

Redundante Daten sind schlecht für das Geschäft

Die Folgen für Unternehmen können verheerend sein, wie Praxisbeispiele belegen:

  • Ein Automobilhersteller kann das Fahrzeug eines Kunden nicht termingerecht reparieren, weil wichtige Informationen zum Reparaturvorgang nicht korrekt sind und ein benötigtes Ersatzteil fehlt. Der Kunde bekommt einen Ersatzwagen und ist verärgert, weil er unnötig viel Zeit opfern muss. Er denkt über einen Wechsel der Marke nach.

  • Eine Supermarktkette bietet einigen seiner treuesten und umsatzstärksten Kunden seit vielen Jahren immer wieder rabattierte Hygieneartikel für Babys an, obwohl deren Kinder längst dem Babyalter entwachsen sind und lange keine entsprechende Käufe mehr getätigt wurden. Die Kunden fühlen sich missachtet, hinterlassen kritische Kommentare in den sozialen Medien und kaufen schließlich woanders ein.

  • Ein Finanzinstitut ist nicht in der Lage, den von der Bundesanstalt für Finanzdienstleistungsaufsicht (BaFin) geforderten Herkunftsnachweis von risikorelevanten Kennzahlen lückenlos und automatisiert zu erstellen. Die Folge sind zum Teil unvollständige Berichte trotz extrem hoher Kosten für manuelle Arbeiten.

Die Liste lässt sich beliebig in allen Branchen fortsetzen. Das Bedrohliche hieran für etablierte Unternehmen ist, dass es Wettbewerber gibt, die es in der Wahrnehmung der Kunden besser können. Sie heißen zum Beispiel Amazon, Apple, Google oder Tesla.