Erfolgsfaktor Expertenwissen

Big Data ist kein Autopilot für das Business

14.05.2013
Von 
Jan-Bernd Meyer betreute als leitender Redakteur Sonderpublikationen und -projekte der COMPUTERWOCHE. Auch für die im Auftrag der Deutschen Messe AG publizierten "CeBIT News" war Meyer zuständig. Inhaltlich betreute er darüber hinaus Hardware- und Green-IT- bzw. Nachhaltigkeitsthemen sowie alles was mit politischen Hintergründen in der ITK-Szene zu tun hat.
Ist Big Data wegen hoher Hard- und Softwareanforderungen nur etwas für große Unternehmen? Weit gefehlt, sagt Joseph Reger, Chief Technology Officer bei Fujitsu, im Gespräch mit CW-Redakteur Jan-Bernd Meyer.

CW: Big Data wird gerne mit Business Intelligence in einen Topf geworfen. Worin unterscheidet sich Big Data elementar von BI?

"Mit Open-Source-Tools können auch KMU Analytics nutzen." Joseph Reger, Fujitsu Siemens.
"Mit Open-Source-Tools können auch KMU Analytics nutzen." Joseph Reger, Fujitsu Siemens.
Foto: Fujitsu Siemens

Reger: Business Intelligence beruht auf teilweise sehr unterschiedlichen Datenarten und großen Datensätzen. Diese konnte man bisher nicht mit herkömmlichen Werkzeugen wie Datenbanken oder einem Business Warehouse Accelerator bearbeiten - zumindest nicht wirtschaftlich. Zudem ergeben Auswertungen sehr großer Datensätze sicherere Aussagen als Statistiken, die auf kleinen Datenmengen basieren. Big Data macht diese neue Art von Business Intelligence nun auch für kleinere Budgets zugänglich.

CW: Big Data wird bisweilen mit den vier Schlüsselbegriffen Volume, Velocity, Variety und Veracity charakterisiert. Umfang, Schnelligkeit und Vielfalt sind selbsterklärend, der vierte Begriff, Wahrhaftigkeit, erstaunt jedoch. Umfragen zufolge traut jeder dritte Manager nicht den Informationen, auf deren Basis er Entscheidungen trifft. Heißt das, alle bislang - auch via BI - vorliegenden Daten sind unzuverlässig? Und wenn das so ist, wieso sollte Big Data an diesem Zustand etwas ändern?

Reger: Interessant - diese Aussage war mir so noch nicht bekannt. Der Unterschied zwischen BI und Big Data liegt im Endeffekt darin, dass die heutigen BI-Statistiken meist auf kleinen Datensätzen aus der Vergangenheit beruhen. Das kann zu unsicheren Vorhersagen über zukünftige Ereignisse führen. Big Data kann die Treffsicherheit durch einen Blick auf sehr viele, in manchen Fällen sogar auf alle Daten deutlich erhöhen. Weiter können mit effizienten Big-Data-Tools Datensätze vorab auf ihre Qualität untersucht werden. Dieses Data Cleaning, Data De-Dubbing, Data Pre-Processing war bisher sehr zeitaufwendig und damit auch teuer. Big Data liefert also nicht einfach genauere Aussagen anhand von größeren Datenmengen, sondern in vielen Fällen auch andere Aussagen. Damit erhöht sich die Treffsicherheit für zukünftige Ereignisse.

CW: Der Begriff Big Data bedeutet, mit riesigen Datenvolumen zu hantieren und sie zu analysieren.Dazu ist aber ein hoher Hard- und insbesondere Softwareaufwand zu treiben. Mit anderen Worten: Big Data ist eine schöne Vision, aber für kleine und mittelständische Unternehmen nicht zu nutzen, oder?

Reger: Das muss nicht so sein. Für Big Data wurden in den vergangenen Jahren sehr viele neue Werkzeuge entwickelt. Beispielsweise eine große Vielfalt an Open-Source-Tools, die auf standardisierter, einfach skalierbarer Hardware sehr performante und effektive Systeme entstehen lassen. Das versetzt nun auch kleine und mittelständische Unternehmen (KMU) in die Lage, diese Generation von BI und Analytics zu nutzen. So kann die Wirkung von Big Data im Mittelstand noch größer ausfallen als bei Großunternehmen, die schon immer BI betrieben haben.

Mit Big Data bekommt der Mittelstand jetzt völlig neue Möglichkeiten. Denn die neuen Methoden und Optionen von Big Data erlauben auch Mittelständlern einen ersten Versuch.

Was Data Scientists leisten

CW: Natürlich kann man anstelle von kostspieligen Lösungen wie etwa HANA auch Open-Source-Produkte wie Hadoop nutzen. Wer im Unternehmen auf diese Karte setzt, braucht aber Spezialisten als Entwickler. Was muss ein Big-Data-Spezialist an Rüstzeug mitbringen, um ein Unternehmen in die Lage zu versetzen, die Versprechen von Big Data zu nutzen?

Reger: Ein guter Technologiepartner ist wichtig - im BI-Umfeld sehen wir schon lange Expertenwissen als sehr wichtigen Erfolgsfaktor. Diese Data Scientists sollten gleichzeitig Technik- und Business-Kenntnisse haben - zumindest im Team. Statistik- und Marketing-Know-how sind zusätzlich von Vorteil. Zum Glück wurden die Werkzeuge - auch im Open-Source-Bereich - inzwischen mit sehr bekannten Interfaces und Abfragemechanismen versehen, die eine herkömmliche beziehungsweise bekannte Bedienung wie etwa SQL auch ohne zwingende Techniktiefe ermöglichen. IT-Unternehmen wie Fujitsu haben Pools von Experten, um Kunden bei Big-Data-Projekten zu unterstützen.

CW: Welche Chancen bieten sich mit Big Data realistisch, und was für einen Zeitrahmen sollte sich ein Unternehmen setzen, um Big Data sinnvoll nutzen zu können?

Reger: Mit Big Data kann man Datenmengen sammeln und analysieren, die bisher nicht in Betracht gezogen wurden, da es schlichtweg unwirtschaftlich war. Dies schließt die Einbeziehung von externen Datenquellen ein.

Je nach Problemstellung kann der Zeitaufwand bis zur erfolgreichen Nutzung von Big Data stark variieren. Ansätze wie Big-Data-Appliances mit fertigen Templates und auch Visualisierung führen in vielen Fällen sehr schnell zu ersten Ergebnissen. Unterschiedliche Zeitrahmen sind also möglich, werden aber nicht in Wochen gemessen.

CW: Von welchen Versprechen der Big-Data-Vertreter sollte man sich lieber verabschieden und warum?

Reger: Big Data ist kein Autopilot für ein Business. Die Ergebnisse müssen mit dem Wissen der Geschäfts- und Branchenkenner und natürlich mit gesundem Menschenverstand weiterverarbeitet werden. Und: Big ist gut, aber besser ist besser. Denn wie immer geht es nicht nur um die Menge, sondern auch um die Qualität der Daten.