"Es ist nicht länger glaubhaft, auf Daten wie auf ein statisches Objekt in einem tiefen See zu blicken, statt sie als eine Ansammlung sich schnell bewegender Wirtschaftsgüter in einem reißenden Fluss zu betrachten. Im Jahr 2016 und darüber hinaus müssen Unternehmen auf die Daten schauen, die geschäftsrelevante Informationen für heute und morgen liefern."
Dieser Appell von Neil Jarvis, CIO Fujitsu America, bringt auf den Punkt, worum es heute geht: Digitale Unternehmen sind datengesteuert. Genau hier setzt auch die digitale Transformation an. Das heißt: Es muss eine Person zum Treiber der digitalen Transformation erkoren werden, die auch den eigentlichen Kern eines digitalen Unternehmens verantwortet, nämlich der Chief Data Officer (CDO).
Mit anderen Worten: Die digitale Transformation beginnt beim Information Management. Hier muss als Erstes aufgeräumt werden. Das aber erfordert ein Motivieren und Agieren nicht nur auf der C-Ebene, sondern auf allen Ebenen der Unternehmensorganisation. Hier wird der CDO von seinen Mitstreitern, den Data Scientists, den Data Brokern und den Data Stewards unterstützt. Grund genug, in diesem dritten Beitrag der Serie "Roadmap zur Digitalisierung" nach dem CDO und Data Steward einen Blick auf die Rolle des Data Scientist zu werfen.
Analytik ist auf dem Vormarsch
Der Job des Data Scientist wurde bereits im Jahr 2012 vom Harvard Business Review zum "sexiest job of the 21st Century" gekürt. Im letzten Jahr war laut einer Untersuchung des Rekrutierungsportals Glassdoor der Beruf des Data Scientist in den USA Job Nummer eins unter den technologiebezogenen Tätigkeiten. Im Jahr 2014 rangierte er noch auf Platz neun. Interessant in diesem Zusammenhang ist auch, dass der verwandte Job eines Analytik-Managers es 2015 von null auf Platz elf schaffte. Das unterstreicht: Analytik ist auf dem Vormarsch, denn digitale Unternehmen sind datengetrieben und datengesteuert. Da wird Kompetenz in Analytik schnell zum kritischen Erfolgsfaktor. Mitarbeiter mit entsprechender Ausbildung und Kompetenz werden daher dringend gesucht, nicht nur in den USA. Und sie sind nicht nur begehrt, sondern werden auch gut bezahlt. Ein leitender Analytik-Manager erhält in den USA im Durchschnitt ein Jahresgehalt von 150.000 Dollar, ein Data Scientist im Mittel 101.000 Dollar bei einer Spannweite von 75.000 bis 127.000 Dollar.
Das mag alles vor dem Hintergrund erstaunen, dass die Anbieter von Analytik- und Business-Intelligence-Werkzeugen angeblich immer einfacher zu bedienende und fachabteilungsgerechte Analytik-Plattformen und -Werkzeuge herausbringen. Self-Service-Business-Intelligence ist angesagt. Das ist zwar richtig, aber ohne Mathematik, Statistik und ein solides Wissen in Information Management geht nicht allzu viel in einem digitalen Unternehmen. Data Scientists sind daher unverzichtbar, um eine höhere Wertschöpfung aus den Unternehmensdaten zu erzielen.
Hinzu kommt, dass heutzutage in Sachen Big Data der größte Teil an Daten nicht strukturiert ist und als Datenstrom in Echtzeit abläuft. Hier sind traditionelle, relationale Datenbanken mit den herkömmlichen Analytik- und BI-Werkzeugen nicht mehr ausreichend. Die neuen, innovativen Tools, die jetzt vermehrt auf den Markt kommen, adressieren zunächst einmal Data Scientists und nicht die Mitarbeiter in den Fachabteilungen. Der Job eines Data Scientist ist daher keineswegs simpel, sondern erfordert viel Wissen und Erfahrung in Sachen Analytik und Information Management.
Was ist Data Science?
Die ersten Anfänge von Data Science liegen bereits gut 50 Jahre zurück. Als Beginn von Data Science gilt der 1962 erschienene Aufsatz von John Tukey "The Future of Data Analysis". Demnach ist Data Science ein "Lernen mit Daten beziehungsweise Lernen von Daten". Damit unterscheidet sich Data Science von der traditionellen Statistik. Nach dem Statistikwissenschaftler Leo Breiman lassen sich Data Science und Statistik jeweils unterschiedlichen Kulturen zuordnen.
• Ziel von Data Science sind vor allem prädiktive Modelle ("Prediction"): Welche auf die Zukunft bezogenen Antworten lassen sich aus zukünftigen Eingangsvariablen eines Modells ableiten?
• Dagegen sind generative Modelle Ziel der Statistik ("Inference"): Was ist der Zusammenhang zwischen den Eingangs- und Ausgangsvariablen eines Modells?
Aus dieser Positionierung von Data Science versus Statistik wurde dann das "Common Task Framework" (CTF) als Basismethodologie von Data Science entwickelt. Es hat zu bemerkenswerten Fortschritten in der prädiktiven Analytik geführt.
Was tut ein Data Scientist?
Wie die Data Stewards arbeiten auch die Data Scientists eng mit den Fachbereichen zusammen und unterstützen diese als Dienstleister in allen analytischen Fragestellungen. Sie profitieren dabei von der horizontalen Sicht über alle Daten, die von den Data Stewards geschaffen wird. Sie besitzen insbesondere ein hohes Maß an Kreativität, das heißt die Fähigkeit, Probleme mit anderen Augen zu sehen und anzugehen ("thinking out oft he box"). Gemeinsam mit den Data Stewards schaffen sie die für ein digitales Unternehmen wichtige Datenkultur. Data Scientists tragen so wesentlich zur digitalen Transformation bei.
- Die Aufgaben des Business Developer
Business Developer blicken tief in die Geschäftsprozesse und können Unternehmensziele mit Datenanalysen in Verbindung bringen. Sie entwickeln eine erste Fragestellung oder decken ein Problem auf, das anhand der erhobenen Daten gelöst werden soll. Als Schnittstelle zwischen Geschäftswelt und Technik kann er den Nutzen der Analyseergebnisse am besten einschätzen und arbeitet daher eng mit dem Data Analyst zusammen. - Die Aufgaben des Data Analyst
Der Data Analyst besitzt profunde Kenntnis über datengetriebene analytische Methoden, Data Mining-Verfahren und Techniken der Datenvisualisierung. Mit ihnen können Datensätze automatisch klassifiziert oder hinsichtlich ihrer Ähnlichkeit gruppiert werden. So kann der Data Analyst die Aussagekraft der Daten bewerten und relevante Muster und Auffälligkeiten in den Datenströmen erkennen. - Die Aufgaben des Data Manager
Der Data Manager sorgt dafür, dass die Qualität der Daten optimiert wird und sie durch Metadaten ausreichend beschrieben werden. Dazu zählt, dass sich der Data Manager einen Überblick über die Nutzungsrechte verschafft und bei sensiblen Daten weiß, wofür diese verwendet werden dürfen. - Die Aufgaben des Application Developer
Der Application Developer setzt die Plattform auf, auf der die Daten integriert und die Anwendungen entwickelt und installiert werden. Er beherrscht verschiedene Werkzeuge zur Parallelisierung und Echtzeitverarbeitung, so dass die statistischen Modelle des Data Analysten auch auf großen Datenmengen genutzt werden können. - Die Aufgaben des Security Manager
Der Security Manager sorgt dafür, dass die Zusammenführung, Anreicherung und Analyse von Daten keine Rückschlüsse auf Einzelpersonen zulässt und damit die Persönlichkeitsrechte verletzen könnte. Der Security Manager muss also den Datenschutz organisatorisch und technisch umsetzen. - Die 5 Typen von Data Scientists im Überblick
Das Schaubild zeigt noch einmal alle 5 Typen von Data Scientists und ihre Aufgaben im Überblick.
Durch den Einsatz von Big-Data-Analytik schaffen die Data Scientists aus der Vielfalt der Unternehmensdaten in Kombination mit Big Data neue, unternehmensrelevante Information und Wissen. Nur so kann sich ein datengetriebenes und -gesteuertes Unternehmen entfalten.
Die Rolle des Data Scientist lässt sich folgendermaßen beschreiben:
• Er verantwortet die aus dem CTF abgeleitete Methodologie von Big-Data-Analytik im Unternehmen.
• Er arbeitet gemäß Donohos "Greater Data Science" (GDS), das heißt, er betreibt Datenexploration und -vorbereitung, Datenpräsentation und Transformation, Durchführung der notwendigen Rechenoperationen und Anwendung der entsprechenden Algorithmen, Datenmodellierung (im Rahmen der Data-Scientist-Projekte) sowie Datenvisualisierung.
• Er kommuniziert die Projektergebnisse in einfacher, klar verständlicher Sprache und liefert gut aufbereitete und nachvollziehbare Sachverhalte, die auf Fakten basierende Unternehmensentscheidungen erlauben.
• Er ist maßgeblich an der Auswahl von Technologien für Big-Data-Analytik beteiligt, die möglichst bimodal einsetzbar sein sollen. (siehe dazu den Abschnitt "Welche Technologien nutzen Data Scientists")
Data Scientists haben dazu auch eine Schnittstelle zum Datenschutzbeauftragten, der über die Einhaltung der gesetzlichen Regelungen bei der Datenbeschaffung und Analyse wacht. Gemeinsam sind sie auch Anwälte einer Big-Data-Ethik.
Die Aufgaben von Data Scientists sollten natürlich im Rahmen der unternehmensspezifischen Roadmap zur Digitalisierung priorisiert werden.
Der Chief Data Scientist berichtet an den CDO
Wie das Team der Data Stewards vernetzt sich auch das der Data Scientists im Unternehmen und identifiziert in den verschiedenen Fachabteilungen und in der IT dezidierte Ansprechpartner. Organisatorisch fasst man am besten das Team mit seinen Ansprechpartnern in den Fachabteilungen und der IT in einem Kompetenzzentrum zusammen. Es hat einen Leiter, der - wie schon eingangs gesagt - an den CDO berichtet: Der CDO stellt das Budget zur Verfügung und verantwortet das Programm der Data Scientist.
Wie bei jedem Kompetenzzentrum gibt es die Möglichkeit einer zentralen, einer eingebetteten oder einer integrierten Organisation:
• In der zentralen Organisation ist man ein reiner Dienstleister, der autonom arbeitet.
• Eingebettet heißt, dass Data Scientists dezidiert in Fachabteilungen im Sinne einer Matrixorganisation mit dem Leiter Data Science als Vorgesetztem eingebettet werden.
• Integriert bedeutet, dass die Data Scientists Mitglieder in den Fachabteilungen sind, wobei auch der Fachabteilungsleiter der Vorgesetzte ist. Hier macht der Leiter Data Science nur noch methodische Vorgaben und setzt die Unternehmensstandards für Data Science. Jede dieser drei Organisationsformen hat die bekannten Vor- und Nachteile.
Welches Organisationsmodell ist also das richtige für Ihr Unternehmen? Im Rahmen einer digitalen Transformation empfehle ich eine zentrale Organisation, denn so kann sie als autonomer Dienstleister im Unternehmen am besten den Wandel treiben, indem sie als dezidiertes Team die neuen Ideen von Big-Data-Analytik innovativ an das Unternehmen anpassen und in die Fachabteilungen tragen kann.
Technik muss bimodale und agile Arbeitsweise unterstützen
Die digitale Transformation braucht natürlich auch Technologien. Dazu gehören sowohl Technologien des Information Managements als auch Big-Data-Analytik. Wie schon erwähnt, sollte man hier besonders darauf achten, dass die von den Data Scientists eingesetzten Techniken eine bimodale Arbeitsweise erlauben: Werkzeuge und Plattformen müssen einen agilen Ansatz unterstützen, damit Data Scientists im Projekt schnell vorankommen und "Quick Wins" erzielen. Aber sie müssen auch einen traditionellen Ansatz unterstützen, der dann zum Tragen kommt, wenn Data-Scientist-Projekte zu Standardanalysen werden. Dann sollten die Systeme in einen "stabilen" Modus überführt werden, insbesondere wenn die Verfügbarkeit der neuen Anwendungen unternehmenskritisch wird oder es um die Integration mit traditionellen Systemen geht.
Was wird aus dem Data Scientist nach der digitalen Transformation?
Data Scientists blicken, wie schon gesagt, auf eine gut 50-jährige Geschichte zurück, aber so richtig in den Fokus kamen sie erst mit dem Aufkommen von Big Data und der jetzt einsetzenden Digitalisierung der Unternehmen. Die digitalen Weltunternehmen wie Amazon, Facebook und Alphabet (vormals Google) verdanken ihren Aufstieg zu einem großen Teil den Data Scientists. Durch deren Arbeit verschafften sich diese Konzerne nicht nur Wettbewerbsvorteile, sondern auch ganz neue Märkte. Das ist der Vorteil digitaler Unternehmen, die sich von traditionellen Unternehmen vor allem durch ihre Datenkultur unterscheiden: Sie sind eben datengetrieben und datengesteuert.
- 9 Wege zur Digitalisierung
Eine neue Studie zum Thema Digitalisierung identifiziert neun Handlungsfelder in denen Unternehmen tätig werden müssen, um die Digitalisierung erfolgreich voranzutreiben und Digitale Exzellenz zu erlangen. - Digital Leadership
Die digitale Transformation muss von der Unternehmensspitze priorisiert und vorangetrieben werden. - Digital Empowerment
Die Qualifizierung von Mitarbeitern für die digitale Transformation sollte unternehmensweit von statten gehen. - Customer & Partner Engagement
Kunden und Partner sind die treibenden Kräfte der digitalen Transformation. Das Ziel für Unternehmen ist es folglich, deren Erwartungen und Anforderungen zu verstehen und diesen möglichst schnell gerecht zu werden. - Business Model Innovation
Digitale Exzellenz erfordert die fortlaufende Überprüfung bestehender Geschäftsmodelle auf Digitalisierungspotenziale und -notwendigkeiten. Unternehmen sollten neue digitale Geschäftsmodelle aktiv entwickeln. - Digital Platform Management
Im digitalen Raum haben verschiedene Plattformen eine zentrale Rolle übernommen. Unternehmen müssen auf diesen Plattformen präsent sein, Einfluss auf sie nehmen oder sogar selbst eine Plattform entwickeln und betreiben. - IT Architecture Transformation
Veraltete IT-Architekturen müssen komplett überarbeitet und erneuert werden. Die auf Stabilität und Sicherheit ausgelegten Backend-Systeme sollten so optimiert werden, dass sie die Frontend-Systeme in ihrer schnellen Weiterentwicklung unterstützen können. - Process Digitisation & Automation
In der klassischen IT-Disziplin der Prozessoptimierung und Effizienzsteigerung erfordert Digitale Exzellenz ein permanentes IT-Engagement. - Data-driven Agility
Digitale Exzellenz erfordert die stetige Auswertung von entstehenden Daten. Diese sollten anschließend in die steuernden Prozesse zurückgeführt werden, wo sie unmittelbar für die Weiterentwicklung und Gestaltung des digitalen Angebotes zur Verfügung stehen. - Digital Security & Compliance
Digitale Exzellenz ist nur zu erreichen und aufrechtzuerhalten wenn Systeme und Prozesse kontinuierlich in Bezug auf Sicherheit und Compliance überprüft und weiterentwickelt werden.
Das unterstreicht die Bedeutung von Data Scientists, deren Aufgabe auch nach einer digitalen Transformation genauso weiterbesteht. Sie sind wie die Data Stewards eine Unternehmensinstitution, die notwendig ist, um ein digitales Unternehmen am Leben zu halten. Man sollte aber prüfen, ob eine zentrale Organisation des Kompetenzzentrums der Data Scientists nach dem Wandel noch die beste Organisationsform für das Unternehmen darstellt, denn diese hängt im Wesentlichen von der eigenen Unternehmenskultur ab.
Im Gegensatz zur Rolle des CDO, der sich bei vollzogenem Wandel zum digitalen Unternehmen selbst abschafft, bleibt also die Rolle des Data Scientist bestehen. Nur berichtet dann der Leiter Data Science typischerweise direkt an den CEO, der ja in der Regel nach der digitalen Transformation per Metamorphose aus dem CDO entstanden ist. Unternehmen, die gleich als digitale Unternehmen gestartet sind wie Facebook und LinkedIn, machen es so.
Fazit
Treiber einer digitalen Transformation sind in besonderem Masse die Data Scientists. Gemeinsam mit den Data Stewards bauen sie eine Datenkultur auf, so dass das Unternehmen datengetrieben und -gesteuert wird. Daher muss nicht nur ein CDO als Treiber des digitalen Wandels in der C-Riege etabliert werden, sondern auch die Motivation und Unterstützung der Mitarbeiter in den Fachabteilungen erfolgen. Das ist nicht nur die Aufgabe der Data Stewards, sondern auch die der Data Scientists, die als Dienstleister in Sachen Big-Data-Analytik die Fachabteilungen mit Fakten und Wissen über den Markt und die Kunden versorgen. Wie die Data Stewards werden sie in einem Kompetenzzentrum organisiert, dass im Rahmen der digitalen Transformation autonom arbeiten sollte. Nach der erfolgten digitalen Transformation sollte sich dann die Organisation des Kompetenzzentrums an die im Unternehmen bestehenden Organisationsstrukturen ausrichten. Der Leiter Data Science sollte dann direkt an den CEO berichten. (pg)
Beiträge der Serie Roadmap zur Digitalisierung:
Der Chief Data Officer dirigiert die digitale Transformation (Teil 1)
Über die Rolle des Data Steward (Teil 2)