Mehr Effizienz durch Datenanalyse und Automation

Ein Data Scientist muss Algorithmen beherrschen

25.10.2018
Von 
Hans Königes war bis Dezember 2023 Ressortleiter Jobs & Karriere und damit zuständig für alle Themen rund um Arbeitsmarkt, Jobs, Berufe, Gehälter, Personalmanagement, Recruiting sowie Social Media im Berufsleben.
In der digitalen Welt spielt die Datenanalyse eine entscheidende Rolle, wollen Unternehmen eine höhere Effizienz durch Automatisierung schaffen. Welche verantwortungsvolle Aufgabe dem Data Scientist hier mit Visualisierung und Storytelling zukommt, erklärt Yasmeen Ahmad, Customer Excellence Director bei Teradata. 2017 wurde sie vom Computer Magazine zum „Data Scientist of the Year“ gekührt.

Was ist die Aufgabe eines Data Scientist?

Yasmeen Ahmad: Ein Data Scientist ist Datenenthusiast, Problemlöser und Geschichtenerzähler in einem. Seine Aufgabe ist es, Daten in Unternehmen anhand verschiedener Analysetechniken zu durchleuchten und so dazu beizutragen, konkrete Fragen und Probleme zu lösen. Ein Data Scientist seziert zunächst alle im Unternehmen vorhandenen Daten, deckt Lücken auf, integriert und organisiert Daten aus den unterschiedlichsten Quellen - kurzum, er bringt Ordnung ins Datenchaos.

Yasmeen Ahmad: Nur ein erfahrener Data Scientist versteht die Eigenschaften und Einschränkungen von Algorithmen und kann den richtigen Algorithmus für ein bestimmtes Geschäftsproblem auswählen.
Yasmeen Ahmad: Nur ein erfahrener Data Scientist versteht die Eigenschaften und Einschränkungen von Algorithmen und kann den richtigen Algorithmus für ein bestimmtes Geschäftsproblem auswählen.
Foto: Ahmad - Teradata

Im zweiten Schritt macht er sich auf die Suche nach Datenmustern. Dafür extrahiert und analysiert er die Informationen auf vielfältige Weise, um festzustellen, welchen Algorithmus er verwenden muss, um die besten Erkenntnisse und Antworten zu erhalten. Im letzten Schritt muss er die gewonnenen Erkenntnisse mittels Visualisierungs- und Storytelling-Techniken an die Entscheider und Mitarbeiter im Unternehmen weitergeben und erklären können, denn wenn andere seine Analyse nicht verstehen, ist seine Arbeit wertlos.

Muss ein "Datenwissenschaftler" auf eine bestimmte Branche spezialisiert sein?

Ahmad: Grundsätzlich ist die Rolle des Data Scientist nicht branchenspezifisch; in allen Branchen und Geschäftsbereichen werden dieselben Analysetechniken eingesetzt. Andererseits haben Data Scientists, die sich auf eine Branche oder ein Geschäftsfeld spezialisieren, durchaus einen Vorteil. Denn ihr tiefes Verständnis des Geschäftskontexts bietet das Potenzial für eine bessere Problemlösung. Aus diesem Grund entscheiden sich viele Unternehmen für eine hybride Struktur, bei der ein zentrales Team von Data Scientists im gesamten Unternehmen tätig ist, während es in den einzelnen Geschäftsbereichen zusätzlich spezialisierte Data Scientists gibt. Unternehmen profitieren dadurch von Spezialisten, die einzelne Geschäftsfelder wirklich verstehen, und von Generalisten, die Best-Practice-Beispiele und Fallstudien unternehmensweit austauschen können.

Welchen Nutzen ziehen Unternehmen den Analysen der Data Scientist?

Ahmad: Die Digitalisierung hat in jeder Branche zu massiven Umwälzungen geführt. An der starken Position einstiger Marktführer rütteln neue Wettbewerber, die ihren Status quo mittels innovativer und flexibler Geschäftsmodelle herausfordern. Traditionelle Produkte und Dienstleistungen haben aufgrund des rasanten Innovationstempos an Differenzierung verloren. Jedes Produkt und jede Dienstleistung kann innerhalb von maximal sechs Monaten nachgebaut werden. Die Daten, die ein Unternehmen über teils Jahrzehnte gesammelt hat, können jedoch nicht nachgebaut werden, und schon gar nicht die aus ihnen gewonnenen Erkenntnisse, die einen echten Wettbewerbsvorteil bedeuten. Da Betriebe in einer digitalen Welt ihre Geschäftsentscheidungen immer mehr auf Daten und Analysen stützen, wird der Data Scientist gebraucht, weil er wesentliche Erkenntnisse generiert. Mit zunehmender organisatorischer Komplexität und dem Druck zur schnellen Markteinführung wird die Automatisierung auf der Grundlage von Daten und Analysen immer wichtiger für das Überleben der Unternehmen. Dabei wird Data Science nicht nur für kundenorientierte Projekte genutzt. Auch der Backend-Betrieb muss effizient sein und optimal funktionieren. Daten und ihre Analysen können eine entscheidende Rolle dabei spielen, höhere Effizienz durch Automatisierung zu ermöglichen. Aus all diesen Gründen ist die Beschäftigung von Data Scientists nicht mehr optional, sondern ein Muss für Unternehmen, die zukunftsorientiert denken und handeln.

Die Beschäftigung von Data Scientists ist nicht mehr optional, sondern ein Muss für Unternehmen, die zukunftsorientiert denken und handeln.
Die Beschäftigung von Data Scientists ist nicht mehr optional, sondern ein Muss für Unternehmen, die zukunftsorientiert denken und handeln.
Foto: weedezign - shutterstock.com

Welche Ausbildung oder speziellen Fähigkeiten braucht man als Data Scientist?

Ahmad: Data Scientists bringen ganz verschiedene individuelle Voraussetzungen mit. Deshalb gibt es für das Berufsprofil "Data Scientist" keine allgemeingültigen Regeln. Die Fähigkeiten und Charakterzüge, nach denen wir bei Teradata suchen, sind in erster Linie Neugier, Problemlösungskompetenz, Erfahrung mit Daten und deren Analyse, hervorragende Kommunikation und vor allem der unstillbare Durst nach Wissen und immer Neues zu lernen. Diese Eigenschaften kennzeichnen den Data Scientist, der Lösungen für die schwierigsten Probleme in hochkomplexen Unternehmensbereichen entwickeln muss. Wir finden diese Fähigkeiten bei Personen mit unterschiedlichem Hintergrund wie Mathematik, Informatik, Physik, Linguistik und Ingenieurwissenschaften. Bestimmte Programmiersprachen (R, Python, Scala, SAS etc.) oder Technologien (Spark, Tensorflow, Hadoop etc.) haben dagegen keine Priorität. Intelligente, neugierige, agile Lernende werden sich bei Bedarf schnell neue Technologien und Sprachen aneignen. Außerdem schreitet die Entwicklung so schnell voran, dass die Werkzeuge und Technologien, die wir heute verwenden, in sechs oder zwölf Monaten wieder veraltet sein können.

Kann man gleichzeitig Data Scientist und Führungskraft sein?

Ahmad: Data Science ist eine Fähigkeit, die nicht mit einer bestimmten Funktion beginnt oder endet. Meine Erfahrung als Data Scientist kann mich dabei aber durchaus zu einer besseren Führungskraft machen. Denn ich verstehe von Haus aus, wie Daten und Analysen in Unternehmen sinnvoll eingesetzt werden. Ich nutze Daten und Fakten, um Entscheidungen zu treffen, und genau das fördere ich dann auch in meinem Team. Als Führungskraft suche ich nach Daten und Beweisen, die mir zeigen, wie ich meinen Teil des Unternehmens verbessern kann, und die mir die richtigen Antworten auf strategisch wichtige Fragen geben wie: Durch welche Maßnahmen können wir unsere Produkte und Services verbessern? Was wollen unsere Kunden wirklich? Auf welche Trends müssen wir reagieren? Auf welche globalen, wirtschaftlichen oder gesellschaftlichen Herausforderungen müssen wir als Unternehmen vorbereitet sein?

Inwiefern unterscheidet sich die Aufgabe von den gängigen Klischees?

Ahmad: Es wird immer angenommen, dass ein Data Scientist den ganzen Tag Algorithmen schreibt und programmiert. In Wahrheit sind die Analytics-Algorithmen jedoch der einfachste Teil des Jobs. Heute gibt es eine Vielzahl von Bibliotheken voller Algorithmen, die man über eine einfache Google-Suche findet. Die Schwierigkeit besteht nicht darin, Algorithmen zu schreiben oder sie auszuführen, sondern zu wissen und zu verstehen, welcher Algorithmus jeweils zum Einsatz kommen soll. Analytics-Algorithmen existieren in vielen Varianten. Nur ein erfahrener Data Scientist versteht ihre Eigenschaften und Einschränkungen und kann den richtigen Algorithmus für ein bestimmtes Geschäftsproblem auswählen. Dazu gehört oft die Iteration durch mehrere Algorithmen zum Vergleichen und Verknüpfen von Ergebnissen, bevor der eine richtige Algorithmus ausgewählt werden kann. Das ist aber bei Weitem der schnellste Teil der gesamten Arbeit als Data Scientist. Viele Menschen unterschätzen den Aufwand, der notwendig ist, um die echten Probleme und Herausforderungen eines Unternehmens zu definieren und zu erforschen, Ergebnisse auszutauschen, Hypothesen aufzustellen und Maßnahmen festzulegen. Gern übersehen wird auch die Zeit, die ein Data Scientist mit der Integration komplexer Datentypen verbringt. Daneben bleibt recht wenig Zeit für die Algorithmen.

Wie hat sich das Stellenprofil in den letzten Jahren verändert und wohin geht die Entwicklung?

Ahmad: Noch vor fünf Jahren haben Unternehmen den "Data Scientist für alle Fälle" eingestellt, jemanden, der quasi alles kann und alles macht. Inzwischen existiert ein besseres Verständnis für die Rolle und wie sie als Teil eines funktionsübergreifenden Teams funktionieren muss. Wir suchen nicht mehr per se den Data Scientist, der Experte dafür ist, Geschäftsanforderungen zu verstehen und zu dokumentieren, Echtzeit-Datenfeeds und komplexe Datenerfassungs-Pipelines einzurichten, Tests zu automatisieren, Code zu integrieren und mehrere Entwicklungs- und Produktionsumgebungen in großen Unternehmen zu managen. Wir stellen hingegen mehrere Mitarbeiter mit unterschiedlichem Hintergrund ein, die im Team arbeiten. Durch die Zusammenarbeit von Data Scientists, Automatisierungsingenieuren, Business-Analysten, Visualisierungs- und UI-Experten, Softwareingenieuren und Architekten können wir echte End-to-End-Lösungen gestalten und realisieren. Ohne die verschiedenen Fähigkeiten im Team hätte der Data Scientist wegen der Konfiguration, Einrichtung und Wartung der ersten Lösungen, die er in Betrieb genommen hat, keine Zeit mehr für neue Analysen. Wir stellen sicher, dass unser Data-Science-Team im Bereich R&D sowie Innovation bleibt und nicht für den operativen Betrieb und die Wartung eingesetzt wird. Wenn es ein gemischtes Team aus verschiedenen Rollen und Fachgebieten gibt, kann der Data Scientist nämlich das machen, was er besonders gut kann, nämlich neue Analyselösungen für Geschäftsprobleme entwickeln.

Welchen Aspekt des Jobs mögen Sie am meisten?

Ahmad: Jeden Tag neue Welten zu entdecken. Für mich öffnet Data Science viele Türen zu neuen Branchen, Fachgebieten und geschäftlichen Herausforderungen, aus denen ich ständig lernen kann. Meine Kernkompetenzen haben mir geholfen, als Berater um die Welt zu reisen und Unternehmen mit komplexen Herausforderungen einen Mehrwert zu bieten. Meine Fähigkeiten für die Lösung hochkomplexer Geschäftsprobleme einzusetzen, macht mich sehr zufrieden. Meine besondere Leidenschaft gilt der Visualisierung und Kommunikation von Daten. Ich habe bei der Ausstellung "The Art of Analytics" von Teradata mitgearbeitet, die die Kraft der Kombination von Data Science und Storytelling unter Beweis stellt und zeigt, wie wichtig überzeugendes "Data-Telling" im Gespräch mit dem Topmanagement ist - und wie man Daten auch in andere Darstellungsformen übersetzen kann.