Nach Beobachtung des Marktforschers Gartner stoßen Entscheider, die Data Science und Machine Learning (kurz DSML) sowie Künstliche Intelligenz (KI) einführen wollen, auf geteiltes Echo. In der Analyse "Six pitfalls to avoid when planning data science and machine learning projects" nennen die Marktforscher sechs Fallen, in die CIOs nicht treten sollten.
Scheitern solche Projekte, führt Gartner das nicht auf die Technologie zurück, sondern auf den Mangel an Erfahrung. Laut Gartner müssen Entscheider grundsätzlich davon ausgehen, dass DSML sowie KI zunächst mindestens Skepsis, wenn nicht Ängste auslösen.
6 Fehlerquellen
Der Lebenszyklus eines DSML-Projektes beginnt laut Gartner mit dem Umreißen eines Business-Problems, dass das Unternehmen lösen will. Danach müssen die Daten vorbereitet werden. Im nächsten Schritt können die beteiligten Entscheider das genauere Vorgehen entwickeln und evaluieren. Im Anschluss implementieren sie es, um den Erfolg immer wieder zu überprüfen. Das Ganze findet nicht als Ad-hoc-Projekt statt, sondern folgt einer zuvor definierten Strategie.
Falle 1: Falsche Erwartungen
Falle 1: Falsche Erwartungen an den Wert für das Business: Gartner versteht KI nicht als "Intelligenz an sich". Sondern als eine Technologie, die Geräte befähigt, Aufgaben zu erfüllen, die vormals dem Menschen vorbehalten waren. Diese Technologie hat ihre Grenzen, wenn es um beispielsweise um emotionale Intelligenz und ethische Fragen geht.
CIOs und alle weiteren Entscheider, die mit DSML und KI operieren, müssen sich also mit den Fachabteilungen zusammensetzen und präzise untersuchen, welche Tasks von Systemen Künstlicher Intelligenz übernommen werden können und welche nicht. Unabhängig von dem Projekt, das sich daraus entwickelt, müssen sich CIOs für die Weiterqualifizierung der gesamten Belegschaft des Unternehmens einsetzen. Gartner spricht hier von "Data Literacy" und verdeutlicht, dass dieses Wissen so notwendig ist wie Lesen und Schreiben.
Falle 2: Ohne Plan und Prozesse loslegen
Falle 2: Start ohne definierten Plan und definierte Prozesse: Gartner rät nicht davon ab, mit den Möglichkeiten von DSML und KI zu spielen, um Übung damit zu gewinnen. Geht es aber an konkrete Projekte, sind ein definierte Plan und definierte Prozesse nötig.
Wer DSML und KI nutzen will, braucht einen Portfolio-basierten Ansatz. Dieses Portfolio sollte kleinere Projekte, die schnellen Erfolg versprechen, ebenso beinhalten wie längerfristige Vorhaben, die eine umfassende Transformation mit sich bringen. Die Analysten empfehlen allen Entscheidern, sich mit ihren Peers über diese Thema auszutauschen.
Falle 3: Datenschutz übersehen
Falle 3: Den Datenschutz vernachlässigen: Der US-Marktforscher geht bei diesem Punkt ganz auf die EU-Datenschutznovelle ein, die ab Mai 2018 für alle Unternehmen gilt, die mit Firmen im EU-Raum Geschäfte machen. Gartner warnt: Data Scientisten, die bei DSML-Projekten eine tragende Rolle spielen, wissen kaum um dieses Regelwerk und werden in ihrer Arbeit wenig darauf achten, ob Daten als personenbezogen gelten oder nicht. Hier ist der Chief Information Security Officer (CISO) gefragt.
Falle 4: Data Scientists fehlt Anerkennung
Falle 4: Data Scientists haben noch kein Standing im Unternehmen: Nach Beobachtung von Gartner erhalten Data Scientists derzeit oft nicht die nötige Anerkennung durch Business Manager. Das liegt schlicht am mangelnden Business-Verständnis der Data-Experten. Gartner plädiert nun nicht dafür, Data Scientists in "Business Manager light" verwandeln zu wollen, denn das ist nicht ihre Aufgabe. Unternehmen müssen den Scientists aber die Möglichkeit geben, das betriebswirtschaftliche Alltagsleben des Unternehmens kennenzulernen.
- Bilderkennung ist wichtigstes Anwendungsgebiet für Machine Learning
Heute kommen Machine-Learning-Algorithmen vor allem im Bereich der Bildanalyse und -erkennung zum Einsatz. In Zukunft werden Spracherkennung und -verarbeitung wichtiger. - Machine Learning im Anwendungsbereich Customer Experience
Heute spielt Machine Learning im Bereich Customer Experience vor allem im Bereich der Kundensegmentierung eine Rolle (hellblau). In Zukunft wird die Spracherkennung wichtiger (dunkelblau). - Machine Learning in den Bereichen Produktion und Prozesse
Unternehmen erhoffen sich im Bereich Produktion/Prozesse heute und in Zukunft (hell-/dunkelblau) vor allem im Bereich Prozessoptimierung positive Effekte durch Machine Learning. - ML im Bereich Kundendienst und Support
Sentiment-Analysen werden eine Kerndisziplin für Machine Learning im Bereich Kundendienst und Support - Auch IT-Abteilungen profitieren
Schon heute wird Machine Learning für die E-Mail-Klassifizierung und Spam-Erkennung genutzt. In Zukunft (dunkelblau) werden Diagnosesysteme wichtiger. - Was Management, Finance und HR von Machine Learning erwarten
Heute und in Zukunft ist in diesem Bereich das Risikomanagement eine vorrangige ML-Disziplin. In Zukunft soll auch das Talent-Management beflügelt werden. - Massive Effekte für Einkauf und Supply Chain Management
Machine Learning wird sich auf verschiedenste Bereiche des Procurements und des Supply Managements auswirken (hellblau = heute; dunkelblau= in Zukunft) - Diese Lernstile sind bekannt
Beim bekanntesten Lernstil, dem Überwachten Lernen (Supervised Learning), werden Bildern oder Dokumenten von Hand eine gewisse Menge an Tags oder Labeln zugewiesen. So werden die ML-Algorithmen trainiert. - Diese Lernstile verwenden Branchen
Während Autobauer eher auf "Semi-supervised Learning" setzen, sammeln andere Branchen mit Supervised Learning Erfahrung. - Machine-Learning-Algorithmen
Die meisten Unternehmen setzen auf einen Mix von Verfahren, um ihre vielfältigen Aufgaben zu lösen. - Einsatz von Machine-Learning-Algorithmen nach Branchen
Neuronale-Netzwerk-Algorithmen finden vor allem im Automotive-Sektor Verwendung - und natürlich in der ITK-Branche selbst. - Diese Programmiersprachen und Frameworks kommen im ML-Umfeld zum Einsatz
Mit knapp 70 Prozent Einsatzgrad ist Java die führende Programmiersprache im Bereich ML. Allerdings holen speziellere Sprachen und Frameworks auf. - Deep-Learning- und Machine-Learning-Packages
DeepLearn Toolbox, Deeplearning4j, das Computational Network Toolkit und Gensim werden auf Dauer die führenden Pakete sein. - Zielinfrastruktur für ML-Workloads
Die Deployments von Machine Learning gehen zunehmend in die Breite und erreichen auch die Cloud und das Internet der Dinge. Auf die Unternehmen kommt mehr Komplexität zu. - Bedenken und Herausforderungen
Datenschutz und Compliance-Themen machen Anwender am meisten zu schaffen, geht es um den Einsatz von Machine Learning. Außerdem vermissen viele einen besseren Überblick über das Marktangebot. - Machine Learning ist Sache der BI- und Analytics-Spezialisten
Die organisatorische Einführung von ML obliegt meistens den BI- und IT-Profis. Viele Anwender holen sich aber auch externe Hilfe. - Wo Externe helfen
Datenexploration, Skill-Aufbau und Implementierung sind die Bereiche, in denen Machine-Learning-Anfänger am häufigsten externe Hilfe suchen.
Das kann zum Beispiel durch Hospitanzen in den Fachabteilungen geschehen. Die Diskussion, die Gartner hier verfolgt, erinnert an das Schlagwort vom Business-/IT-Alignment. DSLM und KI müssen sich langfristig einer Vision orientieren, die zur Geschäftsstrategie des Unternehmens passt.
Falle 5: Verschiedene Metriken
Falle 5: Metriken für Data Science mit allgemeinen IT-Metriken verwechseln: Ohne konkrete Messergebnisse kann niemand den Erfolg eines Projektes beurteilen. Laut Gartner verfallen manche Entscheider dem Irrglauben, auf DSML- und KI-Projekte dieselben Kennzahlen anwenden zu können wie auf die Unternehmens-IT allgemein.
Gartner plädiert für ein Chief Data Officer Dashboard. Es umfasst drei Bereiche: Wert der Informationen (Kosten, Qualität, Geschwindigkeit), Business-Wert (betriebswirtschaftliche Key Performance Indikatoren auf Data und Analytics angewendet) und Stakeholder-Wert (Informationsaustausch und Kontakt zwischen Kunden und allen anderen relevanten Stakeholdern)
Falle 6: Datenqualität und Datenmanagement
Falle 6: Die Relevanz des Datenmanagements unterschätzen: Die Rolle des Data Scientisten ist neu. Seine Arbeit basiert aber auf altbekannten Grundlagen: der Qualität der Daten und dem richtigen Umgang damit. Datensätze dürfen keine doppelten, fehlenden oder fehlerhaften Informationen enthalten. Data Cleansing und Data Governance sind damit Teil jeden DSML-Projektes.