Maschinelles Lernen

Das Datenverständnis ist bei Machine Learning der Schlüssel zum Erfolg

08.10.2021
Anzeige  Die Daten sind vorhanden, aber die Mitarbeiter können nichts damit anfangen. Kein Wunder, dass Machine-Learning-Projekte dann "unrund" laufen. Wir zeigen Ihnen, wie sich das ändern lässt.

Es sind nicht nur ausgefeilte Modelle und Algorithmen, die darüber entscheiden, ob eine Maschine-Learning-Anwendung brauchbare Analysen und Vorhersagen bereitstellt. Vielmehr müssen bei einem Machine-Learning-Prozess und entsprechenden Projekten mehrere Faktoren zusammenspielen. Doch ein beträchtlicher Teil davon bereitet Anwender*innen Kopfzerbrechen. Das ist ein zentrales Ergebnis der Studie Machine Learning 2021, die IDG Resesarch Services mit Unterstützung von Microsoft erstellt hat.

So zählen rund 36 Prozent der Unternehmen die Frage zu den größten Herausforderungen, wie sich die Entscheidungen einer Machine-Learning- oder KI-Instanz nachvollziehen lassen. Das ist beispielsweise deshalb wichtig, damit ein Algorithmus nicht (versehentlich) einzelne Bevölkerungsgruppen diskriminiert, etwa bei der Vergabe eines Darlehens oder der Vorauswahl von Bewerber*innen. Doch auch die Überführung von Machine-Learning-Lösungen in den Produktivbetrieb (31 Prozent) zählt zu den Klippen, die Nutzer*innen umschiffen müssen.

Die Sache mit den Daten

Allerdings ist für 45 Prozent der Unternehmen und Organisationen, die sich mit maschinellem Lernen beschäftigten, ein Teilschritt besonders kompliziert: ein Datenverständnis und eine Datenkompetenz zu entwickeln. Sie beziehen sich auf die Fähigkeit, für eine bestimmte Aufgabe geeignete Daten zu ermitteln beziehungsweise zu erstellen, ihre Qualität zu prüfen und sie zu interpretieren.

Das Datenverständnis ist für Firmen die größte Hürde bei der Umsetzung von Machine-Learning-Projekten. Quelle: IDG Studie Machine Learning 2021
Das Datenverständnis ist für Firmen die größte Hürde bei der Umsetzung von Machine-Learning-Projekten. Quelle: IDG Studie Machine Learning 2021

Speziell die Auswahl von Datenbeständen und deren Konsolidierung stellt für etwa 36 Prozent der Anwender*innen, die maschinelles Lernen einsetzen möchten, eine Herausforderung dar. Wer jedoch eine unzureichende Vorstellung davon hat, mit welchen Daten ein Machine-Learning-Modell trainiert werden soll, kann von einem ML- oder KI-Algorithmus und entsprechenden Applikationen auch keine zufriedenstellenden Analyseergebnisse erwarten.

Die Folge: Nur ein Teil der Datenbestände wird genutzt

Eine weitere Konsequenz eines unzureichenden Datenverständnisses ist, dass Unternehmen nur einen Teil ihrer Datenquellen für KI- und Machine-Learning-Anwendungen nutzen. So verfügen beispielsweise rund 42 Prozent der Unternehmen über Transaktionsdaten. Aber nur 27 Prozent davon werden derzeit für Machine Learning genutzt.

Ähnlich ist die Lage bei weiteren Datenquellen. Ein Drittel der Firmen und Organisationen verfügt über Auftrags- und Bestelldaten, doch nur 21 Prozent verwenden diese im Zusammenhang mit maschinellem Lernen. Dasselbe Bild zeigt sich bei Betriebsdaten (BDE), die in der Fertigung anfallen. Dazu zählen Informationen, die von Maschinen und Mitarbeiter*innen erzeugt werden, die an Produktionssystemen arbeiten. Rund 31 Prozent der Unternehmen erfassen solche Daten. Nur 16 Prozent nutzen sie, um beispielsweise mithilfe Machine-Learning-Anwendungen Produktionsabläufe und die Wartung von Maschinen zu optimieren, Stichwort Predictive Maintenance.

Natürlich eignen sich nicht alle Daten gleichermaßen für Anwendungen im Bereich maschinelles Lernen, etwa weil es sich um ältere Informationen handelt. Dennoch belegen die Ergebnisse der Studie, dass Unternehmen einen beträchtlichen Teil ihres "Datenschatzes" ungenutzt lassen.

Mitarbeiter*innen für das Datenzeitalter fit machen

Ein wichtiger Schritt, um solche Reibungsverluste zu vermeiden, besteht darin, Mitarbeiter*innen Fachwissen zu vermitteln. Dies betrifft beispielsweise Datenkonzepte, deren Bedeutung für Geschäftsprozesse sowie die Integration, Transformation und Konsolidierung von Daten. Ergänzend dazu ist es hilfreich, wenn nicht nur IT-Spezialisten ein grundlegendes Verständnis von Daten und maschinellem Lernen entwickeln, sondern auch die Mitarbeiter*innen in den Fachbereichen. Denn diese wissen am besten, welche Informationen sie benötigen, um ihre Aufgaben optimal zu bewältigen.

Die Elemente einer Datenkultur: Wichtige Elemente sind das Datenverständnis (Data Literacy), die Identifizierung geeigneter Daten (Data Discovery) und ein ungehinderter Zugang zu diesen Informationen über Abteilungsgrenzen (Data Democratization) hinweg.
Die Elemente einer Datenkultur: Wichtige Elemente sind das Datenverständnis (Data Literacy), die Identifizierung geeigneter Daten (Data Discovery) und ein ungehinderter Zugang zu diesen Informationen über Abteilungsgrenzen (Data Democratization) hinweg.
Foto: Microsoft

Ein wichtiges Mittel, um das Datenverständnis und die Datenkompetenz zu verbessern, sind Schulungen. Microsoft stellt beispielsweise im Rahmen der Microsoft Azure Virtual Training Days ein- bis zweitägige kostenfreie Trainingskurse zu den Grundlagen von Daten (Data Fundamentals) sowie künstlicher Intelligenz und maschinellem Lernen zur Verfügung. Mitarbeiter*innen, die sich intensiver mit der Materie beschäftigen wollen, können zudem Zertifikate erwarben, etwa als Azure Data Engineer Associate und Datenwissenschaftler (Azure Data Scientist).

Das Ziel: eine Datenkultur etablieren

Solche Aus- und Weiterbildungsangebote sind ein wichtiges Mittel, um in einem Unternehmen oder einer Organisation eine Datenkultur zu etablieren. Diese ist wiederum unverzichtbar, um datengesteuerte Entscheidungen zu treffen und proaktiv Marktentwicklungen aufzugreifen und neue Geschäftsoptionen zu erschließen. Schlüsselelemente einer Datenkultur sind der ungehinderte Zugang zu Daten aus unterschiedlichen Bereichen ("Datendemokratisierung") und die Datenkompetenz der Mitarbeiter*innen.

Ein erheblicher Teil der vorhandenen Daten wird nicht die Entwicklung von Machine-Learning- und KI-Anwendungen genutzt. Quelle: IDG Studie Machine Learning 2021
Ein erheblicher Teil der vorhandenen Daten wird nicht die Entwicklung von Machine-Learning- und KI-Anwendungen genutzt. Quelle: IDG Studie Machine Learning 2021

Lösungen von Microsoft unterstützen Unternehmen dabei, datenbasierte Geschäftsprozesse und eine Datenkultur aufzubauen. Beispiele für solche Angebote sind Microsoft Azure Machine Learning, zudem Microsoft Azure Data Factory und Microsoft Power Query für die Integration und Konsolidierung von Daten aus unterschiedlichen Quellen. Mithilfe solcher Lösungen sind Anwender*innen in der Lage, das Beste aus ihren Daten "herauszuholen" und ihre Agilität und Wettbewerbsfähigkeit zu steigern.