Datengetriebene Exzesse

Ist unser Datenhunger unnötig?

Kommentar  14.09.2022
Von 
Matt Asay ist Autor der US-Schwesterpublikation Infoworld.com.
Vielleicht brauchen wir gar nicht immer mehr Daten – nur Menschen, die die bereits vorhandenen Daten und ihren Wert im Business-Kontext verstehen.
Daten und kein Ende: Auch in diesem Fall ist weniger manchmal mehr.
Daten und kein Ende: Auch in diesem Fall ist weniger manchmal mehr.
Foto: rootstock - shutterstock.com

Bei Künstlicher Intelligenz (KI) und Datenwissenschaft im Allgemeinen geht es darum, das Beste von Mensch und Maschine zu vereinen. Seit einiger Zeit neigen die KI-Verfechter dazu, vor allem die maschinelle Seite dieser Gleichung zu betonen. Elena Dyachkova, Datenwissenschaftlerin bei Spring Health, gibt per Twitter allerdings zu bedenken:

Wie viel ist genug?

Die Datenexpertin antwortete damit auf einen Kommentar von Sarah Catanzaro, General Partner bei Amplify Partners:

Ein Reminder, dass keine perfekten Daten nötig sind, um Entscheidungen zu treffen. Gary Marcus, Wissenschaftler und Gründer des Machine-Learning (ML)-Spezialisten Geometric Intelligence, der 2016 von Uber übernommen wurde, weiß, wo der Schlüssel zur Wertschätzung von KI und ihren Unterdisziplinen Machine und Deep Learning liegt: "Mustererkennungs-Tools sind am besten, wo nur grobe Ergebnisse gebraucht werden."

Trotz dieser Erkenntnis streben wir nach immer leistungsfähigeren KI-Anwendungen - und nach immer mehr Daten. Das fußt auf der Erwartung, dass ML-Modelle mit mehr Daten bessere Ergebnisse liefern. Leider funktioniert das in der realen Welt nicht so einfach. Mehr Daten können von Vorteil sein, sind aber für viele Anwendungen gar nicht nötig. Viel nötiger wären Menschen, die die bereits vorhandenen Daten besser verstehen. Vincent Dowling, Datenwissenschaftler bei Indeed.com, formuliert es folgendermaßen:

Die Analyse der Daten durch Spezialisten ist essenziell, denn Maschinen werden niemals in der Lage sein, unzureichendes menschliches Knowhow zu kompensieren. In einem Meinungsbeitrag der britischen Zeitung "The Guardian" heißt es: "Das Versprechen der KI ist, Maschinen die Fähigkeit zu verleihen, Muster in Daten zu erkennen und Entscheidungen schneller und besser zu treffen als der Mensch. Aber was passiert, wenn die KI schneller schlechtere Entscheidungen trifft?" Eine sehr reale Möglichkeit, wenn der Mensch die Verantwortung aus der Hand gibt und fälschlicherweise davon ausgeht, dass die Daten oder Maschinen schon für sich selbst sprechen werden.

Es ist kompliziert

Menschen in die Verantwortung zu nehmen, ist in der Praxis jedoch gar nicht so einfach zu bewerkstelligen. Wie Manjunath Bhat, Research Vide President bei Gartner, in einem Blogbeitrag andeutet, wird die KI durch menschliche Eingaben beeinflusst. Die Ergebnisse unserer Algorithmen wiederum beeinflussen die Daten, mit denen wir Entscheidungen treffen: "Menschen konsumieren Fakten in Form von Daten. Daten können jedoch mutieren, umgewandelt oder verändert werden - alles im Namen des einfachen Konsums. Wir haben also keine andere Wahl, als in den Grenzen einer stark kontextualisierten Weltsicht zu leben."

Ein erfolgreiches ML-Projekt erfordere vor allem Daten, eine robuste Pipeline für die Datenströme und eine entsprechende Kennzeichnung, argumentiert Amazon-Wissenschaftler Eugene Yan: "Aber es gibt keine Möglichkeit, diese Daten ohne erfahrene Mitarbeiter richtig zu kennzeichnen. Um das gut zu erledigen, müssen Sie die Daten bis zu einem gewissen Grad verstehen."

In Unternehmen gibt es viele Menschen, die die Feinheiten ihres Geschäfts verstehen. Sie sind am besten in der Lage, die richtigen Fragen "an die Daten" des Unternehmens zu stellen. Was ihnen möglicherweise fehlt, ist das von Dyachkova hervorgehobene zusätzliche Verständnis für Statistik - die Fähigkeit zu erkennen, wann "gute" Ergebnisse tatsächlich gut genug sind. Das ist auch ein Grund, warum Datenwissenschaft so schwierig ist. In jeder Umfrage, die sich mit den größten KI-Hemmnissen beschäftigt, ist das Thema Fachkräftemangel regelmäßig ganz oben mit dabei. Dadurch könnte der Eindruck entstehen, es mangele an Data-Science-Talenten. Vielleicht sollten wir uns jedoch viel eher Sorgen um einen allgemeinen Mangel an grundlegendem Verständnis für Statistik, Mathematik und das Business machen. (fm)

Dieser Beitrag basiert auf einem Artikel unserer US-Schwesterpublikation Infoworld.