Bei Künstlicher Intelligenz (KI) und Datenwissenschaft im Allgemeinen geht es darum, das Beste von Mensch und Maschine zu vereinen. Seit einiger Zeit neigen die KI-Verfechter dazu, vor allem die maschinelle Seite dieser Gleichung zu betonen. Elena Dyachkova, Datenwissenschaftlerin bei Spring Health, gibt per Twitter allerdings zu bedenken:
Product analytics is 80% quick and dirty. But the ability to judge when quick and dirty is appropriate requires a pretty good understanding of stats ??
— Elena Dyachkova (@ElenaRunsNYC) September 10, 2022
Wie viel ist genug?
Die Datenexpertin antwortete damit auf einen Kommentar von Sarah Catanzaro, General Partner bei Amplify Partners:
Many decisions don’t require high precision insights; we shouldn’t shy from the quick and dirty in many contexts
— Sarah Catanzaro (@sarahcat21) September 9, 2022
Ein Reminder, dass keine perfekten Daten nötig sind, um Entscheidungen zu treffen. Gary Marcus, Wissenschaftler und Gründer des Machine-Learning (ML)-Spezialisten Geometric Intelligence, der 2016 von Uber übernommen wurde, weiß, wo der Schlüssel zur Wertschätzung von KI und ihren Unterdisziplinen Machine und Deep Learning liegt: "Mustererkennungs-Tools sind am besten, wo nur grobe Ergebnisse gebraucht werden."
Trotz dieser Erkenntnis streben wir nach immer leistungsfähigeren KI-Anwendungen - und nach immer mehr Daten. Das fußt auf der Erwartung, dass ML-Modelle mit mehr Daten bessere Ergebnisse liefern. Leider funktioniert das in der realen Welt nicht so einfach. Mehr Daten können von Vorteil sein, sind aber für viele Anwendungen gar nicht nötig. Viel nötiger wären Menschen, die die bereits vorhandenen Daten besser verstehen. Vincent Dowling, Datenwissenschaftler bei Indeed.com, formuliert es folgendermaßen:
a lot of the value in being an experienced analyst/scientist is determining the amount of rigor needed to make a decision.
— Vincent Dowling (@stogachess) September 9, 2022
Die Analyse der Daten durch Spezialisten ist essenziell, denn Maschinen werden niemals in der Lage sein, unzureichendes menschliches Knowhow zu kompensieren. In einem Meinungsbeitrag der britischen Zeitung "The Guardian" heißt es: "Das Versprechen der KI ist, Maschinen die Fähigkeit zu verleihen, Muster in Daten zu erkennen und Entscheidungen schneller und besser zu treffen als der Mensch. Aber was passiert, wenn die KI schneller schlechtere Entscheidungen trifft?" Eine sehr reale Möglichkeit, wenn der Mensch die Verantwortung aus der Hand gibt und fälschlicherweise davon ausgeht, dass die Daten oder Maschinen schon für sich selbst sprechen werden.
Es ist kompliziert
Menschen in die Verantwortung zu nehmen, ist in der Praxis jedoch gar nicht so einfach zu bewerkstelligen. Wie Manjunath Bhat, Research Vide President bei Gartner, in einem Blogbeitrag andeutet, wird die KI durch menschliche Eingaben beeinflusst. Die Ergebnisse unserer Algorithmen wiederum beeinflussen die Daten, mit denen wir Entscheidungen treffen: "Menschen konsumieren Fakten in Form von Daten. Daten können jedoch mutieren, umgewandelt oder verändert werden - alles im Namen des einfachen Konsums. Wir haben also keine andere Wahl, als in den Grenzen einer stark kontextualisierten Weltsicht zu leben."
Ein erfolgreiches ML-Projekt erfordere vor allem Daten, eine robuste Pipeline für die Datenströme und eine entsprechende Kennzeichnung, argumentiert Amazon-Wissenschaftler Eugene Yan: "Aber es gibt keine Möglichkeit, diese Daten ohne erfahrene Mitarbeiter richtig zu kennzeichnen. Um das gut zu erledigen, müssen Sie die Daten bis zu einem gewissen Grad verstehen."
In Unternehmen gibt es viele Menschen, die die Feinheiten ihres Geschäfts verstehen. Sie sind am besten in der Lage, die richtigen Fragen "an die Daten" des Unternehmens zu stellen. Was ihnen möglicherweise fehlt, ist das von Dyachkova hervorgehobene zusätzliche Verständnis für Statistik - die Fähigkeit zu erkennen, wann "gute" Ergebnisse tatsächlich gut genug sind. Das ist auch ein Grund, warum Datenwissenschaft so schwierig ist. In jeder Umfrage, die sich mit den größten KI-Hemmnissen beschäftigt, ist das Thema Fachkräftemangel regelmäßig ganz oben mit dabei. Dadurch könnte der Eindruck entstehen, es mangele an Data-Science-Talenten. Vielleicht sollten wir uns jedoch viel eher Sorgen um einen allgemeinen Mangel an grundlegendem Verständnis für Statistik, Mathematik und das Business machen. (fm)
Dieser Beitrag basiert auf einem Artikel unserer US-Schwesterpublikation Infoworld.