Informatica-Studie

Mangelndes Datenmanagement bedroht KI-Erfolg

01.02.2024
Von 


Manfred Bremmer beschäftigt sich mit (fast) allem, was in die Bereiche Mobile Computing und Communications hineinfällt. Bevorzugt nimmt er dabei mobile Lösungen, Betriebssysteme, Apps und Endgeräte unter die Lupe und überprüft sie auf ihre Business-Tauglichkeit. Bremmer interessiert sich für Gadgets aller Art und testet diese auch.
Insbesondere in Deutschland nimmt die KI-Implementierung Fahrt auf. Allerdings müssen viele Unternehmen in Sachen Daten noch ihre Hausaufgaben machen.
Egal, ob sich die Daten im Rechenzentrum oder der Cloud befinden: Ohne Datenstrategie droht jede KI-Initiative zu scheitern.
Egal, ob sich die Daten im Rechenzentrum oder der Cloud befinden: Ohne Datenstrategie droht jede KI-Initiative zu scheitern.
Foto: Gorodenkoff - shutterstock.com

In Deutschland ist die Einführung von generativer künstlicher Intelligenz in vollem Gang. Wie eine Untersuchung von Informatica ergab, lag die Implementierungsrate der Unternehmen im Oktober 2023 bei 58 Prozent, das ist deutlich mehr als der weltweite Durchschnitt (45 Prozent). Weitere 22 Prozent der hierzulande befragten Datenexperten planen die Einführung in den nächsten zwei Jahren, während es bei einem Fünftel (20 Prozent) noch etwas länger dauern könnte.

Allerdings ist der Einstieg nicht ganz so leicht, wie weitere Ergebnisse des Informatica-Reports "CDO Insights 2024: Charting a Course to AI Readiness" zeigen: Nahezu alle Befragten weltweit (99 Prozent) und in Deutschland (100 Prozent), bei denen generative KI bereits eingeführt wurde, stießen auf konkrete Hürden.

Dabei kämpften die deutschen Studienvertreter vor allem mit den großen Mengen domänenspezifischer Daten, die erforderlich sind, um LLMs (Large Language Models) zu traininieren und feinabzustimmen, sowie mit dem Thema Datenschutz und Governance (jeweils 43 Prozent). Als drittgrößtes Problem nannten die hiesigen Datenexperten die Datenqualität (42 Prozent).

Ethische Fragen rund um den Einsatz von KI stellt dagegen nur für ein Viertel der deutschen Datenentscheider (25 Prozent) eine Herausforderung dar, im weltweiten Vergleich lag die Thematik mit 38 Prozent an dritter Stelle hinter der Qualität der Daten (42 Prozent) und der Datenschutz- und Governance-Problematik (40 Prozent).

Kampf mit riesigen Datenmengen und -quellen

Der stärkere Fokus auf KI führt laut Umfrage auch zu einer Anpassung der Datenstrategie: Im letztjährigen Report stand laut Informatica noch die Fähigkeit, die Governance von Daten und Datenprozessen zu verbessern, im Vordergrund. Nun liegt global betrachtet die Priorität der Datenstrategie darauf, zuverlässige und konsistente Daten bereitzustellen, die für generative KI geeignet sind, sowie darauf, eine datengetriebene Kultur und Datenkompetenzen (jeweils 39 Prozent) zu fördern. In Deutschland hat Ersteres ebenfalls höchste Priorität (57 Prozent), dahinter folgt allerdings die Verbesserung von Datenschutz und -sicherheit (46 Prozent).

Angesichts dieser Bewertung ist es kein Wunder, dass mit dem Fokus auf (generative) KI auch die Investitionen in das Datenmanagement steigen müssen. Dabei sind sich die Studienteilnehmer sowohl auf globaler Ebene als auch in Deutschland darin einig, dass in

  • Datenschutz und -sicherheit,

  • Datenqualität und Data Observability sowie

  • Datenintegration und -verarbeitung investiert werden sollte.

Wie weitere Ergebnisse der Umfrage zeigen, gehen die geplanten Investitionen in die richtige Richtung, denn Datenfragmentierung und -komplexität bleiben bestehen und verstärken sich 2024 noch. So arbeiten bereits jetzt 41 Prozent der Unternehmen (Deutschland 37 Prozent) mit 1.000 oder mehr Datenquellen und die Mehrheit der Befragten (global: 79 Prozent; Deutschland: 63 Prozent) glaubt, dass die Anzahl der Datenquellen in diesem Jahr weiter steigen wird.

"Es ist nicht überraschend, dass die Implementierung von generativer KI und die dafür notwendigen Datenstrategien derzeit die größte Aufmerksamkeit von den meisten Datenverantwortlichen erfordern", kommentiert Jitesh Ghai, Chief Product Officer bei Informatica, die Ergebnisse. Zwar gebe es nach wie vor eine Vielzahl technischer und organisatorischer Hürden, die diese Führungskräfte überwinden müssen. Es sei jedoch klar, dass Investitionen in ganzheitliche, hochintegrierte Datenmanagement-Funktionen der Schlüssel sind, um das enorme Potenzial von generativer KI zu erschließen, so Ghai. Unternehmen seien dadurch in der Lage, die volle Kontrolle über ihre immer größer werdenden Datenbestände zu übernehmen.