7 Aspekte

Wie GenAI Ihre Cloud-Architektur verändert

Kommentar  12.09.2023
Von 

David Linthicum ist ein US-amerikanischer Technologieexperte und Buchautor. Zu seinen Schwerpunktthemen gehören unter anderem Cloud Computing, SOA, Enterprise Application Integration und Enterprise Architecture.

Der Einsatz von Generative AI kann sich negativ auf Ihre Cloud-Architektur auswirken. Diese Punkte sollten Sie prüfen.
Im Generative-AI-Zeitalter sollte sich auch Ihre Cloud-Architektur verändern.
Im Generative-AI-Zeitalter sollte sich auch Ihre Cloud-Architektur verändern.
Foto: Pavel Chagochkin - shutterstock.com

Wenn Sie eine Cloud-Architektur mit Beteiligung Generative-AI-gestützter Systeme aufbauen möchten, gilt es dabei einige Aspekte zu analysieren, beziehungsweise zu überdenken. Zum Beispiel die folgenden sieben.

1. Anwendungsfälle

Definieren Sie Zweck und Ziele der generativen KI innerhalb Ihrer Cloud-Architektur klar und deutlich. Machen Sie sich klar, was Sie erreichen wollen - ob es nun um Content-Generierung, Empfehlungssysteme oder andere Anwendungen geht. In der Konsequenz bedeutet das, die Dinge schriftlich festzuhalten und einen Konsens zu finden, wenn es darum geht, wie die Ziele erreicht werden sollen. Das ist nicht nur wichtig, wenn es um Generative AI geht, sondern ganz allgemein ein bedeutender Schritt bei jeder Migration und jedem neuen System, das in der Cloud entwickelt wird.

Generative-AI-Projekte in der Cloud scheitern nach meiner Erfahrung oft daran, dass sinnvolle Business-Anwendungsfälle fehlen: Einige Unternehmen entwickeln einfach nur etwas "Cooles", das keinerlei Mehrwert für das Unternehmen bringt.

2. Datenquellen und -qualität

Identifizieren Sie die Datenquellen, die für Training und Inferenz des generativen KI-Modells erforderlich sind. Diese sollten vor allem zugänglich und qualitativ hochwertig sein sowie sorgfältig gemanagt werden. Zudem gilt es, Verfügbarkeit und Kompatibilität mit Blick auf Cloud-Storage-Lösungen sicherzustellen.

Generative-AI-Systeme arbeiten datenzentriert beziehungsweise "datenorientiert". Es gilt also das Prinzip "Garbage in, Garbage out". Sie sollten sich deshalb auf die Accessibility als primären Treiber der Cloud-Architektur fokussieren. Schließlich kommt das Gros der relevanten Daten im Zuge des Modelltrainings zum Einsatz. Die Informationen verbleiben dabei in der Regel, wo sie sind und werden nicht migriert. Anderenfalls wäre das Ergebnis Redundanz und keine Single Source of Truth. Um sowohl Datenqualität als auch Modell-Performance sicherzustellen, sollten Sie erwägen, effiziente Daten-Pipelines für die Vorverarbeitung und Bereinigung einzurichten.

Dieser Aspekt entscheidet meiner Einschätzung nach zu 80 Prozent darüber, ob die Kombination aus Cloud-Architektur und Generative AI erfolgreich ist - wird allerdings oft übersehen, weil Cloud-Architekten eher die Datenverarbeitung im Blick haben.

3. Datenschutz und -sicherheit

Ebenso wichtig wie Daten sind auch Datenschutz und -sicherheit. Besonders im Zusammenhang mit GenAI, denn diese Systeme können im Rahmen der Datenverarbeitung aus scheinbar unbedeutenden Informationen vertrauliche machen - und diese potenziell offenlegen.

Robuste Data-Security-Maßnahmen sind in Zusammenhang mit generativer KI deshalb obligatorisch - nicht nur, um Compliance zu gewährleisten. Das bedeutet allerdings nicht, im letzten Schritt ein Sicherheitssystem auf Ihre Architektur aufzusetzen. Stattdessen sollte Security bereits beim Aufbau der Systeme in jedem Schritt integriert werden.

4. Skalierbarkeit und Inferenz

Planen Sie mit skalierbaren Cloud-Ressourcen, um unterschiedlichen Workloads und Anforderungen in Sachen Datenverarbeitung gerecht werden zu können. Die meisten Unternehmen ziehen dafür Auto-Scaling- und Load-Balancing-Lösungen in Betracht. Dabei beobachte ich allerdings häufig, dass Systeme aufgebaut werden, die zwar gut zu skalieren aber äußerst kostenintensiv sind. Im Idealfall finden Sie eine Balance zwischen Skalierbarkeit und Kosteneffizienz - und zwar mit Hilfe einer guten Architektur und Finops-Methoden.

Legen Sie dabei auch ein Augenmerk auf die Ressourcen für Modelltraining und -inferenz und wählen Sie dazu geeignete Cloud-Instanzen mit GPUs oder TPUs. Auch die Ressourcenzuweisung lässt sich an dieser Stelle mit Blick auf die Kosteneffizienz optimieren.

5. Modellauswahl

Ihre GenAI-Architektur (General Adversarial Networks, Transformers, etc.) sollten Sie auf der Grundlage Ihres spezifischen Anwendungsfalls und Ihrer Anforderungen wählen. Ziehen Sie Cloud-Dienste für das Modelltraining in Betracht - beispielsweise AWS SageMaker.

Zudem ist es empfehlenswert, Modelle im Rahmen einer robusten Deployment-Strategie (inklusive Versionierung und Containerisierung ) bereitzustellen, um sie für Anwendungen und Services innerhalb Ihrer Cloud-Architektur zugänglich zu machen.

6. Monitoring und Logging

Monitoring- und Logging-Systeme einzurichten, um die KI-Modell-Performance, die Ressourcenauslastung und potenzielle Probleme zu tracken, ist nicht optional. Etablieren Sie Warnmechanismen für Anomalien und Observability-Lösungen, die für cloudbasierte Generative-AI-Systeme ausgelegt sind.

Weil generative KI ressourcenintensiv sein kann, empfiehlt es sich zudem, die Ressourcenkosten kontinuierlich zu überwachen, respektive zu optimieren. Dazu empfehlen sich Tools und Methoden aus dem Bereich Cloud-Kostenmanagement.

7. Weitere Überlegungen

  • Failover und Redundanz sind erforderlich, um eine hohe Verfügbarkeit zu gewährleisten - Disaster-Recovery-Pläne können Ausfallzeiten und Datenverluste im Falle von Ausfällen begrenzen.

  • Überprüfen und bewerten Sie regelmäßig die Sicherheit Ihres generativen KI-Systems innerhalb Ihrer Cloud-Infrastruktur. Beheben Sie Schwachstellen und sorgen Sie für Compliance.

  • Es empfiehlt sich, Richtlinien für die ethische Nutzung von KI-Systemen zu verankern - insbesondere, wenn es um Inhaltsgenerierung geht oder Entscheidungen, die Auswirkungen auf die Benutzer haben. Räumen Sie Bedenken hinsichtlich Bias aus.

  • Bewerten Sie kontinuierlich das Nutzererlebnis, um sicherzustellen, dass KI-generierte Inhalte mit den Nutzererwartungen übereinstimmen und Engagement fördern.

Dieser Beitrag basiert auf einem Artikel unserer US-Schwesterpublikation Infoworld.