Künstliche Intelligenz, Advanced Analytics, Cloud Computing und neue Storage-Technologien helfen Unternehmen bei der Problemlösung, Entscheidungsfindung und Skalierung. Erfahren Sie hier, wie Sie mit moderner, effizienter IT-Infrastruktur im Zeitalter der Daten erfolgreich sein können.

KI-Technologie

Supercomputer als technologische KI-Speerspitze

04.06.2024
KI treibt die Computer-Technologie voran. Doch die Verwirrung über die „beste“ KI-Ausstattung ist groß. Nachfolgend ein Blick auf die Hochleistungs-Systeme.
Ein von Stability AI erzeugtes KI-Bild. Die Vorgabe lautete: "Episches Anime-Artwork eines Zauberers auf einem Berg in der Nacht, der einen kosmischen Zauber in den dunklen Himmel wirft, auf dem steht: 'Stable Diffusion 3'.
Ein von Stability AI erzeugtes KI-Bild. Die Vorgabe lautete: "Episches Anime-Artwork eines Zauberers auf einem Berg in der Nacht, der einen kosmischen Zauber in den dunklen Himmel wirft, auf dem steht: 'Stable Diffusion 3'.
Foto: Stability AI

Viele Unternehmen experimentieren mit generativer KI (GenKI). Laut Gartner befinden sich bereits 45 Prozent der Unternehmen in einer Pilotphase und weitere 10 Prozent haben GenKI schon im produktiven Einsatz. "CEOs reden nicht nur über GenKI - sie investieren inzwischen auch viel Zeit, Geld und Ressourcen, um sie voranzutreiben und die Geschäftsergebnisse zu steigern", kommentiert Gartner-Analyst Frances Karamouzis die Umfrageergebnisse. Doch die Hürden zur GenKI-Nutzung können hoch sein. Wer sich mit vordefinierten Bots und Prompts nicht zufriedengeben kann, steht vor erheblichen technischen und finanziellen Herausforderungen.

Bilder vom Supercomputer

Ein Blick hinter die Kulissen der GenKI-Lösung von Stability AI zeigt den Aufwand, der für den Aufbau und Betrieb eines sehr großen LLMs erforderlich ist. Das Unternehmen bietet Open-Access-KI-Modelle mit in den Bereichen Bild-, Sprache-, Code- und Audio-Generierung. 400 Millionen Bilder wurden bereits mit deren API erzeugt. Das neueste Modell heißt Stable Diffusion 3 und erlaubt 800 Millionen bis 8 Milliarden Parameter. Es kombiniert eine Diffusionstransformator-Architektur mit einer Flussanpassung. Das zugehörige System ist so ausgestattet, dass es Modelle in den Modalitäten Bild, Video, Audio, Sprache und Text verarbeiten kann.

Das alles basiert auf einem hoch performanten KI-Supercomputer, der in Bezug auf Leistung und Effizienz zu den Top 15 der Welt zählt. Die Architektur wurde im Rahmen einer internen Leistungsanalyse ausgearbeitet, bei der unter anderem die Trainingsgeschwindigkeiten der Intel® Gaudi 2®-Beschleuniger mit den A100 und H100 von Nvidia verglichen wurden. Das Ergebnis war beeindruckend: Bei konstanter Stapelgröße von 16 pro Beschleuniger verarbeitete das Gaudi 2-System 927 Trainingsbilder pro Sekunde - 1,5-mal schneller als das H100-80GB. Das zeigt, dass Gaudi 2 eine leistungsstarke Alternative zu den Nvidia-Prozessoren darstellt, die obendrein auch noch preisgünstiger ist. Folglich basiert deren Supercomputer auf 4.000 Gaudi 2 KI-Hardwarebeschleunigern und einer Vielzahl an Intel Xeon® Prozessoren.

Aurora: KI im Exascale-Bereich

Der weltweit schnellste KI-Supercomputer heißt Aurora und steht im Argonne National Laboratory in Lemont, im US-Staat Illinois. Hier wurde vor kurzem mit 1,012 Exaflops die Exascale-Grenze durchbrochen. Das System war von Anfang an als KI-Supercomputer konzipiert, um mithilfe von Hochleistungs-KI neue Pfade in vielen Bereichen der Forschung und Wissenschaft zu betreten. Bereits mit den Vorgängermodellen gab es vielbeachtete KI-Erfolgsgeschichten. Beispielsweise die Kartierung der 80 Milliarden Neuronen des menschlichen Gehirns, eine verbesserte Hochenergieteilchenphysik sowie eine deutlich schnellere Arzneimittelentwicklung. "Aurora wird den Weg zu bahnbrechenden Entdeckungen ebnen, die von neuen Klimamodellen bis hin zur Entschlüsselung der Geheimnisse des Universums reichen", sagt Ogi Brkic, Vice President und General Manager von Data Center AI Solutions bei Intel über das Power-System, das aus 21.248 Intel Xeon CPU Max Series-Prozessoren und 63.744 Intel Data Center GPU Max Series-Einheiten besteht.

Gaudi 3 - die nächste Leistungsklasse

Xeon- und Gaudi 2 sind die aktuellen "Arbeitspferde" der Intel-KI-Prozessoren, doch die nächste Leistungsklasse steht schon den Startlöchern. So wurde kürzlich der Gaudi 3 Accelerator angekündigt, der in der Architektur dem Gaudi 2 zwar ähnelt, aber mehr Leistung bietet. Während Gaudi 2 auf 24 Tensor Processor Cores (TPC) setzt, sind es bei Gaudi 3 2x32 TPCs. Diese basieren auf einer VLIW-Architektur (Very Long Instruction Word) mit SIMD (Single Instruction Multiple Data) Vektoreinheiten, die 2.048-Bit-Operationen mit verschiedensten Datentypen unterstützen. Pro Chip setzt Gaudi 3 auf 48 MB an SRAM, also insgesamt 96 MB, bei Gaudi 2 waren es als Single-Chip-Lösung nur 48 MB. Die 96 MB an SRAM kommen auf eine Bandbreite von 12,8 TB/s. "Die Halbleiter-Innovationen schreiten in einem beispiellosen Tempo voran, sodass jedes Unternehmen ein KI-Unternehmen werden kann", sagte Intel-CEO Pat Gelsinger anlässlich der Vorstellung von Gaudi 3. "Intel ermöglicht KI für alle Unternehmens-Anwendungen: Vom PC über das Rechenzentrum bis hin zur Edge" so Gelsinger weiter. Diese Einschätzung teilen auch viele namhafte OEMs, die bereits eine Reihe Gaudi-basierter RZ-Systeme, Workstations und KI-PCs angekündigt haben. Dazu gehören unter anderen Dell Technologies, Hewlett Packard Enterprise (HPE), Lenovo und Supermicro.

KI benötig mehr als spezielle Hardware

Die Entwicklung und der Betrieb von leistungsstarken KI-Anwendungen benötigen aber weitaus mehr als nur dedizierte Hardware, denn die Entwicklung und der Betrieb der Modelle unterscheidet sich maßgeblich von den bisherigen Methoden und Lösungen. Gefordert sind heute auf KI ausgerichtete Entwicklungs- und Betriebs-Plattformen und -Tools, beispielsweise das, was Intel mit seiner MLOPs-Plattform Tiber anbietet. Die zugehörige Developer-Cloud unterstützt speziell alles rund um KI. Weitere Teile sind Open-Source-Softwaretools, Bibliotheken und Frameworks. Damit lässt sich die KI-Entwicklung und der -Betrieb beschleunigen ohne Kompromisse bei der Sicherheit oder Leistung einzugehen. Außerdem hat Intel auf der jüngsten Vison-Veranstaltung angekündigt, dass man zusammen mit SAP, Red Hat, VMware und anderen ISVs eine offen Plattform schaffen will, um die Bereitstellung sicherer generativer KI-Systeme (GenAI) zu beschleunigen, die durch Retrieval-Augmented Generation (RAG) ermöglicht werden.

Fazit

Die Entwicklung und der Betrieb leistungsstarker KI-Modelle ist extrem rechenintensiv. Nicht alle Technologien sind dafür gleich gut geeignet. Vor allem hängt die Performance nicht nur von der GPU ab, da eine Vielzahl an Faktoren die Gesamtleistung beeinflussen. Intel bietet ein breites Spektrum an leistungsstarken System-Komponenten, mit denen sich die optimale Lösung zu einem fairen Preis konfigurieren lässt. Das reicht vom Supercomputer der Spitzenklasse über Power-Server und -Workstations bis hinunter zum KI-PC. Hinzu kommen offene und skalierbare Entwicklungs- und Betriebs-Plattformen und -Tools.

Intel und KI