Künstliche Intelligenz, Advanced Analytics, Cloud Computing und neue Storage-Technologien helfen Unternehmen bei der Problemlösung, Entscheidungsfindung und Skalierung. Erfahren Sie hier, wie Sie mit moderner, effizienter IT-Infrastruktur im Zeitalter der Daten erfolgreich sein können.

Prozessor-Technologie

Neue CPUs und GPUs für HPC und KI

18.04.2023
Trotz der ständig ansteigenden Rechenleistungen ist der Bedarf nach noch schnelleren Computern ungebrochen. Zwei neue Prozessor-Serien verschieben jetzt die Grenzen des Machbaren deutlich nach oben.
High Performance Computing (HPC) ist die Königsklasse der Computer-Technologien. Neue Prozessoren ermöglichen jetzt völlig neue Anwendungen.
High Performance Computing (HPC) ist die Königsklasse der Computer-Technologien. Neue Prozessoren ermöglichen jetzt völlig neue Anwendungen.
Foto: Panchenko Vladimir - shutterstock.com

Ob Klimamodellierung, System-Simulationen, künstliche Intelligenz (KI) oder die Erforschung von unheilbaren Krankheiten: Überall fordern Wissenschaftler und Forscher schnellere und leistungsfähigere Rechenleistung. Nur wenn die fortschrittlichsten Innovationen der Computertechnologien im großen Maßstab zum Einsatz kommen, lassen sich die aktuellen Herausforderungen von Wissenschaft und Gesellschaft effizient lösen. "Um sicherzustellen, dass HPC allen Anforderungen gerecht werden kann, brauchen wir eine Lösung, die die Bandbreite und die Rechenleistung maximiert", sagt Jeff McVeigh, Corporate Vice President der Super Compute Group bei Intel. "Letztlich geht es darum, die Produktivität der Entwickler und deren Ergebnisse zu maximieren", so McVeigh weiter.

Neue Technologie für höchste Anforderungen

Intel sieht sich dabei in einer führenden Rolle, denn schon immer kamen deren Prozessoren zum Einsatz, wenn es um höchste Leistungsanforderungen ging. Jetzt hat das Unternehmen hier neue Maßstäbe gesetzt, indem es die Intel® Xeon® CPU Max Series und die Intel® Data Center GPU Max Series auf den Markt gebracht hat. Beide Produkte zielen auf Anwendungen ab, bei denen mit skalierbaren, ausgewogenen CPUs und GPUs viele aktuelle Forschungs-Probleme schneller und nachhaltiger gelöst werden können als bisher. Obwohl beide Produkte noch recht neu sind, gibt es bereits erste Erfahrungen, die eine deutliche Leistungssteigerung zeigen. So konnte das Los Alamos National Laboratory in bestimmten Fällen eine 8,57-mal höhere Performance erzielen. Der gegenwärtig im Argonne National Laboratory entstehende Aurora-Supercomputer soll als erster Supercomputer eine Spitzenleistung von über zwei Exaflops mit doppelter Genauigkeit erreichen. Hierzu wird die Leistungsfähigkeit der Kombination von GPUs und CPUs der Max-Serie in einem einzigen System vereint. Geplant sind mehr als 10.000 Blades mit jeweils sechs GPUs der Max-Serie und zwei Xeon Max-CPUs.

Für den Aurora-Supercomputer liefert Intel über 10.000 Blade-Systeme mit CPUs und GPUs der Max-Serie.
Für den Aurora-Supercomputer liefert Intel über 10.000 Blade-Systeme mit CPUs und GPUs der Max-Serie.
Foto: Intel

Breites Partnernetz mit vielen neuen Lösungen

Viele Intel-Partner sind ebenfalls an interessanten HPC-Anwendungen beteiligt. Beispielsweise wurden die CPU-Produkte der Max-Serie für die CTS-2-Systeme im Lawrence Livermore National Laboratory, im Sandia National Laboratory sowie für den Supercomputer Camphor 3 an der Universität Kyoto mit Dell Technologies als Serverpartner ausgewählt. In Argentinien bereitet man sich darauf vor, noch in diesem Frühjahr ein Max+Max-System von Lenovo für den nationalen Wetterdienst des Landes einzusetzen. Hintergrund ist, dass die CPUs der Max-Serie erhebliche Leistungsvorteile für die Klima- und Wettersimulations-Workloads bieten. Hierbei sind sie 2,3-mal schneller als AMD Milan-X auf MPAS-A, wenn nur High Band Memory (HBM) verwendet wird. Auch Supermicro, ein globales Technologieunternehmen für die Bereitstellung von Cloud, KI und 5G-Telco/Edge-IT-Infrastruktur, will die Max-Serie in über 50 neuen Modellen einsetzen. Laut Supermicro wird das die umweltfreundlichste Computing-Lösung mit höchster Leistung pro Watt sein.

Power-Systeme mit modernster Softwareumgebung

Die GPUs der Max-Serie sind Intels Prozessoren mit der höchsten Dichte. Sie bieten mehr als 1 GB Speicherkapazität mit HBM pro Kern, das ist mehr als genug für die meisten gängigen HPC-Workloads. Sie bietet außerdem eine bis zu 4,8-mal bessere Leistung im Vergleich zur Konkurrenz bei realen HPC-Workloads. Bei gleicher HCPG-Leistung verbraucht die CPU 68 Prozent weniger Strom, als ein AMD Milan-X-Cluster. Die AMX-Erweiterungen steigern die KI-Leistung, indem sie den achtfachen Spitzendurchsatz gegenüber AVX-512 für INT8 mit INT32-Akkumulations-Operationen erzielen.

Die Xeon Max-CPU ist außerdem der erste und einzige x86-basierte Prozessor mit HBM, der sofort ohne Codeänderungen genutzt werden kann. Während andere Technologien ein erhebliches Refactoring erfordern, reicht hier eine einfache Neukompilierung, um die Anwendungen auf die neue CPU zu portieren.

Für beide neuen Prozessoren gibt es die einheitliche Programmierumgebung oneAPI. Diese wird Intel um einige Funktionen erweitern, sodass alle neuen Features der Intel-Max-Serie optimal genutzt werden können. "Die Produktfamilie der Intel-Max-Serie bietet Speicher mit hoher Bandbreite und einer API, wodurch es sehr einfach ist, den Code zwischen CPUs und GPUs zu teilen und somit anspruchsvolle Aufgaben schneller zu lösen", erläutert Jeff McVeigh die Vorzüge dieser Architektur.

Alle Details, Spezifikationen und Anwendungs-Fälle sind hier beschrieben.

Intel® Xeon® Max Series CPUs

  • Bis zu 4,8-mal bessere Leistung im Vergleich zur Konkurrenz bei realen HPC- und KI-Workloads.

  • Bis zu 56 Leistungskerne, die aus vier Kacheln bestehen und über Intels Embedded Multi-Die Interconnect Bridge (EMIB)-Technologie verbunden sind.

  • 64 GB integrierter Arbeitsspeicher mit ultrahoher Bandbreite plus Unterstützung für PCI Express 5.0 und CXL1.1 I/O.

  • Bis zu 1,14 GB HBM-Kapazität pro Kern.

Intel® Data Center GPU Max Series

  • Über 100 Milliarden Transistoren in einem Paket, das bis zu 128 Xe-HPC-Kerne enthält

  • 408 MB L2-Cache basierend auf diskreter SRAM-Technologie und 64 MB L1-Cache.

  • Bis zu 128 Raytracing-Einheiten auf jeder GPU der Max-Serie zur Beschleunigung der wissenschaftlichen Visualisierung und Animation.

  • KI-verstärkende Xe Matrix Extensions (XMX) mit tiefen systolischen Arrays, die Vektor- und Matrixfunktionen in einem einzigen Gerät ermöglichen.