Meta, die Muttergesellschaft von Facebook, entwickelt einen eigenen Chip für die Ausführung von KI-Modellen. Zudem will man einen Supercomputer mit 16.000 GPUs für KI-Workloads bauen. Des Weiteren hat der Konzern ein KI-optimiertes RZ-Design in petto.
Chips, RZs und Supercomputer
Dazu schrieb Santosh Janardhan, Leiter der Infrastruktur bei Meta, in einem Blogbeitrag des Unternehmens: "Wir wollen die nächste Generation von Metas KI-Infrastruktur aufbauen. Dazu gehören unser erster spezifischer Siliziumchip für die Ausführung von KI-Modellen, ein neues KI-optimiertes Rechenzentrumsdesign und die zweite Phase unseres 16.000-GPU-Supercomputers für die KI-Forschung."
Das Potenzial von MTIA
Metas Chip für die Ausführung von KI-Modellen, Meta Training and Inference Accelerator (MTIA) genannt, soll laut Janardhan eine höhere Rechenleistung und Effizienz bieten als die derzeit auf dem Markt erhältlichen Prozessoren. Dabei sei MTIA auf Workloads wie Content Understanding, Feeds, generative KI und Ad Ranking zugeschnitten.
Meta ist nicht der einzige große Tech-Konzern, der Chips für die Ausführung von KI-Modellen produzieren will. Angetrieben durch die Verbreitung von großen Sprachmodellen und generativer KI arbeiten andere ebenfalls an spezialisierten Chips für KI-Workloads oder haben bereits solche auf den Markt gebracht.
Konkurrenz für Microsoft und AWS?
So kooperiert etwa Microsoft mit AMD, um einen KI-Chip zu entwerfen. Und mit AWS hat ein weiterer großer Tech-Konzern ebenfalls einen eigenen Chip für die Ausführung von KI-Workloads veröffentlicht.
Das KI-RZ-Design
In Bezug auf das neue RZ-Design schrieb Janardha, dass die neuen RZ-Systeme schneller und kostengünstiger zu bauen seien als frühere Einrichtungen. Dazu setze Meta auf ein KI-optimiertes Design, flüssigkeitsgekühlte KI-Hardware und ein Hochleistungs-KI-Netzwerk, das Tausende von KI-Chips für KI-Trainingscluster im Rechenzentrumsmaßstab miteinander verbindet.
Neben dem neuen Datacenter-Design arbeitet der Konzern nach eigenen Angaben an der Entwicklung von KI-Supercomputern, die das Training von KI-Modellen der nächsten Generation, Augmented-Reality-Tools und Echtzeit-Übersetzungstechnologien unterstützen werden.