Generative AI

Generative AI, auch als generative künstliche Intelligenz (KI) bezeichnet, beschreibt Algorithmen, mit denen auf der Basis von Trainingsdaten neue Inhalte wie Text, Bilder, Audio und Softwarecode, aber auch Videos und Simulationen erstellt werden können. Jüngste Durchbrüche – zum Beispiel mit ChatGPT von OpenAI oder Bard von Google - haben das Potenzial, die Produktion von Inhalten aller Art zu vereinfachen. Damit wird Generative AI zu einem wichtigen Effizienzsteigerungs- und Automatisierungswerkzeug für Unternehmen.

News

Auf einen Blick

Das Wichtigste zum Thema Generative AI:

Viele Aufgaben im Arbeitsalltag, die mit der Erstellung von Content zu tun haben, lassen sich durch Generative AI effizienter gestalten und automatisieren. Das gilt insbesondere für das Erstellen von Texten, Bildern, Grafiken, Präsentationen und Filmen. Beispielsweise wird die Content-Produktion zum Befüllen einer Website einfacher, ebenso das Verfassen von Kurznachrichten, E-Mails oder Briefen.  

Softwareentwickler können sich von Generative AI Code-Bausteine vorschlagen lassen, um ihre Produktivität zu verbessern. Beispielsweise ist ChatGPT in der Lage, beim Entwickeln einer Website zu unterstützen oder Softwarecode in Sprachen wie JavaScript zu generieren.  

Viele Unternehmen nutzen Generative AI beispielsweise in Gestalt von Chatbots, um die Konversation mit Kunden zu automatisieren und zu beschleunigen. Dabei gilt: Je menschenähnlicher die Software-Bots Kundenanfragen behandeln können, desto besser. Entscheidend für die Qualität sind die zugrunde liegenden Large Language Models (LLMs).

Generative AI funktioniert auf der Basis sehr großer Mengen an Trainingsdaten. Wenn deren Urheberschaft unzureichend geklärt ist, kann es zu Rechtstreitigkeiten kommen. Bildende Künstler, Autoren, Journalisten, Designer, Illustratoren – sie alle leben von ihrer kreativen Arbeit und sind besorgt, dass Generative-AI-Systeme ungefragt mit ihren Produkten und Exponaten trainiert werden könnten. Ob das passiert oder nicht, ist schwer zu beurteilen, da das Training großer KI-Systeme meist intransparent verläuft.

Eigene Generative AI zu implementieren, kann für Unternehmen – je nach Größe des Systems – beliebig teuer werden. So sind spezialisierte Hardware und Software erforderlich, ebenso ausgebildetes Personal, um das jeweilige System zu betreiben und zu pflegen. Für mittelständische Betriebe, aber auch für große Konzerne mit kleinen Budgets kann das zu einer Herausforderung werden.

Ohne eine hohe Datenqualität sind Generative-AI-Vorhaben zum Scheitern verurteilt. Akkurate Ergebnisse und Vorhersagen sind nur möglich, wenn der zugrundeliegende Datenbestand gepflegt und stets aktuell ist. Unternehmen, die sich im Daten-Management schwertun, sollten hier zuerst ihre Hausaufgaben erledigen. 

Generative AI kann Mitarbeitende im Unternehmen beim Kreieren von Content aller Art  unterstützen. Das kann etwa nützlich beim Erstellen von Texten, Webseiten-Inhalten oder Softwarecode sein.

Im E-Commerce kann Generative AI helfen, personalisierte Werbung auf Basis vorhandener Kundendaten zu Konsumverhalten und Interessen zu erstellen.  

Repetitive Aufgaben in der Content-Produktion, die Mitarbeitende in ihrer täglichen Arbeit aufhalten, lassen sich mit Generative AI automatisiert erstellen.

Lange Texte können mit generative AI zusammengefasst werden. Diese Summary-Funktionalität hat bereits in viele Softwareprodukte und Tools Einzug gehalten.

Unternehmen können GenAI-Agorithmen gezielt auf eigene Datenbestände aufsetzen und auf dieser Basis urheberrechtlich geschützt neue Produkt- und Serviceangebote schaffen.

OpenAI mit den großen, multimodalen Modellen GPT-3 und GPT-4 sowie dem darauf basierenden Chatbot ChatGPT.

Google mit dem KI-basierten Chatbot Bard, der auf dem LLM von PaLM2 basiert und als Reaktion auf OpenAIs Erfolg mit ChatGPT entwickelt wurde.  

OpenAI mit DALL-E, einer Bildsynthese-Software, die neue Bilder auf der Basis von Textbeschreibungen produziert.  

Stable Diffusion (Open Source), ähnlich wie DALL-E ein Text-to-Image-Modell, das aber deutlich freizügiger mit Inhalten umgeht. Stable Diffusion stellt seinen Quellcode zusammen mit den vortrainierten Gewichten zur Verfügung.

Progen, ein auf 280 Millionen Protein-Samples trainiertes multimodales Modell, das auf Basis von Spracheingaben neue Proteinsequenzen mit bestimmten Funktionen generiert.

Synthesia, eine KI-Plattform zum Generieren synthetischer Musik.

MusicLM von Google, ebenfalls ein KI-Modell, das Musik auf der Basis von Spracheingaben produziert.