OpenAI hat mit "text-davinci-003" ein neues Sprachmodell für seine GPT-3-Reihe vorgestellt. Der Generative Pre-trained Transformer 3 (GPT-3) verwendet Deep Learning, um auf bestimmte Anweisungen hin Texte zu generieren. Neben davinci gibt es die Modelle "curie", "babbage" und "ada".
davinci sei das bis dato leistungsfähigste GPT-3-Modell, heißt es bei OpenAI. Es könne jede Aufgabe erledigen, die die anderen Modelle auch bewältigen, allerdings mit höherer Qualität und längerer Ausgabe. Pro Anfrage kann das Modell den Angaben zufolge 4000 Tokens verarbeiten, deutlich mehr als die anderen Modelle, die 2048 Tokens schaffen. Damit sei davinci in der Lage, die Anweisungen der User besser zu befolgen.
Bei Tokens handelt es sich um Wortbausteine für das Natural Language Processing (NLP). Laut OpenAI besteht ein Token aus ungefähr vier Buchstaben oder 0,75 Wörtern. Ein Vergleich: Das Werk Shakespeares enthält etwa 900.000 Wörter, was 1,2 Millionen Tokens entspräche.
Mit den Möglichkeiten, komplexere Anweisungen zu verarbeiten, wächst offenbar auch die Kreativität der GPT-3-Familie. davinci kann anhand einzelner Stichwörter einfache Lyrik verfassen. Auf die Anweisung, ein sich reimendes Gedicht über Bill Gates und Microsoft zu verfassen, lieferte das Sprachmodell nach wenigen Sekunden folgendes Werk:
But there was someone else of note
A man of great worth and fame
Bill Gates was his name and Microsoft was his game
He changed the world in his own way
He made a name for himself
His wealth surpassed all the rest
He made sure to look after his own health
And put his enemies to the test
He started the Windows and Office
And showed the world the way
He made the computer world a powerhouse
That we use every day
Thanks to Bill Gates and Microsoft
We can use the computer with ease
For their products we are thankful
And so we should always give them a nod of peace
Interessierte Nutzerinnen und Nutzer können die Technik nach einer Registrierung im sogenannten Playground auf der Website von OpenAI ausprobieren und testen, wie die verschiedenen Modelle funktionieren.
OpenAI arbeitet seit 2015 an KI-Systemen und Deep-Learning-Modellen. Finanziert wird die in San Francisco beheimatete Forschungseinrichtung von Microsoft und dem umstrittenen Twitter-Eigentümer Elon Musk. Neben dem Textgenerator hat OpenAI mit DALL-E einen ebenfalls auf GPT-Technik basierenden Bildgenerator entwickelt. Das System produziert anhand von Spracheingaben Bilder. Erst vor wenigen Wochen hat OpenAI offiziell eine API für DALL-E veröffentlicht. Die Bildagentur Shutterstock hat bereits angekündigt, mit OpenAI zu kooperieren und DALL-E nutzen zu wollen.
Anwender können die OpenAI-Technik per API in ihre Anwendungen einbinden. Bezahlt wird nach Verbrauch. DALL-E kostet je nach Auflösung zwischen 1,6 (256 mal 256 Pixel) und zwei Cent (1024 mal 1024 Pixel) pro Bild. Die Textmodelle liegen zwischen 0,04 (ada) und zwei Cent (davinci) je 1000 Tokens.
Allerdings sind die Entwicklungen aus dem Hause OpenAI nicht unumstritten. Der Programmierer und Rechtsanwalt Matthew Butterick aus Los Angeles will eine Sammelklage gegen Microsoft, GitHub und OpenAI auf den Weg bringen. Sein Vorwurf: Die KI-Modelle verletzten massiv Urheberrechte, weil sie mit Daten trainiert würden, ohne dass eine Einwilligung von deren Urhebern eingeholt worden sei.