ChatGPT mag in der Lage sein, implizite und kontextuelle Informationen zu erfassen, nahezu menschlich zu kommunizieren oder sogar zu reimen - richtig witzig ist der Generative-KI-Bot aber nicht. Zu diesem Ergebnis kommen Sophie Jentzsch und Kristian Kersting in einer Forschungsarbeit, die sich mit der Fähigkeit von OpenAIs ChatGPT-3.5 (nicht die neueste Version GPT-4.0) beschäftigte, Humor zu verstehen und zu erzeugen.
Sehr begrenztes Witze-Repertoire
Die beiden mit dem Institut für Softwaretechnologie, dem Deutschen Zentrum für Luft- und Raumfahrt (DLR) und der Technischen Universität Darmstadt verbundenen Forscher fanden insbesondere heraus, dass ChatGPTs Wissen über Witze ziemlich begrenzt ist: Von den als Reaktion auf den Prompt "Do you know any good jokes?" gelieferten 1.008 Ergebnissen waren über 90 Prozent (909) die gleichen 25 Witze.
Die übrigen 99 Proben enthielten nicht unbedingt neue Inhalte, sondern etwa die Hälfte von ihnen waren Abwandlungen der am häufigsten gebrachten Witze, schreiben die Forscher in ihrer Arbeit (PDF). Davon ergaben einige der geänderten Wortspiele noch Sinn, weil nur Teile des ursprünglichen Witzes durch semantisch ähnliche Elemente ersetzt wurden. Andere ergaben danach überhaupt keinen Sinn mehr. Jentsch und Kersting folgern entsprechend, dass die Antworten wahrscheinlich während des Trainings des KI-Modells gelernt und gespeichert wurden, anstatt neu generiert zu werden.
There is, in the most literal sense, nothing funny about RLHF. https://t.co/k4QEpuFvTt pic.twitter.com/E7ZbL0GjiC
— Riley Goodside (@goodside) June 9, 2023
Ist das lustig?
Auch bei der Erkennung von menschlichem Humor und der Erklärung von Witzen ("Can you explain why this joke is funny?") hat die Künstliche Intelligenz so ihre Schwierigkeiten - abgesehen von den gelernten eigenen. "Das Modell ist in der Lage, Wortspiele, die in das gelernte Muster passen, korrekt zu identifizieren, wiederzugeben und zu erklären, aber es scheitert an Wortspielen anderer Art, was zu einer eingeschränkten Wiedergabe von Humor führt", so die Forscher. Außerdem sei das Tool noch nicht in der Lage, eigenständig einzigartige humorige Inhalte zu erstellen.
Nichtsdestotrotz sehen Jentzsch und Kersting bei ChatGPT große Fortschritte im Vergleich zu früheren großen Sprachmodellen (Large Language Models - LLMs), was ein allgemeines Verständnis von Humor angeht. Sie planen, ähnliche Aufgaben an den neu veröffentlichten GPT-4-Modellen und an entsprechenden Open-Source-Modellen wie LLaMa und GPTNeoX durchzuführen, um deren Fähigkeiten, Witze zu generieren und zu verstehen, zu untersuchen.