Chemieforscher kombinieren ChatGPT-Instanzen

KI-Dreifaltigkeit

21.12.2023
Von 
Jürgen Hill ist Chefreporter Future Technologies bei der COMPUTERWOCHE. Thematisch befasst sich der studierte Diplom-Journalist und Informatiker derzeit mit aktuellen IT-Trendthemen wie KI, Quantencomputing, Digital Twins, IoT, Digitalisierung etc. Zudem verfügt er über einen langjährigen Background im Bereich Communications mit all seinen Facetten (TK, Mobile, LAN, WAN). 
Noch haben KI-Systeme ihre Schwächen. Um diese auszubügeln, haben US-Forscher mehrere Systeme kombiniert.
violetter Glaskolben auf blauem Forschungschemie-Banner-Laborhintergrund
violetter Glaskolben auf blauem Forschungschemie-Banner-Laborhintergrund
Foto: biDaala studio - shutterstock.com

Bislang kann die KI dem Menschen in der Wissenschaft noch nicht das Wasser reichen. Zu groß ist etwa die Menge an manuellen Eingriffen, um in der Chemie eine KI für die Kontrolle von Laborgeräten zu trainieren.

Forscher an der Carnegie Mellon University haben nun laut einem Bericht von ars technica herausgefunden, wie man ein KI-System dazu bringen kann, sich selbst Chemie beizubringen. Dazu kombinierten die Wissenschaftler drei KI-Instanzen, die jeweils auf verschiedene Operationen spezialisiert sind.

KI-Dreifaltigkeit

Ziel der Übung, so die Forscher, war ein besseres Verständnis darüber, welche Kapazitäten große Sprachmodelle (LLMs) für die wissenschaftliche Arbeit bieten können. Daher sind alle in dieser Arbeit verwendeten KI-Systeme LLMs, hauptsächlich GPT-3.5 und GPT-4, obwohl auch einige andere - Claude 1.3 und Falcon-40B-Instruct - getestet wurden (GPT-4 und Claude 1.3 schnitten am besten ab).

Die Systeme

Anstatt jedoch ein einziges System für alle Aspekte der Chemie zu verwenden, richteten die Forscher verschiedene Instanzen ein, die arbeitsteilig zusammenarbeiten und nannten das Konstrukt "Coscientist". Die drei hierzu verwendeten Systeme sind:

  • Web Searcher,

  • Documentation Searcher, und

  • Planer.

Der Web Searcher

Dabei hat der Web Searcher zwei Hauptfunktionen. Die eine besteht darin, die Such-API von Google zu nutzen, um Seiten zu finden, die es wert sein könnten, wegen der darin enthaltenen Informationen aufgenommen zu werden. Die zweite besteht darin, diese Seiten zu erfassen und Informationen aus ihnen zu extrahieren.

Der Documention Searcher

Die Dokumentationssuche wiederum ist eine Art RTFM-Instanz. Die KI sollte die Kontrolle über verschiedene Laborautomatisierungsgeräte erhalten, wie etwa. Robotik-Flüssigkeitshandler und dergleichen. Dazu erhielt die KI-Instanz Zugang zu allen Handbüchern für diese Geräte, so dass sie herausfinden konnte, wie man sie steuert.

Der Planer

Der Planer dagegen kann den beiden anderen KI-Instanzen Befehle erteilen und deren Antworten verarbeiten. Er hat Zugang zu einer Python-Sandbox, in der er Code ausführen und Berechnungen durchführen kann. Außerdem hat er Zugriff auf die automatisierte Laborausrüstung, so dass er Experimente durchführen und analysieren kann.

Praktische Erfahrungen

Nachdem die grundlegende Steuerung scheinbar funktionierte, beschlossen die Forscher, es mit Chemie zu versuchen. Sie stellten eine Probenplatte mit Vertiefungen zur Verfügung, die mit einfachen Chemikalien, Katalysatoren und dergleichen gefüllt waren. Das Gerät sollte nun eine bestimmte chemische Reaktion durchführen.

Selbstlernend optimierte das KI-System Coscientist die Ausbeute seiner chemischen Prozesse.
Selbstlernend optimierte das KI-System Coscientist die Ausbeute seiner chemischen Prozesse.
Foto: Gorodenkoff - shutterstock.com

Coscientist beherrschte die Chemie von Anfang an, aber der Versuch, die Synthese durchzuführen, schlug fehl, weil es einen ungültigen Befehl an die Hardware schickte. Daraufhin wurde der Befehl an das Dokumentationsmodul zurückgeschickt, damit es das Problem korrigieren und die Reaktionen durchführen konnte.

Die lernende KI

Nachdem die Grundreaktionen funktionierten, forderten die Forscher das System auf, die Effizienz der Reaktion zu verbessern - sie stellten sich den Optimierungsprozess als ein Spiel vor, bei dem die Punktzahl mit der Ausbeute der Reaktion steigen würde. Nach mehreren Runden fand das System schnell zu einer besseren Ausbeute.

Die Forscher fanden dabei heraus, dass sie die schlechten Entscheidungen in der ersten Runde vermeiden konnten, indem sie Coscientist Informationen über die Ausbeute einer Handvoll zufälliger Ausgangsmischungen zur Verfügung stellten. Dies bedeutet, dass es keine Rolle spielt, woher Coscientist seine Informationen erhält - entweder von den Reaktionen, die es durchführt, oder von einer externen Informationsquelle. Unabhängig davon ist es in der Lage, diese Informationen in seine Planung einzubeziehen.

Funktioniert wie ein Gehirn

Letztlich ähnelt die Struktur von Coscientist, die auf dem Zusammenspiel einer Reihe spezialisierter Systeme beruht, der Funktionsweise von Gehirnen. Zwar sind die spezialisierten Systeme des Gehirns zu einer viel größeren Bandbreite von Aktivitäten fähig, und es gibt viel mehr von ihnen. Aber es könnte sein, dass diese Art von Struktur entscheidend ist, um KI-Lösungen ein komplizierteres Verhalten zu ermöglichen.

Gleichzeitig offenbart der Versuch eine neue Herausforderung: Wie sagt man an den GPT-Instanzen, dass sie etwas nicht tun sollen. Im Beispiel etwa aus den Chemikalien Nervengase zu synthetisieren.