Bislang kann die KI dem Menschen in der Wissenschaft noch nicht das Wasser reichen. Zu groß ist etwa die Menge an manuellen Eingriffen, um in der Chemie eine KI für die Kontrolle von Laborgeräten zu trainieren.
Forscher an der Carnegie Mellon University haben nun laut einem Bericht von ars technica herausgefunden, wie man ein KI-System dazu bringen kann, sich selbst Chemie beizubringen. Dazu kombinierten die Wissenschaftler drei KI-Instanzen, die jeweils auf verschiedene Operationen spezialisiert sind.
KI-Dreifaltigkeit
Ziel der Übung, so die Forscher, war ein besseres Verständnis darüber, welche Kapazitäten große Sprachmodelle (LLMs) für die wissenschaftliche Arbeit bieten können. Daher sind alle in dieser Arbeit verwendeten KI-Systeme LLMs, hauptsächlich GPT-3.5 und GPT-4, obwohl auch einige andere - Claude 1.3 und Falcon-40B-Instruct - getestet wurden (GPT-4 und Claude 1.3 schnitten am besten ab).
Die Systeme
Anstatt jedoch ein einziges System für alle Aspekte der Chemie zu verwenden, richteten die Forscher verschiedene Instanzen ein, die arbeitsteilig zusammenarbeiten und nannten das Konstrukt "Coscientist". Die drei hierzu verwendeten Systeme sind:
Web Searcher,
Documentation Searcher, und
Planer.
Der Web Searcher
Dabei hat der Web Searcher zwei Hauptfunktionen. Die eine besteht darin, die Such-API von Google zu nutzen, um Seiten zu finden, die es wert sein könnten, wegen der darin enthaltenen Informationen aufgenommen zu werden. Die zweite besteht darin, diese Seiten zu erfassen und Informationen aus ihnen zu extrahieren.
Der Documention Searcher
Die Dokumentationssuche wiederum ist eine Art RTFM-Instanz. Die KI sollte die Kontrolle über verschiedene Laborautomatisierungsgeräte erhalten, wie etwa. Robotik-Flüssigkeitshandler und dergleichen. Dazu erhielt die KI-Instanz Zugang zu allen Handbüchern für diese Geräte, so dass sie herausfinden konnte, wie man sie steuert.
Der Planer
Der Planer dagegen kann den beiden anderen KI-Instanzen Befehle erteilen und deren Antworten verarbeiten. Er hat Zugang zu einer Python-Sandbox, in der er Code ausführen und Berechnungen durchführen kann. Außerdem hat er Zugriff auf die automatisierte Laborausrüstung, so dass er Experimente durchführen und analysieren kann.
Praktische Erfahrungen
Nachdem die grundlegende Steuerung scheinbar funktionierte, beschlossen die Forscher, es mit Chemie zu versuchen. Sie stellten eine Probenplatte mit Vertiefungen zur Verfügung, die mit einfachen Chemikalien, Katalysatoren und dergleichen gefüllt waren. Das Gerät sollte nun eine bestimmte chemische Reaktion durchführen.
Coscientist beherrschte die Chemie von Anfang an, aber der Versuch, die Synthese durchzuführen, schlug fehl, weil es einen ungültigen Befehl an die Hardware schickte. Daraufhin wurde der Befehl an das Dokumentationsmodul zurückgeschickt, damit es das Problem korrigieren und die Reaktionen durchführen konnte.
Die lernende KI
Nachdem die Grundreaktionen funktionierten, forderten die Forscher das System auf, die Effizienz der Reaktion zu verbessern - sie stellten sich den Optimierungsprozess als ein Spiel vor, bei dem die Punktzahl mit der Ausbeute der Reaktion steigen würde. Nach mehreren Runden fand das System schnell zu einer besseren Ausbeute.
Die Forscher fanden dabei heraus, dass sie die schlechten Entscheidungen in der ersten Runde vermeiden konnten, indem sie Coscientist Informationen über die Ausbeute einer Handvoll zufälliger Ausgangsmischungen zur Verfügung stellten. Dies bedeutet, dass es keine Rolle spielt, woher Coscientist seine Informationen erhält - entweder von den Reaktionen, die es durchführt, oder von einer externen Informationsquelle. Unabhängig davon ist es in der Lage, diese Informationen in seine Planung einzubeziehen.
Funktioniert wie ein Gehirn
Letztlich ähnelt die Struktur von Coscientist, die auf dem Zusammenspiel einer Reihe spezialisierter Systeme beruht, der Funktionsweise von Gehirnen. Zwar sind die spezialisierten Systeme des Gehirns zu einer viel größeren Bandbreite von Aktivitäten fähig, und es gibt viel mehr von ihnen. Aber es könnte sein, dass diese Art von Struktur entscheidend ist, um KI-Lösungen ein komplizierteres Verhalten zu ermöglichen.
Gleichzeitig offenbart der Versuch eine neue Herausforderung: Wie sagt man an den GPT-Instanzen, dass sie etwas nicht tun sollen. Im Beispiel etwa aus den Chemikalien Nervengase zu synthetisieren.