Spätestens seit dem Jahr 2006 ist klar, dass wir etwas ändern müssen, wenn es um Open Source - und Offenheit im Allgemeinen - geht. Wie Tim O'Reilly damals schrieb, ist in der Cloud-Ära von Open Source "die Motivation zum Teilen (also die Notwendigkeit, eine Kopie des Quellcodes herauszugeben) verschwunden". Und damit nicht genug: "Es ist nicht nur nicht mehr erforderlich, sondern im Falle der größten Applikationen auch nicht mehr möglich."
Dieser Umstand hat die Definition von Open Source im Laufe der letzten zehn Jahre beeinflusst und wirkt sich nun auf die Art und Weise aus, wie wir über künstliche Intelligenz (KI) denken, wie der Buchautor und Technologieexperte Mike Loukides kürzlich feststellte. Noch nie sei es so wichtig wie heute gewesen, an KI mitzuarbeiten - gleichzeitig sei das heute schwerer denn je zuvor: "Der schiere Umfang großer Language-Modelle wirft ein erhebliches Problem auf, wenn es um die Reproduzierbarkeit geht", schreibt der Spezialist.
Ähnlich wie in Zusammenhang mit der Cloud im Jahr 2006 werden die Unternehmen, die im KI-Bereich die interessanteste Arbeit leisten, möglicherweise Schwierigkeiten haben, den Open-Source-Weg zu beschreiten - zumindest in traditioneller Art und Weise. Das bedeutet jedoch nicht, dass dieser Weg vollkommen verschlossen bleibt.
Viel Glück mit Ihrem Laptop
Auch wenn viele Unternehmen behaupten, mit KI zu arbeiten, gibt es laut Loukides eigentlich nur drei Unternehmen, die die Branche in diesem Bereich vor sich hertreiben:
Facebook,
OpenAI und
Google.
Diesen Unternehmen ist die Fähigkeit gemein, umfangreiche Modelle in großem Maßstab zu betreiben. Mit anderen Worten: Sie betreiben KI auf eine Art und Weise, wie Sie und ich es nicht können. Dabei gibt es keine Geheimniskrämerei: Diese Fähigkeit beruht auf der entsprechenden Infrastruktur und dem Wissen, wie diese zu betreiben ist.
"Sie können den Quellcode für Facebooks Open Pretrained Transformer (OPT-175B) herunterladen", räumt Loukides ein, "aber Sie werden nicht in der Lage sein, es selbst auf einer Hardware zu trainieren. Selbst für Universitäten und andere Forschungseinrichtungen sind die Modelle zu umfangreich. Da nutzt auch Facebooks große Ankündigung, OPT-175B zu teilen, um mehr Engagement der Community zu ermöglichen, nichts."
Das klinge zwar großartig, aber, wie Loukides betont, könne OPT-175B "wahrscheinlich nicht einmal von Google und OpenAI reproduziert werden, obwohl sie über ausreichende Rechenressourcen verfügen." Schließlich sei OPT-175B zu eng mit der Infrastruktur von Facebook verbunden (einschließlich kundenspezifischer Hardware), um auf der Infrastruktur von Google reproduziert werden zu können.
Es ist schwer, einem KI-System zu vertrauen, wenn wir seine Funktionsweise nicht verstehen. Deshalb gilt es, Wege zu finden, diese Infrastruktur zu erschließen. Loukides hat eine Idee, auch wenn diese die eifrigsten Verfechter freier Software nicht zufrieden stellen wird: "Die Antwort besteht darin, externen Forschern und Early Adoptern freien Zugang zu gewähren, damit sie ihre eigenen Fragen stellen und die breite Palette der möglichen Ergebnisse erfassen können." Das funktioniert natürlich nicht, indem man ihnen Zugang zu den Rechenzentren von Facebook, Google oder OpenAI verschafft, sondern über öffentlich zugängliche APIs - eine interessante Idee, die funktionieren könnte. Nur eben nicht Open Source in einem Sinne ist, wie es sich viele wünschen.
Offenheit neu denken
Seit 2006 hat Google wichtige Infrastrukturelemente als Open Source zur Verfügung gestellt - insofern das auf seine eigenen, strategischen Ziele einzahlte. Ein kluges Gebahren - und damit ist Google nicht allein. Es ist nur besser im Umgang mit Open Source als die meisten Unternehmen. Weil Open Source von Natur aus egoistisch ist, werden Unternehmen und Einzelpersonen Code öffnen, der ihnen oder ihren eigenen Kunden zugutekommt. Das war schon immer so und wird auch immer so bleiben.
Was Loukides' Argumente für eine sinnvolle Öffnung von KI trotz der Kluft zwischen den drei KI-Giganten und allen anderen angeht, so plädiert er nicht für Open Source im traditionellen Sinn. Die Open-Source-Definition, so fantastisch sie auch klingen mag, hat nie eine Antwort auf die Frage nach der Cloud Open Source gegeben - weder für die Entwickler noch für die Konsumenten von Software. So wie ich Loukides verstehe, liegt der Schlüssel darin, Forschenden ausreichenden Zugang zu gewähren, damit sie die Erfolge und Misserfolge der Funktionsweise eines bestimmten KI-Modells nachvollziehen können. Sie brauchen keinen vollständigen Zugriff auf den gesamten Code und die Infrastruktur, um diese Modelle laufen zu lassen, da das, wie er argumentiert, im Grunde sinnlos ist. In einer Welt, in der ein Entwickler ein quelloffenes Programm auf einem Laptop ausführen und davon abgeleitete Werke erstellen kann, ist es sinnvoll, vollen Zugang zu diesem Code zu verlangen. Angesichts des Umfangs und der einzigartigen Komplexität des Codes, der heute bei Google oder Microsoft läuft, ist es nicht mehr sinnvoll. Jedenfalls nicht für den gesamten Cloud-Code, der in großem Umfang läuft.
Wir müssen unsere binäre Sichtweise von Open Source aufgeben. Diese war noch nie besonders nützlich, um die Open-Source-Welt zu betrachten und sie wird in der Cloud-Ära jeden Tag ein Stück weniger nützlich. Unser Ziel als Unternehmen und Einzelperson sollte darin bestehen, Software auf eine Weise zugänglich zu machen, die unseren Kunden und Drittentwicklern zugutekommt. Es gilt, den Zugang und das Verständnis zu fördern, anstatt zu versuchen, ein jahrzehntealtes Konzept von Open Source auf die Cloud zu übertragen. Das hat bei Open Source nicht funktioniert, genauso wenig wie es bei KI funktioniert. Zeit, umzudenken. (fm)
Dieser Beitrag basiert auf einem Artikel unserer US-Schwesterpublikation Infoworld.