GenAI-Blähungen

Sorgt KI für dummen Code?

Kommentar  15.02.2024
Von 
Matt Asay ist Autor der US-Schwesterpublikation Infoworld.com.
KI-generierter Programmcode hat die Softwareentwicklung für immer verändert. Nicht unbedingt zum Guten.
Künstliche Intelligenz - dummer Programmcode?
Künstliche Intelligenz - dummer Programmcode?
Foto: acceptphoto | shutterstock.com

Laut GitHub befähigen Tools wie Copilot Entwickler dazu, im Schnitt um 55 Prozent schneller zu programmieren. Das ist allerdings gar nicht so toll, wie es sich zunächst anhört. GitClear hat zwischen Januar 2020 und Dezember 2023 mehr als 150 Millionen Codezeilen analysiert. Als Resultat kommt der Tool-Anbieter zu der Prognose, dass sich der sogenannte "Code Churn" (der Prozentsatz an Codezeilen, die weniger als zwei Wochen nach ihrer Entstehung geändert oder aktualisiert werden müssen) im Jahr 2024 verdoppeln wird.

Man könnte es auch anders ausdrücken: Code der im Laufe des Jahres 2023 generiert wurde, erinnert mehr an die Arbeit einer Aushilfskraft, die eher darauf fokussiert war, besonders ausführlichen statt gut wartbaren Programmcode zu schreiben. Die resultierenden Code-Überblähungen können wiederum (unter anderem) in IT-Sicherheitskatastrophen münden.

Dieser Artikel soll keinen Appell an Developer darstellen, keine GenAI-Tools mehr für ihre Arbeit zu nutzen. Vielmehr gilt es, bestimmte Maßnahmen zu ergreifen, um zu verhindern, dass ein übermäßiger KI-Fokus zu unzureichendem Code und weiteren Nachteilen führt.

So verhindern Sie aufgeblähten Code

Large Language Models (LLMs) sind nicht besonders schwer aufzusetzen. Inzwischen kennen wir auch mehr Möglichkeiten, KI-Halluzinationen zu verhindern - Stichwort Retrieval Augmented Generation. Dennoch ist es weiterhin eine undurchschaubare, inkonsistente Kunst, Prompts für ein LLM zu entwerfen. Datasette-Schöpfer Simon Willison drückt es in seinem Blog folgendermaßen aus: "Man muss manchmal unglaublich dumme Dinge tun, um ein Modell dazu bringen, sich wie gewünscht zu verhalten."

Geht es nach Power-DNS-Gründer Bert Hubert, stellt auf-, respektive überblähter Code jedoch das größte Problem im Bereich KI-generierter Software dar: "Je mehr Code Sie haben, desto größer die Risiken. Software wird aktuell zurecht als so gefährlich eingeschätzt, dass wir jedem raten, sie nicht selbst zu betreiben. Die Welt liefert zuviel Code aus und die mediokren Teile haben eine riesige Angriffsfläche geschaffen."

Abhilfe schaffen an dieser Stelle vor allem Code Reviews - sowohl automatisiert als auch manuell. Das bedeutet für Entwickler (insbesondere solche mit weniger Erfahrung): Sie müssen ihre Grundlagen beherrschen. Bei bestimmten Themen haben nicht wenige Devs "Mut zur Lücke" - beispielsweise, wenn es um Datenstrukturen, Algorithmen oder verteilte Systeme geht. Das ist der Fähigkeit enorm abträglich, ein ordentliches Code Review durchzuführen. (fm)

Dieser Beitrag basiert auf einem Artikel unserer US-Schwesterpublikation Infoworld.