Föderiertes Lernen markiert einen Meilenstein, wenn es darum geht, kollaboratives KI-Modelltraining zu verbessern: Die Technik verlagert den Fokus des maschinellen Lernens von zentralisierten hin zu dezentralen Trainingsmethoden. Die Grundprinzipien von Federated Learning auf einen Blick:
Dezentralisierte Daten: Im Gegensatz zu herkömmlichen Methoden, bei denen die Daten zentralisiert werden müssen, wird das Modell beim föderierten Lernen auf die Datenquelle verteilt - die Daten also dort genutzt, wo sie sind.
Schutz der Privatsphäre: Der Federated-Learning-Ansatz optimiert die User Privacy "by Design" und minimiert die Wahrscheinlichkeit von Kompromittierungen, weil die Daten auf den Devices der Nutzer verbleiben.
Kollaboratives Lernen: Modelle lernen auf natürliche Weise von diversen Datensätzen auf unterschiedlichen Devices oder Servern.
Effiziente Datennutzung: Föderiertes Lernen eignet sich in besonderem Maße für Problemdomänen mit umfangreichen, verteilten oder sensiblen Daten. Es optimiert die Nutzung verfügbarer Daten und gewährleistet, dass spezifische Richtlinien eingehalten werden.
Das RoPPFL-Framework
Föderiertes Lernen bietet also die vielversprechende Aussicht auf kollaboratives KI-Modelltraining über mehrere Devices oder Server hinweg, ohne dass die Daten zentralisiert werden müssen. Was bleibt, sind allerdings Security- und Datenschutz-Bedenken, insbesondere mit Blick auf Data-Poisoning-Angriffe.
Das "Robust and Privacy-Preserving Federated Learning" (RoPPFL)-Framework will die inhärenten Herausforderungen, die mit föderiertem Lernen in Edge-Computing-Umgebungen verbunden sind, auflösen. RoPPFL ist ein Mix aus Local Differential Privacy (LDP) und Robust Weighted Aggregation (RoWA).
LDP gewährleistet den Datenschutz, indem es Modellaktualisierungen kalibriertes Rauschen hinzufügt. Das erschwert es Angreifern, auf individuelle Datenpunkte zu schließen.
RoWA erhöht die Widerstandsfähigkeit des Systems gegen Poisoning-Angriffe, indem es Modellaktualisierungen auf der Grundlage ihrer Ähnlichkeit zusammenfasst und so den Impact potenzieller, bösartiger Manipulationen abschwächt.
RoPPFL verwendet eine hierarchische Struktur des föderierten Lernens. Diese organisiert den Modell-Trainingsprozess auf verschiedenen Ebenen, darunter Cloud-Server, Edge-Knoten und Client-Devices. Das RoPPFL-Framework ist somit ein Schritt in die richtige Richtung und adressiert parallel Security- und Datenschutzherausforderungen. Dabei kombiniert es LDP mit einem einzigartigen Aggregationsmechanismus und ebnet den Weg hin zum kollaborativen KI-Modelltraining.
Angesichts der derzeitigen Situation, in der Unternehmen zuerst generative KI-Systeme einrichten und im Anschluss die wichtigen Fragen stellen, müssen wir fundiertere Überlegungen dazu anstellen, wie diese Lösungen aufzubauen, bereitzustellen und abzusichern sind.
- Thomas Weyand, Contentsquare
"Without Data, it´s just another opinion. Doch Daten erzählen auch nicht immer die ganze Wahrheit. Business Intelligence hängt auch sehr von der individuellen Interpretation ab und dafür braucht es das nötige Wissen auf der individuellen Ebene." - Stefan Haertlein, Cisco
"Unser Eindruck ist gerade noch, dass viele Unternehmen mit angezogener Handbremse fahren. Indem wir Schritt für Schritt die Infrastruktur segmentieren, minimieren wir die Angst vor dem Verlust der Datenhoheit und ermöglichen eine Annäherung an das Thema." - Carsten Schröder, Haufe X360
"Es ist empfehlenswert, sich zunächst Teilprojekten zu widmen, die einen “Quick Win” herstellen, um die Toleranz weiter zu fördern. Wenn ich innerhalb von 3 Monaten Ergebnisse sehe, dann gehe ich mit dem Thema Daten ganz anders um." - Hardy Groeger, IBM
"Das Stichwort lautet immer wieder: Balance! Ich muss die spezifischen Use Cases, die organisatorische und methodische Vorgehensweise sowie den technologischen Unterbau ausbalancieren, damit sie lang-, mittel- und kurzfristig zu meinen Unternehmenszielen passen." - Boris Michel, INFORM DataLab
"Wenn ich die verschiedenen Quellsysteme mit einer beliebigen Analytics-Lösung verbinde, habe ich noch lange keine Datenkultur geschaffen. Die richtige Basis schaffe ich nur, wenn ich die ganzen existierenden Silos auflöse." - Felix Hoffmann, LeanIX
"Es kann schon helfen, das C-Level “anzutriggern”, aber immer nur in Zusammenarbeit mit den Fachabteilungen. Es gibt nämlich nichts Schlimmeres, als eine erstickte Graswurzelbewegung. Das bedeutet, keine Hauruck-Aktionen und nicht zu viel auf einmal, sondern Schritt für Schritt und immer mit Blick auf das Ziel." - Florian Weigmann, PlusServer
"Das Ziel eines “Data Fabric Layers” ist es, konsistente und qualitativ hochwertige Daten zu generieren und nutzbar zu machen. Jede technologische Transformation sollte in der Absicht erfolgen, in der Zukunft datengetriebene Entscheidungen treffen zu können."
Dieser Beitrag basiert auf einem Artikel unserer US-Schwesterpublikation Infoworld.