Datenlecks

Was steht über Sie im Internet?

18.03.2023
Von 
Arne Arnold arbeitet seit über 15 Jahren bei der PC-WELT als Redakteur in den Bereichen Software und Internet. Sein Schwerpunkt liegt auf dem Thema Sicherheit für Endanwender bei PC und Mobil-Geräten.
Der Diebstahl von persönlichen Daten im Internet hat eine neue Dimension erreicht. Nicht nur Hacker und die Werbeindustrie haben es auf Ihre persönlichen Daten, Fotos und Texte abgesehen, sondern auch die Datenkraken der künstlichen Intelligenz. Jetzt müssen Sie aufpassen.
Foto: Datenschutz-Stockfoto - shutterstock.com

Sie müssen für eine Operation ins Krankenhaus und Ihr Arzt macht zur medizinischen Dokumentation ein Foto von Ihnen. Natürlich darf der Arzt diese Aufnahme nur zu diesem Zweck verwenden. Doch Jahre später finden Sie genau dieses Foto von Ihnen im Internet in der Datenbank einer künstlichen Intelligenz. Die KI generiert daraus neue Bilder.

Diese verstörende und die Privatsphäre verletzende Erfahrung machte eine in San Francisco lebende Künstlerin, die sich auf Twitter Lapine nennt. Dass sie diesen Skandal aufdecken konnte, hat mit ihrem Beruf zu tun. Als Künstlerin fertigt sie Bilder an und stellt sie ins Internet, wo sie öffentlich zugänglich sind. Im Jahr 2022 sind Bildgeneratoren in Mode gekommen, die mit Hilfe künstlicher Intelligenz neue Fotos erzeugen oder bestehende Bilder bearbeiten können.

Bekannt ist zum Beispiel die App Lensa, die Porträtfotos von Ihnen in Bilder von Superhelden, Feen und anderen Fantasiefiguren verwandelt. Lensa nutzt dazu den KI-Bildgenerator Stable Diffusion der Firma Stable AI. Damit solche KI-Bildgeneratoren funktionieren, müssen sie zunächst mit Millionen von Fotos trainiert werden.

Ein Großteil dieser Trainingsdaten stammt aus dem Internet und umfasst öffentlich zugängliche Bilder. Daraus lernt die KI nicht nur, wie Menschen, Hunde und Katzen aussehen, sondern auch, in welchem Stil Künstler malen. Die KI lernt beispielsweise den Stil von Salvador Dalí oder Vincent van Gogh. Dieser Eklektizismus sorgt für viel Kritik.

Auch die Künstlerin Lapine aus San Francisco wollte wissen, ob ihre Bilder in einer KI stecken und lud unter anderem ein Porträtfoto von sich zur Suchmaschine "Have I been trained" hoch. Diese spukte dann ähnliche Bilder aus, darunter auch die Aufnahmen, die ihr Arzt Jahre zuvor vor Ihrer Operation gemacht hat.

Dieses Ergebnis liefert die Spezialsuche https://haveibeentrained.com bei der Suche nach Patienten in Krankenhausbetten. Mit genau diesen Bildern werden künstliche Intelligenzen trainiert. Meist ohne Wissen der abgebildeten Personen.
Dieses Ergebnis liefert die Spezialsuche https://haveibeentrained.com bei der Suche nach Patienten in Krankenhausbetten. Mit genau diesen Bildern werden künstliche Intelligenzen trainiert. Meist ohne Wissen der abgebildeten Personen.

Lapine berichtete dem Magazin Ars Technica, dass der Chirurg, der sie fotografiert hatte, 2018 gestorben sei. Sie vermutet, dass die Bilder irgendwann danach aus der Obhut der Praxis in die Fänge von Datensammlern gelangten und schließlich in der Datenbank Laion landeten, die rund 400 Millionen verschlagwortete Bilder enthält. Laion hat die Bilder allerdings nicht auf eigenen Servern gespeichert, sondern verwaltet sie nur über Links zu anderen Quellen. Dadurch kann die Datenbank die Verantwortung für missbräuchlich verwendete Bilder leicht von sich weisen.

So suchen Sie nach eigenen Bildern in den KI-Bilddatenbanken

Wenn Sie wissen möchten, ob Fotos von Ihnen bereits in einer der großen Datenbanken enthalten sind, die jetzt von den neuen KI-Bildgeneratoren verwendet werden, können Sie den Dienst unter https://haveibeentrained.com nutzen. Der Name des Dienstes bezieht sich auf den existierenden Dienst https://haveibeenpwned.com, mit dem Sie nach gestohlenen Zugangsdaten suchen können.

Idealerweise verwenden Sie die Suchmaschine Have I been Trained so, dass Sie den Link zu Ihrem Foto, das sich bereits im Internet befindet, in die Suche eingeben. Wenn sich der Link und damit das Foto in der Datenbank von Laiom befindet, werden Sie darüber informiert und erhalten Hilfe, wie Sie den Eintrag aus der Datenbank entfernen können. Auf diese Weise wird das Foto zumindest nicht mehr von zukünftigen KI-Generatoren verwendet.

Anstelle eines Links zu Ihrem Foto können Sie auch eine Fotodatei in die Suchmaschine hochladen. Aber das wollen Sie wahrscheinlich nicht: noch mehr Fotos von sich im Internet. Die Suchmaschine richtet sich in erster Linie an Künstler, die herausfinden wollen, ob Bilder von ihnen in der AI-Datenbank gelandet sind, da es in der Folge zu Urheberrechtsproblemen kommen kann.

Datenlücke bei Facebook: 500 Millionen Daten gestohlen

Im November 2022 machte eine Nachricht die Runde: "Riesiger Whatsapp-Leak - 6 Millionen deutsche Nutzer betroffen". Die Nachricht stieß auf großes Interesse, da unter den gestohlenen Daten auch Telefonnummern waren. Gleichzeitig schien es zu dieser Zeit vermehrt SMS- und Telefon- Spam-Angriffe auf deutsche Nutzer zu geben. Obwohl unklar ist, ob die Spammer die Daten aus dem Datenleck verwendet haben, war und ist die Verunsicherung bei vielen Nutzern groß.

Die sechs Millionen Datensätze stammen übrigens nicht aus einem neuen Whatsapp-Leak aus dem Jahr 2022, sondern sind Teil eines Datendiebstahls bei Facebook, der 2021 bekannt wurde und wohl bereits 2019 stattfand. Damals sollen Daten von rund 553 Millionen Facebook-Nutzern entwendet worden sein. Das sind mehr als 20 Prozent aller Facebook-Nutzer weltweit. Von den betroffenen Facebook-Nutzern wurden unter anderem folgende Daten gestohlen: Mailadresse, Geburtstag, Geschlecht, Arbeitgeber, geografischer Standort, Name, Telefonnummer und Beziehungsstatus.

Sind Sie vom Facebook-Leak betroffen?

Findige Anwaltskanzleien haben speziell für den Facebook- oder Whatsapp-Leak eine Suchmaschine entwickelt, die prüft, ob Ihre Telefonnummer betroffen ist. So bietet die Kanzlei "Wilde Beuger Solmecke" eine Abfrage unter https://www.wbs.legal/i/dl-facebook. Sollte Ihre Handynummer als Teil des Facebook-Leaks erkannt werden, bietet Ihnen die Kanzlei sofort an, für Sie 1000 Euro Schadensersatz von Facebook zu erstreiten.

Twitter-Datenleak: Namen, Mailadressen und Telefonnummern

Über 200 Millionen Twitter-Accounts sollen in diesem Paket stecken, das Anfang Januar in einem Hacker- Forum zum Kauf angeboten wurde. Eine kleine Kostprobe der Daten gibt es gratis.
Über 200 Millionen Twitter-Accounts sollen in diesem Paket stecken, das Anfang Januar in einem Hacker- Forum zum Kauf angeboten wurde. Eine kleine Kostprobe der Daten gibt es gratis.

Die Daten von mehr als 200 Millionen Twitter-Nutzern liegen in Untergrundforen. Sie stammen unter anderem aus einer früheren Schwachstelle in der Twitter-API und sollen Ende 2021 gestohlen worden sein. Unter den erbeuteten Daten sollen sich unter anderem Kontennamen, Telefonnummern und Mailadressen befinden. Das ist besonders ist für Nutzer tragisch, die Twitter anonym nutzen und auf diese Anonymität angewiesen sind. Um herauszufinden, ob Ihre Daten Teil der Hehlerware sind, verwenden Sie eine Spezialsuchmaschine wie Have I been pwned.