Cloud-Desaster

Die schlimmsten Ausfälle der Cloud-Frühzeit

11.08.2019
Von 
JR Raphael ist freier Mitarbeiter bei der Computerworld.
Mittlerweile ist die Cloud allgegenwärtig. Doch sie birgt Risiken. Die zehn größten Cloud-Ausfälle aus der frühen Phase der Cloud sind der Beweis dafür.
Foto: Blackboard - shutterstock.com

Als Konzept birgt die Cloud viele Vorteile. Sie können die eigenen selbst verwalteten Server links liegen lassen und neuen Speicher in der Cloud mieten. Jemand anderes kümmert sich um den Server und hält diese am Laufen. Sie können Ihre Daten dorthin verstauen, wo Sie wollen. Das hat viele Privatanwender und Unternehmen überzeugt, die Cloud und darauf basierende Dienste sind mittlerweile allgegenwärtig. Insbesondere der Smartphone- und Tablet-Boom wäre ohne Clouddienste unvorstellbar,Doch Cloud Computing bringt auch Nachteile mit sich. Wenn Sie sich nicht mehr um die Instandhaltung kümmern müssen, verlieren Sie gleichzeitig einen Teil der Kontrollmöglichkeiten. Und die Sicherheitsbedenken sind nicht zu verachten. Aber all dies ist nichts im Vergleich zum schlimmsten möglichen Szenario: Wenn der Cloud-Service nicht mehr verfügbar ist. Das mussten im November 2017 auch die Nutzer von Homematic IP erleben.

Blick zurück zum Gruseln

Wir führen Ihnen die Risiken, die durch die Abhängigkeit von der Cloud entstehen, vor Augen, indem wir die größten Cloud-Ausfälle aus der Zeit kurz nach 2010 noch einmal zusammenfassen. Denn damals war die Cloud noch längst nicht so selbstverständlich wie heute und trotzdem hatten die Cloud-Ausfälle teilweise schlimme Folgen für die Betroffenen. Um wie viel schlimmer dürften sich ähnliche Ausfälle also heute auswirken...Die schlimmen Folgen eines Ausfalls von Cloud-Diensten können Ihnen zum Beispiel die Unternehmen bestätigen, die vom Ausfall von Amazons Web Service im April 2011 betroffen war: "Wir waren ganz schön durch den Wind", sagt Nick Francis, dessen Start-Up-Unternehmen gerade eine Woche vor Amazons Problem gestartet war. "Wir waren darauf überhaupt nicht vorbereitet."

Francis war nicht der einzige, der überrascht wurde. Große US-Unternehmen wie Reddit und Foursquare sind ausgefallen, als Amazons Cloud gestört war.

"Die Cloud wurde als magisches Ding vermarktet, das arbeitet und völlig verlässlich ist", sagt Lew Moorman, der Hauptstratege bei Rackspace, einen Cloud-Provider, der bereits mehrere Ausfälle durchlebt hat. "Die Wahrheit ist, dass das Kaufen von IT-Leistungen über die Cloud nur einen anderen Weg des Kaufens darstellt. Und IT selbst ist von sich aus fehlerhaft. Wenn Sie sichergehen wollen, dass diese Fehler Ihnen nicht schaden, dann müssen Sie im Voraus planen."

Amazons Web Service (AWS)

Die Befreiung von der lästigen Netzwerk-Instandhaltungsarbeit ist das Hauptverkaufsargument für die Cloud. Und der Nachteil? Sie können nur tatenlos und hilflos zusehen, wenn die Änderung der Routine-Konfiguration des Cloud-Betreibers Ihre Daten vernichtet.

Genau das haben viele AWS-Kunden im letzten April 2011 am eigenen Leib erfahren, als Amazons im US-Bundesstaat Nord Virginia gelegenes Datenzentrum einer Störung zum Opfer fiel und komplett nutzlos wurde.

Der Fehler begann während einer Netzwerkaktualisierung, als eine falsch eingestellte Traffic-Schaltung ein Cluster von Amazon EBS (Elastic Block Store) Datenträgern in einen Wiederspiegelungssturm sandte. Just in dem Augenblick, als nach einer verfügbaren Box gesucht wurde, in der eine Sicherheitskopie der Daten abgelegt werden sollte, sind die Daten verloren gegangen.

Das ist zumindest die Kurz-Version. Amazons vollständige Erklärung fällt dagegen sehr lange aus.

Die Probleme bestanden für etwa vier Tage. Aber während viele Unternehmen ins Straucheln gerieten, überstanden andere Unternehmen wie Netflix diesen Sturm unbeschadet: "Wir verlassen uns lieber auf SimpleDB, S3 und Cassandra Services, die von dem Ausfall nicht betroffen waren", schrieben die Netflix-Entwickler in deren Blog-Eintrag über "Die Lehren, die Netflix aus dem AWS-Ausfall gezogen hat". Zustandslose Services und mehrere redundante aktuelle Kopien von Daten, die über mehrere zugängliche Zonen verteilt waren, seien der Schlüssel zum Erfolg gewesen. Nur so konnte Netflix dem Cloud-Ausfall von AWS entgehen.

Sie denken, dass Ihr Unternehmen so groß wie Netflix sein muss, damit es sicher sein kann? Dann denken Sie noch einmal nach. Twilio, ein Unternehmen, das Entwicklern dabei hilft Kommunikationslösungen in deren Web-Anwendungen zu integrieren, nutzte Amazons EC2, um den Großteil der Infrastruktur zu hosten. Dennoch hatte der Ausfall im April wenig bis keinen Einfluss auf dessen Stabilität.

"Wenn Sie sich auf eine Cloud einlassen, müssen Sie annehmen, dass das Netzwerk Störungen haben wird", sagt Evan Cooke, der Mitbegründer von Twilio. "Wir haben eine Infrastruktur um die Idee herum gebaut, dass der Hoster versagen kann und irgendwann versagen wird. Also haben wir uns nicht auf eine einzige Maschine oder eine einzelne Komponente in der Hauptarchitektur verlassen."