Cloud und Failover-Strategien

Was IT-Entscheider aus dem AWS-Ausfall lernen sollten

16.12.2021

Steven J. Vaughan-Nichols schreibt für unsere US-Schwesterpublikation Computerworld. Er beschäftigte sich bereits mit Business und Technologie als 300bps noch Highspeed war.

Alle Posts des Autors

Ein AWS-Ausfall legte tausende Unternehmen an der Ostküste der USA lahm. Wir zeigen, wie sich Firmen gegen solche Ausfälle wappnen können.

Der AWS-Ausfall Anfang Dezember zeigte deutlich, wie sehr wir alle - egal ob Consumer oder Business - mittlerweile von der Cloud abhängig sind. Doch wie kann man sich vor den Folgen solcher Ausfälle schützen?
Foto: Emilia Dragomir - shutterstock.com

Die Probleme von Amazon Web Services (AWS) Anfang Dezember mit APIs in der Region US-East-1 führte vielen Amerikanern und Kanadiern drastisch vor Augen, wie sehr alle auf AWS angewiesen sind. Selbst Consumer, die noch nie etwas von AWS gehört hatten, waren plötzlich betroffen, weil Disney+ und Netflix nicht mehr funktionierten, der Roomba-Saugroboter den Dienst quittierte, oder die intelligente Lampe einfach dunkel blieb.

Noch härter traf es viele Unternehmen, die für ihren IT-Betrieb auf AWS angewiesen sind. Oder die feststellen mussten, dass sie selbst zwar keine Geschäftsbeziehung zu AWS haben, aber viele ihrer Services - etwa Trello, Smartsheet, Slack etc. - die sie nutzen, nicht mehr funktionierten, weil sie auf AWS basieren.

Lehren aus der AWS-Panne

Doch welche Lehren sollten wir aus dem Vorfall ziehen? Im privaten Umfeld ist das noch einfach: Wir sollten aufhören, uns auf so viele IoT-Devices zu verlassen. Müssen Geschirrspüler, Weihnachtsbeleuchtung, Kühlschrank und Zahnbürste wirklich von der Cloud abhängig sein? Anders sieht es im Business-Umfeld aus. Der Gedanke, dass die IT-Abteilung wieder alle ihre Server selbst betreibt, wird ein frommer Wunsch bleiben. Ein einfacher Vergleich zwischen damals und heute zeigt, wie absurd diese Idee ist.

Und egal, was das C-Level-Management will, die IT kann nicht etwas zum Laufen bringen, das außerhalb ihrer Kontrolle liegt. Zumal es einen Grund gibt, warum jetzt vieles oder alles in der Cloud läuft: In der Regel kostet es weniger, als entsprechende Services On-Premises zu betreiben. Zumal die Downtime in der Cloud bislang sicher geringer war als die der eigenen IT.

Multi-Cloud als Ausfallschutz?

Doch was tun, um Problemen wie dem ASW-Ausfall vorzubeugen? Könnte ein Wechsel zu einer Multi-Cloud-Konfiguration die Lösung sein? In der Theorie vielleicht, aber dazu wären mindestens zwei öffentliche Cloud-Anbieter und möglicherweise ein eigenesRechenzentrum erforderlich. Das wird sehr, sehr teuer. Zudem werden Multi-Clouds als Sicherheitsnetz gegen Ausfälle wie den von AWS nicht funktionieren, davon ist Lydia Leong, Gartner Distinguished VP Analyst, überzeugt.

Oder wie sie es ausdrückt: "Multi-Cloud-Failover erfordert eine vollständige Portabilität zwischen zwei Anbietern. Dies stellt eine enorme Belastung für die Entwickler dar. Die grundlegende Compute-Runtime (ob VMs oder Container) ist dabei nicht das Problem, so dass 'Ich kann meine Container verschieben'-Lösungen von OpenShift, Anthos oder anderen nicht wirklich helfen." Das Problem seien all die Unterscheidungsmerkmale, so Leong, die unterschiedlichen Netzwerkarchitekturen und -funktionen, die unterschiedlichen Speicherkapazitäten, die proprietären PaaS-Funktionen, die völlig unterschiedlichen Sicherheitsfunktionen etc.

Tipps gegen Cloud-Ausfall

Doch genug lamentiert. Gartner-Analystin Leong ist überzeugt, dass es durchaus gelingen kann, ein Unternehmen am Laufen zu halten, selbst wenn die primäre Cloud ausfällt. Hierzu hat sie zwei Tipps auf Lager:

Unternehmen sollten ihre aktiven Anwendungen in mindestens zwei, besser drei Availability Zones (AZ) in jeder von ihnen genutzten Region betreiben. Sicher: Drei sind viel schwieriger zu erreichen als zwei AZs, aber dies ist immer noch einfacher als der Versuch, eine Multi-Cloud-Failover-Lösung aufzubauen.
Ferner sollten die aktiven Anwendungen in mindestens zwei, besser drei Regionen betrieben werden. Auch hier gilt: Zwei sind viel einfacher als drei, aber wenn eine geschäftskritische Anwendung wirklich geschäftskritisch ist, kann es die Mühe wert sein. Falls das nicht realisierbar ist, könnte ein schnelles und vollautomatisches regionales Failover eine Option sein - unter der Voraussetzung, dass ein Unternehmen dazu bereit ist, für eine solchen Dienst zu bezahlen.

Aktuelle IDG-Studien

An der Cloud Readiness und Bereitschaft zum Wandel der Unternehmen hierzulande gibt es keine Zweifel mehr. Die Transformation ist in vollem Gange.

Mehr zur Studie erfahren
Der Schutz vor Ransomware hat hohe Priorität, doch die ergriffenen Maßnahmen greifen zu kurz. Alles dazu in unserer Studie.

Mehr zur Studie erfahren
Das Gros der ERP-Anwender setzt mittlerweile auf SAP S/4HANA, um digital zu transformieren und Wettbewerbsvorteile zu erschließen. Mehr in der Studie.

Mehr zur Studie erfahren
Seit der Einführung von ChatGPT beherrscht kein anderes IT-Thema so die Schlagzeilen wie (generative) künstliche Intelligenz. Wir schauen auf Einsatzszenarien, Hintergründe und Folgen.

Mehr zur Studie erfahren
Der Einsatz von No-/Low-Code boomt. Lange dauert es wohl nicht mehr, bis Software-Entwicklung und Prozessmodellierung via grafischer UI das klassische Coding überholen. Mehr in der Studie.

Mehr zur Studie erfahren
Unternehmen rüsten auf: Je komplexer die Gefährdungslage, desto stärker der Bedarf an Security Services. Dazu alles zu Cyberattacken und Gegenmaßnahmen.

Mehr zur Studie erfahren
Hybrid Work: Wer als Arbeitgeber für die jungen Generationen interessant und attraktiv sein will, darf nicht auf eine moderne IT-Infrastruktur und -Arbeitsumgebung verzichten. Mehr in der Studie.

Mehr zur Studie erfahren
Das datengesteurte Unternehmen - Realität oder Hirngespinst? Erst wenige Firmen schaffen es, mithilfe von Daten-Insights neue Geschäftsmodelle auf die Beine zu stellen. Mehr in der Studie.

Mehr zur Studie erfahren
Für knapp neun von zehn Unternehmen kommt künftig eine Migration in die Cloud ohne strategischen Ansatz nicht infrage. Trends und Zahlen rund ums Thema in unserer Studie.

Mehr zur Studie erfahren
Unternehmen wollen energieeffizienter und nachhaltiger werden. Dazu müssen sie aber noch ihre IT-Strategien anpassen und die notwendige Datenbasis schaffen. Mehr dazu in der Studie.

Mehr zur Studie erfahren