Uptime Global Data Center Survey 2022

Ausfall-Teuerung trifft Knowhow-Defizit

22.09.2022
Von 
Ann schreibt unter anderem für unsere US-Schwesterpublikation Infoworld.com.
Betreiber und Nutzer von Rechenzentren sind aktuell und in Zukunft mit zahlreichen, kostenintensiven Herausforderungen konfrontiert. Das verdeutlicht ein Blick auf eine aktuelle Studie des Uptime Institute.
Ausfälle im Rechenzentrum werden immer teurer, das Personal knapper. Doch die aktuelle "Global Data Center Survey 2022" des Uptime Institute hält auch (ein paar) gute Nachrichten bereit.
Ausfälle im Rechenzentrum werden immer teurer, das Personal knapper. Doch die aktuelle "Global Data Center Survey 2022" des Uptime Institute hält auch (ein paar) gute Nachrichten bereit.
Foto: Svitlana Hulko - shutterstock.com

Im Rahmen seiner aktuellen "Global Data Center Survey 2022" hat das Uptime Institute weltweit 1.500 Rechenzentrumsbesitzer, -betreiber, -zulieferer, -designer und -berater befragt. Die Studie soll Datacenter-Trends in Bezug auf Kapazität, Technologieeinsatz und Personalausstattung aufzeigen. Zu den zentralen Erkenntnissen zählen dabei:

  • Die Widerstandsfähigkeit der physischen Rechenzentrumsinfrastruktur zu verbessern, steht bei vielen Unternehmen auf dem Zettel - auch um immer kostspieligere Ausfälle zu vermeiden.

  • Eine wesentliche Herausforderung ist es dabei, qualifizierte Mitarbeiter auf einem heiß umkämpften Arbeitsmarkt zu rekrutieren.

  • Die Erfassung von Umweltkennzahlen wird vielerorts stiefmütterlich behandelt, trotz der sich abzeichnenden Nachhaltigkeitsanforderungen an Unternehmen.

Im Folgenden haben wir die Ergebnisse der Studie für Sie zusammengefasst.

Server-Aktualisierungszyklen werden länger

Das Uptime Institute hat aber auch gute Nachrichten: Die Lebensdauer von Servern nimmt laut der Studie zu und übersteigt oft die von den Herstellern empfohlene Laufzeit (drei bis fünf Jahre). Im Jahr 2022 gaben 52 Prozent der Befragten an, ähnlich wie Microsoft ihre Server fünf Jahre oder länger in Betrieb zu halten. Zum Vergleich: 2015 lag dieser Wert noch bei 34 Prozent.

Ursächlich für diesen Anstieg sind laut Uptime mehrere Gründe, die Verfügbarkeit von Halbleitern ist ein Faktor. Die Verknappung von Bauteilen habe zu höheren Preisen und längeren Lieferzeiten geführt. Kleinere Unternehmen mit geringerer Kaufkraft seien oft gezwungen gewesen, auf nicht unbedingt notwendige Upgrades zu verzichten, so die Studienautoren.

Der Trend könnte auch auf eine Verlangsamung der Effizienzsteigerungen bei Servern hindeuten: Neue IT-Hardware verbessere zwar in der Regel die Effizienz von Rechenzentren, aber diese Anreize ließen nach. Generationswechsel, insbesondere bei Intel-basierten Servern, die den Großteil des Marktes ausmachen, führten zu deutlich geringeren Leistungs- und Energieverbesserungen als früher, meinen die Marktforscher und konstatieren: "Das Angebot an effizienteren Servern mit alternativen AMD- und ARM-basierten Prozessoren ist nach wie vor begrenzt."

Kosten für Datacenter-Ausfälle steigen

Daneben fördert die Studie einige ermutigende Kennzahlen zu Ausfällen in Rechenzentren zutage. Allerdings warnen die Experten des Uptime Institute davor, diese falsch zu interpretieren:

  • Im Allgemeinen zeigt die Untersuchung von Uptime eine stete Verbesserung, wenn es um die Zahl der Ausfälle pro Standort geht. Im Jahr 2022 geben 60 Prozent der befragten Rechenzentrumsbetreiber an, in den letzten drei Jahren von einem Ausfall betroffen gewesen zu sein. Im Jahr 2020 lag dieser Anteil noch bei 78 Prozent.

  • Ein weiterer positiver Aspekt: Es wurden weniger schwere oder schwerwiegende Ausfälle in Rechenzentren gemeldet. Historisch gesehen machen schwerwiegende Ausfälle laut Uptime etwa 20 Prozent aller Ausfälle aus. Im Jahr 2022 sank dieser Anteil auf 14 Prozent.

Trotz der geringeren Anzahl von Ausfällen pro Standort und der weniger häufigen, schweren Ausfälle ist die Gesamtzahl der Ausfälle weltweit im Vergleich zum Vorjahr gestiegen. Positiv anzumerken ist an dieser Stelle, dass die Häufigkeit der Ausfälle nicht so schnell zunahm wie die globale Auslastung der Rechenzentren.

Auch wenn es schwierig ist, Kennzahlen zu Ausfällen zu interpretieren, ist ein Trend laut Uptime eindeutig: Die Ausfälle werden immer teurer. Insbesondere die Zahl der Outages, die mehr als eine Million Dollar kosten, steigt:

  • Auf die Frage nach den Kosten ihres letzten Ausfalls gaben 25 Prozent der Befragten an, dieser habe mehr als eine Million Dollar an direkten und indirekten Kosten verursacht. Das ist ein deutlicher Anstieg gegenüber dem Jahr 2021, als lediglich 15 Prozent der Teilnehmer über Ausfälle dieser Größenordnung berichteten.

  • Weitere 45 Prozent der Befragten gaben 2022 an, ihr jüngster Ausfall habe zwischen 100.000 und einer Million Dollar gekostet - verglichen mit 47 Prozent im Jahr 2021.

Die Studienautoren sehen für diese Entwicklungen diverse Gründe: "Das kann auf eine Vielzahl von Faktoren zurückgeführt werden, die von Inflation und Geldstrafen über Verstöße gegen Service-Level-Agreements bis hin zu den Kosten für Arbeitseinsätze und Ersatzteile reichen. Der Ausfall eines kritischen IT-Dienstes schlägt sich oft direkt und unmittelbar in einer Unterbrechung der Geschäftstätigkeit und in Umsatzeinbußen nieder."

Laut Uptime sind Probleme mit der Stromversorgung mit großem Abstand nach wie vor die Hauptursache für massive Outages, zumindest gaben 44 Prozent der Befragten dies als Grund für den letzten schwerwiegenden Vorfall in ihrem Unternehmen an. Die zweithäufigste Ausfallursache waren laut der Studie Netzwerkprobleme - 14 Prozent der Studienteilnehmer hatten damit zu kämpfen. Weitere nennenswerte Ursachen waren:

  • Ausfälle der Kühlung (13 Prozent),

  • IT-Systemprobleme (13 Prozent) und

  • Probleme bei Drittanbietern wie SaaS-, Hosting- und Cloud-Providern (8 Prozent).

Multiple Cloud-Backup-Versäumnisse

Auch an der Cloud-Front gibt es gemischte Botschaften. Auf der einen Seite werden Unternehmen immer zuversichtlicher, was die Nutzung der Cloud für unternehmenskritische Workloads angeht. Im Jahr 2019 gaben 74 Prozent der Befragten an, geschäftskritische Workloads nicht in der Public Cloud unterbringen zu wollen. Im Jahr 2022 ist dieser Anteil auf 63 Prozent gesunken. Gleichzeitig stieg der Prozentsatz derjenigen, die davon überzeugt sind mit den bereitgestellten Services einen ausreichenden Einblick in die Ausfallsicherheit zu bekommen, von 14 auf 21 Prozent.

"Andere Daten deuten jedoch darauf hin, dass das Vertrauen der Cloud-Benutzer möglicherweise unangebracht ist", schränken die Studienautoren ein. Das Problem seien die Verfügbarkeitszonen: Eine solche verfüge in der Regel über eine redundante Stromversorgung und ein redundantes Netzwerk. Cloud-Anbieter würden den Benutzern zwar empfehlen, ihre Workloads über mehrere Verfügbarkeitszonen zu verteilen. Allerdings zeigten die Daten, dass die Anwenderunternehmen das nicht so sorgfältig erledigten, wie es angebracht wäre.

Auf die Frage nach den möglichen Auswirkungen eines Ausfalls eines primären Cloud-Anbieters in einer einzigen Verfügbarkeitszone gaben 35 Prozent der Befragten an, dass erhebliche Performance-Probleme oder Ausfallzeiten die Folge wären. Weitere 49 Prozent erwarten zumindest geringfügige Leistungsprobleme oder Ausfallzeiten.

"Dies stellt einen klaren Widerspruch dar", kommentieren die Uptime-Experten. "Die Nutzer scheinen zuversichtlicher zu sein, dass die Cloud geschäftskritische Workloads stemmen kann und doch entwickelt mehr als ein Drittel Anwendungen, die für relativ häufige Ausfälle in Verfügbarkeitszonen anfällig sind."

Rechenzentrums-Personalprobleme verschärfen sich

Weil die Zahl und Größe der Rechenzentren weltweit weiter zunehme, steige auch die Zahl der offenen Stellen und übertreffe die Personalbeschaffungsbemühungen der Unternehmen, schreiben die Analysten. Sie gehen davon aus, dass der weltweite Personalbedarf von etwa zwei Millionen Vollzeitbeschäftigten im Jahr 2019 auf fast 2,3 Millionen im Jahr 2025 steigen wird.

"Der Personalmangel betrifft fast alle Berufe im Rechenzentrum weltweit. In gesättigten Datacenter-Märkten wie USA und Westeuropa altert ein Großteil der bestehenden Belegschaft. Viele Fachleute werden voraussichtlich etwa zur gleichen Zeit in den Ruhestand gehen, so dass im Bereich Datacenter ein Personal- und Knowhow-Defizit entsteht. Die Einstellungsbemühungen werden oft auch dadurch zunichte gemacht, dass die Branche unter Jobsuchenden kaum bekannt ist. Die Bemühungen, die Talent-Pipelines durch die Gewinnung von Quereinsteigern für die Rechenzentrumsbranche zu stärken, stecken noch in den Kinderschuhen", heißt es im Bericht.

53 Prozent der RZ-Betreiber gaben im Rahmen der Studie an, dass sie Schwierigkeiten bei der Suche nach qualifizierten Mitarbeitern im Jahr 2022 hätten - gegenüber 47 Prozent im Jahr 2021 und 38 Prozent im Jahr 2018. Darüber hinaus berichteten 42 Prozent von Problemen hinsichtlich der Abwerbung von Mitarbeitern, in den meisten Fällen von Wettbewerbern. Gegenüber dem Wert von 17 Prozent aus dem Jahr 2018 bedeutet das einen drastischen Anstieg.

Umweltdaten unzureichend erfasst

Die Mehrheit der Studienteilnehmer gibt an, über den Gesamtstromverbrauch des Rechenzentrums und die Stromverbrauchseffektivität (PUE) zu reporten, kritische Umweltkennzahlen werden jedoch weiterhin vielerorts nicht erfasst.

Dabei gehen 63 Prozent der Datacenter-Betreiber davon aus, dass sie demnächst dazu verpflichtet werden, über ihre Emissionen Rechenschaft abzulegen. In vielen Fällen sind sie jedoch nicht darauf vorbereitet: Nur 37 Prozent erfassen und melden Daten zu CO2-Emissionen (gegenüber 33 Prozent im Jahr 2021). Ebenfalls nur 39 Prozent melden derzeit ihren Wasserverbrauch (gegenüber 51 Prozent im Jahr 2021).

"Neue Gesetze, Standards und Anforderungen werden die Betreiber dazu zwingen, diese Lücken zu schließen und in den kommenden Jahren strengere Verfahren in Sachen Nachhaltigkeit und Berichterstattung einzuführen", prophezeien die Analysten von Uptime. (fm)

Dieser Beitrag basiert auf einem Artikel unserer US-Schwesterpublikation Network World.