Warum Londons Metro ausfällt
Zwischen Paddington und der Farringdon Street entstand im Jahr 1863 in London die weltweit erste U-Bahn. Und bis heute ist es eines der geschäftigsten Metro-Netzwerke der Welt: Jeden Morgen durchfahren 538 Züge 270 Stationen - für 2018 rechnet die Stadt mit 1,4 Milliarden Fahrten über 86 Millionen Kilometer. Das wären knapp 110 Trips von der Erde zum Mond - und zurück.
Die zum Teil noch aus viktorianischen Zeiten stammende Infrastruktur und die alternden Züge die darauf unterwegs sind, erfordern regelmäßige Wartung, um den Reisefluss in Gang zu halten. Das Problem: Die Hälfte aller Verspätungen bei der Londoner U-Bahn sind auf Probleme mit den TfL-Assets zurück zu führen. Die Kosten für die Wartung dieser Assets belaufen sich auf satte 59 Prozent des Gesamtbudgets der TfL.
Dabei können auch externe Faktoren zu Service-Ausfällen führen: Ein Data-Science-Projekt förderte einen klaren Zusammenhang zwischen U-Bahn-Ausfällen und den Wetterverhältnissen zu Tage.
Die Datenwissenschaftler spielten zunächst mit dem Gedanken, mit einem übergreifenden Modell für die Ausfallwahrscheinlichkeit aller Systeme zu arbeiten, entschieden sich dann aber dafür, zu untersuchen, wie individuelle Komponenten von Subsystemen mit verschiedenen Auffälligkeiten korrelieren. Das Ergebnis: Eine "heatmap", die über die Auswirkungen eines System- oder Komponentenausfalls in sämtlichen anderen Bereichen Aufschluss gibt. Dabei zeigte sich, dass insbesondere zu hohe oder zu niedrige Temperaturen zu Ausfällen führen. Die Wissenschaftler leiteten die Daten, beziehungsweise Erkenntnisse, an die Stakeholder weiter, um deren Entscheidungsprozess bezüglich Wartung und Upgrades zu unterstützen.
Londoner U-Bahn-Wartungsfragen
Um die Gründe für die Ausfälle verstehen zu können, analysierten die Datenwissenschaftler eingehend alle verfügbaren Datensätze zu Assets, Ausfällen, Wartung, Service und externen Faktoren. Dabei nahmen sie insbesondere auch die Auswirkungen der jeweiligen Ausfälle unter die Lupe. "Das gibt uns einen Überblick über die Auswirkungen der verschiedenen Faktoren. Diese können wir anschließend vergleichen, um Wege zu finden, diese zu umgehen", erklärt Data Scientist Tsiotsios.
Zu den Herausforderungen ihres Tuns zählen Informationssilos, unvollständige Datenund Zeitlimits. TfL betreibt darüber hinaus kritische Infrastrukturen, weswegen die Data Scientists mit verschiedenen Abteilungen zusammenarbeiten und dabei effektives Zeitmanagement an den Tag legen müssen.
Die Wartungsentscheidungen, die die Mitarbeiter treffen, müssen Instandhaltungskosten und Ausfälle minimieren. Die Wartung selbst könnte dabei in bestimmten Zeitabständen - etwa basierend auf Laufleistung oder -zeit - erfolgen. Das würde allerdings entweder zu übermäßigen oder unzureichenden Wartungsintervallen führen. Die Data Scientists hielten es daher für die bessere Option, die historischen Ausfall- und Wartungsdaten zu analysieren, um die Wahrscheinlichkeit von Ausfällen einschätzen zu können. Danach konnten die Kosten für einen Wartungsvorgang identifiziert und eine durchschnittliche, wirtschaftlich günstige Wartungsfrequenz festgelegt werden. "Die Frage ist: Wie schaffen wir es, einen Ausfall für einen spezifischen Systemtyp vorherzusagen", sagt Tsiotsios.
Reibungsloser Verkehr im Untergrund
Die prädiktive Wartung bei TfL wird möglich durch die Analyse von Monitoring-Daten, die das Unternehmen bereits erfasst. So überwachen Sensoren einige Assets permanent, geben Auskunft über deren Zustand und erkennen, wenn ein "Ereignis" bevorsteht. Von diesen Ereignissen gibt es hunderte: Das Schließen einer Zugtür beispielsweise oder die Vorbeifahrt eines Zuges mit einer bestimmten Geschwindigkeit. Wenn eine Zugtür beispielsweise ausfällt, werden zuvor Symptome sichtbar, die auf den baldigen Ausfall hinweisen.
"Die Idee ist, dass bestimmte Ereignismuster Hinweise auf bevorstehende Ausfälle geben", erklärt Tsiotsios. "Mit anderen Worten: Die Ereignisse vor einem Ausfall sollten sich signifikant von denen unterscheiden, die im normalen, gesunden Betrieb auftauchen."
Um alle anfallenden Daten in Form zu bringen, haben die Data Scientists einen "Machine Learning Classifier" konstruiert, der zwischen den einzelnen Verhaltensmustern unterscheiden kann. Ein Algorithmus bewertet anschließend die Verhaltensmuster und gibt Auskunft darüber, ob mit einem Ausfall zu rechnen ist. Neben bevorstehenden Ausfällen erkennt das Machine-Learning-Modell auch einzelne Assets, die demnächst für Probleme sorgen könnten. Diese können dann - bevor es zum Stillstand kommt - überprüft und gewartet werden.
TfL hat einige Data-Analytics-Experimente an den Start gebracht, um den U-Bahn-Service Londons auf Vordermann zu bringen. Ein weiteres Projekt soll künftig etwa Fehlfunktionen der U-Bahn-Türen verhindern, ein anderes beschäftigt sich mit der durchgängigen Erhöhung der Datenqualität. Denn die Datensätze bei TfL sind oft unvollständig oder nicht korrekt. Deshalb arbeiten Datenwissenschaftler und Ingenieure Hand in Hand: "Unser Ziel ist nicht, ein Machine-Learning-Tool zu entwickeln, das uns per Automatisierung die Arbeit abnimmt. Wir wollen das Wissen unserer Ingenieure nicht durch ein Tool ersetzen, das fehleranfällig ist. Stattdessen wollen wir ein Qualitätssicherungs-Tool schaffen, das die Datenqualität nach oben treibt und fehlerhafte Datensätze automatisch erkennt. Nur so können wir einen Prozess schaffen, der für eine kontinuierliche Verbesserung sorgt."
Dieser Artikel basiert auf einem Beitrag unserer UK-Schwesterpublikation Computerworld.