Splunk sammelt und indiziert Log- und Maschinendaten aus beliebigen Quellen, analysiert und visualisiert sie und hilft so, bessere Entscheidungen zu treffen. Der Hersteller spricht von "Operational Intelligence" und setzt unter anderem auf die Bereiche IT-Betrieb, IT-Sicherheit und Business Analytics als Einsatzfelder. Die Daten werden wahlweise in lokalen, in Cloud-basierten oder in hybriden Umgebungen gesammelt, verknüpft und auswertbar gemacht.
Wie das beim Car-Sharing-Dienst DriveNow geschieht, beschrieb Eduard Saller, Data Scientist bei der DriveNow-Mutter BMW Group. Das Kernproblem beim Carsharing: Die Fahrzeuge befinden sich oft nicht dort, wo ein Kunde gerade Bedarf hat. Unternehmen wie DriveNow müssen also Wege finden, um ihre Flotte so zu platzieren, dass die Auslastung optimal ist. Je intensiver ein Fahrzeug genutzt wird, desto höher die Rentabilität. Die Datenexperten von BMW haben sich deshalb vorgenommen, Kennzahlen zu beschaffen, um eine optimale Nutzung zu erreichen und teure Standzeiten zu verkürzen. Die Idee ist laut Saller bei einem betriebsinternen Hackathon entstanden.
Telemetriedaten als Basis
Im ersten Schritt entschied sich das Team, die Telemetriedaten - die Maschinendaten, die von den Autos selbst gesendet werden - zu monitoren. Dazu gehören insbesondere die via GPS ermittelten Positionsdaten eines Fahrzeugs, wenn es gebucht und wieder abgestellt wird, sowie eine "ganze Reihe weiterer Metadaten", wie Saller vor den rund 500 Besuchern der Splunk-Konferenz ausführte. "Wenn man nicht genug Daten gesammelt hat, kann man auch keine Machine-Learning-Ansätze verfolgen, weil einem die Masse fehlt", stellte Saller klar.
Das BMW-Team hat eine Anwendung entwickelt, die direkt auf der Splunk-Datenbank läuft und es erlaubt, Vorhersagen über den Bedarf der Fahrzeuge zu treffen. Neben den Fahrzeugdaten sollen künftig noch andere Quellen angezapft werden: Wetterdaten etwa helfen, jahreszeitliche Abweichungen einzukalkulieren, aber auch kurzfristig auf Hitzewellen und Regenperioden zu reagieren.
Event-Daten geben Aufschluss über bestimmte Peaks, wenn beispielsweise Fußballspiele oder Open-Air-Konzerte stattfinden. Auch Feiertage oder Ferienzeiten sollen einkalkuliert werden. In Großstädten gilt es zudem, die öffentlichen Verkehrsmittel zu berücksichtigen: Ist die Anbindung an den Personennahverkehr gut, sinkt der Bedarf an Carsharing-Autos.
Mit dem Machine-Learning-Toolkit von Splunk, das an die Datenbank des Herstellers angebunden ist, haben die BMW-Techniker ein Vorhersagemodell entwickelt, das sie nun trainieren können. Den Erhebungszeitraum, der für das Training herangezogen werden soll, legen die Datenspezialisten selbst fest. Wenn zum Beispiel eine überdurchschnittliche Hitzewelle auftritt, können die Trainingsdaten darauf abgestimmt werden, so dass nur die letzten zwei oder drei Wochen der Benutzung für die Vorhersage verwendet werden.
Wetter- und Event-Daten als Zugabe
Mit einem Live-Monitoring lässt sich der Zustand der Flotte permanent abbilden. Für den DriveNow-Case werden bislang nur die Maschinendaten der Fahrzeuge verwendet, keine Wetter-, Event- oder sonstigen Daten. Damit stützt sich die Analyse derzeit vor allem auf GPS-Daten: Wann und wo wurde das Fahrzeug bewegt? Grafiken und Heatmaps zeigen die Flottenbewegungen und simulieren künftige Entwicklungen recht genau. Man sieht beispielsweise, was an welchen Orten morgens und abends während des Berufsverkehrs passiert und wie der Bedarf sich ändert. Auch am Flughafen zeigt sich, wann Fahrzeuge gebraucht werden, weil der Flugverkehr am dichtesten ist.
"Wir haben jetzt also das schöne Datenmodell, wir speichern alle Maschinendaten in Splunk, wir haben ein Vorhersagemodell entworfen, und jetzt haben wir die Bedarfsvorhersage, die wir eigentlich wollten - aber was fangen wir jetzt mit all dem an?", fragte Saller rhetorisch. Tatsächlich sei die Zahl der Nutzungsszenarien schnell in die Höhe geschnellt. Einfache Maßnahmen mit großer Wirkung hätten schnell initiiert werden können: zum Beispiel die Fahrzeuge nach der Reinigung und Wartung an Orten mit einer hohen Nutzungswahrscheinlichkeit abzustellen.
Auch die Marketing-Abteilung profitierte, konnte sie doch jetzt gezielt Discount-Aktionen starten. "Wenn wir wissen, ein Fahrzeug steht in einem Bereich mit einem bereits gesättigten Bedarf, können wir den Nutzern gezielt einen Nachlass gewähren", so Saller. "Wir verteilen auch die Fahrzeuge besser über die ganze Stadt hinweg."
Außerdem könne BMW schon für die Welt des autonomen Fahrens trainieren: "Wir wollen natürlich alle gerne irgendwann dahin, dass sich die Fahrzeuge von allein in die perfekte Position bewegen. Das ist noch ein bisschen entfernt, aber wenn man schon weiß, wo die optimale Position ist, und die Möglichkeit hat, die Fahrzeuge dorthin zu bewegen, ist das sicher ein großer Vorteil. Auch die Ladestationen für elektrische Fahrzeuge könnten so optimal in der Stadt positioniert werden. "Das sind Erkenntnisse, auf die wir gar nicht abgezielt hatten. Aber andere Fachbereiche haben sich dann für diese Infos interessiert", sagt Saller.
Das Team überlege sich nun, wie die Applikation erweitert und verfeinert werden könne. Dazu gehöre vor allem, Wetter-, Verkehrs- und EventDaten hinzuzufügen. Außerdem gebe es nun eine datenbasierte Grundlage, um zu entscheiden, in welchen neuen Städten der Fahrdienst in welchem Ausmaß ausgebreitet werden kann. "Wir sind nicht mehr darauf angewiesen, zu schätzen oder externe Marktanalysen anfertigen zu lassen. Wir haben eine Datengrundlage", sagt Saller. "Wir können auch die Rentabilität des Dienstes schnell erhöhen, indem wir die Fahrzeugzahl einschränken und dabei den Kundenbedarf exakter abbilden."