Big Data im Internet of Things (IoT)

Die IoT-Datenflut mit "Vergessen" bekämpfen

19.04.2016
Von 
Harald Weiss ist Fachjournalist in New York und Mitglied bei New York Reporters.
Immer mehr Geräte werden mit immer mehr Sensoren ausgestattet. Die Folge: Die Datenberge des IoT erreichen astronomische Dimensionen - Big Data ist fast schon eine Verharmlosung. Doch es zeichnen sich neue Lösungswege ab; beispielsweise "kontrolliertes Vergessen".
Eine Boeing 787 erzeugt pro Flug etwa ein halbes Terabyte an Daten - mit IoT kommen also Unmengen auf die IT zu.
Eine Boeing 787 erzeugt pro Flug etwa ein halbes Terabyte an Daten - mit IoT kommen also Unmengen auf die IT zu.
Foto: Boeing

Der Geschäftsnutzen von IoT steht außer Frage. Siemens setzt etwa unzählige Sensoren in seinen Schienen-Fahrzeugen ein, um Muster zur Früherkennung von Schäden und Ausfällen ablesen zu können. Das führte bereits zu neuen Geschäftsmodellen, denn zusätzlich zu den eigentlichen Zügen kann Siemens jetzt auch eine feste Mindestbetriebszeit garantieren. Für den Kunden bedeutet das höhere Zuverlässigkeit - für Siemens eröffnen sich damit ganz neue Geschäftsfelder.

Wertschätzung von Daten

Doch eines der IoT-Probleme sind die anfallenden Datenberge. Eine Boeing 787 erzeugt pro Flug ungefähr ein halbes Terabyte an Daten. Multipliziert man das mit der Zahl der Flugzeuge und Flüge, erkennt man schnell, welche gewaltigen Datenmengen hier übertragen, verarbeitet, gespeichert und archiviert werden müssen. Doch es zeichnen sich neue Architekturen ab, mit denen die Daten "dynamisch" aufgenommen und verwaltet werden. Das heißt, nicht alle Daten sind in ihrer Bedeutung gleich. Bestimmte Daten sind vielleicht mehr, andere weniger wertvoll. Und diese Wertschätzung ist dynamisch - ändert sich also über der Zeit. Dazu ein Beispiel. Wenn ein Auto mit seiner automatischen Einparkfunktion eine Parklücke ansteuert, können einige Gigabyte an Daten anfallen. Bis zum Abschluss des Einpark-Manövers sind alle diese Daten gleichwertig hoch einzustufen. Doch nach dem erfolgreichen Einparken, bei dem es keine Beulen und Kratzer gab, reicht ein Logbucheintrag: "Startzeit, Aktion: Einparken, Endzeit." Der Rest an Daten ist bedeutungslos geworden.

Aufbewahren nur für besondere Anlässe

Ein IoT-Business-Idee: Predictive Maintenance von Siemens-Zügen.
Ein IoT-Business-Idee: Predictive Maintenance von Siemens-Zügen.
Foto: S-F - shutterstock.com

Völlig anders sieht es dagegen aus, wenn es eine Beule gegeben hat. Dann sind möglicherweise sogar noch weitere Daten, wie Wetter oder verschiedene Unfallbilder hinzuzufügen. Natürlich gibt es noch andere Ausnahmen. Beispielsweise, wenn es darum geht, die zugehörige Software zu analysieren und zu verbessern. In diesem Fall sind alle Daten für die Evaluierung aufzuheben. Doch auch hier spielt der Faktor Zeit eine wichtige Rolle. Sobald die Software-Arbeiten abgeschlossen sind, haben die zugehörigen Daten nur noch einen dokumentarischen Wert und können nach Ablauf einer Karenzzeit komplett gelöscht werden. Das ist genau das Vorgehen, mit dem man den IoT-Datenbergen wirksam begegnen kann.

IoT ist bei der IT nicht unbedingt willkommen

Trotzdem werden auch nach einem "kontrollierten Vergessen" noch viele Terabytes übrig bleiben. Insofern kommt die IT nicht umhin auch neue Methoden für die Erfassung, Übertragung, Speicherung und Auswertung der IoT-Daten einzuführen. Das ist deshalb so wichtig, weil häufig erst durch die Verknüpfung verschiedener Datenquellen neue Erkenntnisse gewonnen werden. Technisch sind solche Auswertungen nicht trivial, denn die Daten aus verschiedenen Quellen unterscheiden sich meistens auch im Format und im Datentyp. "IoT ist eine großartige Sache, aber die IT-Verantwortlichen werden diese neue Welt nicht uneingeschränkt willkommen heißen", meint Teradatas Industrie-Experte Michael Gerstlauer.

Mit dedizierten Plattformen gegen die Komplexität

Festo CP Factory 16:9
Festo CP Factory 16:9
Foto: Festo

Um dieses Problem zumindest teilweise zu lösen haben die Anbieter verschiedene spezielle IoT-Plattformen geschaffen. Hier sind vor allem die klassischen Datawarehouse-Anbieter aktiv, denn sie sehen bei IoT viele neue Anwendungen und stellen sich mehr und mehr darauf ein. Gerstlauer verweist in diesem Zusammenhang auf Teradatas "Listener". Dieses Programm verfolgt Datenströme aus verschiedenen IoT-Quellen, nimmt sie kontinuierlich auf und verteilt sie an die jeweils geeignete Plattform innerhalb einer Analyseumgebung. Im Anschluss können diese IoT-Daten dann über das Datawarehouse, Hadoop oder Teradatas Aster in gewohnter Weise analysiert werden.

Auch die Cloud-Anbieter drängen mit "Shared-Infrastructure" in diesen Markt. Salesforce setzt hier stark auf Kooperationen, beispielsweise mit GE oder Philips. Amazon und IBM bieten ebenfalls entsprechende IoT-Cloud-Plattformen an. Die Nutzung solcher vordefinierten Plattformen vereinfacht nicht nur die Einführung von IoT-Lösungen - es macht sie auch billiger.

OpenSource: Weniger Kosten - mehr Komplexität

Wer dagegen weiterhin lieber alles On-Premise betreiben will und dabei auf die Kosten schaut, für den könnten die OpenSource-Angebote von Interesse sein. Doch Vorsicht ist geboten. Nicht das was oberflächlich gleich aussieht, ist wirklich gleichwertig. "Wer MapR und Hortonworks unter die Lupe nimmt, erkennt ganz schnell, dass ihre Eigenschaften nicht identisch sind. Aus diesem Grund fahren wir im Hadoop-Umfeld einen agnostischen Ansatz, das heißt, bestimmte Hadoop-Releases eignen sich nur für bestimmte Aufgaben", sagt Gerstlauer über die OpenSource-Unterstützung von Teradata. Hinzu kommt das Wartungsproblem bei OpenSource. "Viele IT-Abteilungen sind nicht in der Lage, sich mit den ständigen Updates zu befassen, die es bei OpenSource gibt", beschreibt Gerstlauer die negativen Seiten der freien Software.