Federation Business Data Lake

EMC stellt flexible Big-Data-Analytics-Plattform vor

24.03.2015
Von 
Bernhard Haluschak war bis Anfang 2019 Redakteur bei der IDG Business Media GmbH. Der Dipl. Ing. FH der Elektrotechnik / Informationsverarbeitung blickt auf langjährige Erfahrungen im Server-, Storage- und Netzwerk-Umfeld und im Bereich neuer Technologien zurück. Vor seiner Fachredakteurslaufbahn arbeitete er in Entwicklungslabors, in der Qualitätssicherung sowie als Laboringenieur in namhaften Unternehmen.
Mit der neu vorgestellten Plattform Federation Business Data Lake will EMC Unternehmen die Analyse von großen Datenmengen erleichtern. Das System beinhaltet Technologien von Pivotal, VMware und hauseigene Informationsinfrastrukturen.

Der Vorteil des integrierten Systems liegt drin, das es schnell und automatisch sogenannte Data Lakes einrichten kann. Die Business Data Lakes von EMC bestehen aus Speicher- und Analysewerkzeugen sowie rieseigen Mengen an strukturierten und unstrukturierten Daten aus verschiedenen Quellen. Die Hauptaufgabe von Federation Business Data Lake ist es, diese Datenmengen zu analysieren und Vorhersagemodelle zu erstellen, um die aktuellen Geschäftsprozesse an die künftigen Entwicklungen anzupassen oder neue Geschäftsmodell zu kreieren.

Der Hersteller verspricht mit dieser Technologie, dass betriebsbereite Umgebungen für die Echtzeitanalyse auf Basis von Hadoop in nur sieben Tagen nutzbar sind. Laut Hersteller ist die Analyse-Ebene des Federation-Business-Data-Lake-Modells mittels vBlock-Technologie von VMware virtualisiert. So lässt sich das System für bestimmte Anwendungsszenarien automatisch provisionieren und konfigurieren. Die Storage-Einheit beziehungsweise die Storage-Arrays basiert auf der Scale-out-Speicherproduktserie Isilon von EMC. Die Basis der Analyse-Ebene besteht aus der Big Data Suite von Pivotal. Sie beinhaltet die Big-Data-Analyseplattform PivotalHD mit vorkonfigurierter Integration in Pivotal HAWQ sowie ein MPP-basiertes natives analytisches SQL-Modul für die analytische Verarbeitung von strukturierten Daten in Hadoop. Das ermöglicht die Integration in Analyse-Plattformen wie SAS oder Tableau.

Darüber hinaus hat EMC zwei weitere Business Data Lakes angekündigt. Sie sollen die Hadoop-Distributionen von Cloudera und Hortonworks sowie die Hadoop-Distributionen auf Grundlage der Open Data Platform unterstützen. Nach Angaben von EMC wird der Federation Business Data Lake ab April 2015 verfügbar sein. Zusätzlich offeriert der Hersteller ein umfangreiches Dienstleistungs- und Trainingsprogramm rund um Federation Business Data Lake an.