Information Governance
Der Markt für Big-Data-Software ist jung, und die Anwendungsgebiete in Unternehmen werden noch sondiert und pilotiert. Unternehmen sollten die neuen Möglichkeiten von Big Data evaluieren. Sinnvoll ist es gleichzeitig, eine Information Governance zu einzuführen und vor allem zu leben. Das trägt entscheidend dazu bei, eine hohe Abfrage-Performance, eine gute Datenqualität und nicht zuletzt ein agiles BI-System zu erhalten. Am Ende ist das die Basis, um neue Ideen in der Peta- und Zettabyte-Welt umzusetzen. (hv)
Wesentliche Herausforderungen für Big Data
-
Geschäftsfälle zu identifizieren, die eine Big-Data-Initiative zweifelsfrei rechtfertigen, fällt derzeit noch schwer. Qualität und Nutzen der Analyseergebnisse sind oft kaum absehbar und quantifizierbar, auch aufgrund fehlender Erfahrungswerte am Markt.
-
Die Grenze zwischen Big-Data- und traditionellen BI- und Data-Warehouse-Szenarien ist fließend. Anwender sollten prüfen, was sie mit ihrer verfügbaren Infrastruktur und zu den gegenwärtigen Kosten erreichen können. Neuinvestitionen sind nicht immer nötig.
-
Eine Big-Data-Strategie kann als Erweiterung des BI-Fahrplans oder aber als völlig neue Aufstellung des Unternehmens definiert werden. Letzteres kann sinnvoll sein, wenn rund um den Produktionsfaktor Daten neue Wettbewerbsvorteile realisiert werden sollen.
-
Sollen poly-strukturierte Daten integriert und verarbeitet werden, gilt es, das Verfahren mit der klassischen Analytik strukturierter Daten zu kombinieren. Ein Datenaustausch muss konzeptionell, architektonisch und technisch realisiert werden.
-
Auf dem Arbeitsmarkt fehlt es an geeigneten Big-Data-Entwicklern und -Analysten. Gesucht werden neue Profile mit Programmier-Know-how und mathematisch-analytischen Fähigkeiten. Im englischen Sprachraum etabliert sich hierfür gerade das Berufsprofil des "Data Scientist". Hauptaufgaben auf der technischen Seite sind die Integration und Analyse der poly-strukturierten Daten unter anderem durch die Anwendung von MapReduce-Programmier-Frameworks. Nicht zu unterschätzen ist auch die Visualisierung der "Massen"-Daten, für die Darstellungsformen der klassischen BI-Welt nicht geeignet sind.
-
Datenschutz und Ethik sind in Deutschland ein heißes Thema. Die Abgrenzung zwischen dem, was erlaubt ist und was nicht, ist unscharf und muss rechtlich geprüft werden. Vor allem Auswertungen personenbezogener Daten aus sozialen Netzwerken sind riskant.
-
Die Auswahl passender Technologien für das Einbinden neuer Datenquellen, das Transformieren und Integrieren nach Regeln, das Speichern der Daten, das Laden der Analyseergebnisse und das Analysieren und Visualisieren ist eine Herausforderung. Das Lösungsangebot am Markt ist groß, und die Einsatzgebiete der unterschiedlichen Technologien sind nicht immer sofort ersichtlich.
-
Skalierbarkeit, Performance, Realtime-Bereitstellung und Wartbarkeit sind wie in klassischen BI-Szenarien auch bei Big Data nicht so einfach zu gewährleisten. Fehlende Reife von Lösungsangeboten und knappes Know-how am Markt verschärfen die Situation.