Trend: Anforderungen im Data Warehousing steigen

27.05.2004
Von 
Gründer und Geschäftsführer des Business Application Research Center (BARC)

sie etwa Hummingbird in seinem Produkt "Genio" bietet.

Die Nützlichkeit von multidimensionalen Datenbanken (MDBs) als dezentral administrierte Data Marts in Fachabteilungen oder Ergänzung zu relationalen Data Warehouses für aggregierte Daten mit hohen Anforderungen hinsichtlich der Abfragegeschwindigkeit ist unbestritten. Es hapert jedoch weiterhin an der Integration beider Ansätze in Bereichen wie durchgängige Datenmodelle, Abfragesprachen oder Schnittstellen. Integrationspfade eröffnen beispielsweise Microsoft und SAS oder Oracle, das mit 10g inzwischen beide Speichertechniken vereint. Ferner stärken Spezialisten wie Applix, Hyperion, MIS oder MIK ihre Anbindungs- und Austauschmöglichkeiten mit anderen Datenbanken.

Da Data Warehouses sich ständig weiterentwickeln, wird ein Lifecycle-Management immer wichtiger. Es umfasst das Management der Stammdaten, die Überwachung und Optimierung der Datenbankressourcen sowie die Abrechnung und Sicherstellung der Performance. Betreiber könnten sich so auch unabhängiger von der Güte der externen Berater oder der IT machen. Beispiele sind die weitgehende Optimierung von Anfragen und Speicherstrukturen bei IBM und NCR oder ein Gegenbeispiel die schlechte Performance von SAP BW bei nicht oder falsch gepflegten Aggregaten. Eine Modellierung und Nachhaltung der sich ständig ändernden Data-Warehouse-Strukturen kann zudem auf der Ebene der Datenintegration durch ETL-Tools wie Cognos "Decisionstream", durch Applikations-Server wie SAP BW oder Spezialanwendungen wie Kalido unterstützt werden.

Ein Trend ist auch die Modernisierung des Data-Warehouse, dessen Architektur künftig Web-fähig sein muss und einen skalierbaren und robusten Applikations-Server umfasst. Viele Funktionen übernimmt nun die Datenbank, etwa für Reporting und Analyse (Data Mining, die Ausführung von Modellen oder zeitnahe Überwachungs- und Notifikationsmechanismen (Alerting). So werden etwa Standardberichte zusehends von besonderen Servern oder den Data-Warehouse-Datenbanken übernommen, da sie anders als in operativen Systemen eine Historisierung von Daten oder die Integration von Daten aus verschiedenen Quellen erlauben. Produktbeispiele sind die "Reporting Services" bei Microsoft sowie Lösungen für das Massenberichtswesen von Actuate, Business Objects (Crystal), Cognos, Information Builders oder Microstrategy.

Ein wesentlicher Nutzen von Data Warehouses wird zudem künftig immer mehr auch in den Metadaten gesehen werden. Diese sollen nicht mehr nur technische Informationen wie Datentypen bereitstellen, sondern auch geschäftsorientierte Informationen für Anwender vorhalten. Analog werden neue Ansätze zur Metadatenspeicherung, Austausch und Bereitstellung benötigt. Ein Beispiel ist das Common Warehouse Model, das ein standardisiertes Beschreibungs- und Austauschformat bietet. Zwar nutzen Oracle, Hyperion und SAS dieses schon, allerdings weitgehend zum einfachen Austausch von Datenmodellen. Spezielle Metadatentechnik bietet auch Ascential mit seinen "Meta Brokern" oder Informatica mit "Super Glue", das zum Aufbau eines Metadata Warehouse dient. Alle ETL-Tools dienen heute zur Integration und auch Analyse von Metadaten, doch steckt eine Verbindung dieser Informationen mit der Datenaufbereitung und Endanwenderwerkzeugen noch in den Kinderschuhen.

Schließlich wird auch die Nutzung unstrukturierter Daten Anwender beschäftigen. So liegen 80 Prozent aller Daten und potenzieller Informationen als Text, Bild oder Tondateien vor und sind nicht integriert mit den strukturierten Daten (Kennzahlen und Metriken) eines Data Warehouses. Hier gilt es künftig, auf allen Ebenen des Systems Lösungen zu finden. So liefert IBM mit dem "Information Integrator" einen ersten Ansatz zur Datenintegration, und alle Datenbankanbieter arbeiten an Techniken zur Speicherung für XML- und unstrukturierte Daten. Speziell mit der Aufbereitung unstrukturierter Daten beschäftigt sich etwa Hummingbird durch die Integration einer Suchmaschine, während Microsoft mit "Smart Tags" eine Option zur Referenzierung solcher Informationen eingeführt hat.