Barc-Studie: Data Warehousing wird strategisch

12.06.2003
Von 
Gründer und Geschäftsführer des Business Application Research Center (BARC)

Veranstaltungsorte sind Hamburg (25.6.03), Düsseldorf (3.7.03) und Stuttgart (9.7. 03). Der Unkostenbeitrag der ganztägigen Veranstaltung beträgt 150 Euro. Anmeldung und weitere Auskünfte bei Herrn Keller unter 0931/ 8806510 oder unter 0931/ 88065128 (Fax)

Einige Datenbankanbieter decken mittlerweile mit ihren Produkten 70 bis 80 Prozent des Funktionsumfanges ab, den spezialisierte Integrationswerkzeuge von Ascential, Business Objects, Cognos, Hummingbird, Informatica oder Sagent bieten. Hervorzuheben sind IBM, Oracle und SAS, deren Tools inzwischen einen guten Leistungsumfang erreichen und eine häufig auch preiswertere Alternative zu separaten Tools für die Extraktion, Transformation und das Laden (ETL) eines Data Warehouse sein können.

Die Datenqualitätserfassung und -verbesserung sorgt im ETL-Prozess für einen Großteil des Projektaufwandes. Dennoch sind die angebotenen Möglichkeiten der untersuchten Datenintegrationswerkzeuge und Data-Warehouse-Lösungen meist schwach ausgeprägt. Ausnahmen bilden hier Ascential und SAS, die durch Zukäufe an Funktionalität gewonnen haben. Alle anderen Hersteller setzen auf Kooperationen mit Spezialanbietern wie Evoke oder Trillium, wobei die Integration der Drittsysteme mehr oder weniger gut ausgeprägt ist.

Datenbanken entwickeln sich zu umfassenden Business-Intelligence-Plattformen. Hinsichtlich der Integration von Speichertechniken führt hier Oracle mit dem neuesten Release „9iR2“ das Feld an. So ist innerhalb einer Datenbank-Engine jetzt sowohl relationale als auch multidimensionale Abspeicherung möglich. Allerdings wird eine proprietäre Anfragesprache für die hybride Technik verwendet, die bisher nur wenige Anbieter von Reporting- und Analysewerkzeugen unterstützen. IBM befindet sich hingegen mit seinen multidimensionalen „Cube-Views“ noch im Betastadium, und Microsoft setzt aktuell auf getrennte Datenbanken unter dem Dach des „SQL Servers“.

Andere untersuchte Anbieter wie Teradata, Sybase oder Sand verlassen sich vollständig auf relationale Datenbank-Management-Systeme - in der Regel mit optimierten Indizierungs- oder Abfragemechanismen. Oracle und Microsoft haben zusätzlich begonnen, Data-Mining-Algorithmen in die Datenbank zu implementieren, die jedoch noch nicht mit entsprechenden, separat angebotenen Produkten von IBM oder SAS konkurrieren können.

Um den wachsenden Datenmengen bei steigenden Benutzerzahlen und hohen Ansprüchen an die Abfragegeschwindigkeit gerecht zu werden, setzen Data-Warehouse-Anbieter auf die breite Unterstützung von 64-Bit-Hardware und den massiven Einsatz von Paralleltechnik. Auch mit Partitionierungsoptionen und Funktionen, die wie Aggregatbildung und Indexierung den Zugriff beschleunigen, lässt sich die Skalierbarkeit steigern. Für große Warehouses zeigten dabei insbesondere Teradata, IBM und Oracle gute Möglichkeiten, gefolgt von SAS und Microsoft. Die Anbieter Sand und Sybase konnten mit interessanten Indexierungsmethoden punkten.