Für User ohne SQL-Kenntnisse

Oracles Data Warehouse wird einfacher

23.03.2021
Von 
Martin Bayer ist Chefredakteur von COMPUTERWOCHE, CIO und CSO. Spezialgebiet Business-Software: Business Intelligence, Big Data, CRM, ECM und ERP.
Mit Hilfe von Self Service-Funktionen sowie No-Code und Low-Code-Tools sollen auch weniger IT-affine Oracle-Kunden in die Lage versetzt werden, Daten zusammenstellen und analysieren zu können.
Mit den neuen Funktionen sollen Oracle-Kunden ihre Data Warehouses künftig einfacher zusammenbauen können.
Mit den neuen Funktionen sollen Oracle-Kunden ihre Data Warehouses künftig einfacher zusammenbauen können.
Foto: locrifa - shutterstock.com

In seiner ersten Ausbaustufe hatte Oracle sein Autonomous Data Warehouse darauf ausgelegt, dass Anwender es weitgehend ohne Administrationsaufwand aus der Cloud nutzen können. Zwar sei damit der Betrieb des Data Warehouse vereinfacht worden, konstatiert George Lumpkin, Vice President für das Produktmanagement des Autonomous Data Warehouse von Oracle.

Allerdings seien immer noch IT-Spezialisten gefordert gewesen, um Datenbank-Schemata und -Tabellen zu entwickeln sowie die Prozesse rund um das Aufbereiten, Bereinigen und Laden der Daten abzuwickeln. "Das Autonomous Data Warehouse war, wie im Grunde alle anderen Cloud Data Warehouse-Angebote im Markt, eine SQL-orientierte Lösung - für technische Anwender konzipiert, die mit relationalen Datenbanken vertraut waren", so Lumpkin.

Cloud Data Warehouse ohne tiefe Fachkenntnisse?

Das soll sich nun mit der nächsten Ausbaustufe ändern. Mit dem neuen Release seines Autonomous Data Warehouse adressiert Oracle in erster Linie Datenanalysten, sogenannte Citizen Data Scientists und Nutzer in den Fachabteilungen. "Wir haben erkannt, dass es keinen Grund gibt, warum der Aufbau eines Cloud-Data-Warehouse tiefes IT-Fachwissen erfordern sollte", sagte der Oracle-Manager. Data Warehouses würden letztendlich gebaut, um Geschäftsprobleme zu lösen und tiefere Einblicke in die Datenbestände eines Unternehmens zu erhalten. Die primären Nutzer seien keine SQL-Gurus, sondern Datenanalysten und Fachanwender in den Geschäftsbereichen.

George Lumpkin, Vice President für das Produktmanagement von Oracle, hebt vor allem die neuen Self-Service-Funktionen des Autonomous Data Warehouse hervor.
George Lumpkin, Vice President für das Produktmanagement von Oracle, hebt vor allem die neuen Self-Service-Funktionen des Autonomous Data Warehouse hervor.
Foto: Oracle

Oracle hat daher eine Reihe verschiedener Self-Service-Funktionen eingebaut. Das beginnt mit dem Laden von Daten. Bis dato erforderte dies zumindest Grundkenntnisse im SQL-Coding. Künftig sollen sich Daten über eine einfache grafische Benutzeroberfläche aggregieren und in das Data Warehouse laden lassen. Per Drag and Drop könnten verschiedenste Datenquellen ansgesprochen werden. Mit dem Hochladen identifiziere das Data Warehouse die Daten und richte automatisch die erforderlichen Schemata und Tabellen ein.

Zudem erweitert Oracle die Zugriffsmöglichkeiten für seine Autonomous Data Warehouse um drei zusätzliche Data-Lake-Funktionen: die einfache Abfrage von Daten in Oracle Big Data Service (Hadoop), die Integration mit dem OCI Data Catalog, um die Datenermittlung in Object Storage zu vereinfachen und zu automatisieren, sowie die Scale-out-Verarbeitung, um Abfragen großer Datensätze in Object Storage zu beschleunigen.

Machine-Learning-Assistent schlägt Algorithmen vor

Darüber hinaus bringt Oracles neues Data Warehouse Release eine Reihe zusätzlicher Analysefunktionen mit. Beispielsweise seien über 30 vorkonfigurierte Machine-Learning-Algorithmen integriert. Mit Hilfe verschiedener AutoML-Assistenten könnten Nutzer über ein einfach zu bedienendes User Interface (UI) die auf die zur Verfügung stehenden Daten passenden Algorithmen finden sowie ihre Modelle entsprechend trainieren. Das System schlägt den Anwendern vor, welcher Algorithmus sich am besten für die vorliegenden Daten eignet.

Um Apps und Erweiterungen für das Autonomous Data Warehouse zu programmieren bringt Oracle seine Low-Code-Entwicklungsplattform APEX ins Spiel. Verschiedene Module und Widgets ließen sich über eine visuelle Bedienoberfläche zu Anwendungen kombinieren. Beispielsweise beinhaltet das neue Data Warehouse mit Graph Studio ein Tool, das die Modellierung von Graphen, also die Analyse von Zusammenhängen zwischen unterschiedlichen Daten, vereinfachen soll. Dafür stünden Nutzern vorgefertigte Workflows und integrierte Funktionen für die Visualisierung der Ergebnisse zur Verfügung.

Darüber hinaus hat der Hersteller auch die Features für IT-Entwickler ausgebaut. Diese könnten künftig auch Python verwenden, um maschinelles Lernen auf ihre Data-Warehouse-Daten anzuwenden. So ließen sich die parallelen Funktionen des Autonomous Data Warehouse besser ausnutzen, versprechen die Oracle-Verantwortlichen. Darüber hinaus könnten Anwender native datenbankinterne Modelle sowie Klassifizierungs- und Regressionsmodelle im ONNX-Format außerhalb des Data Warehouse bereitstellen und verwalten. Den Entwicklern stünden dafür einfach zu integrierende REST-APIs zur Verfügung, um auf die entsprechenden Funktionen zuzugreifen.

Das neue Release führe Cloud-Data-Warehouses in eine neue Richtung, verspricht Oracle-Manager Lumpkin den Kunden. Das Data Warehouse müsse nicht ausschließlich die Domäne von SQL-Experten und IT-Fachleuten sein. "Autonomous Data Warehouse hat den Cloud-Data-Warehouse-Service so erweitert, dass er das Laden und Transformieren von Daten umfasst, tiefergehende Analysen wie Graphen und maschinelles Lernen vereinfacht und schnell neue Low-Code-Anwendungen bereitstellt - alles mit integrierten Self-Service-Tools."