Snowflake ist ein Cloud-Unternehmen aus dem kalifornischen San Mateo, das 2012 gegründet wurde und seinen Schwerpunkt auf Data Warehousing und Analytics legt. Gründer sind die beiden Ex-Oracle-Manager Benoit Dageville und Thierry Cruanes sowie Marcin Zukowski, der auch das niederländische Startup Vectorwise aus der Taufe hob. Bekannter als dieses Trio ist da schon der ehemalige Microsoft-Manager Bob Muglia, der 2014 zum CEO ernannt wurde, ein knappes Jahr bevor das Cloud-Data-Warehouse für Kunden verfügbar gemacht wurde.
Im Mai vergangenen Jahres wurde Muglia von Frank Slootman abgelöst. Der gebürtige Niederländer ist im Silicon Valley kein Unbekannter: Zwischen 2011 und 2017 hatte Slootman als CEO und President ServiceNow aufgebaut und zu einem Milliardenkonzern weiterentwickelt. Davor war er bei EMC verantwortlich für die Geschäftseinheit Backup & Recovery Systems. Diese war aus der Akquisition der Data Domain Corp. hervorgegangen, einem Unternehmen, das Slootman als CEO leitete, an die Börse führte und dann für 2,4 Milliarden Dollar an die heutige Dell-Tochter EMC verkaufte.
Data Warehouse in der Public Cloud
Doch zurück zu Snowflake. Das Unternehmen, das die wintersportbegeisterten Gründer nach ihrer Leidenschaft benannten, bietet eine Cloud-basierte Unternehmenslösung für das Sammeln, Verarbeiten und Verwerten von Daten. Es konkurriert mit Angeboten wie Redshift von Amazon Web Services, Azure SQL Data Warehouse von Microsoft und BigQuery von Google. Wie diese Wettbewerbsprodukte laufen auch die virtuellen Snowflake-Warehouses auf den Cloud-Plattformen der Hyperscaler sowie nach Bedarf auch in Multi-Cloud-Umgebungen - nur in einer Private Cloud oder als On-premises-Lösung gibt es Snowflake nicht.
Die Euphorie der Investoren hat verschiedene Gründe. Generell hat sich Snowflake mit seinem Cloud-basierten Data-Warehouse-System den Ruf eines "Disruptor" erarbeitet. Die Zeit der aufwändig intern aufgesetzten und komplex zu handhabenden Data Warehouses geht zu Ende, stattdessen wollen Unternehmen schlanke, schnelle und weniger aufwändige Lösungen, um den "Rohstoff Daten" unkompliziert bearbeiten und monetarisieren zu können. Snowflake verspricht unbegrenzte Skalierbarkeit, verbrauchsabhängige Bezahlung, Flexibilität und Einfachheit.
Basis ist eine SQL-Datenbank-Engine
Die Data-Warehouse-Lösung, die in der AWS-, Microsoft- und Google-Cloud läuft, ist keine typische Big-Data-Plattform - wie etwa ein Hadoop-System. Die Lösung basiert vielmehr auf einer SQL-Datenbank-Engine, deren Architektur die einstigen Oracle-Techniker für die Anforderungen der Cloud stark angepasst haben. Technisch handelt es sich um ein Hybridsystem, das die Vorteile einer traditionellen Shared-Disk- mit denen einer Shared-Nothing-Datenbankarchitektur vereint. So erzielt Snowflake mehr Speed und bietet SQL-Spezialisten, von denen es viele gibt, die Möglichkeit, übergangslos weiterzuarbeiten.
Als vielversprechend gilt auch das einfache Data Sharing: Strebt ein Snowflake-Kunde Datengeschäfte mit einem Kunden oder Partner an, kann er seinen Datenpool für Dritte zu Recherchezwecken zugänglich machen. Dafür richten Nutzer direkt aus ihrem User Interface sogenannte Reader Accounts für Kunden ein und verwalten diese. Das Unternehmen zeigt Rechercheergebnisse nach Bedarf visualisiert in Form von Grafiken, Tabellen oder sonstigen Charts an. Insgesamt entwickelt der Softwarehersteller seine Lösung in Richtung einer Daten-Cloud beziehungsweise eines Datenmarktplatzes weiter.
Storage und Compute getrennt berechnet
Die Architektur von Snowflake trennt Storage und Compute voneinander, so dass sich beide Ressourcen in den Cloud-Umgebungen der Hyperscaler unterschiedlich nutzen lassen. Kunden zahlen für Speicher und Rechenressourcen unabhängig voneinander. Der Storage wird nach gespeicherten Terabytes pro Monat abgerechnet, die Rechenleistung nach Sekunden.
Bei Snowflake weiß man natürlich um die Bedeutung von "Accessibility": Die Lösung wurde mit reichlich Schnittstellen ausgestattet, was die Marktakzeptanz sichtlich erhöht hat. Viel Geld wurde ausgegeben, damit Snowflake mit den gängigen ETL- und BI-Tools zusammenarbeitet, ODBC- und JDBC-Treiber unterstützt und auch sonst eine breite Palette von Schnittstellen bietet (Web-based UI; SnowSQL als Kommandozeilen-Client; native Konnektoren).
Zu den Vorteilen, die sich Anwender vom Snowflake-Einsatz versprechen, gehört auch die kombinierte Verarbeitung und Analyse strukturierter und semistrukturierter Daten. Beide können zusammen bearbeitet werden, ohne dass sie zuvor in ein bestimmtes relationales Schema transformiert werden müssen. Das Unternehmen hat die Art und Weise, wie Daten automatisiert abgelegt und abgerufen werden, entsprechend angepasst.
Mit seine Multi-Cluster-Architektur geht Snowflake auch das Probleman, dass zu viele gleichzeitige Abfragen das System in die Knie zwingen könnten. Anwender können mehrere virtuelle Warehouses parallel nebeneinander betreiben, so dass Abfragen in einem Warehouse die in einem anderen nicht beeinträchtigen. Data Analysts und Data Scientists werden also nicht durch Lade- und Verarbeitungsprozesse ausgebremst.
Doch nicht nur die technischen Möglichkeiten haben die Wall Street beeindruckt. Ein Teil der Phantasie kommt wohl auch daher, dass der Softwareriese Salesforce über seinen Venture Fund Anteile an Snowflake hält. Wichtiger noch: Die beiden Softwarehäuser vertieften Mitte des Jahres ihre ohnehin weitreichende Partnerschaft, was bei Anlegern gut ankam. Die Plattformen sind nativ miteinander integriert, Salesforce-Kunden können einfach Daten in Snowflake analysieren und visualisieren und so Insights über ihre Geschäfte und Kunden gewinnen.
Wie die Website "Netguru" schreibt, könnte Snowflake eine Schlüsselrolle spielen, wenn Salesforce seinen geplanten Wandel von einem Spezialisten für CRM- und Marketing-Automation-Software zu einem "Customer Data Warehouse" weiter vorantreibe. Die Entwicklung von Einstein Analytics und der Zukauf von Tableau hätten bereits in diese Richtung gedeutet. Mit Snowflake könne zu den erworbenen Visualisierungstools ein umfangreicher Analytics-Stack dazukommen.
Gute Aussichten, aber hoch bewertet
Zusammenfassend lässt sich feststellen, das Snowflake das richtige Produkt zur richtigen Zeit zu sein scheint. Eine universelle, einfach zu nutzende, (Multi-)Cloud-basierende Data-Warehouse-Lösung ist in Zeiten, in denen Unternehmen Kapital aus ihren Daten schlagen wollen, durchaus aussichtsreich. Auf diesem Geschäftsfeld könnte sich Snowflake als zentrale Lösung etablieren, vorausgesetzt, die großen Cloud-Player legen nicht mit eigenen, günstigeren Lösungen nach.
Ob das allerdings eine Börsenbewertung von 60 Milliarden Dollar rechtfertigt, ist eine Frage, die das Unternehmen selbst wohl auch nicht beantworten kann. Das Fiskaljahr 2021, das der Anbieter im Januar nächsten Jahres abschließen wird, soll jedenfalls "nur" einen Umsatz von ungefähr 617 Millionen Euro einbringen.
Immerhin wäre das deutlich mehr als in den Vorjahren: 2019 verdiente Snowflake knapp 97 Millionen Dollar, im Finanzjahr 2020 waren es fast 265 Millionen Dollar. Von Gewinnen ist man allerdings noch weit entfernt. 2019 stand ein Verlust von 178 Millionen Dollar zu Buche, der sich im darauffolgenden Fiskaljahr auf rund 349 Millionen Dollar fast verdoppelte. Snowflake versorgt eigenen Angaben zufolge mit über 2000 Mitarbeitern mehr als 3100 Kunden weltweit. Das Unternehmen unterhält Niederlassungen in 22 Ländern, für Deutschland in Berlin.