Map-D, MemSQL, Framed

Zehn vielversprechende Big-Data-Startups

16.09.2015
Von 
Stephan Wiesend schreibt für die Computerwoche als Experte zu den Themen Mac-OS, iOS, Software und Praxis. Nach Studium, Volontariat und Redakteursstelle bei dem Magazin Macwelt arbeitet er seit 2003 als freier Autor in München. Er schreibt regelmäßig für die Magazine Macwelt, iPhonewelt und iPadwelt.

MemSQL

Bei den NoSQL-Datenbanverwaltungen ist MongoDB unbestrittener Marktführer, an alternativen Engines herrscht trotzdem kein Mangel. MemSQL erweckte beim Erscheinen mit Eigenaussagen wie "The World Fastest Database" für Aufmerksamkeit aber auch Misstrauen, sind Performance-Vergleiche zwischen verschiedenen Datenbankverwaltungen doch umstritten. Grundidee von MemSQL ist, die Beschleunigung von Datenoperationen durch zwei Techniken: Die Datenbank läuft komplett im Arbeitsspeicher und SQL-Befehle wandelt die Software in Echtzeit in C++ um. Erste Referenzkunden waren Zynga und Morgan Stanley, mittlerweile nutzten laut MemSQL bereits hunderte Firmen wie Comcast und Ziff Davis die laufend verbesserte Lösung.

MemSQL läuft komplett im Arbeitsspeicher.
MemSQL läuft komplett im Arbeitsspeicher.
Foto: Stephan Wiesend

Splice Machine

Sowohl SQL als auch NoSQL haben Nachteile; Splice Machine verspricht, die Stärken beider Welten zu vereinen: die Vorteile von Hadoop wie niedrige Kosten und Performance, aber ebenso volle SQL-Kompatibilität. Splice Machine bezeichnet seine Software als "SQL-on-Hadoop RDBMS". Laut Hersteller handelt es sich bei ihrem DBMS um die einzige Unterstützung von ACID-Transaktionen unter Hadoop. Gründer Monte Zweben zufolge erhalten Firmen, die Hadoop-Lösungen und ein Data Warehouse parallel nutzen, mit Splice Machine eine Komplettlösung. Im Unterschied zu ähnlichen Lösungen wie Hive oder Clouderas Impala unterstützt sie etwa Echtzeit-Updates.

Splice Machine funktioniert als "SQL on Hadoop RDBMS".
Splice Machine funktioniert als "SQL on Hadoop RDBMS".
Foto: Stephan Wiesend

Altiscale

Altiscale bietet Hadoop-as-a-Service. Kunden sollen eine besonders flexible und vom Anbieter gewartete Hadoop-Lösung erhalten. Zielgruppe sind gegenwärtige Nutzer von Hadoop mit eigenem Cluster oder Amazon EMR, die nach einer alternativen Nutzungsmöglichkeit suchen. Konkurrenten sind Anbieter wie Qubole und Treasure Data. Gegenüber Managed Hadoop-Anbieter will vor allem Altiscale mit besserem Support und einem besseren Abrechnungsmodell punkten. Viel Aufmerksamkeit erhielt Altiscale wohl auch, da der Gründer Raymie Stata als Ex-Yahoo CTO bekannt ist und zusammen mit Doug Cutting das Projekt Hadoop entwickelte.

Theta Ray

Das israelische Unternehmen Theta Ray will Big Data nutzen, um die Unternehmenssicherheit zu gewährleisten. Ohne die Hilfe von Signaturen oder Heuristik soll die Lösung ein Firmennetz vor Zero-Day-Attacken oder Advanced Persistent Threats schützen. Dazu prüft das System Daten aus verschiedensten Quellen auf Auffälligkeiten - beispielsweise ausfallenden Geräten und Energieabfällen oder auffällige Finanztransaktionen. Stärke des Produkts sei laut CEO Mark Gazi vor allem die vergleichsweise niedrige False Positive-Rate, ein Hautproblem dieses Sicherheitskonzepts. Zielgruppe sind unterschiedlichste Branchen wie Energieversorger und Fabriken als auch Finanzdienstleister. Gründer des 2012 entstandenen Startups sind zwei Professoren der Universitäten von Tel Aviv und Yale. Nach Firmenangaben wird die Lösung von den beiden Investoren General Electric und Poalim bereits verwendet. Konkurrenten sind wohl Firmen wie Splunk, Norse Corp, Plantir und Noise Dynamics.

Theta Ray will durch Datensammeln und -auswertung die Security verbessern.
Theta Ray will durch Datensammeln und -auswertung die Security verbessern.
Foto: Stephan Wiesend

Crate

Eine so genannte Shared-Nothing-Architektur hat das in Berlin und Dornbirn ansässige Crate.io zu bieten. Um Daten hochverfügbar zu halten, kombiniert es als Backend relationales SQL mit NoSQL und integrierter Suche: beispielsweise MySQL mit MongoDB und Elasticsearch. Grundlagen sind die Open-Source-Technologien Presto, Lucene, Elasticsearch und Netty. Crate ist als Community Edition unter einer Apache-Lizenz kostenlos nutzbar, Business- und Enterprise-Lizenzen mit zusätzlichen Funktionen und Support sind verfügbar. Referenzkunden hat die Software offenbar bisher nicht vorzuweisen. (sh)

Abschließend noch einmal der Überblick über alle vorgestellten Startups - alphabetisch sortiert: