"Open Source frisst die Tech-Branche"
In Zeiten des tiefgreifenden, gesamtwirtschaftlichen Wandels übersieht man allzu leicht den massiven Wandel innerhalb der Technologie-Branche selbst. Eigentlich sollte eine Software-zentrierte Welt den großen Playern der Branche entgegenkommen - doch auch sie sind in Schwierigkeiten.
Beispiele hierfür finden sich zuhauf: IBM sieht sich seit ganzen 15 Quartalen mit schrumpfenden Einnahmen konfrontiert, während etwa Dell und EMC auf eine Fusion zusteuern - ein klassisches Mittel, um finanziell geschwächte Industriezweige zu stärken. Beim Software-Konzern BMC fand hingegen eine Restrukturierung mit privatem Beteiligungskapital statt - die dritte klassische Antwort auf rote Zahlen.
Die Frage ist nur: Warum werden die eigentlich traumhaften Voraussetzungen für die Tech-Branche zum Albtraum? Die Antwort besteht aus zwei Worten: Open Source. Denn Open-Source-Software ist der Rohstoff für die Händler, die wiederum darunter leiden, dass ihre Kostenstrukturen nicht an die neue Wirklichkeit des Marktes angepasst wurden. Das wirkt sich nicht nur auf die Software-, sondern auch auf die Hardware-Produkte aus. Das neue Mantra ist ‚software defined‘ und durch die Platzierung von Open-Source-Software in Hardware-Geräte werden vorher unanfechtbare Marktpositionen zu Feldern mit reduziertem Wachstum oder sogar Verlusten.
Open Source erweist sich zudem als viel mehr als nur ein kostengünstiger Ersatz: Die technologischen Innovationen finden im Wesentlichen in diesem Bereich statt. Kaum eine der derzeit aufstrebenden Technologien wäre ohne den Einsatz von Open-Source-Software denkbar. Diese Entwicklung unterstreicht auch der Trend zur ‚software-defined Hardware‘. Auch in anderen Gebieten ist der Aufstieg von Open Source zu beobachten: NoSQL-Datenbanken, Machine Learning und Container sind nur einige Beispiele.
Der Open-Source-Trend verursacht mehr als nur finanzielle Schmerzen bei den etablierten Playern: der andauernde, industrielle Wandel wird in großen Teilen durch den Einsatz von Open-Source-Software getrieben.
- Apache Spark MLlib
Früher als Teil des Hadoop-Universums bekannt, ist Apache Spark mittlerweile ein bekanntes Machine-Learning-Framework. Sein umfangreiches Angebot an Algorithmen wird ständig überarbeitet und erweitert. - Apache Singa
Singa, seit kurzem Teil des Apache Incubator, ist ein Open-Source-Framework, das Deep-Learning-Mechanismen auf große Datenvolumen hin „trainieren“ soll. Singa stellt ein simples Programmierungsmodell für Deep-Learning-Netzwerke bereit und unterstützt dabei diverse Entwicklungsroutinen. - Caffe
Caffe umfasst ein ganzes Set von frei verfügbaren Referenzmodellen für gängige Klassifizierungsroutinen; die gewachsene Caffe-Community steuert weitere Modelle bei. Caffe unterstützt die Nvidia-Programmiertechnik CUDA, mit der Programmteile wahlweise auch durch den Grafikprozessor (GPU) abgearbeitet werden können. - Microsoft Azure ML Studio
Weil die Cloud also die ideale Umgebung für ML-Anwendungen darstellt, hat Microsoft seine Azure-Cloud mit einem eigenen ML-Service auf der Basis von „pay as you go“ ausgestattet: Mit Azure ML Studio können Nutzer KI-Modelle entwickeln und trainieren und anschließend in APIs umwandeln, um diese wiederum Anderen zur Verfügung zur stellen. - Amazon Machine Learning
Amazon Machine Learning arbeitet mit Daten, die in einer Amazon-Cloud wie S3, Redshift oder RDS liegen und kann mithilfe binärer Klassifizierungen und Multiklassen-Kategorisierung von vorgegebenen Daten neue KI-Modelle bauen. - Microsoft DMTK
Das DMTK (Distributed Machine Learning Toolkit) von Microsoft soll ML-Anwendungen über mehrere Maschinen hinweg skalieren. Es ist eher als "Out of the Box"-Lösung gedacht und weniger als Framework - entsprechend gering ist die Anzahl der unterstützten Algorithmen. - Google TensorFlow
TensorFlow basiert auf sogenannten Data-Flow-Graphen, in denen Bündel von Daten („Tensors“) durch eine Reihe von Algorithmen verarbeitet werden, die durch einen Graph beschrieben sind. Die Bewegungsmuster der Daten innerhalb des Systems heißen „Flows“. Die Graphen lassen sich mittels C++ und Python zusammenbauen und via CPU oder GPU verarbeiten. - Microsoft CNTK
Das Microsoft Computational Network Toolkit funktioniert ähnlich wie Google TensorFlow: Neuronale Netze lassen sich durch gerichtete Graphen erzeugen. Microsofts eigener Beschreibung zufolge lässt sich CNTK außerdem mit Projekten wie Caffe, Theano und Torch vergleichen – sei aber schneller und könne im Gegensatz zu den genannten gar parallel auf Prozessor- und Grafikprozessorleistung zugreifen. - Samsung Veles
Das Samsung-Framework ist dazu gedacht, Datensätze zu analysieren und automatisch zu normalisieren, bevor sie in den Produktivbetrieb übergehen – was wiederum durch eine eigene API namens REST sofort möglich ist – vorausgesetzt, die eingesetzte Hardware hat genügend Power. Der Python-Einsatz in Veles umfasst auch ein eigenes Analyse- und Visualisierungstool namens Jupyter (früher IPython) für die Darstellung einzelner Anwendungs-Cluster. - Brainstorm
Brainstorm setzt auf Python, um zwei Data-Management-APIs („Handers“ genannt) bereitzustellen – eine für CPU-Prozessing durch die Bibliothek „Numpy“ und eine für GPU-Verarbeitung via CUDA. Eine benutzerfreundliche GUI ist in Arbeit. - mlpack 2
Die neue Version der in C++ geschriebenen Machine-Learning-Bibliothek mlpack, die erstmals im Jahr 2011 erschien, bringt eine Menge Neuerungen mit – darunter neue Algorithmen und überarbeitete alte. - Marvin
Der Quellcode von Marvin ist sehr übersichtlich - die enthaltenen vortrainierten Modelle (siehe Bild) ermöglichen aber bereits eine umfangreiche Weiterentwicklung. - Neon
Neon von NervanaSystems ist ein Open-Source-Framework, das auf ein- und abschaltbaren Modulen basiert und KI-Prozesse via CPU, GPU oder Nervanas eigener Hardware ermöglicht.
Kein Unternehmen wird das neue Netflix
Netflix ist ein bewundernswertes Unternehmen. Es war einfach nur beeindruckend, wie schnell und effektiv diese Firma den einstigen US-Videotheken-Riesen 'Blockbuster' auseinandernahm. Die disruptive Wirkung, die Netflix entfaltete, steht in einer Linie mit Uber. Und man hat sich bei Netflix keineswegs auf seinen Lorbeeren ausgeruht: Als der Thron im Verleihgeschäft eingenommen war, konzentrierte man sich auf das Streaming-Geschäft. Inzwischen steht das Unternehmen kurz davor, die TV-Branche und ihr über Jahre gewachsenes Produktions-Ökosystem völlig neu zu ordnen.
Im Kern ist Netflix eine Tech-Company. Und auch auf diesem Gebiet überzeugt das Unternehmen. Dabei haben die Verantwortlichen früh erkannt, dass das Betreiben von Data Centern nicht zu den eigenen Stärken gehört. Wegen des ungewissen Wachstumspotentials und den stark heterogenen Nutzergewohnheiten, wäre das Management der Infrastruktur ein unkalkulierbares Risiko gewesen.