Intelligente Systeme

So arbeitet IBM Watson

28.11.2012
Von 
Jan-Bernd Meyer betreute als leitender Redakteur Sonderpublikationen und -projekte der COMPUTERWOCHE. Auch für die im Auftrag der Deutschen Messe AG publizierten "CeBIT News" war Meyer zuständig. Inhaltlich betreute er darüber hinaus Hardware- und Green-IT- bzw. Nachhaltigkeitsthemen sowie alles was mit politischen Hintergründen in der ITK-Szene zu tun hat.

Statt Intelligenz ein Framework

Ein Ansatz bei der Arbeit mit Watson ist die Sentiment-Analyse: Hierbei werden Texte nach Eindrücken wie "gut" und "schlecht" durchleuchtet. Als Signalwörter sind sie leicht zu finden. Es ist auch relativ simpel, den Abstand solcher Wörter zu einer bestimmten Produktbezeichnung zu ermitteln - die Sentiment-Analyse von Texten ist also eine relativ einfache Methode. Solcherlei semantische Suchalgorithmen offerieren auch andere Anbieter. Wolfram Alpha ist ein Beispiel. Sempria Search ein weiteres.

Nicht schnell genug

Das Problem von Echtzeitanalysen, die Entscheidungshilfen blitzschnell bereitzustellen versprechen - implizit ist das ja das Versprechen der Watson-Technik -, ist allerdings: Sie sind momentan noch nicht schnell genug. Verschiedene Realtime-Analytics-Ansätze, die nicht immer miteinander zu vergleichen sind, versuchen sich an diesem Problem. Dazu gehören Yahoo mit seinem S4-Projekt. Accenture arbeitet mit Appistry an einer Software namens "Cloud Map Reduce". Und Datastax bietet "Brisk".

Um Big Data in Echtzeit nicht nur zu verwalten, sondern vor allem zu analysieren, bediente sich IBM im Falle von Watson einer Reihe von Open-Source-Techniken, die schon lange bekannt sind. Hierzu zählt das ursprünglich von IBM entwickelte und jetzt von Apache weiter gepflegte "Hadoop"-Framework, das auf den Einsatz in parallelisierten Umgebungen spezialisiert ist. Hadoop ist die Basis für die Software "InfoSphere BigInsights and Streams", die unstrukturierte Daten wie Text, Audio und Video analysiert.

Wichtig für Watson ist ferner die Unstructured Information Management Architecture (UIMA) von Apache. UIMA dient der natürlichsprachlichen Bearbeitung und Inhaltsanalyse. Das UIMA-Framework nutzt Suchmaschinen wie Apaches "Lucene" oder "Indri" sowie "Jaql", um nur einige zu nennen. Alle verfügen über unterschiedliche Algorithmen, die für bestimmte Fragestellungen optimiert sind.