Data Mining Studie

So finden Sie das richtige Analyse-Werkzeug

24.08.2009
Von 
Peter Neckel ist Analyst beim Data-Mining-Spezialisten Mayato.

Gesamtergebnis

Im Gesamtergebnis von Mayato landeten der SAS Enterprise Miner und der Statistica Data Miner gemeinsam auf dem ersten Platz. Sie punkten beide mit beeindruckendem Funktionsumfang, einer hohen Ausführungsgeschwindigkeit und sicherem Umgang mit großen Datenmengen. Knapp dahinter reiht sich KXEN ein: Das Analytic Framework reicht vor allem beim Funktionsumfang und der grafischen Ergebnisauswertung nicht an die Spitzengruppe heran, kann jedoch die Kategorien Bedienung, Systemstabilität und Automatisierungsgrad für sich entscheiden.

Mit deutlichem Abstand folgen die SAP NetWeaver Data Mining Workbench und KNIME. Beide Werkzeuge zeigen vor allem durch das Fehlen der Sequenzanalyse deutliche Lücken beim Funktionsumfang und bieten nur eine sehr rudimentäre Unterstützung bei der Ergebnisinterpretation. Zudem ist die Dokumentation stark ergänzungsbedürftig, was die Einarbeitung erschwert. KNIME landet bei der Ausführungsgeschwindigkeit auf dem letzten Platz - verursacht durch die zeitraubende Datenvorverarbeitung für das ungewöhnliche BitVector-Format.

Reifegrad von Data-Mining-Tools wächst

Dennoch ist unübersehbar, dass sich der Reifegrad von Data-Mining-Lösungen insgesamt deutlich erhöht hat. Dank eines immer vielfältigeren Produktangebotes und neuen Ansätzen wie Self-Acting Data Mining gibt es mittlerweile für nahezu jede (unternehmens-)spezifische Analyseaufgabe das passende Data-Mining-Werkzeug. Gerade die Assoziations- und Sequenzanalyse eignet sich aufgrund ihrer eingängigen Warenkorbmetapher, der geringen Datenanforderungen und der vielfältigen Anwendungsmöglichkeiten besonders gut als Einstieg in die explorative Datenanalyse.