SAS, KXEN, RapidMiner, SAP Netweaver BI

Vier Tools für Data Mining im Test

03.06.2009
Von 
Peter Neckel ist Analyst beim Data-Mining-Spezialisten Mayato.

Mehr Verfahren - mehr Muster

Nicht jedes der zahlreichen heute verfügbaren Data-Mining-Verfahren eignet sich gleich gut, um bestimmte Analyseaufgaben zu erfüllen (Zudem gibt es Verfahren für Text und Web Mining). So kommen Klassifizierungsmethoden zum Einsatz, wenn es um die Vorhersage des Abwanderungsverhaltens, um Kampagnenplanung, die Zielgruppenauswahl oder Kundenwertberechnungen geht.

Assoziationsanalysen sind hingegen die Grundlage für die Ermittlung von Cross- und Up-Selling-Potenzialen, während Segmentierungsverfahren eher beim Verständnis und der Einteilung der Kundenbasis sowie bei der Erkennung von Marktveränderungen helfen. Auch Zeitreihenanalysen gewinnen zunehmend an Bedeutung, da sie Trends und Zyklen erkennen können und somit in bestimmten Bereichen wichtige Frühwarnfunktionen übernehmen.

Nicht jede Data-Mining-Software deckt jedoch alle Analyseaufgaben ab, was auch der Test belegt: So ist der Funktionsumfang bei KXEN und SAP insgesamt deutlich geringer als bei SAS und RapidMiner. Es fehlen bei SAP zum Beispiel Verfahren wie neuronale Netze oder Support Vector Machines, vor allem aber die Sequenzanalyse, die besonders im Handel relativ häufig eingesetzt wird. KXEN bietet nur die "Robust Regression" als Prognoseverfahren an.

Auch wenn dieses gute Ergebnisse liefert, müssen Anwender somit auf die intuitiv verständliche grafische Darstellung eines Entscheidungsbaumes verzichten. Zudem fehlen klassische statistische Verfahren wie Faktoren- oder Hauptkomponentenanalyse bei SAP und KXEN.