Was die Flüchtlingskrise für die Datenbanken bedeutet

Flüchtlinge: Herausforderung für Datenqualität

20.12.2015

Von

800x600

Holger Wandt ist seit 1991 für Human Inference tätig. Als Sprachwissenschaftler hat er viele Jahre an der Erfassung, Pflege und Qualität des Wissens, das die Produkte von Human Inference auszeichnet, gearbeitet. In seiner heutigen Position als Principal Advisor ist er verantwortlich für alle wissensbezogenen Fragen zur Datenqualität. Er ist der Experte auf dem Gebiet der Interpretation von Kundendaten durch natural language processing, wobei wissensbasierte Verfahren zum Einsatz kommen, die Einsichten der Computerlinguistik zur Spracherkennung und -synthese anwenden. Diese Verfahren sind die Grundlage des Erfolgs der Produktsuite von Human Inference. Daneben ist Dr. Wandt ein vielgefragter Referent auf (inter)nationalen Kongressen, Studienleiter der Masterclass Data Quality Management an der Nyenrode Buisnessuniversität und Dozent der linguistischen Fakultät an der Universität Utrecht Normal 0 21 false false false DE X-NONE X-NONE MicrosoftInternetExplorer4

Alle Posts des Autors Email: Connect:

Die sogenannte Flüchtlingskrise bietet zahlreiche Chancen für Wirtschaft und Gesellschaft. Allerdings stellt sie auch Datenbanken und Datenqualität vor neue Herausforderungen.

Die Gelder für die Bewältigung der Flüchtlingskrise wirken "ähnlich wie ein Konjunkturprogramm", denn jeder Flüchtling wird in naher Zukunft auch ein Konsument. Wenn die schnelle Integration in die Wirtschaft tatsächlich klappt, werden viele Zuwanderer schon bald als zahlende Kunden in den CRM-Systemen und Datenbanken der Unternehmen zu finden sein. Allerdings stellt die Komplexität arabischer Namen für Datenbanken und Datenqualität gleichermaßen eine Herausforderung dar. Doch hierfür gibt es bereits längst überfällige Lösungen.

Arabische Namen stellen Datenbanken und Datenqualität vor neue Herausforderungen. Wir zeigen Ihnen, wie Sie diese bewältigen.
Foto: alphaspirit - shutterstock.com

Rund 11 Milliarden Euro wird der deutsche Staat alleine in diesem Jahr für die Bewältigung der Flüchtlingskrise aufbringen müssen. Nach dem Herbstgutachten des Deutschen Instituts für Wirtschaftsforschung (DIW) sind die Aufwendungen aber gut angelegtes Geld - nämlich als zusätzlicher Anreiz für die Wirtschaft. "Das wirkt ähnlich wie ein Konjunkturprogramm", sagt DIW-Experte Ferdinand Fichtner. Einige Branchen spüren das schon heute, beispielsweise die Telekommunikationsanbieter. Denn eines bringen fast alle Flüchtlinge aus der Heimat mit oder beschaffen es sich hier sehr schnell: Ein Smartphone. Denn das Handy ist in der Regel zunächst die einzige Verbindung zu den Freunden und Verwandten in den Herkunftsländern.

eco Report Mobile Trends 2015
94 Prozent der Befragten sind der Meinung, dass sich der herkömmliche Datenschutz längst überholt hat.
eco Report Mobile Trends 2015
Aus Sicht vieler Experten scheitert Industrie 4.0 bereits an den überholten Datenschutzkonzepten im B2B-Bereich.
eco Report Mobile Trends 2015
82 Prozent der Experten sind der Ansicht, dass der Human Factor stärker in Datenschutzkonzepten abgebildet werden sollte.
eco Report Mobile Trends 2015
Die Befragten sehen für Industrie 4.0 gleich mehrere Hürden, etwa fehlendes Vertrauen, Schwierigkeit, Geschäftsmodelle aufzubauen oder den mangelnden Datenschutz.

Arabische Namen erfordern Datenbanken mit Komplexität

Auch auf Banken, Energieversorger und viele weitere Branchen kommen in der nächsten Zeit zahlreiche neue Kunden zu. Und arabische Namen wie "Abderrahim Al Husseini" oder "Oumaima El Khatib" stellen herkömmliche Kundendatenbanken vor neue Anforderungen, denn sie sind in der Regel erheblich komplexer als mitteleuropäische Namen. Neben dem persönlichen Namen gibt es oft noch Beinamen, Abstammungsbezeichnungen unterschiedlichster Art oder Ehrennamen. Und damit steigt auch das Risiko von Falscherfassungen und Buchstabendrehern, insbesondere bei der telefonischen Aufnahme der Adressen in Call-Centern oder durch falsch ausgefüllte Online-Formulare.

So vermeiden Sie unnötige Kosten

Dazu kommt das Risiko der Mehrfacherfassung, weil der angehende Kunde eventuell nicht weiß, dass er sich schon einmal bei diesem Unternehmen angemeldet hat und auch die Mitarbeiter dort dies nicht bemerken. Schon jetzt gehen Schätzungen selbst bei gut gepflegten Kundendatenbanken von zwei bis zehn Prozent Dubletten aus. Bei schlecht gepflegten Datenbanken können diese Zahlen sogar auf 20 bis 30 Prozent steigen.

Die Folgen sind unnötige Kosten, beispielsweise durch Retouren. Daher ist es sinnvoll, von vornherein auf die Datenqualität zu achten und dabei menschliche Intelligenz mit computergestützten Systemen zu kombinieren, um Kunden später richtig ansprechen zu können. Denn die bisher einigermaßen zuverlässig arbeitenden Prozeduren zur Dublettenerkennung und Adressvalidierung stoßen bei "exotischeren" Namen aus dem Irak, Syrien oder Afghanistan schnell an ihre Grenzen.

Daten_Wildwuchs_Shutterstock_naqiewei Kopie
Kommt die Rede auf Datenqualität, haben viele Unternehmen ein schlechtes Gewissen. Das riecht nach einem großen Projekt mit unsicherem Return on Investment. Doch der Einsatz zahlt sich aus, sofern man ein paar Regeln im Auge behält.
1. Gebot: Du sollst erkennen, dass du betroffen bist!
Datenbanken sind kein statisches Gebilde. Sie unterliegen ständiger Veränderung. Werden sie nicht gepflegt, schleicht sich Wildwuchs ein - durch falsches oder doppeltes Ablegen von Informationen etwa, durch unterschiedliche Schreibweisen, durch unkontrolliertes Zusammenführen von Datenbanken etc. Jedes Unternehmen ist betroffen.
2. Gebot: Du sollst Verantwortliche für Datenqualität benennen!
Datenqualität ist nur zu haben, wenn es Mitarbeiter gibt, die ein Bewusstsein für die Wichtigkeit der Datenpflege haben und sich um diese Aufgabe dauerhaft kümmern. Dazu muss ein Hauptverantwortlicher ernannt werden, der in regelmäßigen Zeiträumen einen Blick auf die Datenqualität wirft, die Reports von Data-Quality-Tools auswertet und gegebenenfalls Handlungen einleitet.
3. Gebot: Du sollst Deinen Datenschatz hüten und anreichern!
Die bereinigte Datenbank muss vor neuen Verschmutzungen geschützt werden. Dabei können Data-Quality-Werkzeuge helfen, die jeden neuen Datenbankeintrag prüfen. So lässt sich herausfinden, ob Datensätze schon einmal angelegt wurden (fehlertoleranter Dublettenabgleich), ob Name, Adresse etc. stimmen und die Angaben plausibel sind (Abgleich mit Referenzdatenbanken) oder ob Kunden oder Lieferanten Compliance-Bestimmungen verletzen (Abgleich mit Sanktionslisten).
4. Gebot: Du sollst deine Daten zugänglich und leicht auffindbar machen!
Auch die bestgepflegte Datenbank nützt nichts, wenn die in ihr schlummernden Informationen im Bedarfsfall nicht schnell genug gefunden werden. Um das zeitnahe Auffinden von Datensätzen zu gewährleisten, bedarf es einer fehlertoleranten Suchfunktion, die in der Lage ist, selbst in riesigen Datenmengen die gewünschten Informationen schnell aufzuspüren.
5. Gebot: Du sollst Datenqualitätsprozesse automatisieren!
Datenbanken beinhalten oft Hundertausende oder sogar Millionen von Datensätzen. Es wäre ineffizient, Aufgaben der Datenbereinigung und der laufenden Qualitätspflege manuell steuern zu wollen. Viele der genannten Prozesse und Aufgaben können mit entsprechender Software in serviceorientierten Architekturen (SOA) automatisiert ablaufen.
6. Gebot: Du sollst Datenqualität als internationale Aufgabe begreifen!
Datenqualität wird mehr und mehr zur grenzüberschreitenden Herausforderung. Im Falle von Fusionen und Übernahmen müssen internationale Stammdaten miteinander in Beziehung gesetzt werden. Darüber hinaus weiten immer mehr Unternehmen ihren Einkauf auf weltweite Märkte aus.
7. Gebot: Du sollst dich auf Expertenwissen stützen!
Es bringt nichts, Daten einfach durch ein Analysetool laufen zu lassen. Im Umgang mit Stammdaten ist Know-how gefragt. Das betrifft die grundsätzliche Zielstellung und Herangehensweise, die Parametrierung der operativen Prozesse, die Bewertung der Ergebnisse und das Installieren von Automatismen zur nachhaltigen Qualitätspflege.
8. Gebot: Verbessere die Qualität deiner Daten schrittweise!
Datenqualitäts-Prozesse werden am besten erstmal in nur einem Bereich gestartet, und zwar dort, wo der Nutzen am größten ist. Dieses Vorgehen hat sich in der Praxis vielfach bewährt. So ergeben sich schon in kurzer Zeit messbare Erfolge im Kleinen, etwa im CRM-System. Zudem sorgt die Strategie der kleinen Schritte für Planungssicherheit.
9. Gebot: Du sollst die Ziele deiner Datenqualitäts-Aktivitäten immer vor Augen haben!
Datenqualität dient letztlich dem einen großen Ziel, alle Prozesse im Unternehmen effizienter zu gestalten, um den Gewinn zu maximieren. Damit dieses große Ziel im kleinen Datenqualitäts-Alltag nicht aus den Augen gerät, empfiehlt es sich, unternehmensspezifische Messgrößen (Key Performance Indicators = KPIs) zu definieren.
10. Gebot: Du sollst die Früchte hoher Datenqualität ernten!
Wer seine Kunden fehlerfrei anspricht, vermittelt Professionalität und Kompetenz, vermeidet Reklamationen oder gar Kündigungen und sorgt für überschaubare Prozesskosten. Wer saubere Kreditoren- und Materialstammdaten hat, verringert den Verwaltungsaufwand und ist in der Lage, Einkaufsprozesse zu optimieren und etwa Mengenvorteile konsequent auszuschöpfen.

"First time right"-Datenbereinigung

Neben den herkömmlichen Algorithmen kommen deshalb in einer guten Datenqualitätssoftware auch wissensbasierte Methoden zum Einsatz. Sie wenden Einsichten der Computerlinguistik zur Spracherkennung und -synthese an, um eine deutlich höhere Erkennungsquote von Dubletten und Fehlern zu erreichen. Sinnvollerweise sollte die Datenbereinigung auch nach dem "First-Time-Right-Prinzip" erfolgen, bei dem Daten direkt bei der Eingabe in eine Datenbank oder ins CRM-System auf ihre Richtigkeit überprüft werden. So können bereits zahlreiche Datenverunreinigungen und Dubletten zugunsten einer hohen Datenqualität verhindert werden. Bei guten Software-Lösungen kontrolliert das System unmittelbar bei der Eingabe eines neuen Kunden die Daten beispielsweise auf ihre Groß-und Kleinschreibung, die korrekte Geschlechts-Zuordnung und die Syntax. Gleichzeitig können E-Mail-Adressen automatisch validiert und postalische Adressdaten geprüft werden. (fm)

Vier CRM-Lösungen im Vergleich
Es muss nicht immer Salesforce sein, wenn es um Customer Relationship Management für kleine und mittelständische Unternehmen geht. Lesen Sie, welche Vor- und Nachteile drei alternative CRM-Systeme im Vergleich zu Salesforce.com bringen: Sage CRM, Microsoft Dynamics NAV und Odoo CRM.
Salesforce CRM
Salesforce verfügt über ein modernes Webinterface.
Salesforce CRM
Ein übersichtliches Dashboard ist Standard bei Salesforce.
Sage CRM
Sage CRM ist Teil der Sage Unternehmenssoftware-Lösung.
Dynamics NAV
Navision beziehungsweise Dynamics NAV hat den bekannten Windows-Look.
Odoo CRM
Odoo CRM ist über zahlreiche Apps einfach erweiterbar.

Aktuelle Technologie-Themen:

Aktuelle Artikel im Überblick:

Aktuelle Artikel im Überblick:

Aktuelle Management-Themen:

Aktuelle Karriere-Themen:

Events

Aktuelle Podcasts im Überblick:

Aktuelle Webcasts im Überblick:

Aktuelles aus den Hot Topics auf COMPUTERWOCHE: -Anzeige-

IT-Strategie

Was die Flüchtlingskrise für die Datenbanken bedeutet

Flüchtlinge: Herausforderung für Datenqualität

Arabische Namen erfordern Datenbanken mit Komplexität

So vermeiden Sie unnötige Kosten

"First time right"-Datenbereinigung

Aktuelle Technologie-Themen:

Aktuelle Artikel im Überblick:

Aktuelle Artikel im Überblick:

Aktuelle Management-Themen:

Aktuelle Karriere-Themen:

Events

Aktuelle Podcasts im Überblick:

Aktuelle Webcasts im Überblick:

Aktuelles aus den Hot Topics auf COMPUTERWOCHE: -Anzeige-

Aktuelle Technologie-Themen:

Aktuelle Management-Themen:

Aktuelle Karriere-Themen:

IT-Strategie

Arabische Namen erfordern Datenbanken mit Komplexität

So vermeiden Sie unnötige Kosten

"First time right"-Datenbereinigung

Per E-Mail versenden

Artikel als PDF kaufen

Über den Autor