Schritt für Schritt zu sauberen Daten

Daten-Score festlegen

von - 16.06.2020
Datenbereinigung
Datenqualität: Die Bereinigung von Datensätzen ist meist eine Mischung aus automatischen und manuellen Aktionen.
(Quelle: Factory42)
Nutzen Sie einen Datenqualitäts-Score zur regelmäßigen und transparenten Datenanalyse direkt im System. Steht die Mi­gration auf ein CRM-System an, sind diese Fragen inte­ressant: Können „Datenleichen“ vorab identifiziert werden? Bietet die neue Plattform Werkzeuge, die für eine anschließende Datenbereinigung, etwa eine Deduplizierung, genutzt werden können? Müssen Kundendaten aus verschiedenen Datenquellen zusammengeführt werden, ist zu definieren, über welchen Schlüssel die Daten gematcht werden können. Anschließend wird evaluiert, welcher Datenstand mit­genommen wird.

Qualität definieren

Datenbereinigung beginnt mit der Definition qualifizierter Kundendaten. Wichtige Aspekte sind Eindeutigkeit, Korrektheit, Vollständigkeit, Relevanz, Aktualität und Klarheit. Dabei sind nicht alle Attribute eines Datensatzes gleich relevant. Wichtiger ist es, bei allen Kunden die Schlüssel­attribute statt bei einem Teil der Kunden alles perfekt zu pflegen. Legen Sie die Reihenfolge der Datenpflege in Abhängigkeit von der ­Gewichtung einzelner Attribute fest. Diese Schlüssel­attribute könnten in einem Datenqualitäts-Score zusammengefasst werden. Sie können aber auch Kundendatensätze priorisieren: Definieren Sie daher eine Datenpflegepriorität. Kriterien dafür können der bisherige Umsatz der Kunden oder die Priorisierung nach Branchen oder Regionen sein.

Die Guten ins Töpfchen …

Die so identifizierten Datensätze werden korrigiert, vervollständigt oder gelöscht. Ein Beispiel ist die automatische Bereinigung von Telefonnummern mit ­Ziffern und führendem „+“. Damit lassen sich auch einfache Dubletten­prüfungen durchführen. Eine Dublettenbereinigung kann mit den richtigen Werkzeugen im neuen System effektiver sein als im Vorfeld. Das Löschen von Daten stellt oft eine psychologische Hürde dar. Sie können solche Datensätze zunächst auf einen Inaktiv-Status setzen und später löschen. Der Aufwand für eine Datenbereinigung und den langfristigen Erhalt der Datenqualität kann je nach Organisation unterschiedlich hoch sein. Ein pragmatisches Vorgehen – orientiert an den Unternehmenszielen – ist empfehlenswert. Aktives Managen der Datenqualität kann die (oft verfluchten) Daten zu einem Segen für die gesamte Organisation werden lassen.
Verwandte Themen