Abstimmen von Daten aus unterschiedlichen Quellen
In diesem Anwendungsfall wird beschrieben, wie Daten, die aus unterschiedlichen Quellen stammen, zur Generierung von Stammdatensätzen abgeglichen und bereinigt werden können.
Nehmen wir an, Sie haben Probleme mit der Datenqualität sowie Anomalien in Ihren Kundendaten. Sie haben Duplikate bei Ihren Lead-Informationen entdeckt, die auf eine mangelnde Synchronisation zwischen den verschiedenen CRMs in Ihrem Unternehmen zurückzuführen sind. Mithilfe einer Kampagne Merging (Zusammenführen) können Sie das Duplikatproblem lösen, da dadurch nur relevante Daten übrig bleiben.
- Wie lassen sich die Abgleichsgruppen identifizieren, die potenzielle Datensatzduplikate enthalten? Diese Frage wird durch Verwendung eines Talend-Jobs in Talend Studio beantwortet.
- Wie können die besten Attributwerte in den Datenquellen ausgewählt werden, um den Benutzern und Systemen die genauesten und zuverlässigsten Stammdatensätze bereitzustellen? Dieses Problem wird durch Verwendung einer Kampagne Merging (Zusammenführen) in Talend Data Stewardship gelöst.
Um das Beispiel zu reproduzieren und genau dieselben Kundendaten zu verwenden, wird davon ausgegangen, dass ein Kampagnenverantwortlicher die in diesem Beispiel verwendete Eingabedatei und den verwendeten Talend-Job heruntergeladen hat. Beides kann zum Laden von Tasks in die Kampagne verwendet werden, sobald diese erstellt wurde.
Rufen Sie die Datei tds_gettingstarted_source_files.zip ab und konfigurieren Sie die Verbindung zu Talend Cloud Data Stewardship in Talend Studio.