Hinzufügen einer Zusammenführungskampagne zur Deduplizierung von Datensätzen
Über eine Kampagne des Typs Merging (Zusammenführen) können Data Stewards mehrere potenziell doppelte Datensätze in einem einzelnen Stammdatensatz zusammenführen. Die Quelldatensätze können aus derselben Quelle (Datendeduplizierung) oder aus unterschiedlichen Quellen (Datenbankabgleich) stammen.
Als Kampagnenverantwortlicher müssen Sie eine Kampagne erstellen, um die Struktur der zu verwaltenden Daten, die mit den Daten auszuführenden Aktionen und die Data Stewards festzulegen, die an den Tasks arbeiten sollen.
Ein geläufiger Anwendungsfall der Datendeduplizierung besteht darin, dass dieselben Kunden in Ihrem CRM-System als separate Datensätze vorhanden sind. In diesem Fall möchten Sie ein Matching der Datensätze durchführen, um alle Duplikate zu identifizieren. Bei einer Kampagne Merging (Zusammenführen) können Sie entscheiden, welche Felder verwendet werden sollen, damit eine Übereinstimmung (ein Match) erkannt wird und die entsprechenden Datensätze zusammengeführt werden können. Nach der Deduplizierung der Daten können die bereinigten Daten mithilfe eines Talend-Jobs erneut in das CRM-System hochgeladen werden.
Einen realen Anwendungsfall zum Datenabgleich finden Sie unter „Abstimmen von Daten aus unterschiedlichen Quellen“.
Vorbereitungen
-
Ein Administrator hat Stewardship-Benutzer erstellt und ihnen Rollen in Talend Management Console zugewiesen. Weitere Informationen zur Verwaltung von Benutzern finden Sie unter Verwalten von Benutzern.
-
Ihnen wurde in Talend Management Console die Rolle eines Kampagnenverantwortlichen bzw. eine Rolle mit Berechtigungen zum Hinzufügen und Verwalten von Datenmodellen und Kampagnen zugewiesen.
-
Sie haben als Kampagnenverantwortlicher auf Talend Cloud Data Stewardship zugegriffen.