Definieren eines Datenmodells in einer Zusammenführungskampagne
- Cloud API Services Platform
- Cloud Big Data
- Cloud Big Data Platform
- Cloud Data Fabric
- Cloud Data Integration
- Cloud Data Management Platform
- Cloud Pipeline Designer Standard Edition
- Data Fabric
- Qlik Talend Cloud Enterprise Edition
Datenmodelle bestimmen die Struktur der zu verwaltenden Daten. Sie dienen der syntaktischen und semantischen Validierung der Daten.
Sie können für alle in einem Datenmodell aufgeführten Attribute eine Zugriffsberechtigung pro Rolle festlegen.
Prozedur
-
Klicken Sie auf der Seite Add campaign (Kampagne hinzufügen) auf Data model (Datenmodell) und wählen Sie in der Modellliste die Datenstruktur aus, die Sie in der Kampagne CRM data deduplication (CRM-Datendeduplizierung) verwenden möchten.
Die Liste Data Model (Datenmodell) bietet Zugriff auf alle definierten Datenmodelle.
-
Wählen Sie die Schaltflächen neben den Attributen in der Datenstruktur aus, um Berechtigungen pro Attribut und pro Data Steward festzulegen und vorzugeben, wer welche Attribute anzeigen/bearbeiten kann.
Option Bezeichnung Stellt einen Lese-/Schreibzugriff für das Attribut im Datenmodell bereit. Stellt nur einen Lesezugriff für das Attribut im Datenmodell bereit. Dieser Zugriffstyp kann sich als nützlich erweisen, wenn der Data Steward Informationen einsehen muss, um relevante Entscheidungen treffen zu können, der Wert der Daten jedoch nicht geändert werden darf. Das betrifft beispielsweise eindeutige Kennungen anderer Elemente, die mit der vom Steward angezeigten Entität verknüpft sind, oder Daten, von denen Sie wissen, dass sie zuverlässig sind und die unverändert bleiben müssen.
Stellt keinen Zugriff auf das Attribut bereit. Das Verbergen eines Attributs kann nützlich sein, wenn es sich um sensible Informationen handelt, die vom Data Steward nicht eingesehen werden sollten, z. B. Finanzdaten. Ein anderes Beispiel für Attribute, die verborgen werden sollten, sind Informationen, die für den Steward nicht aussagekräftig und somit nur störend sind, z. B. technische Kennungen, die jedoch als Teil der Task propagiert werden müssen.
Example
In der Kampagne CRM data deduplication (CRM-Datendeduplizierung) räumen Sie den Data Stewards, die über die Rolle Account analyst (Kontoanalyst) verfügen, einen Lesezugriff auf das Kennungsattribut ein.
-
Wählen Sie in den Listen Survivorship Rule (Survivorship-Regel) neben den Attributen eine Regel aus.
Anhand dieser Regeln können die Attributwerte ermittelt werden, die die Stammdatensätze beim Laden von Daten in die Kampagne definieren. Data Stewards können diese Auswahl dann manuell ändern.
- First valid (Erste gültige): Auswahl der ersten Quelle, die in Bezug auf die im zugeordneten Datenmodell definierten Constraints einen gültigen Wert enthält. Ein Wert gilt als gültig, wenn er allen definierten Constraints und Regeln entspricht. Der „erste Wert“ wird von der Reihenfolge der Datensätze bei der Erstellung der Task vorgegeben.
- First not null (Erste nicht null): Auswahl der ersten Quelle mit einem Wert ungleich null, wobei der „erste Wert“ von der Reihenfolge der Datensätze bei der Erstellung der Task vorgegeben wird.
- Most common (Häufigster): Auswahl des Attributwerts der Duplikate aus einer oder mehreren Datenquellen, der am häufigsten vorkommt.
- Most redent (Neuester): Auswahl des Attributwerts der Duplikate aus einer oder mehreren Datenquellen, der zuletzt verwendet wurde. Das erfolgt auf der Grundlage der Metadaten des letzten Aktualisierungsdatums.
- Most trusted (Vertrauenswürdigster): Auswahl des vertrauenswürdigsten Attributwerts der Duplikate nach dem Trust Score, den Sie bei der Erstellung der Kampagne oder beim Laden der Tasks in die Kampagne festgelegt haben. Wurde kein Trust Score angegeben, dann funktioniert diese Option nicht.
Sie können eine Regel für alle Attribute vorgeben, indem Sie sie in der Liste in der oberen rechten Ecke des Formulars auswählen. Wenn ein bestimmter Algorithmus nicht angewendet werden kann, wird automatisch die Regel First not null (Erster Wert ungleich null) ausgewählt. Wenn Sie bei der Kampagnendefinition z. B. keinen Trust Score festlegen und die Option Most trusted (Vertrauenswürdigster Wert) auswählen, wird stattdessen die Option First not null (Erster Wert ungleich null) zugewiesen. Desgleichen wird First not null (Erster Wert ungleich null) verwendet, wenn Sie Most common (Häufigster Wert) oder First valid (Erster gültiger Wert) auswählen und die Datenduplikate keine gemeinsamen oder gültigen Werte enthalten.Example
Nachstehend einige Beispiele, die illustrieren, wie die Survivorship-Regeln die Auswahl des Werts zur Generierung der Stammdatensätze steuern.First valid (Erster gültiger Wert): E-Mailadresse:- Wenn der erste Wert nicht gültig ist, jedoch der zweite, dann wird die zweite E-Mail ausgewählt.
- Sollten alle E-Mail-Adressen ungültig sein, dann wird der erste Wert ungleich null verwendet.
First not null (Erster Wert ungleich null): Vorname:- Wenn der erste Wert leer ist, der zweite jedoch nicht, dann wird der zweite Vorname ausgewählt.
- Sind alle Vornamen leer, dann enthält der Stammdatensatz keinen Vornamen.
Most common (Häufigster Wert): Nachname:- Wenn die Nachnamen in zwei Quelldatensätzen identisch sind, wird dieser Wert verwendet.
- Wenn sich die Nachnamen in allen Quelldatensätzen unterscheiden, wird der erste Wert ungleich null ausgewählt.
Most recent (Neuester Wert): Telefonnummer und Zeitstempel:- Die Telefonnummer mit dem neuesten Zeitstempel wird verwendet.
- Wenn alle Telefonnummern denselben Zeitstempel aufweisen, wird der erste Wert ungleich null ausgewählt.
Most trusted (Vertrauenswürdigster Wert): Adresse:- Wenn alle Adressen in den Quelldatensätzen über einen Trust Score verfügen, wird der Wert mit dem höchsten Score verwendet.
- Wenn alle Adressen in den Quelldatensätzen einen Trust Score besitzen und zwei Scores identisch sind, wird der erste der identischen Scores verwendet.
- Wenn für keine Adresse ein Trust Score angegeben wurde, wird der erste Wert ungleich null ausgewählt.
Hat diese Seite Ihnen geholfen?
Wenn Sie ein Problem mit dieser Seite oder ihrem Inhalt feststellen, sei es ein Tippfehler, ein ausgelassener Schritt oder ein technischer Fehler, informieren Sie uns bitte!