Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Verwenden von Gruppierungstasks zur Festlegung der Beziehung zwischen Datensatzpaaren

Gruppierungstasks bestehen in der Festlegung der Beziehung zwischen verschiedenen Datensätzen in einer Gruppe. Sobald Sie Ihre Auswahl validieren, geht die Task in den zweiten, im Workflow definierten Status über.

Prozedur

  1. Klicken Sie auf der Seite Tasks auf den Namen der Kampagne, in diesem Beispiel Site deduplication (Standort-Deduplizierung), um eine Liste der Ihnen zugewiesenen Tasks zu öffnen.
    Übersicht über die Kampagne zur Standort-Deduplizierung („Site deduplication“)

    Example

    Sie müssen eine Frage beantworten, um anzugeben, ob es sich bei verdächtigen Paaren in einer Liste von Kinderbildungs- und -betreuungseinrichtungen um tatsächliche Duplikate handelt. Sobald Sie die Datensätze gekennzeichnet und Ihre Auswahl validiert haben, ruft ein Talend-Job die Daten aus der Kampagne ab und verwendet sie beim Daten-Matching in Spark.
  2. Wählen Sie eine Task aus oder drücken Sie die Strg / Umschalt -Taste, um mehrere Tasks auszuwählen, und klicken Sie dann auf Yes (Ja), No (Nein) oder Not sure (Nicht sicher), um die Beziehung zwischen Datenpaaren zu bestätigen.
    Tasks, für die eine Entscheidung getroffen wurde, werden grün gekennzeichnet, und Ihre Auswahl wird in der Spalte Arbitration (Arbitrieren) aufgeführt.
  3. Klicken Sie auf Validate choices (Auswahl validieren) in der oberen rechten Seitenecke, um die von Ihnen für die Tasks getroffene Auswahl zu validieren.

Ergebnisse

Die Auswahl wird übernommen, die Datensätze werden aufgelöst, validiert und aus Ihrer Liste entfernt.

Nächste Maßnahme

Verwenden Sie einen Talend-Job, um die in der Kampagne Site deduplication (Standort-Deduplizierung) gekennzeichneten Daten zu analysieren und ein Matching-Modell zu generieren.

Weitere Informationen finden Sie in den Szenarien zum Matching durch maschinelles Lernen - Job zur Generierung eines Matching-Modells ausgehend von einer Gruppierungskampagne.

Hat diese Seite Ihnen geholfen?

Wenn Sie ein Problem mit dieser Seite oder ihrem Inhalt feststellen, sei es ein Tippfehler, ein ausgelassener Schritt oder ein technischer Fehler, informieren Sie uns bitte!