Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Verbessern des Talend Trust Score™

Das nachstehende Beispiel zeigt, wie Sie den Talend Trust Score™ mithilfe von Talend Cloud Data Inventory und Talend Cloud Data Preparation verbessern können.

In diesem Beispiel sind Sie für ein E-Commerce-Unternehmen tätig. Einige Aufträge wurden noch nicht ausgeliefert. Bei der Einsicht des Status der Aufträge konnten Sie feststellen, dass einige Ländernamen und Steuer-Identifikationsnummern nicht richtig sind.

Nachstehend ein Auszug aus dem Datensatz:
Auszug aus einem Datensatz mit Informationen zu einem E-Commerce-Unternehmen

Prüfen des aktuellen Talend Trust Score™

Procedure

  1. Rufen Sie die Registerkarte Datasets (Datensätze) auf.
  2. Um den Datensatz aufzufinden, dessen Talend Trust Score™ Sie verbessern möchten, führen Sie eine entsprechende Filterung der Datensätze durch.
    Ausgewählte Option „Add filter (Filter hinzufügen)“
  3. In diesem Beispiel verwenden Sie die Tags zur Filterung der Datensätze.
    „Tags in orders (Tags in Aufträge)“ zur Filterung der Datensätze ausgewählt
    Die Datensatzliste wurde gefiltert. Der Talend Trust Score™ beträgt 3,38/5.

What to do next

Um den Talend Trust Score™ zu verbessern, können Sie ausgehend von diesem Datensatz eine Datenaufbereitung erstellen. Weitere Informationen finden Sie unter Erstellen von Datenaufbereitungen ausgehend von einem Datensatz.

Weitere Informationen zu Datenaufbereitungen finden Sie im Nutzungshandbuch für Talend Cloud Data Preparation.

Erstellen von Datenaufbereitungen ausgehend von einem Datensatz

Procedure

  1. Rufen Sie die Registerkarte Datasets (Datensätze) in Talend Cloud Data Inventory auf.
    Ihre Datensatzliste wird mit dem im vorhergehenden Abschnitt angewendeten Filter gefiltert.
  2. Positionieren Sie den Mauszeiger auf dem Datensatz und klicken Sie auf das Symbol Preparations (Datenaufbereitungen).
    Ausgewähltes Symbol „Preparations (Datenaufbereitungen)“
    Daraufhin wird der Assistent Preparations (Datenaufbereitungen) geöffnet.
  3. Klicken Sie auf Add (Hinzufügen).
    Sie werden zu Talend Cloud Data Preparation weitergeleitet und die Datenaufbereitung wird erstellt.

What to do next

Sie können die Datenaufbereitung jetzt konfigurieren.

Konfigurieren von Datenaufbereitungen

About this task

In diesem Beispiel setzen Sie die Funktionen von Talend Cloud Data Preparation ein.

Procedure

  1. Um die Ländernamen zu korrigieren, ziehen Sie die Funktion „Fuzzy Matching“ heran.
    1. Wählen Sie die Spalte delivery_country (Lieferung_Land) aus.
    2. Wählen Sie im rechten Fensterbereich Column (Spalte) aus und geben Sie fuzzy matching ein.
    3. Wählen Sie die Funktion Standardize value (fuzzy matching) (Wert standardisieren (Fuzzy Matching)) aus.
    4. Stellen Sie Match threshold (Übereinstimmungsgrenze) auf Default (> 80%) (Standard (> 80 %)) ein.
    5. Klicken Sie auf Submit (Senden). Der Schritt wird den Datenaufbereitungsschritten im linken Fensterbereich hinzugefügt und die Ländernamen werden berichtigt. Beispiel: United Staates (USAA) wird durch United States (USA) ersetzt.
  2. Um die Ländercodes zu konvertieren, ziehen Sie eine Konvertierungsfunktion heran. Die Spalte delivery_country (Lieferung_Land) ist nach wie vor ausgewählt.
    1. Wählen Sie im rechten Fensterbereich Column (Spalte) aus und geben Sie convert (Konvertieren) ein.
    2. Wählen Sie die Funktion Convert country names and codes (Ländernamen und -codes konvertieren) aus.
    3. Stellen Sie From (Von) auf ISO country code (ISO-Ländercode) und To (In) auf English country name (Englischer Ländername) ein.
    4. Klicken Sie auf Submit (Senden). Die Ländernamen werden konvertiert. Beispiel: CA wird durch Canada (Kanada) ersetzt.
  3. Um die Steuer-Identifikationsnummer zu berichtigen, ziehen Sie die Lookup-Funktion heran.
    Die Funktion ermöglicht Ihnen die Zuordnung der Daten aus der aktuellen Datenaufbereitung zu einem Referenzdatensatz. Weitere Informationen finden Sie unter Dynamische Verwendung der Daten aus einem anderen Datensatz.
    Sie müssen übereinstimmende Spalten miteinander verknüpfen.
    1. Wählen Sie die Spalte customer_id (Kunde_ID) aus. Im vorliegenden Beispiel ist dies die übereinstimmende Spalte.
    2. Klicken Sie auf das Lookup-Symbol über dem rechten Fensterbereich.
      Ausgewähltes Lookup-Symbol
      Daraufhin wird der Lookup-Bereich im rechten Fensterbereich geöffnet.
    3. Klicken Sie auf Select dataset (Datensatz auswählen).
    4. Wählen Sie den Referenzdatensatz aus und klicken Sie auf Select (Auswählen). Sie kehren zum Lookup-Bereich zurück. Der Referenzdatensatz wird jetzt unter der Datenaufbereitung angezeigt.
      Anzeige des Lookup-Bereichs mit dem Referenzdatensatz unter der Datenaufbereitung
    5. Wählen Sie in Current preparation (Aktuelle Datenaufbereitung) und Lookup dataset (Lookup-Datensatz) den Eintrag customer_id (Kunde_ID) aus.
    6. Wählen Sie im Referenzdatensatz die Spalte aus, die zur Datenaufbereitung hinzugefügt werden soll.
      In diesem Beispiel möchten Sie die Steuer-Identifikationsnummer korrigieren. Sie müssen customer_tax_id (Kunde_Steuer_ID) auswählen.
      Auswahl von „customer_tax_id“ in der Option „Import columns (Spalten importieren)“
    7. Klicken Sie auf Submit (Senden). Der Schritt wird den Datenaufbereitungsschritten im linken Fensterbereich hinzugefügt.

Ausführen von Datenaufbereitungen

Procedure

  1. Klicken Sie auf Run (Ausführen).
  2. Wählen Sie den aktuellen Datensatz aus, um die aufbereiteten Daten auszugeben.
    Nach der Auswahl des Datensatzes werden die zusätzlichen Parameter (Additional parameters) angezeigt.
  3. Wählen Sie Update (Aktualisieren) als Action (Aktion) aus.
  4. Geben Sie in Operation keys (Operationsschlüssel) Folgendes ein: order_id (Auftrag_ID).
  5. Wählen Sie (Create entry) ((Eintrag erstellen)) aus und klicken Sie auf Next (Weiter).
    Anzeige von „order_id“ in der Dropdown-Liste „Operation keys (Operationsschlüssel)“
  6. Verknüpfen Sie customer_tax_id (Kunde_Steuer-ID) mit customer_tin (Kunde_Steuer-Identifikationsnummer).
    „customer_tax_id“ verknüpft mit „customer_tin“

    Wenn die Datenaufbereitung über mehr Spalten als der Referenzdatensatz verfügt, können einige Spalten unverknüpft bleiben.

  7. Klicken Sie auf Next (Weiter).
  8. Wählen Sie ein Ausführungsprofil aus und klicken Sie auf Run (Ausführen).
    Die Ausführung der Datenaufbereitung kann einige Minuten in Anspruch nehmen. In Run history (Ausführungsverlauf) über dem rechten Fensterbereich können Sie den Status des Ausführungsvorgangs prüfen.
    Angeklickte Schaltfläche „Run history (Ausführungsverlauf)“
  9. Um die Verbesserungen an Ihrem Datensatz anzuzeigen, kehren Sie zu Talend Cloud Data Inventory zurück.

Prüfen des neuen Talend Trust Score™

Procedure

  1. Um die mithilfe der Datenaufbereitung erzielten Verbesserungen zu ermitteln, öffnen Sie den Datensatz und aktualisieren Sie die Sample-Anzeige in der Ansicht Sample.
    Schaltfläche „Refresh (Aktualisieren)“ in der Head-Sample-Ansicht
    Wie Sie feststellen können, sind alle Ländernamen gültig und es wurden einige Steuer-Identifikationsnummern angegeben.
  2. Um die Wirkung auf die Datensatzqualität zu ermitteln, rufen Sie die Datensatzübersicht auf.
    Der Talend Trust Score™ wurde von 3,38/5 auf 3,57/5 erhöht.
    Darstellung des Talend Trust Score™ von 3,57/5.

What to do next

Sie können den Talend Trust Score™ ebenfalls mithilfe von Datenqualitätsregeln verbessern. Weitere Informationen finden Sie unter Übersicht über die Kachel der Datenqualitätsregeln.

Hat diese Seite Ihnen geholfen?

Wenn Sie ein Problem mit dieser Seite oder ihrem Inhalt feststellen, sei es ein Tippfehler, ein ausgelassener Schritt oder ein technischer Fehler, informieren Sie uns bitte!