Das nachstehende Beispiel zeigt, wie Sie den Talend Trust Score™ mithilfe von Talend Cloud Data Inventory und Talend Cloud Data Preparation verbessern können.
In diesem Beispiel sind Sie für ein E-Commerce-Unternehmen tätig. Einige Aufträge wurden noch nicht ausgeliefert. Bei der Einsicht des Status der Aufträge konnten Sie feststellen, dass einige Ländernamen und Steuer-Identifikationsnummern nicht richtig sind.
Nachstehend ein Auszug aus dem Datensatz:
Prüfen des aktuellen Talend Trust Score™
Procedure
Rufen Sie die Registerkarte Datasets (Datensätze) auf.
Um den Datensatz aufzufinden, dessen Talend Trust Score™ Sie verbessern möchten, führen Sie eine entsprechende Filterung der Datensätze durch.
In diesem Beispiel verwenden Sie die Tags zur Filterung der Datensätze.
Die Datensatzliste wurde gefiltert. Der Talend Trust Score™ beträgt 3,38/5.
Erstellen von Datenaufbereitungen ausgehend von einem Datensatz
Procedure
Rufen Sie die Registerkarte Datasets (Datensätze) in Talend Cloud Data Inventory auf.
Ihre Datensatzliste wird mit dem im vorhergehenden Abschnitt angewendeten Filter gefiltert.
Positionieren Sie den Mauszeiger auf dem Datensatz und klicken Sie auf das Symbol Preparations (Datenaufbereitungen).
Daraufhin wird der Assistent Preparations (Datenaufbereitungen) geöffnet.
Klicken Sie auf Add (Hinzufügen).
Sie werden zu Talend Cloud Data Preparation weitergeleitet und die Datenaufbereitung wird erstellt.
What to do next
Sie können die Datenaufbereitung jetzt konfigurieren.
Konfigurieren von Datenaufbereitungen
About this task
In diesem Beispiel setzen Sie die Funktionen von Talend Cloud Data Preparation ein.
Procedure
Um die Ländernamen zu korrigieren, ziehen Sie die Funktion „Fuzzy Matching“ heran.
Wählen Sie die Spalte delivery_country (Lieferung_Land) aus.
Wählen Sie im rechten Fensterbereich Column (Spalte) aus und geben Sie fuzzy matching ein.
Wählen Sie die Funktion Standardize value (fuzzy matching) (Wert standardisieren (Fuzzy Matching)) aus.
Stellen Sie Match threshold (Übereinstimmungsgrenze) auf Default (> 80%) (Standard (> 80 %)) ein.
Klicken Sie auf Submit (Senden). Der Schritt wird den Datenaufbereitungsschritten im linken Fensterbereich hinzugefügt und die Ländernamen werden berichtigt. Beispiel: United Staates (USAA) wird durch United States (USA) ersetzt.
Um die Ländercodes zu konvertieren, ziehen Sie eine Konvertierungsfunktion heran. Die Spalte delivery_country (Lieferung_Land) ist nach wie vor ausgewählt.
Wählen Sie im rechten Fensterbereich Column (Spalte) aus und geben Sie convert (Konvertieren) ein.
Wählen Sie die Funktion Convert country names and codes (Ländernamen und -codes konvertieren) aus.
Stellen Sie From (Von) auf ISO country code (ISO-Ländercode) und To (In) auf English country name (Englischer Ländername) ein.
Klicken Sie auf Submit (Senden). Die Ländernamen werden konvertiert. Beispiel: CA wird durch Canada (Kanada) ersetzt.
Um die Steuer-Identifikationsnummer zu berichtigen, ziehen Sie die Lookup-Funktion heran.
Sie müssen übereinstimmende Spalten miteinander verknüpfen.
Wählen Sie die Spalte customer_id (Kunde_ID) aus. Im vorliegenden Beispiel ist dies die übereinstimmende Spalte.
Klicken Sie auf das Lookup-Symbol über dem rechten Fensterbereich.
Daraufhin wird der Lookup-Bereich im rechten Fensterbereich geöffnet.
Klicken Sie auf Select dataset (Datensatz auswählen).
Wählen Sie den Referenzdatensatz aus und klicken Sie auf Select (Auswählen). Sie kehren zum Lookup-Bereich zurück. Der Referenzdatensatz wird jetzt unter der Datenaufbereitung angezeigt.
Wählen Sie in Current preparation (Aktuelle Datenaufbereitung) und Lookup dataset (Lookup-Datensatz) den Eintrag customer_id (Kunde_ID) aus.
Wählen Sie im Referenzdatensatz die Spalte aus, die zur Datenaufbereitung hinzugefügt werden soll.
In diesem Beispiel möchten Sie die Steuer-Identifikationsnummer korrigieren. Sie müssen customer_tax_id (Kunde_Steuer_ID) auswählen.
Klicken Sie auf Submit (Senden). Der Schritt wird den Datenaufbereitungsschritten im linken Fensterbereich hinzugefügt.
Ausführen von Datenaufbereitungen
Procedure
Klicken Sie auf Run (Ausführen).
Wählen Sie den aktuellen Datensatz aus, um die aufbereiteten Daten auszugeben.
Nach der Auswahl des Datensatzes werden die zusätzlichen Parameter (Additional parameters) angezeigt.
Wählen Sie Update (Aktualisieren) als Action (Aktion) aus.
Geben Sie in Operation keys (Operationsschlüssel) Folgendes ein: order_id (Auftrag_ID).
Wählen Sie (Create entry) ((Eintrag erstellen)) aus und klicken Sie auf Next (Weiter).
Verknüpfen Sie customer_tax_id (Kunde_Steuer-ID) mit customer_tin (Kunde_Steuer-Identifikationsnummer).
Wenn die Datenaufbereitung über mehr Spalten als der Referenzdatensatz verfügt, können einige Spalten unverknüpft bleiben.
Klicken Sie auf Next (Weiter).
Wählen Sie ein Ausführungsprofil aus und klicken Sie auf Run (Ausführen).
Die Ausführung der Datenaufbereitung kann einige Minuten in Anspruch nehmen. In Run history (Ausführungsverlauf) über dem rechten Fensterbereich können Sie den Status des Ausführungsvorgangs prüfen.
Um die Verbesserungen an Ihrem Datensatz anzuzeigen, kehren Sie zu Talend Cloud Data Inventory zurück.
Prüfen des neuen Talend Trust Score™
Procedure
Um die mithilfe der Datenaufbereitung erzielten Verbesserungen zu ermitteln, öffnen Sie den Datensatz und aktualisieren Sie die Sample-Anzeige in der Ansicht Sample.
Wie Sie feststellen können, sind alle Ländernamen gültig und es wurden einige Steuer-Identifikationsnummern angegeben.
Um die Wirkung auf die Datensatzqualität zu ermitteln, rufen Sie die Datensatzübersicht auf.
Der Talend Trust Score™ wurde von 3,38/5 auf 3,57/5 erhöht.
Wenn Sie ein Problem mit dieser Seite oder ihrem Inhalt feststellen, sei es ein Tippfehler, ein ausgelassener Schritt oder ein technischer Fehler, informieren Sie uns bitte!