Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Wiederherstellen der E-Mailadressen vor dem Upload in eine Marketinglösung

Der Datensatz Marketing leads ist in einer Datei enthalten, die Sie von einer Marketingkampagne erhalten haben. Allerdings fehlen die E-Mailadressen.

Damit Sie diese Datei in Ihre Marketinglösung hochladen können, müssen Sie die E-Mailadressen erstellen. Sie leiten die Adressen vom Namen und Unternehmen der Leads sowie vom E-Mail-Format ab, das von den Unternehmen normalerweise verwendet wird.

Laden Sie folgende Dateien herunter: marketing_leads.zip und emails_reference.zip.

Hinzufügen einer Datenaufbereitung für den Datensatz Marketing leads

Fügen Sie eine Datenaufbereitung hinzu, um die Aufbereitung und Bereinigung Ihrer Daten in Angriff zu nehmen.

Sie können eine Datenaufbereitung ausgehend von einem in Talend Data Preparation bereits verfügbaren Datensatz oder ausgehend von einer Ihrer lokalen Dateien erstellen. Beim Hinzufügen einer Datenaufbereitung über die entsprechende Schaltfläche wird diese in dem Ordner erstellt, in dem Sie zurzeit arbeiten. Darüber hinaus wird die Datenaufbereitung automatisch in die Liste der Datenaufbereitungen aufgenommen, alle von Ihnen vorgenommenen Änderungen werden automatisch gespeichert.

Before you begin

Sie haben unter Verwendung der zuvor heruntergeladenen Datei den Datensatz marketing_leads in Talend Cloud Data Preparation erstellt.

Procedure

  1. Klicken Sie auf der Homepage auf Preparations (Datenaufbereitungen), um die Liste der Datenaufbereitungen zu öffnen.
  2. Klicken Sie auf die Schaltfläche Add Preparation (Datenaufbereitung hinzufügen).
  3. Wählen Sie in der Liste Datasets (Datensätze) den Eintrag marketing_leads als Quellmaterial aus.
    Fenster Add a preparation (Datenaufbereitung hinzufügen) mit einer Liste der Datensätze, die zum Erstellen einer Datenaufbereitung verfügbar sind, darunter marketing_leads.
    In das Feld Preparation name (Name der Datenaufbereitung) wird automatisch ein Name eingetragen, den Sie jedoch nach Bedarf ändern können.
  4. Klicken Sie auf Submit (Senden).

Results

Der Datensatz wird mit einem leeren Rezept geöffnet, und Sie können mit den Arbeitsschritten zum Hinzufügen einer Datenaufbereitung beginnen. Alle Änderungen, die Sie vornehmen, werden automatisch gespeichert.

Entfernen von leeren Datenelementen aus dem Datensatz

Der graue Teil der Qualitätsleiste verweist darauf, dass eine Spalte leere Datenelemente enthält. Sie möchten die Zeilen mit den leeren Datenelementen entfernen.

Für einige Spalten im Raster zeigt die Qualitätsleiste leere Zellen an.

Daten, die dem Spaltentyp entsprechen, werden in der Qualitätsleiste grün angezeigt, rot hingegen kennzeichnet ungültige Daten, die nicht mit dem Spaltentyp übereinstimmen.

Procedure

  1. Klicken Sie in der Spalte first_name (Vorname) auf den grauen Teil der Qualitätsleiste.
  2. Klicken Sie auf Delete the rows with empty cell (Zeilen mit leeren Zellen löschen), um die Zeilen mit fehlenden Daten zu entfernen.

    Sie können diese Aktion für jede beliebige Spalte durchführen. Allerdings existiert eine einfache Vorgehensweise, um alle leere Zeilen aus einem Datensatz zu entfernen.

  3. Klicken Sie auf das Menüsymbol in der oberen linken Ecke des Rasters und wählen Sie Display rows with empty values (Zeilen mit leeren Werten anzeigen) aus.

    Durch diese Aktion wird ein Filter auf alle leeren Datenelemente im Datensatz angewendet.

    Ein Filter rows with empty values (Zeilen mit leeren Werten) ist auf den Datensatz angewendet.
  4. Geben Sie im Funktionsbereich Delete these filtered rows (Diese gefilterten Zeilen löschen) ein und klicken Sie auf das Ergebnis, um die zugeordnete Funktion anzuwenden.

    Dadurch werden alle verbleibenden Zeilen mit leeren Zellen aus dem Datensatz entfernt.

  5. Klicken Sie in der Filterleiste auf das Papierkorb-Symbol, um den Filter zu löschen und erneut den gesamten Datensatz anzuzeigen.

Results

Alle Zeilen mit leeren Datenelementen wurden aus dem Datensatz entfernt, die Qualitätsleiste unter jeder Spalte ist damit vollständig grün.

Entfernen der Leerzeichen aus den Namen der Leads

Leerzeichen können vor und nach dem Inhalt in jeder Zelle vorhanden sein.

Sie kommen vorwiegend in Spalten vor, in die Daten manuell eingegeben wurden, wie z. B. Namen oder Telefonnummern. Diese Leerzeichen werden als graue Quadrate dargestellt.

Wie Sie feststellen können, enthalten die Spalten first_name und last_name einige Einträge mit Leerzeichen.

Daten mit Leerzeichen.

Procedure

  1. Wählen Sie die Spalte first_name aus.
  2. Klicken Sie bei gedrückter Strg-Taste (Ctrl) auf die Überschrift der Spalte last_name.

    Die beiden Spalten sind nun markiert, und Sie können in einer einzigen Aktion eine Funktion auf beide Spalten anwenden.

  3. Geben Sie im Funktionsbereich Remove trailing and leading characters (Angehängte und führende Zeichen entfernen) ein und klicken Sie dann auf das Ergebnis, um die Optionen für die entsprechende Funktion anzuzeigen.
  4. Wählen Sie in der Dropdown-Liste Padding character (Padding-Zeichen) den Eintrag Whitespace (Leerzeichen) aus und klicken Sie auf Submit (Senden).

    Sie haben die Möglichkeit, das Ergebnis dieser Funktion in einer neuen Spalte auszugeben, indem Sie das Kontrollkästchen Create new column (Neue Spalte erstellen) aktivieren.

Results

Aus den ausgewählten Spalten werden alle Leerzeichen entfernt.

Duplizieren von Spalten

Wenn Sie eine Kopie einer bestimmten Spalte benötigen, können Sie die betreffende Spalte duplizieren.

Sie duplizieren zwei Spalten und verwenden diese als Basis für die Wiederherstellung der E-Mailadressen.

Procedure

  1. Klicken Sie auf die zu duplizierende Spalte, in diesem Beispiel first_name (Vorname).
  2. Klicken Sie auf das Menüsymbol bzw. klicken Sie mit der rechten Maustaste auf die Spalte, um das Kontextmenü zu öffnen.
  3. Klicken Sie auf Duplicate column (Spalte duplizieren).
    Das Menü der Spalte First Name (Vorname) ist geöffnet, und die Option Duplicate column (Spalte duplizieren) ist ausgewählt.

    Daraufhin wird eine Kopie der Spalte, first_name_copy, mit denselben Daten wie die Originalspalte erstellt.

  4. Wiederholen Sie diese Schritte, um die Spalte last_name (Nachname) zu duplizieren.

Results

Die zwei Spalten wurden dupliziert. Die in diesen zwei Spalten enthaltenen Informationen werden zur Erstellung des lokalen Teils der zu erstellenden E-Mailadressen verwendet.

Umbenennen von Spalten

Um eine Spalte leichter zu identifizieren, können Sie sie umbenennen.

Sie benennen jetzt die zwei zuvor erstellten Spalten um, um sie mit einem aussagekräftigen Namen zu versehen. Die neuen Spalten werden dann zur Erstellung des lokalen Teils der E-Mailadressen verwendet.

Procedure

  1. Klicken Sie auf die Spalte, die umbenannt werden soll, in diesem Beispiel first_name_copy (Vorname_Kopie).
  2. Verwenden Sie die Option Rename column (Spalte umbenennen) im Kontextmenü der Spalte.
    Das Menü der Spalte fist_name_copy ist geöffnet, und die Option Rename column (Spalte umbenennen) ist ausgewählt.
  3. Geben Sie email_first_name als neuen Spaltennamen ein und drücken Sie die Eingabetaste, um ihn anzuwenden.
  4. Wiederholen Sie diese Schritte, um die Spalte last_name_copy (Nachname_Kopie) in email_last_name (E_Mail_Nachname) umzubenennen.

Results

Die ausgewählten Spalten werden umbenannt.

Ändern der Namen zu Kleinbuchstaben

In manchen Fällen müssen Sie die Schreibung von Text zu Kleinbuchstaben ändern. Das kann sich als nützlich erweisen, wenn der Text an anderen Text angehängt werden soll.

Die in den zwei umbenannten Spalten enthaltenen Daten beginnen mit einem Großbuchstaben. Sie möchten den gesamten Text in Kleinbuchstaben setzen, um die zwei Spalten zusammenführen zu können.

Zwei Spalten mit Namen in Großbuchstaben.

Procedure

  1. Wählen Sie die Spalte aus, deren Text in Kleinschreibung geändert werden soll, in diesem Beispiel email_first_name.
  2. Geben Sie im Funktionsbereich Change to lower case (In Kleinbuchstaben ändern) ein und klicken Sie auf das Ergebnis, um die zugeordnete Funktion auszuführen.

    Sie haben die Möglichkeit, das Ergebnis dieser Funktion in einer neuen Spalte auszugeben, indem Sie das Kontrollkästchen Create new column (Neue Spalte erstellen) aktivieren.

  3. Wiederholen Sie diese Schritte, um die Spalte email_last_name (E_Mail_Nachname) in Kleinbuchstaben zu ändern.

Results

Der in den zwei Spalten enthaltene Text wird jetzt mit Kleinbuchstaben angezeigt.
Zwei Spalten mit Namen in Kleinbuchstaben.

Verwenden der E-Mail-Domänen aus einem anderen Datensatz

Die Lookup-Funktion vergleicht Daten aus dem aktuellen Datensatz mit den entsprechenden Daten in einem Referenzdatensatz.

Einerseits verfügen Sie über den Datensatz marketing_leads (Marketing_Leads), den Sie zurzeit bearbeiten und der Informationen zu den Unternehmen enthält, für die die aufgelisteten Kunden tätig sind. Der Datensatz emails_reference (E_Mails_Referenz) andererseits enthält eine Liste von Unternehmen sowie die E-Mail-Domänen, die diese verwenden.

Sie führen jetzt einen Lookup für den Datensatz emails_reference durch, um die Informationen zu E-Mail-Domänen zu extrahieren und sie dann mit den Unternehmen aus dem Datensatz marketing_leads abzugleichen.

Before you begin

Um den Lookup für emails_reference durchführen zu können, müssen Sie den Datensatz zunächst über die Schaltfläche Add dataset (Datensatz hinzufügen) in der Ansicht Datasets (Datensätze) auf der Homepage importieren.

Der Datensatz Emails reference (E-Mail-Referenz) wird in der Ansicht Datasets (Datensätze) angezeigt.

Procedure

  1. Öffnen Sie die Datenaufbereitung marketing_leads.
  2. Klicken Sie auf die Lookup-Schaltfläche im oberen rechten Bildschirmteil, um das Lookup-Fenster zu öffnen.
    Mauszeiger über der Schaltfläche Lookup.
  3. Klicken Sie auf Select dataset (Datensatz auswählen), um einen bereits vorhandenen Datensatz auszuwählen.
    Erster Schritt des Lookup-Konfigurationsmenüs.
  4. Wählen Sie den Datensatz aus, den Sie für den Lookup-Vorgang verwenden möchten, in diesem Beispiel den Datensatz emails_reference.
  5. Wählen Sie in den Dropdown-Listen Current preparation (Aktuelle Datenaufbereitung) und Lookup dataset (Lookup-Datensatz) die in Ihrer Haupt-Datenaufbereitung und Ihrem Referenzdatensatz übereinstimmenden Spalten aus, in diesem Beispiel die Spalten company (Unternehmen) und company_name (Unternehmen_Name).
    Um einen Lookup-Vorgang durchzuführen, muss sowohl in der Datenaufbereitung als auch in dem Datensatz, die Sie zusammenführen möchten, mindestens eine Spalte mit übereinstimmenden Daten vorhanden sein.
    Zweiter Schritt des Lookup-Konfigurationsmenüs.
  6. Wählen Sie in der Dropdown-Liste Columns to add (Hinzuzufügende Spalten) die Spalte mit den E-Mailadressen aus, die dem aktuellen Datensatz hinzugefügt werden sollen, in diesem Beispiel email_domain.
    Dritter Schritt des Lookup-Konfigurationsmenüs.
  7. Bestimmen Sie, ob die vorgenommenen Änderungen nur auf die ausgefilterten oder auf alle Zeilen angewendet werden sollen.
  8. Klicken Sie auf Submit (Senden), um die Änderungen anzuwenden.

Results

Die Spalte email_domain wird im Datensatz marketing_leads neben der Spalte company hinzugefügt.
Rasteransicht des Datensatzes, der die Spalte email_domain enthält.

Die Informationen zu den E-Mail-Domänen werden zu den Vor- und Nachnamen aus der duplizierten Spalte hinzugefügt, um vollständige E-Mailadressen zu erstellen.

Zusammenführen des Inhalts mehrerer Spalten

In manchen Fällen sind die Daten, die Sie verwenden möchten, auf mehrere Spalten aufgeteilt. Über eine Verkettung (Konkatenation) können Sie diese Spalten gruppieren.

Alle Informationen, die Sie zur Erstellung der E-Mailadressen benötigen, sind jetzt bereit. Sie brauchen sie nur noch zusammenzuführen. Dazu führen Sie die drei Spalten zusammen, die Sie seit Beginn dieses Szenarios erstellt haben.

Die drei zusammenzuführenden Spalten

Procedure

  1. Wählen Sie die Spalte email_first_name aus.
    Beim Zusammenführen mehrerer Spalten wird die Spalte, die Sie zuerst auswählen, in diesem Fall email_first_name (E_Mail_Vorname), als erster Teil der zusammengeführten, neu erstellten Spalte verwendet.
  2. Geben Sie im Funktionsbereich Concatenate with (Konkatenieren mit) ein und klicken Sie dann auf das Ergebnis, um die Optionen für die entsprechende Funktion anzuzeigen.
  3. Konfigurieren Sie die Funktion wie folgt:
    • Aktivieren Sie das Kontrollkästchen Create new column (Neue Spalte erstellen).
    • Lassen Sie das Feld Prefix (Präfix) leer.
    • Wählen Sie im Feld Use with (Verwenden mit) die Option Other column (Andere Spalte) aus.
    • Wählen Sie im Feld Column (Spalte) die Option email_last_name aus.
    • Geben Sie im Begrenzerfeld . ein.
    • Wählen Sie im Feld Add separator (Begrenzer hinzufügen) die Option Both values not empty (Beide Werte nicht leer) aus.

    Da Sie nur jeweils zwei Spalten konkatenieren können, führen Sie zunächst die Spalten email_first_name und email_last_name mit . als Begrenzer zusammen.

  4. Klicken Sie auf die Schaltfläche Submit (Senden), um die Funktion anzuwenden.

    Daraufhin wird eine neue Spalte mit dem zusammengeführten Inhalt aus den zwei Spalten erstellt.

  5. Gehen Sie ebenso vor, um die gerade erstellte Spalte mit der Spalte email_domain (E_Mail_Domäne) zusammenzuführen. Dieses Mal verwenden Sie jedoch @ als Begrenzer.

Results

Der Inhalt der drei Spalten wird zusammengeführt. Sie haben eine Spalte mit gültigen E-Mailadressen erstellt, bestehend aus Vornamen, Nachnamen und einer Webdomäne für jedes Unternehmen.

Die entstandene Spalte mit den neu erstellten E-Mail-Adressen.

Löschen doppelter Spalten

Wenn Sie eine Spalte entfernen möchten, die Sie nicht mehr benötigen, können Sie sie löschen.

Sie haben die Spalten zur Verkettung verwendet und können Sie somit jetzt löschen und nur das Ergebnis beibehalten.

Procedure

  1. Klicken Sie auf die zu löschende Spalte, in diesem Beispiel email_first_name (E_Mail_Vorname).
  2. Klicken Sie auf das Menüsymbol bzw. klicken Sie mit der rechten Maustaste auf die Spalte, um das Kontextmenü zu öffnen.
  3. Klicken Sie auf Delete column (Spalte löschen).
    Die Spalte email_first_name ist geöffnet, und die Option Delete column (Spalte löschen) ist ausgewählt.
  4. Gehen Sie ebenso vor, um die Spalten email_last_name und email_domain zu löschen.

Results

Die ausgewählten Spalten werden gelöscht.

Exportieren der aufbereiteten E-Mailadressen

Nachdem die Datenaufbereitung abgeschlossen ist, möchten Sie die Daten, die Sie bereinigt haben, möglicherweise exportieren.

Sie haben Ihren Datensatz aufbereitet und die ursprünglichen Informationen wiederhergestellt, in diesem Fall die E-Mailadressen der Kunden.

Procedure

  1. Klicken Sie auf die Schaltfläche Export (Exportieren).
  2. Wählen Sie das Dateiformat aus, das für den Export der Daten verwendet werden soll:
    • Bei der Auswahl von Local CSV file (Lokale CSV-Datei) müssen Sie festlegen, welche Feldbegrenzer, Textbegrenzungen und Maskierungszeichen verwendet werden sollen, und einen Namen für die zu exportierende Datei eingeben.
    • Bei der Auswahl von Local XLSX file (Lokale XLSX-Datei) müssen Sie einen Namen für die zu exportierende Datei auswählen.
    • Bei der Auswahl von Amazon S3 müssen Sie Ihre Anmeldedaten und andere Informationen für die Speicherung der Datei in Amazon S3 eingeben.

Results

Die von Ihnen mithilfe der Datenaufbereitung bereinigten Daten werden in eine lokale Datei exportiert.

Hat diese Seite Ihnen geholfen?

Wenn Sie ein Problem mit dieser Seite oder ihrem Inhalt feststellen, sei es ein Tippfehler, ein ausgelassener Schritt oder ein technischer Fehler, informieren Sie uns bitte!