Einfügen gefilterter Daten in eine Azure Cosmos DB-Tabelle

Dieses Szenario soll Sie bei der Einrichtung und Verwendung von Konnektoren in einer Pipeline unterstützen. Es wird empfohlen, dass Sie das Szenario an Ihre Umgebung und Ihren Anwendungsfall anpassen.

Beispiel einer Pipeline, die anhand der nachfolgenden Anleitungen erstellt wurde.

Vorbereitungen

Wenn Sie dieses Szenario reproduzieren möchten, laden Sie folgende Datei herunter und extrahieren Sie sie: local-file-to-azure_cosmosdb.zip .

Prozedur

Klicken Sie auf Connections (Verbindungen) > Add connection (Verbindung hinzufügen).
Wählen Sie den Typ der zu erstellenden Verbindung im daraufhin geöffneten Fenster aus.
Example
Cosmos DB
Wählen Sie in der Liste Engine Ihre Engine aus.
InformationshinweisAnmerkung:
- Es wird empfohlen, die Remote Engine Gen2 und nicht die Cloud Engine for Design für eine erweiterte Datenverarbeitung einzusetzen.
- Wenn keine Remote Engine Gen2 in Talend Management Console erstellt wurde bzw. diese vorhanden, aber als nicht verfügbar markiert ist, d. h. sie ist nicht aktiv und wird nicht ausgeführt, dann können Sie weder einen Connection type (Verbindungstyp) in der Liste auswählen noch die neue Verbindung speichern.
- Die Liste der verfügbaren Verbindungstypen richtet sich nach der ausgewählten Engine.
Wählen Sie den Typ der zu erstellenden Verbindung aus.
Wählen Sie für dieses Beispiel CosmosDB aus.
Geben Sie die Verbindungseigenschaften für den Zugriff auf die Azure Cosmos DB-Datenbank wie in Eigenschaften von Azure Cosmos DB beschrieben ein, prüfen Sie die Verbindung und klicken Sie dann auf Add dataset (Datensatz hinzufügen).
Geben Sie im Fensterbereich Add a new dataset (Neuen Datensatz hinzufügen) einen Namen für Ihren Datensatz ein. In diesem Beispiel soll die Cosmos DB-Sammlung verarbeitete Daten zu Leads aufnehmen.
Example
leads
Geben Sie die erforderlichen Eigenschaften entsprechend der in Ihrem Azure-Konto enthaltenen Cosmos DB-Sammlung ein.
Klicken Sie auf Validate (Validieren), um den Datensatz zu speichern.
Gehen Sie genauso vor, um die Testverbindung und den Datensatz hinzuzufügen, der als Quelle in Ihrer Pipeline für das CRM verwendet werden soll.
In diesem Beispiel wird der Datensatz bank marketing data (Bankspezifische Marketingdaten) mit folgendem CSV-Schema verwendet:
```
CSV Schema:
age;job;marital;education;default;balance;housing;loan;contact;day;month;duration;campaign;pdays;previous;poutcome;y
```
Klicken Sie auf der Seite Pipelines auf Add pipeline (Pipeline hinzufügen). Ihre neue Pipeline wird geöffnet.
Legen Sie einen sinnvollen Namen für die Pipeline fest.
Example
Inserting bank marketing data into a CosmosDB table (Bankspez. Marketingdaten in eine CosmosDB-Tabelle einfügen)
Klicken Sie auf ADD SOURCE (QUELLE HINZUFÜGEN) und wählen Sie im daraufhin geöffneten Fenster Ihren Quelldatensatz aus, bank marketing data (Bankspezifische Marketingdaten).
Klicken Sie auf , um Prozessoren zur Pipeline hinzuzufügen, beispielsweise einen Prozessor des Typs Type converter (Typkonverter), um Saldodaten vom Typ Zeichenfolge (String) in den Typ Doppelwert (Double) zu konvertieren.
Klicken Sie auf , um einen Prozessor vom Typ Filter hinzuzufügen, der alle Leads ab 30 Jahren ausfiltern soll, die Führungskräfte sind und ein Saldo über 2000 Dollar aufweisen.
Klicken Sie auf das Element ADD DESTINATION (ZIEL HINZUFÜGEN) der Pipeline, um ein Fenster zu öffnen, in dem Sie den Cosmos DB-Datensatz auswählen können, in den Ihre Ausgabedaten eingefügt werden sollen.
Klicken Sie auf der Registerkarte Configuration (Konfiguration) des Ziels auf Main (Haupt) und:
1. Aktivieren Sie die Optionen Create collection if not exists (Sammlung erstellen, wenn nicht vorhanden) und Auto ID generation (Autom. ID-Generierung), damit bei der Ausführung der Pipeline, in die die Daten eingefügt werden sollen, eine Datenbanksammlung und -ID erstellt werden.
2. Klicken Sie auf Main (Haupt) und wählen Sie Insert (Einfügen) in der Liste Data action (Datenaktion) aus, um die Daten bei der Ausführung der Pipeline in den vorhandenen Datensatz einzufügen.
Klicken Sie auf Save (Speichern), um die Konfiguration zu speichern.
Klicken Sie in der oberen Symbolleiste von Talend Cloud Pipeline Designer auf die Schaltfläche Run (Ausführen), um das Fenster zur Auswahl des Ausführungsprofils zu öffnen.
Wählen Sie Ihr Ausführungsprofil in der Liste aus (weitere Informationen finden Sie unter „Ausführungsprofile“) und klicken Sie dann auf Run (Ausführen), um die Pipeline auszuführen.

Ergebnisse

Ihre Pipeline wird ausgeführt, die Daten wurden verarbeitet und gefiltert und der Ausgabe-Flow wird in den von Ihnen definierten Microsoft CRM-Datensatz eingefügt.

Sie können das Log Ihrer Pipeline prüfen, um Detailangaben zum Umfang der an Azure Cosmos DB gesendeten Daten zu erhalten.

Hervorhebung des Logs für das Volumen der Daten, die an die Azure Cosmos DB gesendet wurden.

Hat diese Seite Ihnen geholfen?

Wenn Sie ein Problem mit dieser Seite oder ihrem Inhalt feststellen, sei es ein Tippfehler, ein ausgelassener Schritt oder ein technischer Fehler, informieren Sie uns bitte!

Geben Sie hier Ihr Feedback ab

Einfügen gefilterter Daten in eine Azure Cosmos DB-Tabelle

Vorbereitungen

Prozedur

Example

Example

Example

Ergebnisse

Hat diese Seite Ihnen geholfen?