Umwandeln von Daten

Erstellen Sie wiederverwendbare und regelbasierte Datenumwandlungen als Teil Ihrer Daten-Pipeline. Sie können Umwandlungen als Teil Ihrer Dateneingliederung durchführen oder wiederverwendbare Umwandlungs-Datenaufgaben erstellen. Sie können Umwandlungen auf Zeilenebene durchführen und Datensätze erstellen, die entweder als Tabelle umgesetzt oder als Ansichten erstellt werden, in denen Umwandlungen direkt bei Bedarf durchgeführt werden.

Erweiterte Umwandlungen sind für ein Qlik Talend Cloud Premium- oder Qlik Talend Cloud Enterprise-Abonnement verfügbar.

Sie können explizite Datensatzumwandlungen durchführen oder globale Regeln erstellen, die mehrere Datensätze umwandeln. Sie können auch einen Datensatz filtern, um einen Teilsatz von Zeilen zu erstellen.
Sie können SQL-Umwandlungen hinzufügen. Mit einer SQL-Umwandlung können Sie eine SQL SELECT-Abfrage in eine Pipeline eingeben, um komplexe oder einfache Umwandlungen zu definieren.
Sie können visuelle Umwandlungsflüsse mit Quellen, Prozessoren und Zielen hinzufügen, um komplexe oder einfache Umwandlungen zu definieren.

Datenaufgaben werden im Kontext des Besitzers des Projekts, zu dem sie gehören, ausgeführt. Weitere Informationen zu erforderlichen Rollen und Berechtigungen finden Sie unter Rollen und Berechtigungen für Datenbereiche.

Eine Umwandlungsdatenaufgabe enthält drei Ansichten:

Umwandeln

In dieser Ansicht werden alle Umwandlungen angezeigt, um den Fluss vom Quelldatensatz zum Zieldatensatz zu visualisieren.
Datensätze

In dieser Ansicht werden alle grundlegenden Umwandlungen der Datensätze angezeigt, wie z. B. das Filtern von Daten oder das Hinzufügen von Spalten sowie Regeln zur Durchführung globaler Umwandlungen.
Modell

Mit dieser Ansicht können Sie ein Datenmodell mit den Beziehungen zwischen den eingeschlossenen Datensätzen erstellen.

Zusätzlich zum Speichern von Tabellen im Data Warehouse können Sie Tabellen auch als Iceberg-Tabellen speichern, die von der Datenplattform verwaltet werden. Diese Option ist derzeit nur bei Snowflake-Projekten verfügbar. Wählen Sie hierzu in den Aufgabeneinstellungen unter Tabellentyp die Option Von Snowflake verwaltete Iceberg-Tabellen aus.

Erstellen einer Umwandlungs-Datenaufgabe

Die einfachste Art und Weise, eine Umwandlungs-Datenaufgabe zu erstellen, ist es, für eine Speicher-Datenaufgabe auf ... zu klicken und dann Daten umwandeln auszuwählen.

Sie können auch auf Erstellen in einem Projekt klicken und Daten umwandeln auswählen. In diesem Fall müssen Sie definieren, welche Quell-Datenaufgabe verwendet werden soll.

Definieren Sie Ihre Quelldaten und Ziele in Umwandeln.

Sie haben zwei Möglichkeiten:
- Grundlegende Datensatzumwandlungen durchführen
  
  Wählen Sie Quelldatensätze aus und klicken Sie auf Zu Ziel hinzufügen, um sie zu Ziel hinzuzufügen.
  
  Sie können dann in Datensätze grundlegende Umwandlungen auf die Datensätze anwenden, also beispielsweise Daten filtern oder Spalten hinzufügen.
  
  Weitere Informationen finden Sie unter Verwalten von Datensätzen.
- Eine SQL-Umwandlung hinzufügen
  
  Wählen Sie Quelldatensätze aus und klicken Sie auf SQL-Umwandlung hinzufügen
  
  Mit einer SQL-Umwandlung können Sie eine SQL SELECT-Abfrage in eine Pipeline eingeben, um komplexe oder einfache Umwandlungen zu definieren.
  
  Weitere Informationen finden Sie unter Hinzufügen von SQL-Umwandlungen.
- Einen Umwandlungsfluss hinzufügen
  
  Wählen Sie Quelldatensätze aus und klicken Sie auf Umwandlungsfluss hinzufügen
  
  Im Fluss-Designer können Sie einen Umwandlungsfluss mit Quellen, Prozessoren und Zielen erstellen, um komplexe oder einfache Umwandlungen zu definieren.
  
  Weitere Informationen finden Sie unter Hinzufügen von Umwandlungsflüssen.
Sie können auch mehrere Datensätze aus anderen Speicherdatenaufgaben hinzufügen, indem Sie auf Quelldaten auswählen klicken.

Sie können Datensätze aus dem aktuellen Projekt oder aus einem anderen Projekt hinzufügen. So fügen Sie Datensätze aus einem anderen Projekt hinzu:
- Sie müssen mindestens die Rolle Kann nutzen in dem Bereich des genutzten Projekts haben.
- Beide Projekte müssen sich auf derselben Datenplattform befinden.
Weitere Informationen über projektübergreifende Pipelines finden Sie unter Erstellen projektübergreifender Pipelines.
Nachdem Sie die gewünschten Transformationen hinzugefügt haben, validieren Sie die Datensätze, indem Sie auf Datensätze validieren klicken. Falls bei der Validierung Fehler gefunden werden, beheben Sie diese, bevor Sie fortfahren.

Weitere Informationen finden Sie unter Validieren und Anpassen der Datensätze.
Datenmodell erstellen

Klicken Sie auf Modell, um die Beziehungen zwischen den enthaltenen Datasets festzulegen.

Weitere Informationen finden Sie unter Erstellung eines Datenmodells.
Klicken Sie auf Vorbereiten, um die Datenaufgabe und alle erforderlichen Artefakte vorzubereiten. Dies kann eine Weile dauern.

Sie können den Fortschritt unter Vorbereitungsfortschritt unten im Bildschirm verfolgen.
Wenn der Status Vorbereitet anzeigt, können Sie die Datenaufgabe ausführen.

Klicken Sie auf ... und dann auf Ausführen.

Die Datenaufgabe beginnt nun mit der Erstellung von Datensätzen, um die Daten umzuwandeln.

Es ist nicht möglich, zu ändern, welche Datensätze inbegriffen sind, wenn Sie mit der Erzeugung von Datensätzen begonnen haben.

Verwenden der Ansicht Umwandeln

In Umwandeln werden alle Umwandlungen angezeigt, um den Fluss vom Quelldatensatz zum Zieldatensatz zu visualisieren.

Wählen Sie eine Umwandlung aus, um zu sehen, welche Quelldatensätze verwendet und welche Zieldatensätze erstellt werden.
Wählen Sie eine Quelle aus, um alle Umwandlungen, in denen sie verwendet wird, und alle daraus resultierenden Ziele anzuzeigen.
Wählen Sie ein Ziel aus, um zu sehen, welche Quelldatensätze verwendet werden und welche Umwandlung in diesem Zieldatensatz erstellt wird.

Ansicht „Umwandeln“ in der Umwandlung — Ansicht „Umwandeln“ in einer Umwandlung

Sie können die folgenden Einstellungen ändern, indem Sie auf Anzeigeoptionen klicken:

Nach Umwandlungstyp filtern

Zeigen Sie nur Umwandlungen von einem oder zwei Umwandlungstypen an.
Filtern

Zeigen Sie alle Umwandlungen oder nur die ausgewählte Umwandlung an. Sie müssen eine Umwandlung auswählen, um diese Option zu aktivieren.
Dichte

Wählen Sie aus, ob Sie Umwandlungen in einem kompakten Layout oder in einem breiten Layout mit mehr Platzbedarf anzeigen möchten.

Verwenden der Ansicht Datensätze

Unter Datensätze können Sie alle Zieldatensätze in der Umwandlungsaufgabe anzeigen und bearbeiten.

Unter Verwalten von Datensätzen finden Sie weitere Informationen.

Hinzufügen eines Zieldatensatzes

Sie können der Umwandlungsaufgabe weitere Zieldatensätze hinzufügen.

Klicken Sie auf .
Geben Sie den Namen und optional die Beschreibung für den Datensatz an.
Wählen Sie einen Quelldatensatz aus den Datensätzen aus, die in der Aufgabe in Quelldatensatz verfügbar sind.

TipphinweisSie können Kein Quelldatensatz auswählen, um einen leeren Datensatz zu erstellen, der mit keiner Quelle verbunden ist. Sie können während des Entwurfs Spalten zum Datensatz hinzufügen, aber Sie müssen eine Verbindung zu einem Quelldatensatz herstellen, bevor Sie die Aufgabe vorbereiten können.

Der Zieldatensatz ist jetzt hinzugefügt.

Ändern des Quelldatensatzes

Sie können den Quelldatensatz eines Zieldatensatzes ändern.

Klicken Sie auf nach Quelle: [Name des Quelldatensatzes].
Wählen Sie einen weiteren Quelldatensatz aus den Datensätzen aus, die in der Aufgabe in Quelldatensatz verfügbar sind.

TipphinweisSie können Kein Quelldatensatz auswählen, um die Verbindung zwischen dem Zieldatensatz und der Quelle zu trennen. Sie können den Datensatz während des Entwurfs bearbeiten, aber Sie müssen eine Verbindung zu einem Quelldatensatz herstellen, bevor Sie die Aufgabe vorbereiten können.

Hinzufügen neuer Spalten

Sie können dem Zieldatensatz neue Spalten hinzufügen.

Hinzufügen einer vollständig neuen Spalte

Klicken Sie auf + Hinzufügen.

Geben Sie einen Namen für die Spalte an, und legen Sie eine Formel fest, um die Daten der Spalte zu definieren.

Weitere Informationen finden Sie unter Hinzufügen von Spalten zu einem Dataset.
Hinzufügen einer Spalte aus der Quelle

Klicken Sie auf neben Hinzufügen und wählen Sie Spalte aus Quelle hinzufügen.

Wählen Sie eine Spalte aus dem Quelldatensatz aus.

Neuanordnung von Spalten

Sie können die ordinale Position einer Spalte ändern.

Wählen Sie eine Spalte aus.
Klicken Sie auf und dann auf Neu ordnen.
Verwenden Sie die Pfeile, um die Spalte nach oben oder unten zu verschieben.
Schließen Sie Ordinal ändern, wenn Sie fertig sind.

Erstellen von Umwandlungsregeln

Sie können wiederverwendbare Umwandlungsregeln erstellen, um globale Umwandlungen für Datensätze durchzuführen.

Weitere Informationen zum Erstellen von Regeln finden Sie unter Erstellen von Regeln zur Umwandlung von Datensätzen.

Sie können die Auswirkungen von Regeln anzeigen, indem Sie die Option Regelauswirkungen anzeigen auswählen. Sie können keine Änderungen an den Datensätzen vornehmen, wenn die Option Regelauswirkungen anzeigen aktiviert ist.

Filtern eines Datensatzes

Sie können Daten filtern, um bei Bedarf einen Teilsatz der Zeilen zu erstellen.

Klicken Sie auf und dann auf Filtern.

Weitere Informationen zu Filtern finden Sie unter Filtern eines Datensatzes.

Planen einer Umwandlungsaufgabe

Sie können eine Umwandlungsaufgabe planen, damit sie regelmäßig aktualisiert wird. Sie können einen zeitbasierten Plan festlegen oder die Aufgabe so einrichten, dass sie nach dem Abschluss von Eingabedatenaufgaben ausgeführt wird.

Klicken Sie in einer Datenaufgabe auf ... und wählen Sie Planung aus, um einen Plan zu erstellen. Die Standardplanungseinstellung wird aus den Einstellungen im Projekt übernommen. Weitere Informationen zu Standardeinstellungen finden Sie unter Umwandlungsstandardwerte.

Sie müssen Planung immer auf Ein festlegen, um den Plan zu aktivieren.

Wenn alle Datensätze in der Aufgabe nicht eingetreten sind, kann nichts ausgeführt werden, da die Umwandlung spontan mit Ansichten durchgeführt wird. Sie können dennoch einen Plan erstellen, damit eine nicht eingetretene Umwandlungsaufgabe ausgeführt wird, wenn die Planbedingung erfüllt ist. Die Aufgabe wird sofort abgeschlossen, was eine nachgelagerte Aufgabe, z. B. einen Data Mart, auslösen kann. So können Sie einen ereignisbasierten Pipeline-Plan erstellen, der nicht eingetretene Umwandlungen umfasst, ohne den Pipeline-Fluss zu unterbrechen.

Zeitbasierte Pläne

Sie können zeitbasierte Pläne verwenden, um Aufgaben unabhängig davon auszuführen, wann die einzelnen Eingabequellen aktualisiert werden.

Wählen Sie in Datenaufgabe ausführen die Option Zu einer bestimmten Uhrzeit aus.

Sie können einen stündlichen, täglichen, wöchentlichen oder monatlichen Plan erstellen.

Ereignisbasierte Pläne

Sie können einen ereignisbasierten Plan festlegen oder die Aufgabe so einrichten, dass sie nach dem Abschluss von Eingabedatenaufgaben ausgeführt wird.

Wählen Sie in Datenaufgabe ausführen die Option Bei einem bestimmten Ereignis aus.

Sie können auswählen, ob die Aufgabe ausgeführt werden soll, nachdem eine der Eingabeaufgaben erfolgreich abgeschlossen wurde, oder nachdem eine Auswahl an Eingabeaufgaben erfolgreich abgeschlossen wurde.

Die Aufgabe wird nicht ausgeführt, wenn eine Eingabeaufgabe oder nachgelagerte Aufgabe bei Auslösen des Plans noch läuft. Die Aufgabe wird dann bis zur nächsten geplanten Ausführung übersprungen.

Überwachen einer Umwandlungsaufgabe

Sie können den Status und Fortschritt einer Umwandlungsaufgabe überwachen, indem Sie auf Überwachen klicken.

Weitere Informationen finden Sie unter Überwachen einer einzelnen Datenaufgabe.

Laden von Daten

Sie können Tabellen manuell laden, wenn die Daten als physische Tabellen materialisiert sind. Das ist nützlich, wenn Probleme mit einer oder mehreren Tabellen vorliegen.

Wenn Datensätze nicht materialisiert sind, müssen Sie die Quelldatensätze in den vorgelagerten Datenaufgaben neu laden, um die Daten zu aktualisieren.

Öffnen Sie die Datenaufgabe und wählen Sie die Registerkarte Überwachen aus.
Wählen Sie die Tabellen aus, die Sie laden möchten.
Klicken Sie auf Tabellen laden.

Der Ladevorgang findet bei der nächsten Aufgabenausführung statt. Der Ladeprozess verhält sich unterschiedlich, je nach der Verlaufseinstellung und dem Umwandlungstyp der einzelnen Datensätze. Das bedeutet, dass der Ladeprozess zwischen Datensätzen in einer Datenaufgabe unterschiedlich sein kann.

Datensatzumwandlungen werden durch Abschneiden und Neuladen geladen.
SQL-Umwandlungen und Umwandlungsflüsse können neu geladen werden, indem abgeschnitten und neu geladen wird oder mit dem vollständigen Ladevorgang verglichen und Änderungen angewendet werden. Als Best Practice wird Vergleichen und Anwenden empfohlen.

Neuladen eines Datensatzes basierend auf SQL-Umwandlung oder Umwandlungsfluss

Sie können den Ladevorgang für Tabellen mit ausstehendem Laden abbrechen, indem Sie auf Ladevorgang abbrechen klicken. Bereits geladene Tabellen sind davon nicht betroffen, und aktuell laufende Ladevorgänge werden abgeschlossen.

Nachgelagerte Aufgaben werden neu geladen, um Änderungen anzuwenden und Rückdatierung zu vermeiden.

Auswirkung des erneuten Ladens einer Umwandlung auf nachgelagerte Objekte — Auswirkung auf nachgelagerte Objekte nach dem erneuten Laden einer Umwandlungsaufgabe

Die Auswirkung auf nachgelagerte Objekte hängt vom Typ des durchgeführten Ladevorgangs und vom Typ des unmittelbar nachgelagerten Datensatzes ab. Standardverarbeitung bedeutet, dass der Datensatz reagieren und die Daten mit der konfigurierten Methode für den angegebenen Datensatz verarbeiten wird.

Beispiel: Erneutes Laden eines Datensatzes mit Abschneiden und Neuladen

Wenn der nächste Datensatz Datensatzumwandlungen verwendet, wird er bei der nächsten Ausführung durch Abschneiden und Neuladen geladen.
Wenn der nächste Datensatz eine SQL-Umwandlung oder ein Umwandlungsfluss ist, wird er mit Vergleichen und Anwenden neu geladen.

Neuladen eines Datensatzes ohne Verlauf

In diesem Fall ist kein Verlauf zu berücksichtigen. Um die Verarbeitung im Ziel zu reduzieren, wird der Ladevorgang wie folgt durchgeführt:

Die Tabellen werden abgeschnitten.
Die aktuellen Daten werden aus der vorgelagerten Datenaufgabe geladen.

Nachgelagerte Aufgaben werden neu geladen, um Änderungen anzuwenden.

Neuladen eines Datensatzes mit aktiviertem Verlauf

Der Ladevorgang wird wie folgt durchgeführt:

Aktuelle, vorherige und Änderungstabellen werden abgeschnitten.
Daten aus der vorgelagerten Datenaufgabe, einschließlich vorheriger Tabellen, werden geladen.

Neuladen eines Datensatzes basierend auf SQL-Umwandlung oder Umwandlungsfluss

Abschneiden und neu laden

InformationshinweisDiese Option kann zu einem Verlaufsverlust führen.
1. Aktuelle und Änderungstabellen werden abgeschnitten.
2. Die Abfrage wird ausgeführt und in die aktuellen Tabellen geladen.
Neu laden und vergleichen
1. Die Abfrage wird ausgeführt und mit den aktuellen Tabellen verglichen.
2. Änderungen werden hinzugefügt.

Wenn ein Datensatz, der auf einer SQL-Umwandlung oder einem Umwandlungsfluss basiert, aufgrund des Ladens einer vorgelagerten Aufgabe neu geladen wird, wird immer „Vergleichen und Anwenden“ verwendet. Wenn Sie den Datensatz abschneiden und neu laden möchten, müssen Sie einen spezifischen Ladebefehl für diese Tabellen ausgeben. In diesem Fall müssen Sie auch die Auswirkung auf nachgelagerte Tabellen berücksichtigen.

Umwandlungseinstellungen

Sie können Eigenschaften für die Umwandlungsdatenaufgabe festlegen.

Klicken Sie auf Einstellungen.

Wenn die Aufgabe bereits ausgeführt wurde, erfordert das Ändern einer anderen Einstellung als der Laufzeiteinstellungen, dass Sie die Datensätze erneut erstellen.

Allgemeine Einstellungen

Datenbank

Datenbank, die in der Datenquelle verwendet werden soll
Aufgabenschema

Sie können den Namen des Datenaufgabenschemas ändern. Der Standardname ist der Name der Aufgabe.
Internes Schema

Sie können den Namen des internen Speicherschemas ändern. Der Standardname ist der Name der Aufgabe, an den "__internal" angehängt ist.
Standardgroßschreibung von Schemanamen

Sie können die Standardgroßschreibung für alle Schemanamen festlegen. Wenn Ihre Datenbank so konfiguriert ist, dass die Großschreibung erzwungen wird, hat diese Option keine Wirkung.
Präfix für alle Tabellen und Ansichten
Sie können ein Präfix für alle Tabellen und Ansichten festlegen, die mit dieser Aufgabe erstellt wurden.

InformationshinweisSie müssen ein eindeutiges Präfix verwenden, wenn Sie ein Datenbankschema in mehreren Datenaufgaben nutzen möchten.
Eingetreten

Sie können auswählen, nur Ansichten zu erstellen, die spontan Umwandlungen durchführen können (Nicht materialisiert), oder sowohl Tabellen als auch Ansichten zu erstellen (Materialisiert).
Verlaufsdatenspeicher (Typ 2)

Sie können Verlaufsänderungsdaten beibehalten, um Daten leicht erneut so erstellen zu können, wie sie zu einem bestimmten Zeitpunkt aussahen. Sie können Verlaufsansichten und Live-Verlaufsansichten verwenden, um Verlaufsdaten anzuzeigen.

Laufzeiteinstellungen

Parallele Ausführung

Sie können die maximale Anzahl an Verbindungen für vollständige Ladevorgänge auf eine Zahl von 1 bis 5 setzen.
Warehouse

Der Name des Cloud Data Warehouse.

Katalogeinstellungen

In Katalog veröffentlichen

Wählen Sie diese Option aus, um diese Version der Daten als Datensatz im Katalog zu veröffentlichen. Der Kataloginhalt wird aktualisiert, wenn Sie diese Aufgabe zum nächsten Mal vorbereiten.

Weitere Informationen zu Katalog finden Sie unter Verstehen Ihrer Daten mit Katalogwerkzeugen.

Tabellentypeinstellungen

Diese Einstellungen sind nur in Projekten mit Snowflake als Datenplattform verfügbar.

Tabellentyp

Sie können auswählen, welchen Tabellentyp Sie verwenden möchten:
- Snowflake-Tabellen
- Von Snowflake verwaltete Iceberg-Tabellen
  
  Sie müssen den Standardnamen des externen Volumes in Externes Snowflake-Volume festlegen.
Zu verwendender Cloud-Speicherordner

Sie können auswählen, welcher Ordner beim Bereitstellen von Daten im Bereitstellungsbereich verwendet werden soll.
- Standardordner
  
  Dadurch wird ein Ordner mit dem Standardnamen <projektname>/<datenaufgabenname> erstellt.
- Stammordner
  
  Speichern Sie Daten im Stammordner des Speichers.
- Ordner
  
  Geben Sie einen Ordnernamen an, der verwendet werden soll.
Mit Snowflake Open Catalog synchronisieren

Aktivieren Sie diese Option, damit Snowflake Open Catalog die Dateien im Cloud-Dateispeicher verwalten kann.

Einschränkungen

Es ist nicht möglich, Datentypen in einer Umwandlungsdatenaufgabe zu ändern, wenn die Option Nicht eingetreten ausgewählt ist.
Die Herkunft auf Feldebene ist für Datensätze, die in SQL-Transformationen oder Umwandlungsflüssen erstellt wurden, nicht verfügbar.

VERWANDTE LERNINHALTE:

Verwenden von Qlik Cloud Data Integration zum Eingliedern und Umwandeln von Daten

Weitere Informationen

Verwenden von Qlik Cloud Data Integration zum Eingliedern und Umwandeln von Daten

Hat diese Seite Ihnen geholfen?

Wenn Sie Probleme mit dieser Seite oder ihren Inhalten feststellen – einen Tippfehler, einen fehlenden Schritt oder einen technischen Fehler –, teilen Sie uns bitte mit, wie wir uns verbessern können!

Geben Sie hier Ihr Feedback ab