Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Umwandeln von Daten

Erstellen Sie wiederverwendbare und regelbasierte Datenumwandlungen als Teil Ihrer Daten-Pipeline. Sie können Umwandlungen als Teil Ihrer Dateneingliederung durchführen oder wiederverwendbare Umwandlungs-Datenaufgaben erstellen. Sie können Umwandlungen auf Zeilenebene durchführen und Datensätze erstellen, die entweder als Tabelle umgesetzt oder als Ansichten erstellt werden, in denen Umwandlungen direkt bei Bedarf durchgeführt werden.

Sie können explizite Umwandlungen pro Datensatz durchführen oder globale Regeln erstellen, die mehrere Datensätze umwandeln. Sie können auch einen Datensatz filtern, um einen Teilsatz von Zeilen zu erstellen.

InformationshinweisDatenaufgaben werden im Kontext ihres Besitzers verwendet. Weitere Informationen zu erforderlichen Rollen und Berechtigungen finden Sie unter Rollen und Berechtigungen für Datenbereiche.

Erstellen einer Umwandlungs-Datenaufgabe

Die einfachste Art und Weise, eine Umwandlungs-Datenaufgabe zu erstellen, ist es, für eine Speicher-Datenaufgabe auf ... zu klicken und dann Daten umwandeln auszuwählen.

Sie können auch auf Neu hinzufügen in einem Datenprojekt klicken und Daten umwandeln auswählen. In diesem Fall müssen Sie definieren, welche Quell-Datenaufgabe verwendet werden soll.

  1. Definieren Sie Ihre Quelldaten in Dataset umwandeln.

    Wählen Sie Quelldatensätze aus und klicken Sie auf Hinzufügen, um sie zu Ausgabe hinzuzufügen.

    Sie können eine SQL-Umwandlung hinzufügen, indem Sie einen Datensatz auswählen und auf SQL-basierten Datensatz hinzufügen klicken.

    Hinzufügen von SQL-basierten Datensätzen

    TipphinweisSie können auch mehrere Datensätze aus anderen Speicher-Datenobjekten hinzufügen, indem Sie auf Quelldaten auswählen klicken.
  2. Nehmen Sie alle notwendigen Änderungen an den inbegriffenen Datasets wie beispielsweise Transformationen, Filtern von Daten oder Hinzufügen von Spalten vor.

    Weitere Informationen finden Sie unter Verwalten von Datensätzen.

  3. Wenn Sie die gewünschten Transformationen hinzugefügt haben, können Sie die Datasets validieren, indem Sie auf Datensätze validieren klicken. Falls bei der Validierung Fehler gefunden werden, beheben Sie diese, bevor Sie fortfahren.

    Weitere Informationen finden Sie unter Validieren und Anpassen der Datensätze.

  4. Datenmodell erstellen

    Klicken Sie auf Modell, um die Beziehungen zwischen den enthaltenen Datasets festzulegen.

    Weitere Informationen finden Sie unter Erstellung eines Datenmodells.

  5. Klicken Sie auf Vorbereiten, um die Datenaufgabe und alle erforderlichen Artefakte vorzubereiten. Dies kann eine Weile dauern.

    Sie können den Fortschritt unter Vorbereitungsfortschritt unten im Bildschirm verfolgen.

  6. Wenn der Status Vorbereitet anzeigt, können Sie die Datenaufgabe ausführen.

    Klicken Sie auf ... und dann auf Ausführen.

Die Datenaufgabe beginnt nun mit der Erstellung von Datensätzen, um die Daten umzuwandeln.

InformationshinweisEs ist nicht möglich, zu ändern, welche Datensätze inbegriffen sind, wenn Sie mit der Erzeugung von Datensätzen begonnen haben.

Hinzufügen von SQL-basierten Datensätzen

Sie können SQL-basierte Tabellen in Umwandlungsaufgaben aufnehmen. Mit einer SQL-basierten Tabelle können Sie eine SQL SELECT-Abfrage in ein Pipeline eingeben, um komplexe oder einfache Umwandlungen zu definieren.

Weitere Informationen finden Sie unter Hinzufügen von SQL-Umwandlungen.

  • Wählen Sie bei Dataset umwandeln die Datasets, die in die Abfrage eingeschlossen werden sollen, und klicken Sie auf SQL-basierte Tabelle hinzufügen.

Planen einer Umwandlungsaufgabe

Sie können eine Umwandlungsaufgabe planen, damit sie regelmäßig aktualisiert wird. Sie können einen zeitbasierten Plan festlegen oder die Aufgabe so einrichten, dass sie nach dem Abschluss von Eingabedatenaufgaben ausgeführt wird.

Klicken Sie in einer Datenaufgabe auf ... und wählen Sie Planung aus, um einen Plan zu erstellen. Die Standardplanungseinstellung wird aus den Einstellungen im Datenprojekt übernommen. Weitere Informationen zu Standardeinstellungen finden Sie unter Umwandlungsstandardwerte.

Sie müssen Planung immer auf Ein festlegen, um den Plan zu aktivieren.

InformationshinweisWenn alle Datensätze in der Aufgabe nicht eingetreten sind, kann nichts ausgeführt werden, da die Umwandlung spontan mit Ansichten durchgeführt wird. Sie können dennoch einen Plan erstellen, damit eine nicht eingetretene Umwandlungsaufgabe ausgeführt wird, wenn die Planbedingung erfüllt ist. Die Aufgabe wird sofort abgeschlossen, was eine nachgelagerte Aufgabe, z. B. einen Data Mart, auslösen kann. So können Sie einen ereignisbasierten Pipeline-Plan erstellen, der nicht eingetretene Umwandlungen umfasst, ohne den Pipeline-Fluss zu unterbrechen.

Zeitbasierte Pläne

Sie können zeitbasierte Pläne verwenden, um Aufgaben unabhängig davon auszuführen, wann die einzelnen Eingabequellen aktualisiert werden.

  • Wählen Sie in Datenaufgabe ausführen die Option Zu einer bestimmten Uhrzeit aus.

Sie können einen stündlichen, täglichen, wöchentlichen oder monatlichen Plan erstellen.

Ereignisbasierte Pläne

Sie können einen ereignisbasierten Plan festlegen oder die Aufgabe so einrichten, dass sie nach dem Abschluss von Eingabedatenaufgaben ausgeführt wird.

  • Wählen Sie in Datenaufgabe ausführen die Option Bei einem bestimmten Ereignis aus.

Sie können auswählen, ob die Aufgabe ausgeführt werden soll, nachdem eine der Eingabeaufgaben erfolgreich abgeschlossen wurde, oder nachdem eine Auswahl an Eingabeaufgaben erfolgreich abgeschlossen wurde.

InformationshinweisDie Aufgabe wird nicht ausgeführt, wenn eine Eingabeaufgabe oder nachgelagerte Aufgabe bei Auslösen des Plans noch läuft. Die Aufgabe wird dann bis zur nächsten geplanten Ausführung übersprungen.

Überwachen einer Umwandlungsaufgabe

Sie können den Status und Fortschritt einer Umwandlungsaufgabe überwachen, indem Sie auf Überwachen klicken.

Weitere Informationen finden Sie unter Überwachen einer einzelnen Datenaufgabe.

InformationshinweisWenn ein Datensatz, der auf einer SQL-Umwandlung basiert, aufgrund des Ladens einer vorgelagerten Aufgabe neu geladen wird, wird immer „Vergleichen und Anwenden“ verwendet. Wenn Sie den Datensatz abschneiden und neu laden möchten, müssen Sie einen spezifischen Ladebefehl für diese Tabellen ausgeben. In diesem Fall müssen Sie auch die Auswirkung auf nachgelagerte Tabellen berücksichtigen.

Umwandlungseinstellungen

Sie können Eigenschaften für die Umwandlungsdatenaufgabe festlegen.

  • Klicken Sie auf Einstellungen.

WarnhinweisWenn die Aufgabe bereits ausgeführt wurde, erfordert das Ändern einer anderen Einstellung als der Laufzeiteinstellungen, dass Sie die Datensätze erneut erstellen.

Allgemeine Einstellungen

  • Datenbank

    Datenbank, die in der Datenquelle verwendet werden soll.

  • Datenaufgabenschema

    Sie können den Namen des Speicher-Datenaufgabenschemas ändern. Der Standardname lautet store.

  • Internes Schema

    Sie können den Namen des internen Speicherschemas ändern. Der Standardname lautet store__internal.

  • Präfix für alle Tabellen und Ansichten

    Sie können ein Präfix für alle Tabellen und Ansichten festlegen, die mit dieser Aufgabe erstellt wurden.

    InformationshinweisSie müssen ein eindeutiges Präfix verwenden, wenn Sie ein Datenbankschema in mehreren Datenaufgaben nutzen möchten.
  • Eingetreten

    Sie können auswählen, Tabellen zu erstellen (Eingetreten) oder nur Ansichten zu erstellen, die spontan Umwandlungen durchführen können (Nicht eingetreten).

  • Verlauf

    Sie können Verlaufsänderungsdaten beibehalten, um Daten leicht erneut so erstellen zu können, wie sie zu einem bestimmten Zeitpunkt aussahen. Sie können Verlaufsansichten und Live-Verlaufsansichten verwenden, um Verlaufsdaten anzuzeigen.

Laufzeiteinstellungen

  • Parallele Ausführung

    Sie können die maximale Anzahl an Datenverbindungen für vollständige Ladevorgänge auf eine Zahl von 1 bis 5 setzen.

  • Warehouse

    Der Name des Cloud Data Warehouse.

Beschränkungen

  • Es ist nicht möglich, Datentype in einer Umwandlungsdatenaufgabe zu ändern, wenn die Option Nicht eingetreten ausgewählt ist.

  • Nicht materialisierte SQL-basierte Datensätze stellen nur den vollen Ergebnissatz bereit. Inkrementelles Filtern wird nicht unterstützt. Nicht materialisierte SQL-basierte Datensätze stellen auch nur aktuelle Daten bereit und bewahren keine Verlaufsdaten auf.

Weitere Informationen

Hat diese Seite Ihnen geholfen?

Wenn Sie Probleme mit dieser Seite oder ihren Inhalten feststellen – einen Tippfehler, einen fehlenden Schritt oder einen technischen Fehler –, teilen Sie uns bitte mit, wie wir uns verbessern können!