Zu Hauptinhalt springen Zu ergänzendem Inhalt springen

Erstellen eines Auflösungs-Sprints mit einem Talend Studio-Auftrag

Sie können einen Auflösungs-Sprint mit einem Talend Studio-Auftrag als Datenquelle erstellen.

Dies ist der Workflow zum Erstellen und Befüllen eines Sprints:

  1. Den Sprint erstellen

    Sie erstellen den Sprint in Data Stewardship in Qlik Talend Data Integration.

  2. Den Sprint befüllen

    Sie erstellen einen Auftrag in Talend Studio, um den Sprint zu befüllen. Sie können eine Aufgabe erstellen, um den Auftrag regelmäßig auszuführen und neue Datensätze zur Validierung einzureichen.

Voraussetzungen

Bevor Sie den Sprint erstellen, ist benötigen Sie:

  • Ihre Qlik Cloud und Talend Cloud Mandanten müssen verbunden sein. Weitere Informationen finden Sie unter Verbinden von Qlik Cloud mit Talend Cloud.

  • Einen Bereich, der beim Erstellen des Sprints verwendet wird.

    Sprint-Besitzer bzw. -Ersteller benötigen die folgenden Berechtigungen im Bereich: „Kann verwalten“, „Kann bearbeiten“, „Kann anzeigen“, „Kann Daten anzeigen“.

    Data Stewards benötigen die folgenden Berechtigungen im Bereich: „Kann bearbeiten“, „Kann anzeigen“, „Kann Daten anzeigen“.

  • Eine Verbindung zum Snowflake Data Warehouse, das Sie zum Speichern von Sprint-Daten verwenden möchten. Verwenden Sie kein Daten-Gateway für die Verbindung.

    Alle Sprint-Benutzer benötigen die folgenden Berechtigungen im Bereich der Verbindung: „Kann bearbeiten“, „Kann anzeigen“, „Kann Daten anzeigen“.

    Sie können eine Verbindung in Verbindungen im Aktivitätscenter Qlik Talend Data Integration erstellen.

    Weitere Informationen zu Snowflake-Verbindungen finden Sie unter Snowflake.

Um einen Auflösungs-Sprint zu erstellen, klicken Sie im Aktivitätscenter Qlik Talend Data Integration unter Data Stewardship auf Sprint erstellen.

Allgemeine Sprint-Einstellungen

  1. Name

    Fügen Sie einen Namen für den Sprint hinzu.

  2. Bereich

    Wählen Sie einen Bereich, in dem Sie den Sprint erstellen möchten.

  3. Beschreibung

    Fügen Sie eine Beschreibung des Sprints hinzu.

  4. Sprint-Population

    Wählen Sie Talend Studio-Auftrag aus.

Klicken Sie auf Weiter, wenn Sie bereit sind, mit der Definition des Datenschemas fortzufahren.

Datenschema definieren

Sie müssen jetzt das Datenschema definieren.

InformationshinweisDas Datenschema muss dem Datenschema der Ausgabe des Talend Studio-Auftrags entsprechen, der den Sprint befüllt.

Fügen Sie Spalten zum Datenschema hinzu, indem Sie auf Spalte hinzufügen klicken. Klicken Sie auf Weiter, wenn Sie bereit sind, mit der Definition des Datenspeichers fortzufahren.

Geben Sie Name, Beschreibung und Typ für jede Spalte an.

Sie können Spalte sperren und Spalte ausschließen verwenden, um zu steuern, welche Spalten angezeigt und bearbeitet werden können. Dies ist hilfreich, um eine Validierungsansicht zu erstellen, in der nur die für die Validierung erforderlichen Spalten verfügbar sind.

  • Spalte sperren

    Wenn Sie diese Option auswählen, ist die Spalte für Data Stewards sichtbar, kann aber nicht bearbeitet werden. Verwenden Sie die Option für Spalten, die nicht validiert werden müssen, aber als Referenz für die Data Stewards nützlich sind.

  • Spalte ausschließen

    Wenn Sie diese Option auswählen, ist die Spalte für Data Stewards nicht sichtbar. Verwenden Sie die Option für Spalten, die nicht als Referenz für die Data Stewards benötigt werden.

Anwenden von Validierungsregeln

Sie können Validierungsregeln auf eine Spalte anwenden, um ungültige Daten leichter zu erkennen. Ungültige Daten werden in der Spalte hervorgehoben.

  • Klicken Sie auf +, um eine Validierungsregel anzuwenden.

Sie können entweder eine bestehende Validierungsregel auswählen oder eine neue Validierungsregel erstellen.

Weitere Informationen zum Erstellen von Validierungsregeln finden Sie unter Erstellen einer Validierungsregel.

Mit Datenspeicher verbinden

Sie müssen eine Verbindung zu dem Cloud Data Warehouse herstellen, das Sie zum Speichern von Sprint-Daten verwenden möchten. Snowflake ist derzeit das einzige unterstützte Data Warehouse.

  1. Wählen Sie die Verbindung zum Data Warehouse aus.

  2. Wählen Sie aus, welche Datenbank Sie verwenden möchten.

  3. Wählen Sie, ob Sie ein bestehendes Datenbankschema oder ein neues Datenbankschema verwenden möchten.

    Wenn Sie Neues Datenbankschema auswählen, legen Sie den Namen des neuen Schemas fest.

  4. Legen Sie den Namen der Tabelle, die für aufgelöste Sprintdaten verwendet werden soll, unter Tabellenname für aufgelöste Datensätze fest.

Klicken Sie auf Weiter, wenn Sie bereit sind, Rollen und andere Einstellungen für den Sprint-Workflow zu definieren.

Rollen und Einstellungen für den Sprint-Workflow definieren

Der letzte Schritt ist die Definition von Rollen und anderen Einstellungen.

  1. Besitzer hinzufügen

    Fügen Sie alle Benutzer hinzu, die Besitzer des Sprints sein sollen.

  2. Data Stewards hinzufügen

    Fügen Sie alle Data Stewards für diesen Sprint hinzu.

  3. Datensatz-Workflow

    Sie können auswählen, ob Sie einen zweiten Validierungsschritt durch Sprint-Besitzer hinzufügen möchten.

    InformationshinweisWenn ein Benutzer, der sowohl Sprint-Besitzer als auch Data Steward ist, einen Datensatz validiert, wird der zweite Validierungsschritt umgangen.
  4. Datensatzzuweisung

    Wählen Sie, ob Sie Datensätze automatisch zuweisen möchten oder ob Sie Datensätze manuell Data Stewards zuweisen möchten.

    • Automatisch:

      Datensätze werden automatisch mit einer gleichmäßigen Verteilung Data Stewards zugewiesen. Datensätze werden keinen Sprint-Besitzern zugewiesen, die nicht auch Data Stewards sind.

    • Manuell

      Datensätze werden anfänglich keinem Data Steward zugewiesen. Sprint-Besitzer und Data Stewards können Datensätze aus Nicht zugewiesen zuweisen.

  5. Priorität

    Sie können die Priorität für den Sprint festlegen.

Klicken Sie auf Speichern, wenn Sie bereit zum Erstellen des Sprints sind.

Der Sprint ist jetzt erstellt. Der nächste Schritt besteht darin, den Sprint mithilfe eines Talend Studio-Auftrags zu befüllen.

Befüllen des Sprints

Sie erstellen einen Auftrag in Talend Studio mit der Komponente tdsOutput, um den Sprint zu befüllen. Sie können eine Aufgabe erstellen, um den Auftrag regelmäßig auszuführen und neue Datensätze zur Validierung einzureichen.

Weitere Informationen finden Sie unter Einstellungen für tDSOutput.

Hat diese Seite Ihnen geholfen?

Wenn Sie ein Problem mit dieser Seite oder ihrem Inhalt feststellen, sei es ein Tippfehler, ein ausgelassener Schritt oder ein technischer Fehler, informieren Sie uns bitte!