Erstellen eines Auflösungs-Sprints über eine CSV-Datei
Sie können einen Auflösungs-Sprint aus einer CSV-Datei erstellen, die die zu validierenden Daten enthält.
Voraussetzungen
Bevor Sie den Sprint erstellen, benötigen Sie:
-
Einen Bereich, der beim Erstellen des Sprints verwendet wird.
Sprint-Besitzer bzw. -Ersteller benötigen die folgenden Berechtigungen im Bereich: „Kann verwalten“, „Kann bearbeiten“, „Kann anzeigen“, „Kann Daten anzeigen“.
Data Stewards benötigen die folgenden Berechtigungen im Bereich: „Kann bearbeiten“, „Kann anzeigen“, „Kann Daten anzeigen“.
-
Eine Verbindung zum Snowflake Data Warehouse, das Sie zum Speichern von Sprint-Daten verwenden möchten. Verwenden Sie kein Daten-Gateway für die Verbindung.
Alle Sprint-Benutzer benötigen die folgenden Berechtigungen im Bereich der Verbindung: „Kann bearbeiten“, „Kann anzeigen“, „Kann Daten anzeigen“.
Sie können eine Verbindung in Verbindungen im Aktivitätscenter Qlik Talend Data Integration erstellen.
Weitere Informationen zu Snowflake-Verbindungen finden Sie unter Snowflake.
Erstellen eines Sprints
Um einen Auflösungs-Sprint zu erstellen, klicken Sie im Aktivitätscenter Qlik Talend Data Integration unter Data Stewardship auf Sprint erstellen.
Allgemeine Sprint-Einstellungen
-
Name
Fügen Sie einen Namen für den Sprint hinzu.
-
Bereich
Wählen Sie einen Bereich, in dem Sie den Sprint erstellen möchten.
-
Beschreibung
Fügen Sie eine Beschreibung des Sprints hinzu.
-
Quelle für Sprint-Population
Wählen Sie Datei aus.
Importieren Sie die CSV-Datei, die die zu validierenden Daten enthält.
Klicken Sie auf Weiter, wenn Sie bereit sind, mit der Definition des Datenschemas fortzufahren.
Datenschema definieren
Sie können jetzt das Datenschema, das zur Datenvalidierung verwendet wird, validieren und an Ihre Anforderungen anpassen. Datenqualitätsindikatoren werden für jede Spalte angezeigt, und möglicherweise ungültige Daten werden hervorgehoben. Dies basiert auf einer Stichprobe der Daten.
Spalten sperren
Klicken Sie auf ... in einer Spalte und wählen Sie Sperren aus, um die Spalte für die Bearbeitung im Sprint zu sperren. Die Spaltendaten bleiben sichtbar, können aber von Data Stewards nicht bearbeitet werden.
Spalten ausschließen
Klicken Sie auf ... in einer Spalte und wählen Sie Ausschließen aus, um die Spalte vom Sprint auszuschließen. Die Spaltendaten werden Data Stewards nicht mehr angezeigt.
Einen semantischen Typ auf eine Spalte anwenden
Die Spalte verwendet standardmäßig ihren nativen Datentyp. Sie können einen semantischen Typ auf die Spalte anwenden, um Stewards bei der Datenvalidierung zu unterstützen.
-
Wählen Sie die Spalte aus und klicken Sie auf
neben Datentyp. Sie können nun einen semantischen Typ auswählen, der auf die Spalte angewendet werden soll.
Sie können auch den Namen und die Beschreibung für jede Spalte ändern.
Klicken Sie auf Weiter, wenn Sie bereit sind, mit der Definition des Datenspeichers fortzufahren.
Eine Validierungsregel zu einer Spalte hinzufügen
Sie können Validierungsregeln auf eine Spalte anwenden, um ungültige Daten leichter zu erkennen. Ungültige Daten werden in der Spalte hervorgehoben.
-
Wählen Sie die Spalte aus und klicken Sie auf Validierungsregel anwenden. Sie können entweder eine bestehende Validierungsregel auswählen oder eine neue Validierungsregel erstellen.
Weitere Informationen zum Erstellen von Validierungsregeln finden Sie unter Erstellen einer Validierungsregel.
Mit Datenspeicher verbinden
Sie müssen eine Verbindung zu dem Cloud Data Warehouse herstellen, das Sie zum Speichern von Sprint-Daten verwenden möchten. Snowflake ist derzeit das einzige unterstützte Data Warehouse.
-
Wählen Sie die Verbindung zum Data Warehouse aus.
-
Wählen Sie aus, welche Datenbank Sie verwenden möchten.
-
Wählen Sie, ob Sie ein bestehendes Datenbankschema oder ein neues Datenbankschema verwenden möchten.
Wenn Sie Neues Datenbankschema auswählen, legen Sie den Namen des neuen Schemas fest.
-
Legen Sie den Namen der Tabelle, die für aufgelöste Sprintdaten verwendet werden soll, unter Tabellenname für aufgelöste Datensätze fest.
Klicken Sie auf Weiter, wenn Sie bereit sind, Rollen und andere Einstellungen für den Sprint-Workflow zu definieren.
Rollen und Einstellungen für den Sprint-Workflow definieren
Der letzte Schritt ist die Definition von Rollen und anderen Einstellungen.
-
Besitzer hinzufügen
Fügen Sie alle Benutzer hinzu, die Besitzer des Sprints sein sollen.
-
Data Stewards hinzufügen
Fügen Sie alle Data Stewards für diesen Sprint hinzu.
-
Datensatz-Workflow
Sie können auswählen, ob Sie einen zweiten Validierungsschritt durch Sprint-Besitzer hinzufügen möchten.
InformationshinweisWenn ein Benutzer, der sowohl Sprint-Besitzer als auch Data Steward ist, einen Datensatz validiert, wird der zweite Validierungsschritt umgangen. -
Datensatzzuweisung
Wählen Sie, ob Sie Datensätze automatisch zuweisen möchten oder ob Sie Datensätze manuell Data Stewards zuweisen möchten.
-
Automatisch:
Datensätze werden automatisch mit einer gleichmäßigen Verteilung Data Stewards zugewiesen. Datensätze werden keinen Sprint-Besitzern zugewiesen, die nicht auch Data Stewards sind.
-
Manuell
Datensätze werden anfänglich keinem Data Steward zugewiesen. Sprint-Besitzer und Data Stewards können Datensätze aus Nicht zugewiesen zuweisen.
-
-
Priorität
Sie können die Priorität für den Sprint festlegen.
Klicken Sie auf Speichern, wenn Sie bereit zum Erstellen des Sprints sind.
Der Sprint ist jetzt erstellt, und die zugewiesenen Data Stewards können mit der Validierung der Daten beginnen.