Skapa en lösningssprint från en CSV-fil
Du kan skapa en lösningssprint från en CSV-fil som innehåller data som ska valideras.
Förutsättningar
Innan du skapar sprinten behöver du:
-
Ett utrymme att använda när du skapar sprinten.
Sprintägare/skapare måste ha följande behörigheter i utrymmet: Kan hantera, Kan redigera, Kan visa, Kan visa data
Datastewards måste ha följande behörigheter i utrymmet: Kan redigera, Kan visa, Kan visa data
-
En koppling till Snowflake-datalagret som du vill använda för att lagra sprintdata. Använd inte en datagateway för kopplingen.
Alla sprintanvändare måste ha följande behörigheter i utrymmet för kopplingen: Kan redigera, Kan visa, Kan visa data
Du kan skapa en koppling i Kopplingar i Qlik Talend Data Integration aktivitetscenter.
För mer information om Snowflake-kopplingar, se Snowflake.
Skapa en sprint
För att skapa en lösningssprint, klicka på Skapa sprint i Data stewardship i aktivitetscentret Qlik Talend Data Integration.
Allmänna sprintinställningar
-
Namn
Lägg till ett namn för sprinten.
-
Utrymme
Välj vilket utrymme att skapa sprinten i.
-
Beskrivning
Lägg till en beskrivning av sprinten.
-
Källa för populering av sprint
Välj Fil.
Importera CSV-filen som innehåller de data du vill validera.
Klicka på Nästa när du är redo att fortsätta med att definiera dataschemat.
Definiera dataschemat
Du kan nu validera dataschemat som används för att validera data och anpassa det till dina krav. Datakvalitetsindikatorer visas för varje kolumn, och eventuellt ogiltiga data markeras. Detta baseras på ett urval av data.
Lås kolumner
Klicka på ... på en kolumn och välj Lås för att låsa kolumnen för redigering i sprinten. Kolumndata kommer fortfarande att vara synliga men kan inte redigeras av dataförvaltare.
Uteslut kolumner
Klicka på ... på en kolumn och välj Uteslut för att utesluta kolumnen från sprinten. Kolumndata kommer inte att vara synlig för dataförvaltare.
Tillämpa en semantisk typ på en kolumn
Kolumnen kommer att använda sin ursprungliga datatyp som standard. Du kan tillämpa en semantisk typ på kolumnen för att hjälpa förvaltare vid validering av data.
-
Välj kolumnen och klicka på
bredvid Datatyp. Du kan nu välja en semantisk typ att tillämpa på kolumnen.
Du kan också ändra namnet och beskrivningen för varje kolumn.
Klicka på Nästa när du är redo att fortsätta för att definiera datalagringen.
Lägg till en valideringsregel till en kolumn
Du kan tillämpa valideringsregler på en kolumn för att göra det enklare att upptäcka ogiltiga data. Ogiltiga data kommer att markeras i kolumnen.
-
Välj kolumnen och klicka på Tillämpa valideringsregel. Du kan antingen välja en befintlig valideringsregel eller skapa en ny valideringsregel.
Mer information om att skapa valideringsregler finns i Creating a validation rule.
Anslut till datalagring
Du måste koppla till det molndatalager som du vill använda för att lagra sprintdata. Snowflake är för närvarande det enda datalagret som stöds.
-
Välj kopplingen till datalagret.
-
Välj vilken databas du vill använda.
-
Välj om du vill använda ett befintligt databasschema, eller ett nytt databasschema.
Om du väljer Nytt databasschema, ange namnet på det nya schemat.
-
Ange namnet på tabellen som ska användas för lösta sprintdata i Tabellnamn för lösta poster.
Klicka på Nästa när du är redo att fortsätta med att definiera roller och andra inställningar för sprintarbetsflödet.
Definiera roller och inställningar för sprintarbetsflödet
Det sista steget är att definiera roller och andra inställningar.
-
Lägg till ägare
Lägg till alla användare som ska vara ägare av sprinten.
-
Lägg till stewards
Lägg till alla datastewards för den här sprinten.
-
Arbetsflöde för poster
Du kan välja om du vill lägga till ett andra valideringssteg av sprintägare.
Anteckning om informationOm en användare som är både sprintägare och datavårdare validerar en post, hoppas det andra valideringssteget över. -
Tilldelning av poster
Välj om du vill auto-tilldela poster, eller om du vill tilldela poster manuellt till datavårdare.
-
Automatiskt
Poster tilldelas automatiskt till datavårdare med en jämn fördelning. Poster kommer inte att tilldelas sprintägare som inte också är datavårdare.
-
Manuellt
Poster kommer initialt inte att tilldelas en datavårdare. Sprintägare och datavårdare kan tilldela poster från Otilldelade.
-
-
Prioritet
Du kan ange prioritet för sprinten.
Klicka på Spara när du är redo att skapa sprinten.
Sprinten är nu skapad, och de tilldelade datavårdarna kan börja validera data.