Skapa en lösningssprint från en CSV-fil

Du kan skapa en lösningssprint från en CSV-fil som innehåller data som ska valideras.

Förutsättningar

Innan du skapar sprinten behöver du:

Ett utrymme att använda när du skapar sprinten.

Sprintägare/skapare måste ha följande behörigheter i utrymmet: Kan hantera, Kan redigera, Kan visa, Kan visa data

Datastewards måste ha följande behörigheter i utrymmet: Kan redigera, Kan visa, Kan visa data
En koppling till Snowflake-datalagret som du vill använda för att lagra sprintdata. Använd inte en datagateway för kopplingen.

Alla sprintanvändare måste ha följande behörigheter i kopplingsutrymmet: Kan redigera, Kan visa, Kan visa data

Du kan skapa en koppling i Kopplingar i Qlik Talend Data Integration aktivitetscenter.

För mer information om Snowflake-kopplingar, se Snowflake.

Skapa en sprint

För att skapa en lösningssprint, klicka på Skapa sprint i Data stewardship i aktivitetscentret Qlik Talend Data Integration.

Allmänna sprintinställningar

Namn

Lägg till ett namn för sprinten.
Utrymme

Välj vilket utrymme att skapa sprinten i.
Beskrivning

Lägg till en beskrivning av sprinten.
Källa för populering av sprint

Välj Fil.

Importera CSV-filen som innehåller de data du vill validera.

Klicka på Nästa när du är redo att fortsätta med att definiera dataschemat.

Definiera dataschemat

Du kan nu validera dataschemat som används för att validera data och anpassa det till dina krav. Datakvalitetsindikatorer visas för varje kolumn, och eventuellt ogiltiga data markeras. Detta baseras på ett urval av data.

Lås kolumner

Klicka på ... på en kolumn och välj Lås för att låsa kolumnen för redigering i sprinten. Kolumndata kommer fortfarande att vara synliga men kan inte redigeras av dataförvaltare.

Uteslut kolumner

Klicka på ... på en kolumn och välj Uteslut för att utesluta kolumnen från sprinten. Kolumndata kommer inte att vara synlig för dataförvaltare.

Tillämpa en semantisk typ på en kolumn

Kolumnen kommer att använda sin ursprungliga datatyp som standard. Du kan tillämpa en semantisk typ på kolumnen för att hjälpa förvaltare vid validering av data.

Välj kolumnen och klicka på bredvid Datatyp. Du kan nu välja en semantisk typ att tillämpa på kolumnen.

Du kan också ändra namnet och beskrivningen för varje kolumn.

Klicka på Nästa när du är redo att fortsätta för att definiera datalagringen.

Lägg till en valideringsregel till en kolumn

Du kan tillämpa valideringsregler på en kolumn för att göra det enklare att upptäcka ogiltiga data. Ogiltiga data kommer att markeras i kolumnen.

Välj kolumnen och klicka på Tillämpa valideringsregel. Du kan antingen välja en befintlig valideringsregel eller skapa en ny valideringsregel.

Mer information om att skapa valideringsregler finns i Creating a validation rule.

Anslut till datalagring

Du måste ansluta till det molndatalager som du vill använda för att lagra sprintdata. Snowflake är för närvarande det enda datalager som stöds.

Välj kopplingen till datalagret.
Välj vilken databas som ska användas.
Välj om du vill använda ett befintligt databasschema, eller ett nytt databasschema.

Om du väljer Nytt databasschema, ange namnet på det nya schemat.
Ange namnet på tabellen som ska användas för lösta sprintdata i Tabellnamn för lösta poster.

Klicka på Nästa när du är redo att fortsätta med att definiera roller och andra inställningar för sprintarbetsflödet.

Definiera roller och inställningar för sprintarbetsflödet

Det sista steget är att definiera roller och andra inställningar.

Lägg till ägare

Lägg till alla användare som ska vara ägare av sprinten.
Lägg till datastewards

Lägg till alla datastewards för den här sprinten.
Arbetsflöde för poster

Du kan välja om du vill lägga till ett andra valideringssteg av sprintägare.

Anteckning om informationOm en användare som är både sprintägare och datasteward validerar en post, hoppas det andra valideringssteget över.
Tilldelning av poster

Välj om du vill tilldela poster automatiskt, eller om du vill tilldela poster manuellt till dataförvaltare.
- Automatiskt
  
  Poster tilldelas automatiskt till dataförvaltare med en jämn fördelning. Poster kommer inte att tilldelas sprintägare som inte också är dataförvaltare.
- Manuellt
  
  Poster kommer initialt inte att tilldelas en dataförvaltare. Sprintägare och dataförvaltare kan tilldela poster från Otilldelade.
Prioritet

Du kan ställa in prioritet för sprinten. Prioritet används för att sortera sprintar i sprintlistan.

Klicka på Spara när du är redo att skapa sprinten.

Sprinten är nu skapad, och de tilldelade datavårdarna kan börja validera data.

Var den här sidan till hjälp för dig?

Om du stöter på några problem med den här sidan eller innehållet på den, t.ex. ett stavfel, ett saknat steg eller ett tekniskt fel – meddela oss!

Lämna din feedback här