Gå till huvudinnehåll Gå till ytterligare innehåll

Skapa en lösningssprint från en CSV-fil

Du kan skapa en lösningssprint från en CSV-fil som innehåller data som ska valideras.

Förutsättningar

Innan du skapar sprinten behöver du:

  • Ett utrymme att använda när du skapar sprinten.

    Sprintägare/skapare måste ha följande behörigheter i utrymmet: Kan hantera, Kan redigera, Kan visa, Kan visa data

    Datastewards måste ha följande behörigheter i utrymmet: Kan redigera, Kan visa, Kan visa data

  • En koppling till Snowflake-datalagret som du vill använda för att lagra sprintdata. Använd inte en datagateway för kopplingen.

    Alla sprintanvändare måste ha följande behörigheter i utrymmet för kopplingen: Kan redigera, Kan visa, Kan visa data

    Du kan skapa en koppling i Kopplingar i Qlik Talend Data Integration aktivitetscenter.

    För mer information om Snowflake-kopplingar, se Snowflake.

Skapa en sprint

För att skapa en lösningssprint, klicka på Skapa sprint i Data stewardship i aktivitetscentret Qlik Talend Data Integration.

Allmänna sprintinställningar

  1. Namn

    Lägg till ett namn för sprinten.

  2. Utrymme

    Välj vilket utrymme att skapa sprinten i.

  3. Beskrivning

    Lägg till en beskrivning av sprinten.

  4. Källa för populering av sprint

    Välj Fil.

    Importera CSV-filen som innehåller de data du vill validera.

Klicka på Nästa när du är redo att fortsätta med att definiera dataschemat.

Definiera dataschemat

Du kan nu validera dataschemat som används för att validera data och anpassa det till dina krav. Datakvalitetsindikatorer visas för varje kolumn, och eventuellt ogiltiga data markeras. Detta baseras på ett urval av data.

Lås kolumner

Klicka på ... på en kolumn och välj Lås för att låsa kolumnen för redigering i sprinten. Kolumndata kommer fortfarande att vara synliga men kan inte redigeras av dataförvaltare.

Uteslut kolumner

Klicka på ... på en kolumn och välj Uteslut för att utesluta kolumnen från sprinten. Kolumndata kommer inte att vara synlig för dataförvaltare.

Tillämpa en semantisk typ på en kolumn

Kolumnen kommer att använda sin ursprungliga datatyp som standard. Du kan tillämpa en semantisk typ på kolumnen för att hjälpa förvaltare vid validering av data.

  • Välj kolumnen och klicka på Redigera bredvid Datatyp. Du kan nu välja en semantisk typ att tillämpa på kolumnen.

Du kan också ändra namnet och beskrivningen för varje kolumn.

Klicka på Nästa när du är redo att fortsätta för att definiera datalagringen.

Lägg till en valideringsregel till en kolumn

Du kan tillämpa valideringsregler på en kolumn för att göra det enklare att upptäcka ogiltiga data. Ogiltiga data kommer att markeras i kolumnen.

  • Välj kolumnen och klicka på Tillämpa valideringsregel. Du kan antingen välja en befintlig valideringsregel eller skapa en ny valideringsregel.

Mer information om att skapa valideringsregler finns i Creating a validation rule.

Anslut till datalagring

Du måste koppla till det molndatalager som du vill använda för att lagra sprintdata. Snowflake är för närvarande det enda datalagret som stöds.

  1. Välj kopplingen till datalagret.

  2. Välj vilken databas du vill använda.

  3. Välj om du vill använda ett befintligt databasschema, eller ett nytt databasschema.

    Om du väljer Nytt databasschema, ange namnet på det nya schemat.

  4. Ange namnet på tabellen som ska användas för lösta sprintdata i Tabellnamn för lösta poster.

Klicka på Nästa när du är redo att fortsätta med att definiera roller och andra inställningar för sprintarbetsflödet.

Definiera roller och inställningar för sprintarbetsflödet

Det sista steget är att definiera roller och andra inställningar.

  1. Lägg till ägare

    Lägg till alla användare som ska vara ägare av sprinten.

  2. Lägg till stewards

    Lägg till alla datastewards för den här sprinten.

  3. Arbetsflöde för poster

    Du kan välja om du vill lägga till ett andra valideringssteg av sprintägare.

    Anteckning om informationOm en användare som är både sprintägare och datavårdare validerar en post, hoppas det andra valideringssteget över.
  4. Tilldelning av poster

    Välj om du vill auto-tilldela poster, eller om du vill tilldela poster manuellt till datavårdare.

    • Automatiskt

      Poster tilldelas automatiskt till datavårdare med en jämn fördelning. Poster kommer inte att tilldelas sprintägare som inte också är datavårdare.

    • Manuellt

      Poster kommer initialt inte att tilldelas en datavårdare. Sprintägare och datavårdare kan tilldela poster från Otilldelade.

  5. Prioritet

    Du kan ange prioritet för sprinten.

Klicka på Spara när du är redo att skapa sprinten.

Sprinten är nu skapad, och de tilldelade datavårdarna kan börja validera data.

 

Var den här sidan till hjälp för dig?

Om du stöter på några problem med den här sidan eller innehållet på den, t.ex. ett stavfel, ett saknat steg eller ett tekniskt fel – meddela oss!