Omvandla data

Du kan skapa återanvändbara och regelbaserade datatransformeringar som en del av din datapipeline. Du kan utföra omvandlingar som en del av din registrering av data eller skapa återanvändbara datauppgifter för omvandlingar. Du kan utföra transformeringar på radnivå, inkludera SQL-transformeringaroch utforma komplexa transformeringsflöden. De resulterande datauppsättningar kan antingen materialiseras som tabeller eller skapas som vyer som omgående utför transformeringar.

Avancerade transformeringar är tillgängliga med en Qlik Talend Cloud Premium-eller en Qlik Talend Cloud Enterprise-prenumeration.

Du kan utföra explicita omvandlingar av datauppsättningar eller skapa globala regler som omvandlar flera datauppsättningar. Du kan också filtrera en datauppsättning för att skapa en delmängd av rader.
Du kan lägga till SQL-omvandlingar. En SQL-transformering gör det möjligt för dig att ställa en SQL SELECT-fråga i en pipeline för att definiera komplexa eller enkla transformeringar.
Du kan använda SQL Workbench för att utforska data i förberedda uppgifter och validera SQL-frågor i kontexten av ditt projekt. Mer information finns i Utforska data med SQL Workbench.
Du kan lägga till visuella transformationsflöden med källor, processorer och mål för att definiera komplexa eller enkla omvandlingar.

Datauppgifterna styrs av ägaren till det projekt de tillhör. Mer information om nödvändiga roller och behörigheter finns i Roller och behörigheter för datautrymmen.

En datatransformeringsuppgift innehåller tre vyer:

Transformering

I den här vyn visas alla transformeringar för att visualisera flödet från källdatauppsättning till måldatauppsättning.
Datauppsättningar

I den här vyn visas alla grundläggande transformeringar av datauppsättningar, som exempelvis filtrera data eller lägga till kolumner, samt regler för att utföra globala transformeringar.
Modell

I den här vyn kan du skapa en datamodell med relationerna mellan de inkluderade datauppsättningarna. Mer information finns i Skapa en datamodell.

Förutom att lagra tabeller i datalagret kan du också lagra tabeller som Iceberg-tabeller som hanteras av dataplattformen. Detta alternativ är för närvarande endast tillgängligt för Snowflake-projekt. Detta är möjligt genom att välja Snowflake-hanterade Iceberg-tabeller under Tabelltyp i uppgiftsinställningarna.

Skapa en transformeringsdatauppgift

Det enklaste sättet att skapa en omvandlingsdatauppgift är att klicka på … på en lagringsdatauppgift och sedan välja Transform data.

Du kan också klicka på Skapa i ett projekt och välja Transformera data. I det här fallet måste du definiera vilken källdatauppgift som ska användas.

Definiera dina källdata och mål i Transform.

Du kan antingen:
- Utföra transformeringar av datauppsättningar
  
  Välj källdatauppsättningar och klicka på Lägg till mål för att lägga till dem i Mål.
  
  Därefter kan du utföra grundläggande transformeringar på datauppsättningarna, exempelvis filtrera data eller lägga till kolumner i Datauppsättningar.
  
  Mer information finns i Hantera datauppsättningar.
- Lägga till en SQL-transformering
  
  Välj källdatauppsättningar och klicka på Lägg till SQL-transformering.
  
  En SQL-transformering gör det möjligt för dig att ställa en SQL SELECT-fråga i en pipeline för att definiera komplexa eller enkla transformeringar.
  
  Mer information finns i Lägga till SQL-transformeringar.
- Lägga till transformeringsflöde
  
  Välj källdatauppsättningar och klicka på Lägg till transformeringsflöde.
  
  Med flow designer kan du skapa ett transformationsflöde med källor, processorer och mål för att definiera komplexa eller enkla transformeringar.
  
  Mer information finns i Lägga till transformationsflöden.
Du kan också lägga till fler datauppsättningar från andra lagringsdatauppgifter genom att klicka på Select source data.

Du kan lägga till datauppsättningar från det aktuella projektet eller från ett annat projekt. Så här lägger du till datauppsättningar från ett annat projekt:
- Du måste ha minst rollen Kan använda i utrymmet för det använda projektet.
- Båda projekten måste finnas på samma dataplattform.
Om det valda projektet är under versionskontroll, kan du välja vilken gren som ska användas som källa. För mer information om projektövergripande pipelines, se Bygga projektövergripande pipelines.
När du har lagt till de omvandlingar du vill ha validerar du datauppsättningarna genom att klicka på Validera datauppsättningar. Om fel hittas vid valideringen åtgärdar du felen innan du fortsätter.

Mer information finns i Validera och justera datauppsättningarna.
Skapa en datamodell

Klicka på Model för att ställa in relationerna mellan de inkluderade datauppsättningarna.

Mer information finns i Skapa en datamodell.
Klicka på Förbered för att förbereda dataarbetsuppgiften och alla nödvändiga artefakter. Detta kan ta lite tid.

Du kan följa förloppet under Förlopp för förberedelse på skärmens nedre del.

Anteckning om informationInnan du förbereder en uppgift ska du stoppa alla uppgifter som ligger direkt nedströms.
När statusen visar Prepared kan du köra datauppgiften.

Klicka på ... och sedan på Run.

Datauppgiften kommer nu att börja skapa datauppsättningar för att omvandla data.

Det är inte möjligt att ändra vilka datauppsättningar som ingår när du har börjat generera datauppsättningar.

Använda vyn Transformering

I vyn Transformering visas alla transformeringar för att visualisera flödet från källdatauppsättning till måldatauppsättning.

Välj en transformering för att se vilka källdatauppsättningar som används och vilka måldatauppsättningar som skapas.
Välj en källa för att se alla transformeringar där den används, och alla resulterande mål.
Välj ett mål för att se vilka källdatauppsättningar som används och vilken transformering som har skapat den här måldatauppsättningen.

Transformeringsvy i Transformering — Transformeringsvy i en transformering

Du kan ändra följande inställningar genom att klicka på Visa alternativ:

Filtrera efter transformeringstyp

Visa endast transformeringar av en eller två transformeringstyper.
Filter

Visa alla transformeringar eller bara den valda transformeringen. Du måste välja en transformering för att aktivera detta alternativ.
Täthet

Välj om du vill visa transformeringar med en kompakt layout, eller en bred layout som tar upp mer utrymme.

Använd vyn Datauppsättningar

I Datauppsättningar kan du visa och redigera alla datauppsättningar i transformeringsuppgiften.

Se även Hantera datauppsättningar för mer information.

Lägga till en måldatauppsättning

Du kan lägga till fler måldatauppsättningar till transformeringsuppgiften.

Klicka på .
Ange Namn och, om du vill, Beskrivning för datauppsättningen.
Välj en källdatauppsättning från de datauppsättningar som finns tillgängliga i uppgiften i Källdatauppsättning.

Anteckning om tipsDu kan välja Ingen källdatauppsättning för att skapa ett tomt dataset som inte är kopplat till någon källa. Du kan lägga till kolumner i datauppsättningen under designen, men du måste koppla en källdatauppsättning innan du kan förbereda uppgiften.

Måldatauppsättningen är nu tillagd.

Byta källdatauppsättning

Du kan byta källdatauppsättningen för en måldatauppsättning.

Klicka på efter Källa: [namn på källdatauppsättning].
Välj en annan källdatauppsättning från de datauppsättningar som finns tillgängliga i uppgiften i Källdatauppsättning.

Anteckning om tipsDu kan välja Ingen källdatauppsättning för att koppla bort måldatasetet från källan. Du kan redigera datauppsättningen under designen, men du måste koppla en källdatauppsättning innan du kan förbereda uppgiften.

Lägga till kolumner

Du kan lägga till nya kolumner i måldatauppsättningen.

Lägg till en ny kolumn från början

Klicka på + Lägg till.

Ange ett namn för kolumnen och ange ett uttryck för att definiera kolumnens data.

Mer information finns i Lägga till kolumner i en datauppsättning.
Lägg till en kolumn från källan

Klicka på bredvid Lägg till och välj Lägg till kolumn från källa.

Välj en kolumn från källdatauppsättningen.

Flytta om kolumner

Du kan ändra ordningplacering för en kolumn.

Välj en kolumn
Klicka på och sedan Flytta om.
Använd pilarna för att flytta kolumnen uppåt eller nedåt.
Stäng Ändra ordningstal när du är klar.

Skapa transformeringsregler

Du kan skapa återanvändbara transformeringsregler för att utföra global transformering av datauppsättningar.

Mer information om att skapa regler finns i Skapa regler för att transformera dataset.

Du kan visa effekter av reglerna genom att välja Visa effekter av reglerna. Du kan inte göra ändringar i datauppsättningarna när Visa effekter av reglerna är aktiverat.

Filtrera en datauppsättning

Du kan vid behov filtrera data för att skapa en delmängd av rader.

Klicka på och sedan Filter.

Mer information om filter hittar du i Filtrera ett dataset.

Schemalägga en omvandlingsuppgift

Du kan schemalägga en transformeringsuppgift så att den uppdateras regelbundet. Du kan ställa in ett tidsbaserat schema, eller ställa in uppgiften att köras när indatauppgifter har slutförts.

Klicka på … på en datauppgift och välj Schemaläggning för att skapa ett schema. Standardinställningen för schemaläggning ärvs från inställningarna i projektet. Mer information om standardinställningar finns i Standardvärden för transformering.

Du måste alltid sätta Schemaläggning till På för att aktivera schemat.

Om alla datauppsättningar i uppgiften är icke-materialiserade finns det inget att köra eftersom transformeringen utförs direkt med vyer. Du kan fortfarande skapa ett schema för en icke-materialiserad transformeringsuppgift som ska köras när schemaläggningsvillkoren är uppfyllda. Uppgiften kommer att slutföras direkt vilket kan utlösa en uppgift nedströms, till exempel en datamart. På så sätt kan du bygga upp ett händelsebaserat pipelineschema som omfattar icke-materialiserade transformeringar utan att pipelineflödet avbryts.

Tidsbaserade scheman

Du kan använda ett tidsbaserat schema för att köra uppgiften oavsett när de olika indatakällorna uppdateras.

Välj Vid en specifik tidpunkt i Kör datauppgift.

Du kan skapa ett schema med intervall på dagar, veckor eller månader.

Händelsebaserade scheman

Du kan använda ett händelsebaserat schema som körs när indatauppgifterna har slutförts.

Välj Vid ett specifikt event i Kör datauppgift.

Du kan välja om du vill köra uppgiften när någon av indatauppgifterna har slutförts, eller när någon uppgift i ett urval av indatauppgifter har slutförts.

Uppgiften körs inte om någon indatauppgift eller uppgift nedströms körs när schemat utlöses. Uppgiften hoppas över tills nästa schemalagda körning.

Övervaka en omvandlingsuppgift

Du kan övervaka statusen och förloppet för en transformeringsuppgift genom att klicka på Monitor.

Mer information finns i Övervaka en enskild datauppgift.

Ladda data

Du kan utföra en manuell laddning av tabeller om data materialiseras som fysiska tabeller. Detta är användbart när det finns problem med en eller flera tabeller.

Om datauppsättningar är icke-materialiserade måste du ladda källdatauppsättningar i datauppgifter uppströms för att uppdatera data.

Öppna datauppgiften och välj fliken Övervaka.
Välj tabellerna du vill ladda.
Klicka på Ladda tabeller.

Laddningen sker nästa gång uppgiften körs. Laddningsprocessen fungerar annorlunda beroende på historikinställningen och typen av transformering för varje datauppsättning. Detta innebär att laddningsprocessen kan skilja sig åt mellan datauppsättningar i en datauppgift.

Transformering av datauppsättningar laddas genom trunkering och laddning.
SQL-transformeringar och transformeringsflöden laddas genom att trunkera och ladda, eller genom att jämföra och tillämpa. Bästa praxis är att jämföra och tillämpa.

Ladda en datauppsättning baserat på SQL-transformering eller transformeringsflöde

Du kan avbryta laddningen för tabeller som väntar på laddning genom att klicka på Avbryt laddning. Detta kommer inte att påverka tabeller som redan har laddats och laddningar som körs för tillfället kommer att slutföras.

Uppgifter nedströms laddas för att ändringar ska tillämpas och antedatering undvikas.

Effekter nedströms på laddning av transformering — Påverkan nedströms efter laddning av en transformeringsuppgift

Påverkan nedströms beror på typen av utförd laddningsåtgärd och typ av datauppsättning omedelbart nedströms. Standardbearbetning innebär att datauppsättningen kommer att reagera och bearbeta data med den konfigurerade metoden för den specifika datauppsättningen.

Exempel: Ladda en datauppsättning via trunkera och ladda

Om nästa datauppsättning använder transformeringar av datauppsättningar kommer den att laddas vid nästa körning via trunkera och ladda.
Om nästa datauppsättning är en SQL-transformering eller ett transformeringsflöde kommer den att laddas med jämför och tillämpa.

Ladda en datauppsättning utan historik

I det här fallet finns det ingen historik att ta hänsyn till. För att begränsa bearbetningen på målet utförs laddningen genom att:

Trunkera tabellerna.
Ladda aktuell data från datauppgiften uppströms.

Uppgifter nedströms laddas för att ändringar ska tillämpas.

Ladda en datauppsättning med historik aktiverad.

Laddningen utförs genom att:

Trunkera aktuella, föregående och ändringstabeller.
Ladda data från datauppgiften uppströms, inklusive föregående tabeller.

Ladda en datauppsättning baserat på SQL-transformering eller transformeringsflöde

Trunkerar och laddar

Anteckning om informationI det här alternativet kan historik gå förlorad.
1. Trunkera aktuella och ändringstabeller.
2. Köra frågan och ladda den till de aktuella tabellerna.
Ladda och jämför
1. Köra frågan och jämför den med de aktuella tabellerna.
2. Lägga till ändringar.

När en datauppsättning som baseras på SQL-transformation eller transformationsflöde laddas om på grund av en laddning av en uppgift uppströms laddas den alltid genom att jämföra och tillämpa. Om du vill trunkera och ladda den måste du skicka en specifik laddning för de berörda tabellerna. I det här fallet måste du även ta hänsyn till effekten på tabeller nedströms.

Ta bort en uppgift

Du kan ta bort datauppgiften om den inte körs och det inte finns några beroenden till efterföljande uppgifter i samma projekt.

I projektvyn Pipelineprojekt klickar du på på en uppgift och väljer Ta bort.

Artefakter (tabeller och vyer) som skapats av uppgiften kommer också att tas bort, om du inte väljer att behålla dem.

Tänk på att de artefakter du behåller inte längre kommer att uppdateras av uppgiften.

Visa uppgiftsinformation

Klicka på i menyraden för att visa uppgiftsinformation, till exempel:

Ägare
Utrymme
Dataplattform
Projekt-id
Körnings-ID för datauppgift

Inställningar för transformering

Du kan ställa in egenskaper för transformeringsdatauppgiften.

Klicka på Inställningar.

Om uppgiften redan har körts måste du återskapa datauppsättningarna om du ändrar en annan inställning än Runtime-inställningar.

Allmänna inställningar

Databas

Databas som ska användas i datakällan.
Uppgiftsschema

Du kan byta namn på schemat för datauppgiften. Standardnamnet är namnet på uppgiften.
Internt schema

Du kan ändra namnet på datauppgiftsschemat för intern lagring. Standardnamnet är namnet på uppgiften med __internal som tillägg.
Standardversalisering av schemanamn

Du kan ange standardversalisering för alla schemanamn. Om din databas är konfigurerad för att tvinga fram versalisering kommer detta alternativ inte att ha någon effekt.
Prefix för alla tabeller och vyer
Du kan ange prefix för alla tabeller och vyer som skapas av uppgiften.

Anteckning om informationDu måste använda ett unikt prefix om du vill använda ett databasschema i flera datauppgifter.
Materialiserad

Du kan välja om du bara vill skapa vyer som utför omvandlingar omgående (Non-materialized), eller skapa både tabeller och vyer (Materialized).
Historisk datalagring (typ 2)

Du kan behålla historiska ändringsdata så att du enkelt kan återskapa data så som de såg ut vid en viss tidpunkt. Du kan använda historiska vyer och historiska livevyer för att se historiska data.
Publicera i katalogen

Välj det här alternativet för att publicera den här versionen av data till Katalogen som en datauppsättning. Kataloginnehållet kommer att uppdateras nästa gång du förbereder den här uppgiften.

Mer information om Katalog finns i Förstå data med hjälp av katalogverktyg.

Inställningar för körtid

Parallell körning

Du kan ställa in det maximala antalet kopplingar för fullständig laddning till ett tal mellan 1 och 5.
Lager

Namnet på molndatalagret.

Inställningar för typ av vy

Inställningen för typ av vy gäller endast för Snowflake.

Standardvyer

Använd standardvyer för de flesta fall.
Snowflake säkra vyer

Använd säkra vyer i Snowflake för vyer som är avsedda för skydd av dataintegritet eller känslig information, t.ex. vyer som skapats för att begränsa åtkomsten till känsliga data som inte bör exponeras för alla användare av de underliggande datatabellerna.

Anteckning om information Snowflake säkra vyer kan köras långsammare än standardvyer.

Tabelltypsinställningar

Dessa inställningar är endast tillgängliga i projekt med Snowflake som dataplattform.

Tabelltyp

Du kan välja vilken typ av tabell som ska användas:
- Snowflake-tabeller
- Iceberg-tabeller som hanteras av Snowflake
  
  Du måste ange standardnamnet på den externa volymen i Snowflake external volume.
Mapp att använda i molnet

Välj vilken mapp som ska användas när data mellanlagras i mellanlagringsområdet.
- Standardmapp
  
  Detta skapar en mapp med standardnamnet: <projektnamn>/<datauppgiftens namn>.
- Rotmapp
  
  Lagra data i lagringens rotmapp.
- Mapp
  
  Ange namnet på mappen som ska användas.
Synka med Snowflake Open Catalog

Aktivera detta för att låta Snowflake Open Catalog hantera filerna i fillagringen i molnet.

Metodtips

Det är inte möjligt att ändra källa för en datamängd i en datamart om fakta och dimensioner har lagts till. Om du vill vara flexibel kan du lägga till en föregående Transform-uppgift med icke-materialiserade vyer som kan användas för att ändra källor och även för att ha en modell för alla källuppgifter.

Begränsningar och överväganden

Det är inte möjligt att ändra datatyper i en omvandlingsdatauppgift när alternativet Non-materialized är valt.
Ursprung på fältnivå är inte tillgängligt för datauppsättningar som har skapats i SQL-transformeringar eller transformeringsflöden.

Anteckning om informationDenna begränsning gäller endast för Qlik Cloud Government. Att använda Lägg till i mål för att läsa från en Qlik Open LakehouseSpegel-uppgift inställd på Endast lägg till stöds inte. Som en lösning kan du läsa data med hjälp av en SQL-transformering eller ett transformeringsflöde.

RELATERAD INFORMATION:

Använda Qlik Cloud Dataintegration för att introducera och transformera data

Mer information

Använda Qlik Cloud Dataintegration för att introducera och transformera data

Var den här sidan till hjälp för dig?

Om du stöter på några problem med den här sidan eller innehållet på den, t.ex. ett stavfel, ett saknat steg eller ett tekniskt fel – meddela oss!

Lämna din feedback här