Lagra strömmande dataset | Qlik CloudHjälp
Gå till huvudinnehåll Gå till ytterligare innehåll

Lagra strömmande dataset

Följande inställningar för uppgiften Strömmande transformering gäller för Qlik Open Lakehouse-projekt som använder en strömmande källa.

Du kan lagra och transformera strömmande data med uppgiften Strömmande transformera data. Strömmande data innehåller ofta nästlade strukturer och matriser som kräver tillplattning, och transformeringsfunktioner behövs under lagringsfasen. Dessa funktioner är tillgängliga för uppgiften Strömmande transformering, vilket gör att du kan tillämpa transformeringar omedelbart efter mellanlagring av dina strömmande data.

Hantera datasetets granularitet

Du kan platta till nästlade strukturer och matriser för att öka granulariteten. Granularitet visas i vyn Dataset. Klicka på redigera för att redigera granularitet:

  • Om du väljer ett fält från en matris kommer måltabellen att inkludera en rad per element. Detta ökar antalet rader i målet.

  • Du måste välja fält från samma matrissökväg. Om du väljer fält från olika sökvägar genereras ett valideringsfel.

  • Visade datatyper återspeglar den valda granulariteten. Till exempel blir en ARRAY<INT> INT när den plattas till. Mer information finns i Mappningar av datatyper.

Ta bort en uppgift

Du kan ta bort datauppgiften om den inte körs och det inte finns några beroenden till efterföljande uppgifter i samma projekt.

  • I projektvyn Pipelineprojekt klickar du på Mer på en uppgift och väljer Ta bort.

Artefakter (tabeller och vyer) som skapats av uppgiften kommer också att tas bort, om du inte väljer att behålla dem.

Anteckning om informationTänk på att de artefakter du behåller inte längre kommer att uppdateras av uppgiften.

Visa uppgiftsinformation

Klicka på Information i menyraden för att visa uppgiftsinformation, till exempel:

  • Ägare

  • Utrymme

  • Dataplattform

  • Projekt-id

  • Körnings-ID för datauppgift

Inställningar för Strömmande transformering

Du kan ställa in egenskaper för uppgiften Strömmande transformera data när dataplattformen är Qlik Open Lakehouse.

  • Klicka på Inställningar.

Allmänna inställningar

  • Uppgiftsschema

    Du kan ändra namnet på uppgiftsschemat för Strömmande transformering. Standardnamnet är namnet på lagringsuppgiften.

  • Internt schema

    Du kan ändra namnet på det interna lagringens datatillgångsschema. Standardnamnet är namnet på lagringsuppgiften med _internal tillagt.

  • Prefix för alla tabeller och vyer

    Du kan ange prefix för alla tabeller och vyer som skapas av uppgiften.

    Anteckning om informationDu måste använda ett unikt prefix om du vill använda ett databasschema i flera datauppgifter.
  • Mapp att använda

    Du kan ändra lagringsmappen för uppgiften Strömmande transformering.

  • Laddningsinställningar för nya dataset

    • Endast lägg till

      Lägger till nya poster utan att ändra befintliga data. Nyckelbegränsningar tillämpas inte om dubblettposter anländer.

    • Tillämpa ändringar

      Uppdaterar befintliga poster och infogar nya poster baserat på nyckelfält.

      Om du väljer att slå samman ändringar kan du även välja följande:

      • Mjuk radera poster genom att ange raderingsuttryck

        Definiera ett raderingsuttryck för att markera poster för radering.

      • Behåll historiska poster (Typ 2)

        Behåll tidigare versioner av ändrade poster.

  • Avnästla kolumner

    • Bevara nästlade kolumner

      Välj för att bevara nästlade data.

    • Avnästla till separata kolumner

      Standardbeteendet är att avnästla data till separata kolumner.

  • Måltabellspartition

    Anteckning om informationDet här alternativet är endast tillgängligt när Endast lägg till har valts i Laddningsinställningar.
    • Ingen partition

      Nya tabeller skapas utan partitioner.

    • Partitionera efter händelsedatum

      Nya tabeller partitioneras efter det datum då händelserna matas in.

  • Hantering av dataändringar

    Anteckning om informationDet här alternativet är endast tillgängligt när Tillämpa ändringar har valts i Laddningsinställningar.
    • Inkludera mjuka raderingar: Ange ett uttryck för att definiera vilka poster som ska markeras för radering.

    • Skapa ett historiskt datalager (Typ 2): Detta behåller tidigare versioner av ändrade poster.

  • Kvarhållningshantering
    • Ingen partitionsrensning

    • Partitionsrensning för aktuell ögonblicksbild

Tabelldefinitioner

  • hdr__from_timestamp

    När det här alternativet är aktiverat kommer rubrikkolumnen hdr__from_timestamp att visas i standardvyer. Dessutom, när Partitionera efter händelseinläsningsdatum väljs i introduktionsguiden, kommer hdr__from_timestamp att användas som standardpartitionskolumn.

    Anteckning om informationHistorikvyer inkluderar alltid alla rubrikkolumner för standardvyer, oavsett denna inställning.

Körningsinställningar

  • Lakehouse-kluster

    Du kan ändra lakehouse-klustret, men detta måste stödja strömmande arbetsbelastningar eller blandade arbetsbelastningar.

Inställningar för schemautveckling

  • Lägg till kolumner på rotnivå

    Den här inställningen gäller när nya kolumner läggs till i uppgiften för strömmande mellanlagring på rotnivå.

    • Tillämpa på mål

      Lägger automatiskt till nya kolumner på rotnivå från uppgiften Strömmande mellanlagring till uppgiften Strömmande transformering. Detta är standardinställningen.

    • Ignorera

      Lägger inte till nya kolumner på rotnivå.

    • Stoppa uppgift

      Stoppar transformeringsuppgiften om en ny kolumn på rotnivå upptäcks i uppgiften för strömmande mellanlagring.

  • Lägg till kolumner i strukturer

    Den här inställningen gäller när nya fält läggs till inuti en befintlig nästlad struktur i uppgiften för strömmande mellanlagring.

    • Tillämpa på mål

      Lägger automatiskt till nya fält i befintliga strukturer i uppgiften Strömmande transformering om de läggs till i mellanlagringsstrukturen.

    • Ignorera

      Lägger inte till nya fält i befintliga strukturer.

    • Stoppa uppgift

      Stoppar transformeringsuppgiften om ett nytt fält läggs till i en struktur i uppgiften Strömmande mellanlagring.

  • Ändra fältdatatyper

    • Ignorera

      Ändrar inte datatypen.

    • Stoppa uppgift

      Stoppar transformeringsuppgiften om en ändring av datatyp upptäcks i uppgiften Strömmande mellanlagring.

Datasetinställningar

Följande inställningar är tillgängliga för alla dataset i vyn Design > Dataset.

Klicka på mer bredvid datasetet och välj Inställningar.

  • Hantering av dataladdning

    Väljer hur data laddas in i måltabellen.

    • Endast lägg till

      Lägger till nya poster utan att ändra befintliga data. Nyckelbegränsningar tillämpas inte om dubblettposter anländer.

    • Tillämpa ändringar

      Uppdaterar befintliga poster och infogar nya poster baserat på nyckelfält.

  • Hantering av dataändringar

    Anteckning om informationDet här alternativet är endast tillgängligt när Tillämpa ändringar har valts i Laddningsinställningar.
    • Inkludera mjuka raderingar: Ange ett uttryck för att definiera vilka poster som ska markeras för radering. Detta bör vara ett uttryck som valideras till Sant (True) om ändringen är en mjuk radering.

      Exempel: operation = 'D'

    • Skapa ett historiskt datalager (Typ 2): Detta behåller tidigare versioner av ändrade poster.

  • Partitionskolumner

    Valfritt kan du välja partitionskolumner för att optimera prestandan.

    Klicka på Lägg till kolumn för att lägga till en partitionskolumn, välj sedan en Transformering och ställ in en Parameter om det behövs.

  • Kvarhållningshantering   

    Partitionsrensning tar bort partitioner som är äldre än kvarhållningsperioden. Detta raderar inte data fysiskt och påverkar inte äldre ögonblicksbilder omedelbart. Äldre data kan vara tillgängliga i äldre ögonblicksbilder tills de har löpt ut.

    Anteckning om informationVisas endast om partitionen har minst en datum- eller datumtidskolumn.
    • Ingen partitionsrensning

    • Partitionsrensning för aktuell ögonblicksbild

  • Sortera kolumner

    Anteckning om informationDet här alternativet är endast tillgängligt när Endast lägg till har valts i Laddningsinställningar.

    Valfritt kan du ange de kolumner efter vilka data ska sorteras i varje fil i din Iceberg-tabell. Under datainmatning använder Iceberg dessa kolumner för att ordna poster. Att definiera sorteringsnycklar på kolumner som ofta används i frågor förbättrar datalokaliteten, vilket resulterar i snabbare läsprestanda och effektivare komprimering. Korrekt konfigurerade sorteringsnycklar säkerställer att dina data är optimalt organiserade för frågeprestanda.

    Klicka på Lägg till kolumn för att lägga till en sorteringskolumn och ställ sedan in sorteringsordningen.

  • Varaktighet för utgång av ögonblicksbild

    Den här inställningen styr hur länge ögonblicksbilder behålls, vilket avsevärt påverkar tabellstorlek och lagringskostnader. För tabeller som uppdateras ofta rekommenderas en kortare varaktighet för att hjälpa till att minska lagringskostnaderna.

    Anteckning om informationAnge 0 för att inaktivera utgång av ögonblicksbild.
  • Standardvy-rubriker

    • Ärv från datauppgiftsinställningar

      Detta är standard. Inaktivera om du vill ställa in specifika rubrikkolumner endast för detta dataset.

    • hdr__from_timestamp

      När det här alternativet är aktiverat kommer rubrikkolumnen hdr__from_timestamp att visas i standardvyer. Dessutom, när Partitionera efter händelseinläsningsdatum väljs i introduktionsguiden, kommer hdr__from_timestamp att användas som standardpartitionskolumn.

      Anteckning om informationHistorikvyer inkluderar alltid alla rubrikkolumner för standardvyer, oavsett denna inställning.

Var den här sidan till hjälp för dig?

Om du stöter på några problem med den här sidan eller innehållet på den, t.ex. ett stavfel, ett saknat steg eller ett tekniskt fel – meddela oss!