Skapa och hantera datamarter

När du har registrerat dina data kan du skapa datamarter med data från lagrings- eller omvandlingsuppgifterna. Du kan skapa valfritt antal datamarter beroende på dina affärsbehov. Helst ska dina datamarter innehålla databaser med sammanfattade data som samlats in för analys av ett särskilt delavsnitt eller enhet i en organisation, till exempel försäljningsavdelningen.

Skapande av datamarter är tillgängligt med en Qlik Talend Cloud Premium- eller Qlik Talend Cloud Enterprise-prenumeration.

Proceduren för att skapa en datamart är identisk, oavsett om din datamart är baserad på en lagringsuppgift eller en omvandlingsuppgift. Instruktionerna i det här delavsnittet utgår från att datamarten baseras på en lagringsuppgift.

Datauppgifterna styrs av ägaren till det projekt de tillhör. Mer information om nödvändiga roller och behörigheter finns i Roller och behörigheter i datautrymmen.

Förutom att lagra tabeller i datalagret kan du också lagra tabeller som Iceberg-tabeller som hanteras av dataplattformen. Detta alternativ är för närvarande endast tillgängligt för Snowflake-projekt. Detta är möjligt genom att välja Snowflake-hanterade Iceberg-tabeller under Tabelltyp i uppgiftsinställningarna.

Förutsättningar

Innan du kan skapa en datamart behöver du göra följande:

Fyll lagret med data (från mellanlagringen) som du vill använda i din datamart. Mer information finns i Introduktion av data.
Skapa en relationstabell för datauppsättningarna så att relationen mellan källdatauppsättningarna kan definieras. Mer information finns i Skapa en datamodell.

Anteckning om varningAlla källdataposter måste ha nycklar.

Skapa en datamart

För att skapa en datamart:

Öppna ditt projekt.
Gör något av följande:
- Klicka på Skapa längst upp till höger och välj Skapa datamart
- I lagringsdatauppgiften klickar du på längst ner till höger och väljer sedan Skapa datamart.
Skapa datamart-dialogen öppnas.
Fyll i ett namn på din datamart och, eventuellt, en beskrivning.
Om du vill konfigurera datamarten senare avmarkerar du kryssrutan Öppna och klickar sedan på Skapa. I annat fall klickar du bara på Skapa.

Datamarten öppnas på fliken Datamart.
Välj dina källdata enligt beskrivningen i Välja dina källdata
Om du vill att datamarten ska innehålla dimensioner lägger du till dimensioner enligt beskrivningen i Lägga till dimensioner och ett fakta i datamarten
Om du vill att datamarten ska innehålla ett fakta lägger du till fakta enligt beskrivningen i Lägga till ett fakta
Om datamart innehåller både dimensioner och ett fakta lägger du till dimensioner i ditt star-schema enligt beskrivningen i Bygga ett star-schema
Skapa dataposter i din datamart och fyll dem med data enligt beskrivningen i Fylla din datamart

Välja dina källdata

Du väljer dina källdata från datauppsättningarna i en Lagringsuppgift eller en Transfomera data-uppgift.

För att göra detta:

Klicka på knappen Välj källdata mitt i fliken eller klicka på knappen Välj källdata i verktygsfältet.

Dialogen Välj källdata öppnas.
I listrutan Projekt väljer du vilket projekt du vill hämta datakällor från.

Du kan lägga till datauppsättningar från det aktuella projektet eller från ett annat projekt. Så här lägger du till datauppsättningar från ett annat projekt:
- Du måste ha minst rollen Kan använda i utrymmet för det använda projektet.
- Båda projekten måste finnas på samma dataplattform.
Mer information om projektövergripande pipelines finns på Bygga projektövergripande pipelines.
Från listrutan Datauppgifter väljer du en lagringsuppgift, eller en transformeringsuppgift om du skapade transformeringar.
Lämna antingen standard-% för att söka efter alla datauppsättningar eller ange namnet på en specifik datauppsättning som du vill leta upp. Klicka sedan på Sök.
Välj de önskade datauppsättningarna och klicka sedan på Lägg till valda tabeller.
Klicka på OK för att stänga dialogen och fortsätt till Lägg till ett fakta och/eller Lägg till dimensioner.

Du kan upprepa processen för att lägga till datauppsättningar från andra datauppgifter.

Lägga till dimensioner och ett fakta i datamarten

När du har valt dina källdata kan du fortsätta att bygga din datamart. En datamart kan ha en faktadatauppsättning, dimensionsdatauppsättningar eller en kombination av båda (där dimensionsdatauppsättningarna är logiskt relaterade till faktadatauppsättningen).

Lägga till dimensioner

Gör så här för att lägga till en dimension.

Klicka på knappen Lägg till dimension.

Dialogen Lägg till dimension öppnas.
Följande inställningar finns tillgängliga:
- Mest detaljerad datauppsättning Välj en datauppsättning.
- Namn: Ange ett visningsnamn för dimensionen. Som standard väljs det mest detaljerade datauppsättningsnamnet.
- Beskrivning: Du kan även lägga till en beskrivning.
- Historiktyp: Välj ett av följande:
  - Typ 1: Den befintliga posten i dimensionen kommer att uppdateras när motsvarande post i Lagringsplatsen uppdateras.
  - Typ 2: En ny post kommer att läggas till i dimensionen när motsvarande post i Lagringsplatsen uppdateras.
- Relaterad datauppsättning att denormalisera: Alla datauppsättningar som kan denormaliseras i dimensionsdatauppsättningen (enligt relationerna i källdatatillgångsmodellen) kan väljas här.
  
  Exempel på en dimension som kan denormaliseras
Klicka på OK för att spara dina inställningar.

Dimensionen kommer att läggas till i listan Dimensioner till vänster.

Se även Rollspelsdimension .

Visa information om en dimension

När du väljer en dimension visas fliken Källrelationsmodell i mittrutan. På den här fliken visas källdatauppsättningar som har konsoliderats i dimensionen. Datauppsättningar som du väljer att denormalisera när du lade till dimensionen visas som valda (och gråtonade).

Exempel på en relationsmodell med relaterade dimensioner — Dimensionen Produkter denormaliserad med datauppsättningen Kategorier och Leverantörer

Lägga till ett fakta

Gör så här för att lägga till ett fakta:

Klicka på knappen Lägg till en fakta.

Dialogen Lägg till fakta öppnas.
Följande inställningar finns tillgängliga:
- Fakta: Välj en datauppsättning som fakta. Datauppsättningen ska definiera detaljnivån för det fakta som du skapar.
- Namn: Ange ett visningsnamn för fakta. Som standard väljs faktanamnet.
- Beskrivning: Du kan även lägga till en beskrivning.
- Relaterade datauppsättningar att denormalisera: Alla datauppsättningar som kan denormaliseras i din faktadatauppsättning kommer att kunna väljas här.
- Avancerat
  - Använd aktuella data: När den är vald (standardvärdet), kommer faktumet inte att innehålla kolumnen för transaktionsdata.
  - Välj transaktionsdatum: För att lokalisera data i enlighet med ett visst transaktionsdatum, väljer du det här alternativet och sedan en datumkolumn. Det här är användbart om ditt star-schema innehåller dimensionsvärden av typ 2 och du behöver hitta korrekt data för en viss transaktion. Om en kund exempelvis har flera adresser, kan det vara möjligt att hitta den korrekta adressen i enlighet med beställningsdatumet.
    
    Exempel på användning:
    
    En återförsäljare behöver skapa en datamart för att analysera förhållandet mellan beställningar och kunder. Datamarten ska kunna svara på frågor som: vilken delstat i USA hade den högsta ordersumman i Q4 2022?
    
    Om återförsäljaren väljer alternativet Använd aktuella data kommer endast den senaste versionen av posten i tabellen Kunder att ingå i beräkningen.
    
    Om transaktionsdatumet ignoreras kommer det att resultera i felaktiga uppgifter, vilket illustreras nedan:
    
    Om återförsäljaren väljer alternativet Välj transaktionsdatum kommer kundens beställningar dock att associeras med rätt registerversion i tabellen Kunder.
    
    Detta gör det möjligt för återförsäljaren att exakt beräkna den totala summan av beställningar per stat under fjärde kvartalet 2022.
    
    Anteckning om tipsObservera att transaktionsdatumet kan användas på olika sätt i varje datamart, beroende på verksamhetens behov. I en datamart kan det till exempel användas för att analysera beställningsdatum, medan det i en annan datamart kan användas för att analysera leveransdatum.
Klicka på OK för att spara dina inställningar.

Fakta kommer att läggas till i listan Fakta till vänster.

Visar information om fakta

När du väljer ett fakta visas följande flikar i mittrutan:

Star-schemamodell (standard): Visar en grafisk presentation av datauppsättningens relationer i datamarten.
Faktamodell: Visar alla datauppsättningar som är relaterade till faktadatauppsättningen. Datauppsättningar som du väljer att denormalisera när du lade till fakta visas som valda (och gråtonade).

Fakta om Orderuppgifter med en denormaliserad Order-datauppsättning
Transaktionsdatum: Namnet på transaktionskolumnen om du valde alternativet Välj transaktionsdatum när du lade till faktan.

Hantering av okända och sent anlända dimensioner

Varje dimension innehåller rader med -1 och 0, som är dimensionens affärsnyckel (objekt-ID). Rad -1 är reserverad för sent anlända dimensioner, medan 0 är reserverad för okända dimensioner.

Okända dimensioner

"Okänd" är data som inte var tillgängliga när dimensionen ursprungligen skapades. Låt oss till exempel säga att du har ett ORDER-faktum med en SHIPPER-kolumn som är affärsnyckeln för dimensionen SHIPPER. Om ORDER-faktaraden inte har skickats ännu – och därmed har NULL för kolumnen SHIPPER – kommer den att relateras till 0-posten (som betecknar en Okänd för dimensionen). När ORDER fact senare uppdateras med ett SHIPPER-värde (t.ex. USPS), kommer den relaterade dimensionens ID(0) i sin tur att uppdateras.

"Okänd" kan också vara saknade eller icke existerande data, som kanske aldrig kommer att läggas till.

Dimensioner som kommer sent

En dimension som kommer sent har en nyckel som finns i de nya faktauppgifterna, men som ännu inte finns i dimensionen. Om till exempel SHIPPER i ORDER-faktumet har värdet "NEWSHIP" för en ny avsändare och den affärsnyckeln ännu inte finns i dimensionen DIM_SHIPPER, kommer datamart-bearbetningen att relatera det faktumet till raden -1. Detta innebär att det saknas en dimensionsmedlem i din dimensionstabell. När affärsnyckeln "NEWSHIP" anländer för dimensionen DIM_SHIPPER skapas dess dimensionsrad och faktaposten uppdateras för justering till den dimension som tidigare saknades.

Bygga ett star-schema

När du har lagt till dimensioner i din datamart kan du fortsätta att koppla dem till din faktadatauppsättning och på så sätt skapa ett star-schema.

För att göra detta:

Välj ditt fakta i listan Fakta till vänster.
Välj vilka dimensioner du vill lägga till från listan Rekommenderade dimensioner till vänster.

Rekommenderade dimensioner visas kopplade till faktadatauppsättningen med en prickad linje.

På bilden nedan har vissa dimensioner lagts till tidigare och är därför kopplade till en grå heldragen linje.
Klick på Använd för att lägga till dimensionerna.

Dimensionerna visas kopplade till faktadatauppsättningen med en heldragen grå linje.
Stäng panelen Rekommenderade dimensioner genom att klicka på .

Fylla din datamart

När du har utformat din datamart kan du gå vidare och fylla den.

För att göra detta:

Klicka på knappen Förbered i verktygsfältet uppe till höger.

I förberedelseprocessen ingår att skapa datauppsättningar och vyer i datamarten och att uppdatera katalogen.

Du kan följa förloppet under Förlopp för förberedelse på skärmens nedre del.

När förberedelserna är klara ändras knappen Förbered till Kör.
Om du vill kan du i stället validera datamarten enligt beskrivningen i Validera och synkronisera din datamart nedan.
Klicka på knappen Kör.

Fönstret växlar till vyn Övervakning, som visar laddningsprocessen och statusen för datauppsättningarna i din datamart.

Alla källposter bearbetas av datamarten, även borttagna poster. Detta görs för att säkerställa att historisk information behålls.

För dimensionsdatauppsättningar med typ 2-historik kommer alla versionsrader för en post att ingå i det visade antalet bearbetade poster och därmed visas ett högre värde än det verkliga antalet bearbetade poster.

Validera och synkronisera din datamart

Validering av datamarten säkerställer att metadata för datamarten är identiska med motsvarande metadata i Storage (eller Transform, om detta är definierat). Vid validering av datamarten jämförs också skapade metadata med den aktuella star-schemadesignen. Om du till exempel kör valideringen efter att du har lagt till en dimension i en redan skapad datamart misslyckas valideringen.

Så här validerar du datamarten:

Välj antingen Validera datauppsättningar på -menyn till höger om knappen Kör eller klicka på knappen Validera datauppsättningar längst ned till höger i fönstret.

Ett meddelande om att valideringen är slutförd visas.
Om metadata inte är synkroniserade eller om det finns star-schemadesignkonflikter öppnas rutan Validera och justera längst ned i fönstret automatiskt med valideringsrapporten.

Exempel på en datamart med en star-schemadesignkonflikt:

Exempel på en datamart med valideringsfel:
Om du vill lösa eventuella problem med väntande designändringar klickar du på knappen längst upp till höger och väljer Förbered. Om värdet för kolumnen Kan ändras utan dataförlust är Ja utförs en ALTER-åtgärd. I annat fall återskapas datamartens tabeller.

Observera att alla valideringsfel måste åtgärdas manuellt.

Hantera datamarter

I det här avsnittet beskrivs de olika alternativen för att hantera dina datauppsättningar och datamarter.

Förfina fakta eller dimensioner

I fliken Datauppsättningar kan du utföra olika operationer för att förfina dina fakta och dimensioner, till exempel skapa omvandlingsregler (till exempel ersätta kolumnvärden) och lägga till uttryck på kolumnnivån. Fliken Datauppsättningar finns till höger om fliken Datamart:

Datauppsättningsflik för hantering av fakta- och dimensionsdatauppsättningar. — Fliken datauppsättningar

Lägga till regler

Se Skapa regler för att omvandla datauppsättningar för en förklaring av hur globala regler läggs till

Se Hantera datauppsättningar för mer information om regler och andra operationer du kan utföra på dina datauppsättningar. Observera att vissa av alternativen, till exempel att filtrera och byta namn på datauppsättningar inte är tillgängliga för datauppgifter för datamarter.

Lägga till kolumner

Du kan lägga till nya kolumner i måldatauppsättningen.

Lägg till en ny kolumn från början

Klicka på + Lägg till.

Ange ett namn för kolumnen och ange ett uttryck för att definiera kolumnens data.

Mer information finns i Lägga till kolumner i en datauppsättning.
Lägg till en kolumn från källan

Klicka på bredvid Lägg till och välj Lägg till kolumn från källa.

Välj en kolumn från källdatauppsättningen.

Flytta om kolumner

Du kan ändra ordningplacering för en kolumn.

Välj en kolumn
Klicka på och sedan Flytta om.
Använd pilarna för att flytta kolumnen uppåt eller nedåt.
Stäng Ändra ordningstal när du är klar.

Rollspelsdimension

En rollspelsdimension är samma dimension som används flera gånger inom samma star-schema, men med olika betydelser. Detta är vanligt med dimensionerna Date och Customer. Ditt star-schema kan till exempel ha två Date-enheter, en som representerar orderdatumet och en som representerar mottagningsdatumet.

Så här lägger du till eller redigerar en dimensions rollnamn:

Klicka på -ikonen i dimensionsnoden och välj Redigera roll.
I dialogrutan Redigera roll anger du ett namn (eller redigerar det befintliga namnet) i fältet Rollnamn i star-schema och klickar på OK.

Rollnamnet visas under dimensionsnamnet.

Ytterligare alternativ för hantering

I följande tabell beskrivs ytterligare alternativ för hantering:

Till	Gör det här
Lägg till ytterligare källdatauppsättningar	Se Välja dina källdata.
Lägg till ytterligare fakta	Se Lägga till ett fakta
Lägga till ytterligare dimensioner	Se Lägga till dimensioner och ett fakta i datamarten.
Ta bort en dimension	Välj dimensionen i rutan Dimensioner och välj sedan Ta bort från -menyn.
Ta bort ett fakta	Välj fakta i rutan Fakta och välj sedan Ta bort från -menyn.
Återskapa en datamart	Klicka på -knappen längst upp till höger och välj Återskapa tabeller. Det kan vara nödvändigt att återskapa en datamart om det exempelvis finns flera ändringar i lagringsplatsen som inte kan synkas automatiskt med datamarten. Anteckning om informationOm det uppstår problem med enskilda tabeller rekommenderas du att först försöka läsa in tabellerna igen istället för att återskapa dem. Om du återskapar tabeller kan detta leda till att historiska data förloras. Om det sker stora förändringar måste du också förbereda datauppgifter nedströms som använder de återskapade datauppgifterna för att ladda data på nytt.
Stoppa en datamartuppgift som körs.	Klicka på knappen Stoppa i verktygsfältet uppe till höger.
Förbered en datamart-uppgift	Klicka på knappen längst upp till höger och välj Förbered för att synkronisera datauppsättningarna med Transform- eller Storage-tillgångarna och lösa eventuella designkonflikter. Detta förbereder en uppgift för utförande. Detta inkluderar följande: Validering av att designen är giltig. Skapande eller ändring av de fysiska tabellerna och vyerna så att de stämmer överens med designen. Generering av SQL-koden för datauppgiften. Skapande eller ändring av katalogposterna för uppgiftens utgående datauppsättningar. Du kan följa förloppet under Förlopp för förberedelse på skärmens nedre del.

Schemalägga en datamartuppgift

Du kan schemalägga en datamartuppgift så att den uppdateras regelbundet. Du kan ställa in ett tidsbaserat schema, eller ställa in uppgiften att köras när indatauppgifter har slutförts.

Klicka på ... på en datauppgift och välj Schemaläggning för att skapa ett schema. Standardinställningen för schemaläggning ärvs från inställningarna i projektet. Mer information om standardinställningar finns i Standardvärden för datamart.

Du måste sätta Schemaläggning till På för att aktivera schemat.

Tidsbaserade scheman

Du kan använda ett tidsbaserat schema för att köra uppgiften oavsett när de olika indatakällorna uppdateras.

Välj Vid en specifik tidpunkt i Kör datauppgift.

Du kan skapa ett schema med intervall på dagar, veckor eller månader.

Händelsebaserade scheman

Du kan använda ett händelsebaserat schema som körs när indatauppgifterna har slutförts.

Välj Vid ett specifikt event i Kör datauppgift.

Du kan välja om du vill köra uppgiften när någon av indatauppgifterna har slutförts, eller när någon uppgift i ett urval av indatauppgifter har slutförts.

Uppgiften körs inte om någon indatauppgift eller uppgift nedströms körs när schemat utlöses. Uppgiften hoppas över tills nästa schemalagda körning.

Ladda data

Du kan utföra en manuell ominläsning av data. Detta är användbart när det finns problem med en eller flera tabeller.

Öppna datauppgiften och välj fliken Övervaka.
Välj tabellerna du vill ladda.

När en dimension väljs för laddning kommer alla fakta som använder denna dimension också att laddas för att integriteten ska bevaras.
Klicka på Ladda tabeller.

Du kan avbryta laddningen för tabeller som väntar på laddning genom att klicka på Avbryt laddning. Detta kommer inte att påverka tabeller som redan har laddats och laddningar som körs för tillfället kommer att slutföras.

Laddningen utförs genom att:

Trunkera de valda dimensionerna och fakta.
Ladda de valda dimensionstabellerna från datauppgiften uppströms.
Ladda faktatabellerna från datauppgiften uppströms. Detta inkluderar följande:
- Uttryckligen valda faktatabeller
- Faktatabeller med anknytning till en dimension som laddas.

Om du laddar dimensionen x och relaterat faktum a och därefter dessutom skapar ett nytt faktum b med hjälp av dimensionen x kommer faktum b inte att laddas automatiskt. Du måste ladda det nya faktumet b manuellt.

Datamartinställningar

Klicka på knappen Inställningar i verktygsfältet för att öppna dialogen Inställningar: <data-mart-name>.

Om uppgiften redan har körts måste du återskapa datauppsättningarna om du ändrar en annan inställning än Runtime-inställningar.

Allmänna inställningar

Följande inställningar är tillgängliga i fliken Allmänt:

Databas: Den databas där dartamarten skapas
Datauppgiftsschema: Det schema som datauppsättningarna skapas i
Internt schema: Det schema som de interna datauppsättningarna skapas i
Standardversalisering av schemanamn

Du kan ange standardversalisering för alla schemanamn. Om din databas är konfigurerad för att tvinga fram versalisering kommer detta alternativ inte att ha någon effekt.
Prefix för alla tabeller och vyer
Du kan ange prefix för alla tabeller och vyer som skapas av uppgiften.

Anteckning om informationDu måste använda ett unikt prefix om du vill använda ett databasschema i flera datauppgifter.

Inställningar för körtid

Följande inställningar är tillgängliga i fliken Körning:

Parallell körning: Ange det maximala antalet databasanslutningar som Qlik Cloud får öppna för den här uppgiften. Standardantalet är 10.
Lager: gäller bara för Snowflake. Namnet på datalagret Snowflake.

Kataloginställningar

Publicera i katalogen

Välj det här alternativet för att publicera den här versionen av data till Katalogen som en datauppsättning. Kataloginnehållet kommer att uppdateras nästa gång du förbereder den här uppgiften.

Mer information om Katalog finns i Förstå data med hjälp av katalogverktyg.

Tabelltypsinställningar

Dessa inställningar är endast tillgängliga i projekt med Snowflake som dataplattform.

Tabelltyp

Du kan välja vilken typ av tabell som ska användas:
- Snowflake-tabeller
- Iceberg-tabeller som hanteras av Snowflake
  
  Du måste ange standardnamnet på den externa volymen i Snowflake external volume.
Mapp att använda i molnet

Välj vilken mapp som ska användas när data mellanlagras i mellanlagringsområdet.
- Standardmapp
  
  Detta skapar en mapp med standardnamnet: <projektnamn>/<datauppgiftens namn>.
- Rotmapp
  
  Lagra data i lagringens rotmapp.
- Mapp
  
  Ange namnet på mappen som ska användas.
Synka med Snowflake Open Catalog

Aktivera detta för att låta Snowflake Open Catalog hantera filerna i fillagringen i molnet.

Mer information

Datamartvyns struktur

Var den här sidan till hjälp för dig?

Om du hittar några fel på denna sida eller i innehållet – ett stavfel, ett steg som saknas eller ett tekniskt fel – berätta för oss så att vi kan blir bättre!

Lämna din feedback här