Skapa och hantera datamarter
När du har registrerat dina data kan du skapa datamarter med data från lagrings- eller omvandlingsuppgifterna. Du kan skapa valfritt antal datamarter beroende på dina affärsbehov. Helst ska dina datamarter innehålla databaser med sammanfattade data som samlats in för analys av ett särskilt delavsnitt eller enhet i en organisation, till exempel försäljningsavdelningen.
Proceduren för att skapa en datamart är identisk, oavsett om din datamart är baserad på en lagringsuppgift eller en omvandlingsuppgift. Instruktionerna i det här delavsnittet utgår från att datamarten baseras på en lagringsuppgift.
Förutsättningar
Innan du kan skapa en datamart behöver du göra följande:
- Fyll lagret med data (från mellanlagringen) som du vill använda i din datamart. Mer information finns i Introduktion av data.
-
Skapa en relationstabell för datauppsättningarna så att relationen mellan källdatauppsättningarna kan definieras. Mer information finns i Skapa en datamodell.
Anteckning om varningAlla källdataposter måste ha nycklar.
Skapa en datamart
För att skapa en datamart:
-
Öppna ditt projekt.
-
Gör något av följande:
- Klicka på Skapa längst upp till höger och välj Skapa datamart
-
I lagringsdatauppgiften klickar du på längst ner till höger och väljer sedan Skapa datamart.
Skapa datamart-dialogen öppnas.
-
Fyll i ett namn på din datamart och, eventuellt, en beskrivning.
-
Om du vill konfigurera datamarten senare avmarkerar du kryssrutan Öppna och klickar sedan på Skapa. I annat fall klickar du bara på Skapa.
Datamarten öppnas på fliken Datamart.
- Välj dina källdata enligt beskrivningen i Välja dina källdata
- Om du vill att datamarten ska innehålla dimensioner lägger du till dimensioner enligt beskrivningen i Lägga till dimensioner och ett fakta i datamarten
- Om du vill att datamarten ska innehålla ett fakta lägger du till fakta enligt beskrivningen i Lägga till ett fakta
- Om datamart innehåller både dimensioner och ett fakta lägger du till dimensioner i ditt star-schema enligt beskrivningen i Bygga ett star-schema
- Skapa dataposter i din datamart och fyll dem med data enligt beskrivningen i Fylla din datamart
Välja dina källdata
Du väljer dina källdata från datauppsättningarna i lagringsdatauppgiften.
För att göra detta:
-
Klicka på knappen Välj källdata mitt i fliken eller klicka på knappen Välj källdata i verktygsfältet.
Dialogen Välj källdata öppnas.
-
Från rullgardinsmenyn Datatillgångar väljer du en lagringsuppgift, eller en omvandlingsuppgift om du skapade omvandlingar.
-
Lämna antingen standard-% för att söka efter alla datauppsättningar eller ange namnet på en specifik datauppsättning som du vill leta upp. Klicka sedan på Sök.
-
Välj de önskade datauppsättningarna och klicka sedan på Lägg till valda tabeller.
-
Klicka på OK för att stänga dialogen och fortsätt till Lägg till ett fakta och/eller Lägg till dimensioner.
Lägga till dimensioner och ett fakta i datamarten
När du har valt dina källdata kan du fortsätta att bygga din datamart. En datamart kan ha en faktadatauppsättning, dimensionsdatauppsättningar eller en kombination av båda (där dimensionsdatauppsättningarna är logiskt relaterade till faktadatauppsättningen).
Lägga till dimensioner
Gör så här för att lägga till en dimension.
-
Klicka på knappen Lägg till dimension.
Dialogen Lägg till dimension öppnas.
-
Följande inställningar finns tillgängliga:
- Mest detaljerad datauppsättning Välj en datauppsättning.
- Namn: Ange ett visningsnamn för dimensionen. Som standard väljs det mest detaljerade datauppsättningsnamnet.
- Beskrivning: Du kan även lägga till en beskrivning.
- Historiktyp: Välj ett av följande:
- Typ 1: Den befintliga posten i dimensionen kommer att uppdateras när motsvarande post i Lagringsplatsen uppdateras.
- Typ 2: En ny post kommer att läggas till i dimensionen när motsvarande post i Lagringsplatsen uppdateras.
-
Relaterad datauppsättning att denormalisera: Alla datauppsättningar som kan denormaliseras i dimensionsdatauppsättningen (enligt relationerna i källdatatillgångsmodellen) kan väljas här.
-
Klicka på OK för att spara dina inställningar.
Dimensionen kommer att läggas till i listan Dimensioner till vänster.
Se även Rollspelsdimension .
Visa information om en dimension
När du väljer en dimension visas fliken Källrelationsmodell i mittrutan. På den här fliken visas källdatauppsättningar som har konsoliderats i dimensionen. Datauppsättningar som du väljer att denormalisera när du lade till dimensionen visas som valda (och gråtonade).
Lägga till ett fakta
Gör så här för att lägga till ett fakta:
-
Klicka på knappen Lägg till en fakta.
Dialogen Lägg till fakta öppnas.
-
Följande inställningar finns tillgängliga:
- Fakta: Välj en datauppsättning som fakta. Datauppsättningen ska definiera detaljnivån för det fakta som du skapar.
- Namn: Ange ett visningsnamn för fakta. Som standard väljs faktanamnet.
- Beskrivning: Du kan även lägga till en beskrivning.
- Relaterade datauppsättningar att denormalisera: Alla datauppsättningar som kan denormaliseras i din faktadatauppsättning kommer att kunna väljas här.
- Avancerat
- Använd aktuella data: När den är vald (standardvärdet), kommer faktumet inte att innehålla kolumnen för transaktionsdata.
-
Välj transaktionsdatum: För att lokalisera data i enlighet med ett visst transaktionsdatum, väljer du det här alternativet och sedan en datumkolumn. Det här är användbart om ditt star-schema innehåller dimensionsvärden av typ 2 och du behöver hitta korrekt data för en viss transaktion. Om en kund exempelvis har flera adresser, kan det vara möjligt att hitta den korrekta adressen i enlighet med beställningsdatumet.
Exempel på användning:
En återförsäljare behöver skapa en datamart för att analysera förhållandet mellan beställningar och kunder. Datamarten ska kunna svara på frågor som: vilken delstat i USA hade den högsta ordersumman i Q4 2022?
Om återförsäljaren väljer alternativet Använd aktuella data kommer endast den senaste versionen av posten i tabellen Kunder att ingå i beräkningen.
Om transaktionsdatumet ignoreras kommer det att resultera i felaktiga uppgifter, vilket illustreras nedan:
Om återförsäljaren väljer alternativet Välj transaktionsdatum kommer kundens beställningar dock att associeras med rätt registerversion i tabellen Kunder.
Detta gör det möjligt för återförsäljaren att exakt beräkna den totala summan av beställningar per stat under fjärde kvartalet 2022.
Anteckning om tipsObservera att transaktionsdatumet kan användas på olika sätt i varje datamart, beroende på verksamhetens behov. I en datamart kan det till exempel användas för att analysera beställningsdatum, medan det i en annan datamart kan användas för att analysera leveransdatum.
-
Klicka på OK för att spara dina inställningar.
Fakta kommer att läggas till i listan Fakta till vänster.
Visar information om fakta
När du väljer ett fakta visas följande flikar i mittrutan:
- Star-schemamodell (standard): Visar en grafisk presentation av datauppsättningens relationer i datamarten.
-
Faktamodell: Visar alla datauppsättningar som är relaterade till faktadatauppsättningen. Datauppsättningar som du väljer att denormalisera när du lade till fakta visas som valda (och gråtonade).
- Transaktionsdatum: Namnet på transaktionskolumnen om du valde alternativet Välj transaktionsdatum när du lade till faktan.
Hantering av okända och sent anlända dimensioner
Varje dimension innehåller rader med -1 och 0, som är dimensionens affärsnyckel (objekt-ID). Rad -1 är reserverad för sent anlända dimensioner, medan 0 är reserverad för okända dimensioner.
Okända dimensioner
"Okänd" är data som inte var tillgängliga när dimensionen ursprungligen skapades. Låt oss till exempel säga att du har ett ORDER-faktum med en SHIPPER-kolumn som är affärsnyckeln för dimensionen SHIPPER. Om ORDER-faktaraden inte har skickats ännu – och därmed har NULL för kolumnen SHIPPER – kommer den att relateras till 0-posten (som betecknar en Okänd för dimensionen). När ORDER fact senare uppdateras med ett SHIPPER-värde (t.ex. USPS), kommer den relaterade dimensionens ID(0) i sin tur att uppdateras.
Dimensioner som kommer sent
En dimension som kommer sent har en nyckel som finns i de nya faktauppgifterna, men som ännu inte finns i dimensionen. Om till exempel SHIPPER i ORDER-faktumet har värdet "NEWSHIP" för en ny avsändare och den affärsnyckeln ännu inte finns i dimensionen DIM_SHIPPER, kommer datamart-bearbetningen att relatera det faktumet till raden -1. Detta innebär att det saknas en dimensionsmedlem i din dimensionstabell. När affärsnyckeln "NEWSHIP" anländer för dimensionen DIM_SHIPPER skapas dess dimensionsrad och faktaposten uppdateras för justering till den dimension som tidigare saknades.
Bygga ett star-schema
När du har lagt till dimensioner i din datamart kan du fortsätta att koppla dem till din faktadatauppsättning och på så sätt skapa ett star-schema.
För att göra detta:
- Välj ditt fakta i listan Fakta till vänster.
-
Välj vilka dimensioner du vill lägga till från listan Rekommenderade dimensioner till vänster.
Rekommenderade dimensioner visas kopplade till faktadatauppsättningen med en prickad linje.
På bilden nedan har vissa dimensioner lagts till tidigare och är därför kopplade till en grå heldragen linje.
-
Klick på Använd för att lägga till dimensionerna.
Dimensionerna visas kopplade till faktadatauppsättningen med en heldragen grå linje.
-
Stäng panelen Rekommenderade dimensioner genom att klicka på .
Fylla din datamart
När du har utformat din datamart kan du gå vidare och fylla den.
För att göra detta:
-
Klicka på knappen Förbered i verktygsfältet uppe till höger.
I förberedelseprocessen ingår att skapa datauppsättningar och vyer i datamarten och att uppdatera katalogen.
Du kan följa förloppet under Förlopp för förberedelse på skärmens nedre del.
När förberedelserna är klara ändras knappen Förbered till Kör.
-
Om du vill kan du i stället validera datamarten enligt beskrivningen i Validera och synkronisera din datamart nedan.
-
Klicka på knappen Kör.
Fönstret växlar till vyn Övervakning, som visar laddningsprocessen och statusen för datauppsättningarna i din datamart.
Alla källposter bearbetas av datamarten, även borttagna poster. Detta görs för att säkerställa att historisk information behålls.
Validera och synkronisera din datamart
Validering av datamarten säkerställer att metadata för datamarten är identiska med motsvarande metadata i Storage (eller Transform, om detta är definierat). Vid validering av datamarten jämförs också skapade metadata med den aktuella star-schemadesignen. Om du till exempel kör valideringen efter att du har lagt till en dimension i en redan skapad datamart misslyckas valideringen.
Så här validerar du datamarten:
-
Välj antingen Validera datauppsättningar på -menyn till höger om knappen Kör eller klicka på knappen Validera datauppsättningar längst ned till höger i fönstret.
Ett meddelande om att valideringen är slutförd visas.
-
Om metadata inte är synkroniserade eller om det finns star-schemadesignkonflikter öppnas rutan Validera och justera längst ned i fönstret automatiskt med valideringsrapporten.
Exempel på en datamart med en star-schemadesignkonflikt: Exempel på en datamart med valideringsfel:
-
Om du vill lösa eventuella problem med väntande designändringar klickar du på knappen längst upp till höger och väljer Förbered. Om värdet för kolumnen Kan ändras utan dataförlust är Ja utförs en ALTER-åtgärd. I annat fall återskapas datamartens tabeller.
Observera att alla valideringsfel måste åtgärdas manuellt.
Hantera datamarter
I det här avsnittet beskrivs de olika alternativen för att hantera dina datauppsättningar och datamarter.
Förfina fakta eller dimensioner
I fliken Datauppsättningar kan du utföra olika operationer för att förfina dina fakta och dimensioner, till exempel skapa omvandlingsregler (till exempel ersätta kolumnvärden) och lägga till uttryck på kolumnnivån. Fliken Datauppsättningar finns till höger om fliken Datamart:
Lägga till regler
Se Skapa regler för att omvandla datauppsättningar för en förklaring av hur globala regler läggs till
Lägga till kolumner
Du kan lägga till nya kolumner i måldatauppsättningen.
-
Lägg till en ny kolumn från början
Klicka på + Lägg till.
Ange ett namn för kolumnen och ange ett uttryck för att definiera kolumnens data.
Mer information finns i Lägga till kolumner i en datauppsättning.
-
Lägg till en kolumn från källan
Klicka på bredvid Lägg till och välj Lägg till kolumn från källa.
Välj en kolumn från källdatauppsättningen.
Flytta om kolumner
Du kan ändra ordningplacering för en kolumn.
-
Välj en kolumn
-
Klicka på och sedan Flytta om.
-
Använd pilarna för att flytta kolumnen uppåt eller nedåt.
-
Stäng Ändra ordningstal när du är klar.
Rollspelsdimension
En rollspelsdimension är samma dimension som används flera gånger inom samma star-schema, men med olika betydelser. Detta är vanligt med dimensionerna Date och Customer. Ditt star-schema kan till exempel ha två Date-enheter, en som representerar orderdatumet och en som representerar mottagningsdatumet.
Så här lägger du till eller redigerar en dimensions rollnamn:
- Klicka på -ikonen i dimensionsnoden och välj Redigera roll.
I dialogrutan Redigera roll anger du ett namn (eller redigerar det befintliga namnet) i fältet Rollnamn i star-schema och klickar på OK.
Rollnamnet visas under dimensionsnamnet.
Ytterligare alternativ för hantering
I följande tabell beskrivs ytterligare alternativ för hantering:
Till | Gör det här |
---|---|
Lägg till ytterligare källdatauppsättningar | Se Välja dina källdata. |
Lägg till ytterligare fakta | Se Lägga till ett fakta |
Lägga till ytterligare dimensioner | Se Lägga till dimensioner och ett fakta i datamarten. |
Ta bort en dimension | Välj dimensionen i rutan Dimensioner och välj sedan Ta bort från -menyn. |
Ta bort ett fakta | Välj fakta i rutan Fakta och välj sedan Ta bort från -menyn. |
Återskapa en datamart | Klicka på -knappen längst upp till höger och välj Återskapa tabeller. Det kan vara nödvändigt att återskapa en datamart om det exempelvis finns flera ändringar i lagringsplatsen som inte kan synkas automatiskt med datamarten. |
Stoppa en datamartuppgift som körs. | Klicka på knappen Stoppa i verktygsfältet uppe till höger. |
Förbered en datamart-uppgift | Klicka på knappen längst upp till höger och välj Förbered för att synkronisera datauppsättningarna med Transform- eller Storage-tillgångarna och lösa eventuella designkonflikter. Detta förbereder en uppgift för utförande. Detta inkluderar följande:
Du kan följa förloppet under Förlopp för förberedelse på skärmens nedre del. |
Schemalägga en datamartuppgift
Du kan schemalägga en datamartuppgift så att den uppdateras regelbundet. Du kan ställa in ett tidsbaserat schema, eller ställa in uppgiften att köras när indatauppgifter har slutförts.
Klicka på ... på en datauppgift och välj Schemaläggning för att skapa ett schema. Standardinställningen för schemaläggning ärvs från inställningarna i projektet. Mer information om standardinställningar finns i Standardvärden för datamart.
Du måste sätta Schemaläggning till På för att aktivera schemat.
Tidsbaserade scheman
Du kan använda ett tidsbaserat schema för att köra uppgiften oavsett när de olika indatakällorna uppdateras.
Välj Vid en specifik tidpunkt i Kör datauppgift.
Du kan skapa ett schema med intervall på dagar, veckor eller månader.
Händelsebaserade scheman
Du kan använda ett händelsebaserat schema som körs när indatauppgifterna har slutförts.
Välj Vid en specifik tidpunkt i Kör datauppgift.
Du kan välja om du vill köra uppgiften när någon av indatauppgifterna har slutförts, eller när någon uppgift i ett urval av indatauppgifter har slutförts.
Ladda data
Du kan utföra en manuell ominläsning av data. Detta är användbart när det finns problem med en eller flera tabeller.
Öppna datauppgiften och välj fliken Övervaka.
Välj tabellerna du vill ladda.
När en dimension väljs för laddning kommer alla fakta som använder denna dimension också att laddas för att integriteten ska bevaras.
Klicka på Ladda tabeller.
Du kan avbryta laddningen för tabeller som väntar på laddning genom att klicka på Avbryt laddning. Detta kommer inte att påverka tabeller som redan har laddats och laddningar som körs för tillfället kommer att slutföras.
Laddningen utförs genom att:
Trunkera de valda dimensionerna och fakta.
Ladda de valda dimensionstabellerna från datauppgiften uppströms.
Ladda faktatabellerna från datauppgiften uppströms. Detta inkluderar följande:
Uttryckligen valda faktatabeller
Faktatabeller med anknytning till en dimension som laddas.
Datamartinställningar
Klicka på knappen Inställningar i verktygsfältet för att öppna dialogen Inställningar: <data-mart-name>.
Allmänna inställningar
Följande inställningar är tillgängliga i fliken Allmänt:
- Databas: Den databas där dartamarten skapas
- Datauppgiftsschema: Det schema som datauppsättningarna skapas i
- Internt schema: Det schema som de interna datauppsättningarna skapas i
- Prefix för alla tabeller och vyer
Du kan ange prefix för alla tabeller och vyer som skapas av uppgiften.
Anteckning om informationDu måste använda ett unikt prefix om du vill använda ett databasschema i flera datauppgifter.
Inställningar för körtid
Följande inställningar är tillgängliga i fliken Körning:
- Parallell körning: Ange det maximala antalet databasanslutningar som Qlik Cloud får öppna för den här uppgiften. Standardantalet är 10.
- Lager: gäller bara för Snowflake. Namnet på datalagret Snowflake.
Kataloginställningar
Publicera i katalogen
Välj det här alternativet för att publicera den här versionen av data till Katalogen som en datauppsättning. Kataloginnehållet kommer att uppdateras nästa gång du förbereder den här uppgiften.
Mer information om Katalog finns i Förstå data med hjälp av katalogverktyg.