Ga naar hoofdinhoud Ga naar aanvullende inhoud

Datamarts maken en beheren

Zodra u vertrouwd bent geraakt met de gegevens, kunt u datamarts maken met de gegevens uit de opslag- of transformatie-taken. U kunt net zoveel datamarts maken als nodig is, afhankelijk van uw bedrijfsbehoeften. Idealiter moeten uw datamarts opslagplaatsen bevatten van samengevatte gegevens die zijn verzameld voor analyse in een specifieke sectie of afdeling binnen een organisatie, bijvoorbeeld de verkoopafdeling.

InformatieDe procedure voor het maken van een datamart verloopt altijd hetzelfde, ongeacht of uw datamart is gebaseerd op een opslagtaak of een transformatietaak. De instructies in deze sectie zijn opgesteld op basis van een datamart die is gebaseerd op een opslagtaak.
InformatieDe situatie van de eigenaar van de gegevenstaken is bepalend voor de werking ervan. Zie Rollen en machtigingen in gegevensruimten voor meer informatie over de vereiste rollen en machtigingen.

Vereisten

Voordat u een datamart kunt maken, moet u eerst het volgende doen:

  • Vul de opslag in met gegevens (vanuit de tussenopslag) die u wilt gebruiken in uw datamart. Ga voor meer informatie naar Gegevens onboarden.
  • Maak een relationeel model voor een gegevensverzameling om de relatie tussen de brongegevensverzamelingen te definiëren. Ga voor meer informatie naar Een gegevensmodel maken.

    WaarschuwingAlle brongegevensverzamelingen moeten sleutels bevatten.

Een datamart maken

Om een datamart te maken, gaat u als volgt te werk:

  1. Open uw gegevensproject door te klikken op aan het einde van de rij en selecteer Openen.

  2. Voer een van de volgende handelingen uit:

    • Klik op de knop Nieuwe toevoegen in de rechterbovenhoek en selecteer Datamart maken.
    • Zoek de opslagasset en klik op het pictogram in de rechterbenedenhoek. Selecteer vervolgens Datamart maken.

    Het dialoogvenster Datamart maken wordt geopend.

  3. Geef een naam op voor uw datamart en geef eventueel een omschrijving op.

  4. Als u de datamart later wilt configureren, schakel het selectievakje Openen dan uit en klik op Maken. Klik anders op Maken.

    De datamart wordt geopend op het tabblad Datamart.

  5. Selecteer uw brongegevens zoals beschreven in Uw brongegevens selecteren.
  6. Als u wilt dat de datamart dimensies bevat, voeg dan dimensies toe zoals beschreven in Dimensies en een feit toevoegen aan de datamart.
  7. Als u wilt dat de datamart een feit bevat, voeg dan een feit toe zoals beschreven in Een feit toevoegen.
  8. Als de datamart zowel dimensies als een feit bevat, voeg de dimensies dan toe aan uw sterrenschema zoals beschreven in Een sterrenschema maken.
  9. Maak de gegevensverzamelingen in uw datamart en vul ze met de gegevens zoals beschreven in Uw datamart invullen.

Uw brongegevens selecteren

U selecteert uw brongegevens in de gegevensverzamelingen in de opslaggegevenstaak.

Ga als volgt te werk:

  1. Klik op de knop Brongegevens selecteren in het midden van het tabblad of klik op de menuknop Brongegevens selecteren.

    Het dialoogvenster Brongegevens selecteren wordt geopend.

  2. In de vervolgkeuzelijst Gegevensassets selecteert u een opslagtaak of een transformatietaak als u transformaties hebt gemaakt.

  3. Laat de standaard % zoeken naar alle gegevensverzamelingen of geef de naam op van een specifieke gegevensverzameling. Klik vervolgens op Zoeken.

  4. Selecteer de gewenste gegevensverzamelingen en klik vervolgens op Geselecteerde tabellen toevoegen.

  5. Klik op OK om het dialoogvenster te sluiten en ga dan verder naar Een feit toevoegen en/of Dimensies toevoegen.

InformatieU kunt het proces herhalen om gegevensverzamelingen van andere gegevenstaken toe te voegen.

Dimensies en een feit toevoegen aan de datamart

Nadat u uw brongegevens hebt geselecteerd, kunt u verdergaan met het bouwen van uw datamart. Een datamart kan een feitengegevensverzameling, dimensiegegevensverzamelingen of een combinatie van beide bevatten (waarbij de dimensiegegevensverzamelingen op logische wijze zijn gerelateerd aan de feitengegevensverzameling).

Dimensies toevoegen

Een dimensie toevoegen.

  1. Klik op de knop Dimensie toevoegen.

    Het dialoogvenster Dimensie toevoegen wordt geopend.

  2. De volgende instellingen zijn beschikbaar:

    • Meest gedetailleerde gegevensverzameling: Een gegevensverzameling selecteren.
    • Naam: Geef een weergavenaam voor de dimensie op. De standaardinstelling is de naam van de meest gedetailleerde gegevensverzameling.
    • Beschrijving: Geef desgewenst een beschrijving op.
    • Geschiedenistype: Selecteer een van de volgende opties:
      • Type 1: De bestaande record in de dimensie wordt bijgewerkt als de bijbehorende record in de opslag wordt bijgewerkt.
      • Type 2: Een nieuw record wordt toegevoegd aan de dimensie als de bijbehorende record in de opslag wordt bijgewerkt.
    • Verwante gegevensverzameling om te denormaliseren: Gegevensverzamelingen die in de dimensiegegevensverzameling gedenormaliseerd moeten worden (volgens de relaties in het model van de brongegevensasset) zijn hier beschikbaar om te selecteren.

       

      Voorbeeld van een dimensie die gedenormaliseerd kan worden

      Voorbeeld van een dimensie met gerelateerde dimensies

  3. Klik op OK om uw instellingen op te slaan.

    De dimensie wordt toegevoegd aan de lijst Dimensies aan de linkerkant.

Zie ook Rol spelende dimensies.

Informatie over een dimensie bekijken

Als u een dimensie selecteert, wordt het tabblad Relationeel bronmodel getoond in het middelste deelvenster. Dit tabblad toont de brongegevensverzamelingen die in de dimensie zijn geconsolideerd. Gegevensverzamelingen die u selecteert om te denormaliseren nadat u de dimensie hebt toegevoegd, worden als geselecteerd getoond (en grijs weergegeven).

Productendimensie gedenormaliseerd met de categoriëen- en leveranciersgegevensverzameling

Een feit toevoegen

Ga als volgt te werk om een feit toe te voegen:

  1. Klik op de knop Een feit toevoegen.

    Het dialoogvenster Feit toevoegen wordt geopend.

  2. De volgende instellingen zijn beschikbaar:

    • Feit: Selecteer een gegevensverzameling als feit. De gegevensverzameling moet de granulariteit defiëren van het feit dat u aan het maken bent.
    • Naam: Geef een weergavenaam voor het feit op. De standaardinstelling is de feitennaam.
    • Beschrijving: Geef desgewenst een beschrijving op.
    • Verwante gegevensverzamelingen om te denormaliseren: Gegevensverzamelingen die gedenormaliseerd kunnen worden in uw feitengegevensverzameling worden hier voor selectie getoond.
    • tabblad
      • Huidige gegevens gebruiken: Indien deze optie is geselecteerd (standaardinstelling), bevat het feit geen kolom voor transactiedatum.
      • Transactiedatum kiezen: Als u gegevens wilt zoeken op basis van een specifieke transactiedatum, selecteert u deze optie en een datumkolom. Dit is handig als uw sterrenschema type 2-dimensies bevat en u de correcte gegevens voor een specifieke transactie wilt zoeken. Als een klant bijvoorbeeld meerdere adressen heeft, kunt u het correcte adres mogelijk vinden op basis van de orderdatum.

        Voorbeeld gebruikscase:

        een retailer moet een datamart maken om de relatie tussen bestellingen en klanten te analyseren. De datamart moet antwoord kunnen geven op de volgende query's: Welke staat in de VS had het hoogste aantal bestellingen in Q4 2022?

         

        Als de retailer de optie Huidige gegevens gebruiken selecteert, wordt alleen de meest recente recordversie in de tabel Customers meegenomen in de berekening.

        Het negeren van de transactiedatum resulteert in onjuiste gegevens, zoals hieronder wordt getoond:

         

        Toont de relatie tussen de feitentabel Orders en de dimensie Customers als de optie Huidige gegevens gebruiken is geselecteerd.

         

        Als de retailer echter de optie Transactiedatum kiezen selecteert, worden de bestellingen van klanten gekoppeld aan de correcte recordversie in de tabel Customers.

        Hiermee kan de retailer nauwkeurig het totaal aantal bestellingen per staat in Q4 2022 berekenen.

         

        Toont de relatie tussen de feitentabel Orders en de dimensie Customers als de optie Transactiedatum gebruiken is geselecteerd.

        TipHoud er rekening mee dat de transactiedatum afhankelijk van de zakelijke behoeften in elke datamart verschillend kan worden toegepast. Deze kan in de ene datamart bijvoorbeeld worden gebruikt om bestellingsdatums te analyseren en in de andere datamart voor het analyseren van verzenddatums.
  3. Klik op OK om uw instellingen op te slaan.

    Het feit wordt toegevoegd aan de lijst Feiten aan de linkerkant.

Informatie over het feit bekijken

Als u een feit selecteert, worden de volgende tabbladen getoond in het middelste deelvenster:

  • Sterrenschemamodel (standaard): toont een grafische weergave van de relaties van de gegevensverzamelingen binnen de datamart.
  • Feitenmodel: toont gegevensverzamelingen die zijn gerelateerd aan de feitengegevensverzameling. Gegevensverzamelingen die u selecteert om te denormaliseren nadat u het feit hebt toegevoegd, worden als geselecteerd getoond (en grijs weergegeven).

     

    Ordergegevensfeit met gedenormaliseerde ordergegevensverzameling

  • Transactiedatum: De naam van de transactiekolom als u de optie Transactiedatum kiezen hebt geselecteerd bij het toevoegen van het feit.

Een sterrenschema maken

Nadat u dimensies aan uw datamart hebt toegevoegd, kunt u deze verbinden met uw feitengegevensverzameling om een sterrenschema te maken.

Voor de volgende actie:

  1. Selecteer links uw feit in de lijst Feiten.
  2. Selecteer welke dimensies u wilt toevoegen uit de lijst Aanbevolen dimensies aan de rechterkant.

    Aanbevolen dimensies worden met een stippellijn verbonden met de feitengegevensverzameling.

    In de onderstaande afbeelding zijn sommige dimensies eerder toegevoegd en daarom met elkaar verbonden met een ononderbroken grijze lijn.

  3. Klik op Toevoegen om de dimensies toe te voegen.

    De dimensies worden met een ononderbroken grijze lijn verbonden met de feitengegevensverzameling.

  4. Klik op om het deelvenster Aanbevolen dimensies te sluiten.

Uw datamart invullen

Nadat u klaar bent met het ontwerpen van uw datamart, kunt u deze gaan invullen.

Ga als volgt te werk:

  1. Klik op de menuknop Voorbereiden in de rechterbovenhoek.

    Het voorbereidingsproces omvat het maken van gegevensverzamelingen en weergaven in de datamart en het bijwerken van de Catalogus.

    U kunt de voortgang volgen onder Voortgang van voorbereiding in het onderste deel van het scherm.

    Nadat de voorbereiding is voltooid, wordt de knop Voorbereiden gewijzigd in Uitvoeren.

  2. U kunt eventueel de datamart valideren zoals hieronder beschreven in Uw datamart valideren en synchroniseren.

  3. Klik op de knop Uitvoeren.

    Het venster schakelt naar de bewakingsweergave en toont het laadproces en de status van de gegevensverzamelingen in uw datamart.

Elke bronrecord wordt verwerkt door de datamart, zelfs verwijderde records. Hierdoor wordt gegarandeerd dat historische gegevens blijven bewaard.

InformatieVoor dimensiegegevensverzamelingen met type 2-geschiedenis omvat het aantal verwerkte records alle versierijen voor een record en wordt een waarde weergegeven die hoger is dan het aantal daadwerkelijk verwerkte records.

Uw datamart valideren en synchroniseren

Door de datamart te valideren verzekert u dat de metagegevens van de datamart identiek zijn aan de bijbehorende metagegevens in de brongegevensasset (van het type opslag of transformatie indien gedefinieerd). Bij het valideren van de datamart worden ook de gemaakte metagegevens vergeleken met het ontwerp van het huidige sterrenschema. Als u bijvoorbeeld de validatie uitvoert nadat u een dimensie hebt toegevoegd aan een eerder gemaakte datamart, zal de validatie mislukken.

Ga als volgt te werk om de datamart te valideren:

  1. Selecteer Gegevensverzamelingen valideren in het menu rechts van de knop Uitvoeren of klik op de knop Gegevensverzamelingen valideren onderaan het venster.

    De melding Validatie is voltooid wordt getoond.

  2. Als de metagegevens niet gesynchroniseerd zijn of als het ontwerp van het sterrenschema in conflict is, wordt het deelvenster Valideren en aanpassen samen met het validatierapport automatisch onderaan het venster geopend.

  3. Als u problemen met Ontwerpwijzigingen in behandeling wilt oplossen, klikt u bovenaan op de knop en selecteert u Voorbereiden. Als de waarde van de kolom Kan worden veranderd zonder gegevensverlies op Ja is ingesteld, wordt er een ALTER-bewerking uitgevoerd. Anders worden de datamarttabellen opnieuw gemaakt.

    Alle Validatiefouten moeten handmatig worden opgelost.

Datamarts beheren

In deze sectie worden de verschillende opties beschreven die beschikbaar zijn voor het beheren van uw gegevensverzamelingen en datamarts.

Feiten of dimensies verfijnen

Op het tabblad Gegevensverzamelingen kunt u verschillende bewerkingen uitvoeren om uw feiten en dimensies te verfijnen, zoals het maken van transformatieregels (bijvoorbeeld het vervangen van kolomwaarden) en het toevoegen van uitdrukkingen op kolomniveau. U vindt het tabblad Gegevensverzamelingen rechts naast het tabblad Datamart:

Tabblad Gegevensverzamelingen

Tabblad Gegevensverzamelingen voor het beheren van feiten- en dimensiegegevensverzamelingen

Regels toevoegen

Voor een uitleg over het toevoegen van algemene regels raadpleegt u Regels maken om gegevensverzamelingen te transformeren

InformatieVoor meer informatie over regels en andere bewerkingen die u voor uw gegevensverzamelingen kunt uitvoeren, raadpleegt u Gegevensverzamelingen beheren. Houd er rekening mee dat sommige opties zoals het filteren en hernoemen van gegevensverzamelingen niet beschikbaar zijn voor datamartgegevenstaken.

Kolommen en uitdrukkingen toevoegen

Voor een uitleg over het toevoegen van kolommen en uitdrukkingen raadpleegt u Kolommen toevoegen aan een gegevensverzameling.

Rol spelende dimensies

Een rol spelende dimensie is de dimensie die meerdere keren in hetzelfde sterrenschema is gebruikt, maar met verschillende betekenissen. Dit gebeurt vaak bij dimensies voor Date en Customer. U hebt bijvoorbeeld een sterrenschema met twee entiteiten van Date, één vertegenwoordigt de Order Date en de andere vertegenwoordigt de Received Date.

Ga als volgt te werk om de rolnaam van een dimensie toe te voegen of te bewerken:

  1. Klik op het pictogram in het dimensieknooppunt en selecteer Rol bewerken.
  2. Op het dialoogvenster Rol bewerken geeft u een naam op (of bewerkt u de huidige naam) in het veld Rolnaam in sterrenschema en klikt u op OK.

    De rolnaam wordt weergegeven onder de dimensienaam.

Extra beheeropties

De volgende tabel beschrijft extra beheeropties:

Naar Doe dit
Extra brongegevensverzamelingen toevoegen Zie: Uw brongegevens selecteren.
Extra feiten toevoegen Zie Een feit toevoegen
Extra dimensies toevoegen Zie: Dimensies en een feit toevoegen aan de datamart.
Een dimensie verwijderen Selecteer de dimensie in het venster Dimensies en selecteer vervolgens Verwijderen in het menu.
Een feit verwijderen Selecteer het feit in het venster Feiten en selecteer vervolgens Verwijderen in het menu.
Een datamart opnieuw maken Klik op de knop in de rechterbovenhoek en selecteer Tabellen opnieuw maken. Een datamart opnieuw maken is bijvoorbeeld noodzakelijk als er wijzigingen in de opslag zijn aangebracht die niet automatisch naar de datamart kunnen worden gesynchroniseerd.
Een datamarttaak stoppen Klik op de knop Stoppen in de rechterbovenhoek.
Een datamarttaak voorbereiden

Klik op de knop in de rechterbovenhoek en selecteer Voorbereiden om de gegevensverzamelingen te synchroniseren met de transformatie- of opslagassets en los eventuele ontwerpconflicten op. Hiermee wordt een taak voorbereid op uitvoering. Dit omvat de volgende handelingen:

  • Validatie dat het ontwerp geldig is.

  • De fysieke tabellen en weergaven maken of wijzigen om bij het ontwerp te laten passen.

  • De SQL-code voor de gegevenstaak genereren.

  • De catalogusinvoer maken of wijzigen voor de uitvoergegevensverzamelingen van de taak.

U kunt de voortgang volgen onder Voortgang van voorbereiding in het onderste deel van het scherm.

Een datamarttaak plannen

U kunt inplannen dat een datamarttaak periodiek wordt bijgewerkt. U kunt een planning op tijdbasis instellen of instellen dat de taak wordt uitgevoerd als ingevoerde gegevenstaken zijn voltooid.

Klik op ... van een gegevenstaak en selecteer Planning om een planning te maken. De standaard planningsinstelling wordt overgenomen van de instellingen van het gegevensproject. Ga voor meer informatie over standaardinstellingen naar Standaardwaarden datamart.

U moet Planning altijd instellen op Aan om de planning in te schakelen.

Planningen op tijdbasis

U kunt een planning op tijdbasis uitvoeren om de taak uit te voeren ongeacht op welk tijdstip de verschillende invoerbronnen worden bijgewerkt.

  • Selecteer Op een specifiek tijdstip in De gegevenstaak uitvoeren.

U kunt een planning per maand, week, dag of uur instellen.

Planningen op basis van gebeurtenis

U kunt een planning op basis van gebeurtenis instellen of instellen dat de taak wordt uitgevoerd als ingevoerde gegevenstaken zijn voltooid.

  • Selecteer Bij een specifieke gebeurtenis in De gegevenstaak uitvoeren.

U kunt selecteren of u de taak wilt uitvoeren als de invoertaken zijn voltooid of als een selectie van de invoertaken is voltooid.

InformatieDe taak wordt niet uitgevoerd als een invoertaak of downstreamtaak wordt uitgevoerd als de planning wordt geactiveerd. De taak wordt overgeslagen tot de volgende geplande uitvoering.

Datamartinstellingen

Klik op de menuknop Instellingen om het dialoogvenster Instellingen: <datamartnaam> te openen.

WaarschuwingAls de taak reeds begonnen is en u wilt een andere instelling dan Runtime aanpassen, dan moet u de datasets opnieuw aanmaken.

Tabblad Algemeen

Op het tabblad Algemeen zijn de volgende instellingen beschikbaar:

  • Database De database waarin de datamart wordt gemaakt
  • Schema van gegevenstaak: Het schema waarin de gegevensverzamelingen worden gemaakt
  • Intern schema: Het schema waarin de interne gegevensverzamelingen worden gemaakt
  • Prefix voor alle tabellen en weergaven

    U kunt een prefix instellen voor alle tabellen en weergaven die met deze taak zijn gemaakt.

    InformatieU moet een unieke prefix gebruiken als u een databaseschema in verschillende gegevenstaken wilt gebruiken.

Tabblad Runtime

Op het tabblad Runtime zijn de volgende instellingen beschikbaar:

  • Parallelle uitvoering: Geeft het maximum aantal databaseverbindingen op die Qlik Cloud mag openen voor de taak. Het standaard aantal is 10.
  • Warehouse: Alleen relevant voor Snowflake. De naam van de Snowflake-datawarehouse

Was deze pagina nuttig?

Als u problemen ervaart op deze pagina of de inhoud onjuist is – een typfout, een ontbrekende stap of een technische fout – laat het ons weten zodat we dit kunnen verbeteren!