Datamarts maken en beheren
Zodra u uw gegevens hebt ge-onboard, kunt u datamarts maken met behulp van de gegevens uit de taken Opslag of Transformeren . U kunt een willekeurig aantal datamarts maken, afhankelijk van uw zakelijke behoeften. Idealiter zouden uw datamarts opslagplaatsen moeten bevatten van samengevatte gegevens die zijn verzameld voor analyse van een specifieke sectie of eenheid binnen een organisatie, bijvoorbeeld de verkoopafdeling.
Naast het opslaan van tabellen in het datawarehouse, kunt u tabellen ook opslaan als Iceberg-tabellen die worden beheerd door het gegevensplatform. Deze optie is momenteel alleen beschikbaar voor Snowflake-projecten. Dit is mogelijk door Snowflake-beheerde Iceberg-tabellen te selecteren onder Tabeltype in de taakinstellingen.
Vereisten
U kunt gegevenstaken van de volgende typen gebruiken als bron voor een datamart:
-
Opslag
-
Transformeren
Voordat u een datamart kunt maken, moet u het volgende doen in de brongegevenstaken:
- Vul de gegevenssets met gegevens die u in uw datamart wilt gebruiken. Voor meer informatie, zie Onboarding van gegevens naar een datawarehouse.
-
Maak een relationeel model voor de gegevensset om de relaties tussen de brongegevenssets te definiëren. Voor meer informatie, zie Een gegevensmodel maken.
WaarschuwingAlle brongegevenssets moeten sleutels hebben.
Een datamart maken
Een datamart maken:
-
Open uw project.
-
Doe een van de volgende dingen:
- Klik op Maken in de rechterbovenhoek en selecteer Datamart maken.
-
Klik in de brongegevenstaak op
in de rechterbenedenhoek en selecteer vervolgens Datamart maken.
Het dialoogvenster Datamart maken wordt geopend.
-
Geef een naam op voor uw datamart en geef optioneel ook een beschrijving op.
-
Als u de datamart later wilt configureren, wist u het selectievakje Openen en klikt u vervolgens op Maken. Klik anders gewoon op Maken.
De datamart wordt geopend op het tabblad Datamart.
- Selecteer uw brongegevens zoals beschreven in Uw brongegevens selecteren
- Als u wilt dat de datamart dimensies bevat, voegt u dimensies toe zoals beschreven in Dimensies en een feit toevoegen aan de datamart
- Als u wilt dat de datamart een feit bevat, voegt u een feit toe zoals beschreven in Een feit toevoegen
- Als de datamart zowel dimensies als een feit bevat, voegt u de dimensies toe aan uw sterschema zoals beschreven in Een sterschema bouwen
- Maak de gegevenssets in uw datamart en vul ze met gegevens zoals beschreven in Uw datamart vullen
Meer informatie
Uw brongegevens selecteren
U selecteert uw brongegevens uit de gegevenssets in de brongegevenstaak.
Om dit te doen:
-
Klik op de knop Brongegevens selecteren in het midden van het tabblad of klik op de werkbalkknop Brongegevens selecteren.
Het dialoogvenster Brongegevens selecteren wordt geopend.
-
Selecteer in de vervolgkeuzelijst Pijplijnprojecten uit welk project u brongegevens wilt ophalen.
U kunt gegevenssets toevoegen uit het huidige project of uit een ander project. Gegevenssets uit een ander project toevoegen:
-
U moet ten minste de rol Kan consumeren hebben in de ruimte van het geconsumeerde project.
-
Beide projecten moeten zich op hetzelfde gegevensplatform bevinden.
Als het geselecteerde project onder versiebeheer staat, kunt u selecteren welke branch u als bron wilt gebruiken. Voor meer informatie over projectoverschrijdende pijplijnen, zie Projectoverschrijdende pijplijnen bouwen.
-
-
Selecteer in de vervolgkeuzelijst Gegevenstaken een Opslag-taak of een Transformeren-taak als u transformaties hebt gemaakt.
-
Laat de standaard % staan om naar alle gegevenssets te zoeken of voer de naam in van een specifieke gegevensset die u wilt zoeken. Klik vervolgens op Zoeken.
-
Selecteer de gewenste gegevenssets en klik vervolgens op Geselecteerde tabellen toevoegen.
-
Klik op OK om het dialoogvenster te sluiten en ga vervolgens verder met Een feit toevoegen en/of Dimensies toevoegen.
Dimensies en een feit toevoegen aan de datamart
Zodra u uw brongegevens hebt geselecteerd, kunt u doorgaan met het bouwen van uw datamart. Een datamart kan een feitengegevensset, dimensiegegevenssets of een combinatie van beide hebben (waarbij de dimensiegegevenssets logisch gerelateerd zijn aan de feitengegevensset).
Dimensies toevoegen
Een dimensie toevoegen.
-
Klik op de knop Dimensie toevoegen.
Het dialoogvenster Dimensie toevoegen wordt geopend.
-
De volgende instellingen zijn beschikbaar:
- Meest granulaire gegevensset: Selecteer een gegevensset.
- Naam: Geef een weergavenaam op voor de dimensie. De standaardwaarde is de naam van de meest granulaire gegevensset.
- Beschrijving: Geef optioneel een beschrijving op.
- Geschiedenistype: Selecteer een van de volgende opties:
- Type 1: De bestaande record in de dimensie wordt bijgewerkt wanneer de bijbehorende record in de Opslag wordt bijgewerkt.
- Type 2: Er wordt een nieuwe record toegevoegd aan de dimensie wanneer de bijbehorende record in de Opslag wordt bijgewerkt.
-
Gerelateerde gegevensset om te denormaliseren: Alle gegevenssets die kunnen worden gedenormaliseerd in de dimensiegegevensset (volgens de relaties in het brongegevensassetmodel) zijn hier beschikbaar voor selectie.
Voorbeeld van een dimensie die kan worden gedenormaliseerd
-
Klik op OK om uw instellingen op te slaan.
De dimensie wordt toegevoegd aan de lijst Dimensies aan de linkerkant.
Zie ook Role-playing dimensies.
Informatie over een dimensie bekijken
Wanneer u een dimensie selecteert, wordt het tabblad Bron relationeel model weergegeven in het middelste deelvenster. Dit tabblad toont de brongegevenssets die zijn geconsolideerd in de dimensie. Gegevenssets die u hebt gekozen om te denormaliseren toen u de dimensie toevoegde, worden geselecteerd (en grijs) weergegeven.
Een feit toevoegen
Een feit toevoegen:
-
Klik op de knop Feit toevoegen.
Het dialoogvenster Feit toevoegen wordt geopend.
-
De volgende instellingen zijn beschikbaar:
- Feit: Selecteer een gegevensset als het feit. De gegevensset moet de granulariteit definiëren van het feit dat u maakt.
- Naam: Geef een weergavenaam op voor het feit. De standaardwaarde is de naam van het feit.
- Beschrijving: Geef optioneel een beschrijving op.
- Gerelateerde gegevenssets om te denormaliseren: Alle gegevenssets die kunnen worden gedenormaliseerd in uw feitengegevensset zijn hier beschikbaar voor selectie.
- Geavanceerd
- Huidige gegevens gebruiken: Wanneer geselecteerd (de standaardinstelling), bevat het feit geen kolom met transactiedatums.
-
Transactiedatum kiezen: Om gegevens te zoeken op basis van een specifieke transactiedatum, selecteert u deze optie en selecteert u vervolgens een datumkolom. Dit is handig als uw sterschema type 2-dimensies bevat en u de juiste gegevens voor een specifieke transactie moet vinden. Als een klant bijvoorbeeld meerdere adressen heeft, is het wellicht mogelijk om het juiste adres te vinden op basis van de besteldatum.
Voorbeeld van een use case:
Een detailhandelaar moet een datamart maken om de relatie tussen bestellingen en klanten te analyseren. De datamart moet vragen kunnen beantwoorden zoals: Welke Amerikaanse staat had de hoogste som van bestellingen in Q4 2022?
Als de detailhandelaar de optie Huidige gegevens gebruiken selecteert, wordt alleen de meest actuele recordversie in de tabel Klanten opgenomen in de berekening.
Het negeren van de transactiedatum leidt tot onnauwkeurige gegevens, zoals hieronder wordt geïllustreerd:
Als de detailhandelaar echter de optie Transactiedatum kiezen selecteert, worden de bestellingen van de klant gekoppeld aan de juiste recordversie in de tabel Klanten .
Hierdoor kan de detailhandelaar de totale som van bestellingen per staat in Q4 2022 nauwkeurig berekenen.
TipHoud er rekening mee dat de transactiedatum in elke datamart anders kan worden benut, afhankelijk van de zakelijke behoeften. In de ene datamart kan het bijvoorbeeld worden gebruikt om besteldatums te analyseren, terwijl het in een andere datamart kan worden gebruikt om verzenddatums te analyseren.
-
Klik op OK om uw instellingen op te slaan.
Het feit wordt toegevoegd aan de lijst Feiten aan de linkerkant.
Informatie over het feit bekijken
Wanneer u een feit selecteert, worden de volgende tabbladen weergegeven in het middelste deelvenster:
- Sterschemamodel (standaard): Toont een grafische weergave van de relaties tussen gegevenssets binnen de datamart.
-
Feitenmodel: Toont alle gegevenssets die gerelateerd zijn aan de feitengegevensset. Gegevenssets die u hebt gekozen om te denormaliseren toen u het feit toevoegde, worden geselecteerd (en grijs) weergegeven.
Bestelgegevens -feit met een gedenormaliseerde Bestellingen-gegevensset
- Transactiedatum: De naam van de transactiekolom als u de optie Transactiedatum kiezen hebt geselecteerd bij het toevoegen van het feit.
Omgaan met onbekende en laat arriverende dimensies
Elke dimensie bevat rijen -1 en 0, die de bedrijfssleutel (object-ID) van de dimensie zijn. Rij -1 is gereserveerd voor laat arriverende dimensies, terwijl 0 is gereserveerd voor onbekende dimensies.
Onbekende dimensies
“Onbekend” zijn gegevens die niet beschikbaar waren toen de dimensie oorspronkelijk werd gemaakt. Stel dat u bijvoorbeeld een BESTELLING-feit hebt met een VERZENDER-kolom die de bedrijfssleutel is voor de VERZENDER-dimensie. Als de rij van het BESTELLING-feit nog niet is verzonden - en dus NULL heeft voor de VERZENDER-kolom - wordt deze gerelateerd aan de record 0 (wat een Onbekend voor de dimensie aangeeft). Wanneer het BESTELLING-feit later wordt bijgewerkt met een VERZENDER-waarde (bijvoorbeeld USPS), wordt de gerelateerde dimensie-ID (0) op zijn beurt bijgewerkt.
Laat arriverende dimensies
Een laat arriverende dimensie heeft een sleutel die bestaat in de nieuwe feitengegevens, maar die nog niet bestaat in de dimensie. Als de VERZENDER in het BESTELLING-feit bijvoorbeeld de waarde "NEWSHIP" heeft voor een nieuwe verzender en die bedrijfssleutel nog niet bestaat in de DIM_SHIPPER-dimensie, zal de datamart-verwerking dat feit relateren aan de rij -1. Dit duidt op een ontbrekend dimensielid in uw dimensietabel. Wanneer de bedrijfssleutel "NEWSHIP" arriveert voor de DIM_SHIPPER-dimensie, wordt de dimensierij ervan gemaakt en wordt de feitenrecord bijgewerkt om uit te lijnen met de eerder ontbrekende dimensie.
Een sterschema bouwen
Zodra u dimensies aan uw datamart hebt toegevoegd, kunt u doorgaan met het verbinden ervan met uw feitengegevensset, waardoor een sterschema ontstaat.
Om dit te doen:
- Selecteer uw feit in de lijst Feiten aan de linkerkant.
-
Selecteer welke dimensies u wilt toevoegen uit de lijst Aanbevolen dimensies aan de rechterkant.
Aanbevolen dimensies worden weergegeven verbonden met de feitengegevensset met een stippellijn.
In de onderstaande afbeelding zijn sommige dimensies eerder toegevoegd en daarom verbonden met een ononderbroken grijze lijn.
-
Klik op Toepassen om de dimensies toe te voegen.
De dimensies worden weergegeven verbonden met de feitengegevensset met een ononderbroken grijze lijn.
-
Om het paneel Aanbevolen dimensies te sluiten, klikt u op
.
Uw datamart vullen
Zodra u uw datamart hebt ontworpen, kunt u doorgaan met het vullen ervan.
Om dit te doen:
-
Klik op de werkbalkknop Voorbereiden in de rechterbovenhoek.
Het voorbereidingsproces omvat het maken van gegevenssets en weergaven in de datamart en het bijwerken van de Catalogus.
U kunt de voortgang volgen onder Voortgang voorbereiding in het onderste deel van het scherm.
Nadat de voorbereiding is voltooid, verandert de knop Voorbereiden in Uitvoeren.
-
Valideer optioneel de datamart zoals hieronder beschreven in Uw datamart valideren en synchroniseren.
-
Klik op de knop Uitvoeren .
Het venster schakelt over naar de weergave Monitor , waarin de laadvoortgang en status van de gegevenssets in uw datamart worden weergegeven.
Elke bronrecord wordt verwerkt door de datamart, zelfs verwijderde records. Dit wordt gedaan om ervoor te zorgen dat historische informatie behouden blijft.
Uw datamart valideren en synchroniseren
Het valideren van de datamart zorgt ervoor dat de metagegevens van de datamart identiek zijn aan de bijbehorende metagegevens in de Opslag (of Transformeren indien gedefinieerd). Het valideren van de datamart vergelijkt ook de gemaakte metagegevens met het huidige sterschema-ontwerp. Als u de validatie bijvoorbeeld uitvoert na het toevoegen van een dimensie aan een reeds gemaakte datamart, zal de validatie mislukken.
De datamart valideren:
-
Selecteer Gegevenssets valideren in het menu
rechts van de knop Uitvoeren of klik op de knop Gegevenssets valideren rechtsonder in het venster.
Er wordt een bericht Validatie is voltooid weergegeven.
-
Als de metagegevens niet synchroon lopen of als er conflicten zijn in het sterschema-ontwerp, wordt het deelvenster Valideren en aanpassen onder aan het venster automatisch geopend met het validatierapport.
Voorbeeld van een datamart met een conflict in het sterschema-ontwerp:
Voorbeeld van een datamart met validatiefouten:
-
Om eventuele problemen met Ontwerpwijzigingen in behandeling op te lossen, klikt u op de knop
in de rechterbovenhoek en selecteert u Voorbereiden. Als de waarde van de kolom Kan worden gewijzigd zonder gegevensverlies Ja is, wordt een ALTER-bewerking uitgevoerd. Anders worden de datamart-tabellen opnieuw gemaakt.
Houd er rekening mee dat alle Validatiefouten handmatig moeten worden opgelost.
Datamarts beheren
In deze sectie worden de verschillende opties beschreven die beschikbaar zijn voor het beheren van uw gegevenssets en datamarts.
Feiten of dimensies verfijnen
Op het tabblad Gegevenssets kunt u verschillende bewerkingen uitvoeren om uw feiten en dimensies te verfijnen, zoals het maken van transformatieregels (bijvoorbeeld het vervangen van kolomwaarden) en het toevoegen van expressies op kolomniveau. Het tabblad Gegevenssets bevindt zich rechts van het tabblad Datamart :
Regels toevoegen
Voor een uitleg over het toevoegen van globale regels, zie Regels maken om gegevensverzamelingen te transformeren
Nieuwe kolommen toevoegen
U kunt nieuwe kolommen toevoegen aan de doelgegevensset.
-
Een nieuwe kolom vanaf nul toevoegen
Klik op + Toevoegen.
Geef een naam op voor de kolom en stel een expressie in om de kolomgegevens te definiëren.
Voor meer informatie, zie Kolommen toevoegen aan een gegevensset.
-
Een kolom uit de bron toevoegen
Klik op
naast Toevoegen en selecteer Kolom uit bron toevoegen.
Selecteer een kolom uit de brongegevensset.
Kolommen opnieuw ordenen
U kunt de ordinale positie van een kolom wijzigen.
-
Selecteer een kolom.
-
Klik op
en vervolgens op Opnieuw ordenen.
-
Gebruik de pijlen om de kolom omhoog of omlaag te verplaatsen.
-
Sluit Ordinaal wijzigen wanneer u klaar bent.
Role-playing dimensies
Een role-playing dimensie is dezelfde dimensie die meerdere keren binnen hetzelfde sterschema wordt gebruikt, maar met verschillende betekenissen. Dit wordt vaak gezien bij de dimensies Datum en Klant. Uw sterschema kan bijvoorbeeld twee Datum-entiteiten hebben, één die de Besteldatum vertegenwoordigt en de andere die de Ontvangstdatum vertegenwoordigt.
De rolnaam van een dimensie toevoegen of bewerken:
- Klik op het pictogram
in het dimensieknooppunt en selecteer Dimensienaam bewerken in dit sterschema.
-
Voer in het dialoogvenster Dimensienaam bewerken in dit sterschema een naam in (of bewerk de bestaande naam) in het veld Dimensienaam in dit sterschema en klik op OK.
De nieuwe naam verschijnt onder de oorspronkelijke dimensienaam.
Aanvullende beheeropties
De volgende tabel beschrijft aanvullende beheeropties:
| Om | Doe dit |
|---|---|
| Aanvullende brongegevenssets toevoegen | Zie Uw brongegevens selecteren. |
| Aanvullende feiten toevoegen | Zie Een feit toevoegen |
| Aanvullende dimensies toevoegen | Zie Dimensies en een feit toevoegen aan de datamart. |
| Een dimensie verwijderen | Selecteer de dimensie in het deelvenster Dimensies en selecteer vervolgens Verwijderen in het menu |
| Een feit verwijderen | Selecteer het feit in het deelvenster Feiten en selecteer vervolgens Verwijderen in het menu |
| Een datamart opnieuw maken |
Klik op de knop InformatieAls er problemen met afzonderlijke tabellen zijn, wordt aanbevolen om eerst de tabellen opnieuw te laden voordat u ze opnieuw maakt. Door het opnieuw maken van de tabellen kunnen historische gegevens verloren gaan. Als er grote wijzigingen zijn, moet u ook downstream gegevenstaken voorbereiden die gebruikmaken van de opnieuw gemaakte gegevenstaken om de gegevens te laden.
|
| Een actieve datamart-taak stoppen | Klik op de knop Stoppen in de rechterbovenhoek. |
| Een datamart-taak voorbereiden |
Klik op de knop
U kunt de voortgang volgen onder Voortgang voorbereiding in het onderste deel van het scherm. InformatieVoordat u een taak voorbereidt, stopt u alle taken die direct downstream zijn.
|
Een datamart-taak plannen
U kunt een datamart-taak plannen om periodiek te worden bijgewerkt. U kunt een op tijd gebaseerd schema instellen of de taak instellen om te worden uitgevoerd wanneer invoergegevenstaken zijn voltooid.
Klik op ... bij een gegevenstaak en selecteer Planning om een schema te maken. De standaard planningsinstelling wordt overgenomen van de instellingen in het project. Voor meer informatie over standaardinstellingen, zie Standaardwaarden voor datamart.
U moet Planning instellen op Aan om het schema in te schakelen.
Op tijd gebaseerde schema's
U kunt een op tijd gebaseerd schema gebruiken om de taak uit te voeren, ongeacht wanneer de verschillende invoerbronnen worden bijgewerkt.
-
Selecteer Op een specifiek tijdstip in De gegevenstaak uitvoeren.
U kunt een schema per uur, dagelijks, wekelijks of maandelijks instellen.
Op gebeurtenissen gebaseerde schema's
U kunt een op gebeurtenissen gebaseerd schema gebruiken om de taak uit te voeren wanneer invoergegevenstaken zijn voltooid.
-
Selecteer Bij een specifieke gebeurtenis in De gegevenstaak uitvoeren.
U kunt selecteren of u de taak wilt uitvoeren wanneer een van de invoertaken met succes is voltooid, of wanneer een van een selectie van invoertaken met succes is voltooid.
Gegevens opnieuw laden
U kunt gegevens handmatig opnieuw laden. Dit is handig wanneer er problemen zijn met een of meer tabellen.
-
Open de gegevenstaak en selecteer het tabblad Monitor.
-
Selecteer de tabellen die u opnieuw wilt laden.
Wanneer een dimensie is geselecteerd om opnieuw te laden, worden alle feiten die die dimensie gebruiken ook opnieuw geladen om de integriteit te behouden.
-
Klik op Tabellen opnieuw laden.
U kunt het opnieuw laden annuleren voor tabellen die in behandeling zijn voor opnieuw laden door op Opnieuw laden annuleren te klikken. Dit heeft geen invloed op tabellen die al opnieuw zijn geladen, en het opnieuw laden dat momenteel wordt uitgevoerd, wordt voltooid.
Het opnieuw laden wordt uitgevoerd door:
-
De geselecteerde dimensies en feiten af te kappen.
-
De geselecteerde dimensietabellen uit de stroomopwaartse gegevenstaak te laden.
-
De feitentabellen uit de stroomopwaartse gegevenstaak te laden. Dit omvat:
-
Expliciet geselecteerde feitentabellen.
-
Feitentabellen die gerelateerd zijn aan een dimensie die opnieuw wordt geladen.
-
Een taak verwijderen
U kunt de gegevenstaak verwijderen als deze niet actief is en er geen afhankelijkheden zijn van downstreamtaken in hetzelfde project.
-
Klik in de Pipeline project-weergave van het project op
bij een taak en selecteer Verwijderen.
Artefacten (tabellen en weergaven) die door de taak zijn gemaakt, worden ook verwijderd, tenzij u ervoor kiest om ze te behouden.
Taakinformatie weergeven
Klik op in de menubalk om taakinformatie weer te geven, zoals:
-
Eigenaar
-
Ruimte
-
Gegevensplatform
-
Project-id
-
Runtime-id gegevenstaak
Datamart-instellingen
Klik op de werkbalkknop Instellingen om het dialoogvenster Instellingen: <datamart-naam> te openen.
Algemene instellingen
Op het tabblad Algemeen zijn de volgende instellingen beschikbaar:
- Database: De database waarin de datamart wordt gemaakt
- Gegevenstaakschema: Het schema waarin de gegevenssets worden gemaakt
- Intern schema: Het schema waarin de interne gegevenssets worden gemaakt
-
Standaard hoofdlettergebruik van schemanaam
U kunt het standaard hoofdlettergebruik voor alle schemanamen instellen. Als uw database is geconfigureerd om hoofdlettergebruik af te dwingen, heeft deze optie geen effect.
- Prefix voor alle tabellen en weergaven
U kunt een prefix instellen voor alle tabellen en weergaven die met deze taak zijn gemaakt.
InformatieU moet een unieke prefix gebruiken als u een databaseschema in verschillende gegevenstaken wilt gebruiken. -
Publiceren naar catalogus
Selecteer deze optie om deze versie van de gegevens als gegevensverzameling te publiceren naar Catalogus. De catalogusinhoud wordt bijgewerkt de volgende keer dat u deze taak voorbereidt.
Ga voor meer informatie over Catalogus naar Uw gegevens begrijpen met catalogushulpmiddelen.
Runtime-instellingen
Op het tabblad Runtime zijn de volgende instellingen beschikbaar:
- Parallelle uitvoering: Voer het maximale aantal databaseverbindingen in dat Qlik Cloud mag openen voor de taak. Het standaardaantal is 10.
- Warehouse: Alleen relevant voor Snowflake. De naam van het Snowflake-datawarehouse.
Instellingen voor weergavetype
De instellingen voor weergavetype zijn alleen van toepassing op Snowflake.
-
Standaardweergaven
Gebruik Standaardweergaven voor de meeste gevallen.
-
Snowflake veilige weergaven
Gebruik Snowflake veilige weergaven voor weergaven die zijn bestemd voor gegevensprivacy of de bescherming van gevoelige informatie, zoals weergaven die zijn gemaakt om de toegang tot gevoelige gegevens te beperken die niet mogen worden blootgesteld aan alle gebruikers van de onderliggende tabellen.
Informatie Snowflake veilige weergaven kunnen langzamer worden uitgevoerd dan Standaardweergaven.
Instellingen voor tabeltype
Deze instellingen zijn alleen beschikbaar in projecten met Snowflake als gegevensplatform.
-
Tabeltype
U kunt kiezen welk type tabel u wilt gebruiken:
-
Snowflake-tabellen
-
Snowflake-beheerde Iceberg-tabellen
U moet de standaardnaam van het externe volume instellen in Snowflake extern volume.
-
-
Te gebruiken cloudopslagmap
Selecteer welke map u wilt gebruiken voor het tijdelijk opslaan van gegevens in het tussenopslaggebied.
-
Standaardmap
Hiermee wordt een map gemaakt met de standaardnaam: <projectnaam>/<gegevenstaaknaam>.
-
Hoofdmap
Sla gegevens op in de hoofdmap van de opslag.
-
Map
Geef een mapnaam op om te gebruiken.
-
-
Synchroniseren met Snowflake Open Catalog
Schakel dit in om Snowflake Open Catalog de bestanden in de cloud bestandsopslag te laten beheren.
Best practices
-
Het is niet mogelijk om de bron voor een gegevensset te wijzigen als er feiten en dimensies zijn toegevoegd. Als u flexibel wilt zijn, kunt u een voorafgaande Transformeren-taak toevoegen met niet-gematerialiseerde weergaven die kunnen worden gebruikt om bronnen te wijzigen en ook om een model te hebben voor alle brontaken.
Beperkingen
Er zijn beperkingen als u brongegevensverzamelingen gebruikt die aan al deze voorwaarden voldoen:
-
Gemaakt door SQL-transformatie of een transformatiestroom
-
Niet-gematerialiseerd
-
Historische gegevensopslag (type 2) is uitgeschakeld
Deze gegevensverzamelingen worden bij elke uitvoering als bijgewerkt beschouwd, wat de efficiëntie en kosten kan beïnvloeden. U kunt dit verminderen door:
-
De te materialiseren brongegevensverzamelingen wijzigen.
-
Expliciete transformaties voor gegevensverzamelingen gebruiken.
-
Algemene regels maken om meerdere gegevensverzamelingen te transformeren.
Relaties
-
Het is niet mogelijk om gegevens uit twee gegevensverzamelingen met elkaar in verband te brengen. Maak een transformatietaak waarbij u de relatie in het gegevensmodel definieert en gebruik de transformatietaak als bron voor de taak.
-
Wanneer twee gegevensverzamelingen aan elkaar gerelateerd zijn in het gegevensmodel, zullen beide gegevensverzamelingen beschikbaar zijn in de taak, zelfs als u slechts één van de gegevensverzamelingen hebt geselecteerd.