Structuur van de datamartweergaven
Dit onderwerp beschrijft de interne koptekstkolommen (herkenbaar aan het voorvoegsel hdr__) van de datamartweergaven. Gegevenspijplijnen culmineren vaak in datamarts, die gegevens denormaliseren tot sterschema's. Feiten bieden een handige structuur voor analisten die gebruikmaken van dimensionale modellering. Als u de rol van de kopkolommen begrijpt, kunt u gerichtere rapporten genereren voor analyse en gebruik door downstream toepassingen.
Feitenweergave
Indeling weergavenaam: <DATA_ASSET_SCHEMA>.[<PREFIX>]<FACT>
De volgende koptekstkolommen worden toegevoegd aan de weergavestructuur.
Kolom |
Type |
Beschrijving |
---|---|---|
hdr__deleted | Booleaanse waarde |
Geeft aan of het record al dan niet uit de feitentabel is verwijderd. |
hdr_{dimension-name}_key_id | int64 |
Refereert aan Type 1 en Type 2 dimensies. De feitenweergave bevat een aparte kolom voor elke dimensie in het feit. Voorbeeld: hdr__EMPLOYEES_key_id |
Type 1 dimensieweergave
Indeling weergavenaam: <DATA_ASSET_SCHEMA>.[<PREFIX>]<DIMENSION>
De volgende koptekstkolommen worden toegevoegd aan de weergavestructuur.
Kolom |
Type |
Beschrijving |
---|---|---|
hdr_{dimension-name}_key_id | int64 |
Reeks oplopend per record. |
hdr__deleted | Booleaanse waarde |
Geeft aan of het record al dan niet uit de dimensietabel is verwijderd. |
Type 2 dimensieweergave
Indeling weergavenaam: <INTERNAL_SCHEMA>.[<PREFIX>]<DIMENSION>
De volgende koptekstkolommen worden toegevoegd aan de weergavestructuur.
Kolom |
Type |
Beschrijving |
---|---|---|
hdr_{dimension-name}_key_id |
int64 |
Reeks oplopend per record. |
hdr__from_timestamp | tijdstempel |
De UTC-starttijdstempel voor deze versie van het record. De kolom kan bijvoorbeeld de datum aangeven waarop een klant op een bepaald adres is gaan wonen. Met deze kolom kunt u:
Voor een Type 2 dimensie met gedenormaliseerde entiteiten is dit de tijdstempel van de bijgewerkte gegevensverzameling in de Opslag of Transformatie gegevensasset. |
hdr__to_timestamp | tijdstempel |
Het UTC-eindtijdstempel van de recordversie. De kolom wordt gebruikt om het datumbereik voor een bepaalde recordversie af te bakenen. De kolom kan bijvoorbeeld de datum aangeven waarop een klant niet meer op een bepaald adres woont. Zie ook de beschrijving van de kolom hdr_from_timestamp hierboven. |
hdr__operation | varchar(1) |
Volledige lading bewerkingen:
Verwerking van wijzigingen (met behulp van wijzigingstabellen):
Acties die voortvloeien uit vergelijkings- en toepassingsbewerkingen:
|
hdr__was_current_from_timestamp | tijdstempel |
Toont het UTC-tijdstempel van wanneer de laatste update werd toegepast op het record. Met deze kolom en de kolom hdr__was_current_to_timestamp kunt u gegevens analyseren op een specifieke datum, waarbij u alleen weet wat u toen wist. Stel dat u bijvoorbeeld het totaal van de bestellingen van de vorige dag dagelijks om 2.00 uur berekent. Op 1 december is de totale som van de bestellingen van de vorige dag $ 1.000.000. Op 2 december wordt echter vastgelegd dat op 30 november een order van $ 500.000 is geplaatst. Het orderbedrag voor 30 november was dus eigenlijk $ 1.500.000! Als u echter een rapport genereert voor de totale som van de bestellingen op 30 november op basis van wat actueel was op 1 december om 2.00 uur, zou het resultaat nog altijd $ 1.000.000 zijn. |
hdr__was_current_to_timestamp | tijdstempel |
Deze kolom wordt ingevuld wanneer een record wordt vervangen door een nieuwer record. Het toont het UTC-tijdstempel van wanneer het record werd verwerkt, en dus niet langer het laatste record. Zie ook de beschrijving van de kolom hdr__was_current_from_timestamp hierboven. |