Datamartvyns struktur
I det här avsnittet beskrivs de interna rubrikkolumnerna (identifieras via sina hdr__-prefix) i datamartvyerna. Datapipelines kulminerar ofta i datamarter som denormaliseras till star-scheman. I Fakta anges en praktisk struktur för förbrukning av analytiker med hjälp av dimensionell modellering. Genom att förstå rubrikkolumnernas roll kan du därför generera mer fokuserade rapporter för analys och förbrukning av appar nedströms.
Faktavy
Visa namnformatet: <DATA_ASSET_SCHEMA>.[<PREFIX>]<FACT>
Följande rubrikkolumner läggs till i visningsstrukturen.
Kolumn |
Typ |
Beskrivning |
---|---|---|
hdr__deleted | Boolesk |
Anger huruvida posten raderades eller inte från faktatabellen. |
hdr_{dimension-name}_key_id | int64 |
Referens till dimensioner av typ 1 och typ 2. Faktavyn kommer att ha en separat kolumn för varje dimension i fakta. Exempel: hdr__EMPLOYEES_key_id |
Vy för dimension av typ 1
Visa namnformatet: <DATA_ASSET_SCHEMA>.[<PREFIX>]<DIMENSION>
Följande rubrikkolumner läggs till i visningsstrukturen.
Kolumn |
Typ |
Beskrivning |
---|---|---|
hdr_{dimension-name}_key_id | int64 |
Sekvens ökad per post. |
hdr__deleted | Boolesk |
Anger huruvida posten raderades eller inte från dimensionstabellen. |
Vy för dimension av typ 2
Visa namnformatet: <INTERNAL_SCHEMA>.[<PREFIX>]<DIMENSION>
Följande rubrikkolumner läggs till i visningsstrukturen.
Kolumn |
Typ |
Beskrivning |
---|---|---|
hdr_{dimension-name}_key_id |
int64 |
Sekvens ökad per post. |
hdr__from_timestamp | tidsmarkör |
UTC-starttidsmarkören för denna version av posten. Kolumnen kan exempelvis ange det datum en kund flyttade in på en viss adress. Med den här kolumnen kan du:
För en dimension av typ 2 med denormaliserade element är detta tidsmarkören från den uppdaterade datasatsen i lagrings- eller transformeringsdatatillgången. |
hdr__to_timestamp | tidsmarkör |
UTC-slutvärdet för postversionen. Kolumnen används för att avgränsa intervallet med datum för en given postversion. Kolumnen kan exempelvis ange det datum en kund flyttade ut från en viss adress. Se även beskrivningen av kolumnen hdr_from_timestamp ovan. |
hdr__operation | varchar(1) |
Fullständig laddning-operationer:
Operationer för ändringsbearbetning (med ändringstabeller):
Åtgärder till följd av jämförelse- och tillämpningsåtgärder:
|
hdr__was_current_from_timestamp | tidsmarkör |
Visar UTC-tidsmarkören för när den senaste uppdateringen tillämpades på posten. Med denna kolumn tillsammans med hdr__was_current_to_timestamp kan du analysera data efter ett specifikt datum med enbart den kunskap som du hade då. Du kanske exempelvis beräknar totalsumman av föregående dags ordrar vid 2:00. 1 december är totalsumman av föregående dags ordrar 1 000 000 USD. Men 2 december infogas en post som anger att en order på totalt 500 000 USD lades den 30 november. Så ordersumman för 30 november var i verkligheten 1 500 000 USD! Men om du genererar en rapport för den totala ordersumman 30 november baserat på vad som fanns 1 december 2:00 blir resultatet fortfarande 1 000 000 USD. |
hdr__was_current_to_timestamp | tidsmarkör |
Den här kolumnen fylls i när en post ersätts av en nyare post. Den visar UTC-tidsmarkören för när posten bearbetades och därför inte längre den senaste posten. Se även beskrivningen av kolumnen hdr__was_current_from_timestamp ovan. |