Struttura vista data mart
Questo argomento descrive le colonne intestazione interne (identificabili dal relativo prefisso hdr__) delle viste data mart. Le pipeline di dati spesso terminano in un data mart, che denormalizza i dati in schemi stella. I fatti presentano una struttura pratica per il consumo da parte di analisti mediante l'utilizzo di modelli dimensionali. Pertanto, la comprensione del ruolo delle colonne intestazione consentirà di generare report più dettagliati per l'analisi e il consumo da parte di applicazioni downstream.
Vista Fatti
Visualizzare il formato nome: <DATA_ASSET_SCHEMA>.[<PREFIX>]<FACT>
Le seguenti colonne di intestazione vengono aggiunte alla struttura della vista.
Colonna |
Tipo |
Descrizione |
---|---|---|
hdr__deleted | Booleano |
Indica se il record è stato eliminato o meno dalla tabella dei fatti. |
hdr_{dimension-name}_key_id | int64 |
Fare riferimento alle dimensioni Tipo 1 e Tipo 2. La vista dei fatti contiene una colonna separata per ogni dimensione nel fatto. Esempio: hdr__EMPLOYEES_key_id |
Vista dimensione Tipo 1
Visualizzare il formato nome: <DATA_ASSET_SCHEMA>.[<PREFIX>]<DIMENSION>
Le seguenti colonne di intestazione vengono aggiunte alla struttura della vista.
Colonna |
Tipo |
Descrizione |
---|---|---|
hdr_{dimension-name}_key_id | int64 |
Sequenza incrementata per record. |
hdr__deleted | Booleano |
Indica se il record è stato eliminato o meno dalla tabella dimensione. |
Vista dimensione Tipo 2
Visualizzare il formato nome: <INTERNAL_SCHEMA>.[<PREFIX>]<DIMENSION>
Le seguenti colonne di intestazione vengono aggiunte alla struttura della vista.
Colonna |
Tipo |
Descrizione |
---|---|---|
hdr_{dimension-name}_key_id |
int64 |
Sequenza incrementata per record. |
hdr__from_timestamp | timestamp |
La data e ora di inizio in UTC per questa versione del record. Per esempio, la colonna può indicare la data in cui un cliente example, ha iniziato a vivere a un determinato indirizzo. Questa colonna consente di eseguire le seguenti azioni:
Per una dimensione Tipo 2 con entità denormalizzate, la data e l'ora coincidono con il set di dati aggiornato nell'asset di dati Archiviazione o Transformazione. |
hdr__to_timestamp | timestamp |
La data e ora di fine in UTC della versione del record. La colonna viene utilizzata per delimitare l'intervallo di date per la versione di un determinato record. Ad esempio, la colonna può indicare la data in cui un cliente ha cessato di vivere presso un determinato indirizzo. Vedere anche la descrizione della colonna hdr_from_timestamp riportata sopra. |
hdr__operation | varchar(1) |
Operazioni di caricamento completo:
Cambia operazioni di elaborazione (utilizzando le tabelle Modifica):
Le azioni risultanti dal confronto e dall'applicazione delle operazioni:
|
hdr__was_current_from_timestamp | timestamp |
Mostra la data e ora in UTC dell'ultimo aggiornamento applicato al record. Questa colonna, insieme alla colonna hdr__was_current_to_timestamp, consente di analizzare i dati in base a una data specifica, utilizzando i dati noti allora. Ad esempio, supponiamo che ogni giorno si debba calcolare il totale delle vendite effettuate il giorno precedente alle 2:00 del mattino. In questo caso, il 1 dicembre la somma totale degli ordini completati il giorno precedente sarebbe di $1.000.000. Tuttavia, il 2 dicembre viene aggiunto un record che stabilisce che il 30 novembre è stato effettuato un ordine per un totale di $500.000. In questo caso, l'importo per gli ordini per il 30 novembre, in realtà ammonterebbe $1.500.000! Però, se si genera un report per la somma totale degli ordini del 30 novembre in base ai dati di cui si disponeva il 1 dicembre alle 2:00, il risultato sarebbe ancora $1.000.000. |
hdr__was_current_to_timestamp | timestamp |
Questa colonna viene popolata quando un record viene sostituito con uno più recente. Mostra la data e ora in UTC del giorno in cui il record è stato elaborato, e quindi non più il record più recente. Vedere anche la descrizione della colonna hdr__was_current_from_timestamp riportata sopra. |