Vai al contenuto principale Passa a contenuto complementare

Struttura vista data mart

Questo argomento descrive le colonne intestazione interne (identificabili dal relativo prefisso hdr__) delle viste data mart. Le pipeline di dati spesso terminano in un data mart, che denormalizza i dati in schemi stella. I fatti presentano una struttura pratica per il consumo da parte di analisti mediante l'utilizzo di modelli dimensionali. Pertanto, la comprensione del ruolo delle colonne intestazione consentirà di generare report più dettagliati per l'analisi e il consumo da parte di applicazioni downstream.

Vista Fatti

Visualizzare il formato nome: <DATA_ASSET_SCHEMA>.[<PREFIX>]<FACT>

Le seguenti colonne di intestazione vengono aggiunte alla struttura della vista.

Campi intestazione tabella

Colonna

Tipo

Descrizione

hdr__deleted Booleano

Indica se il record è stato eliminato o meno dalla tabella dei fatti.

hdr_{dimension-name}_key_id int64

Fare riferimento alle dimensioni Tipo 1 e Tipo 2. La vista dei fatti contiene una colonna separata per ogni dimensione nel fatto.

Esempio:

hdr__EMPLOYEES_key_id

Vista dimensione Tipo 1

Visualizzare il formato nome: <DATA_ASSET_SCHEMA>.[<PREFIX>]<DIMENSION>

Le seguenti colonne di intestazione vengono aggiunte alla struttura della vista.

Campi intestazione tabella

Colonna

Tipo

Descrizione

hdr_{dimension-name}_key_id int64

Sequenza incrementata per record.

hdr__deleted Booleano

Indica se il record è stato eliminato o meno dalla tabella dimensione.

Vista dimensione Tipo 2

Visualizzare il formato nome: <INTERNAL_SCHEMA>.[<PREFIX>]<DIMENSION>

Le seguenti colonne di intestazione vengono aggiunte alla struttura della vista.

Campi intestazione tabella

Colonna

Tipo

Descrizione

hdr_{dimension-name}_key_id

int64

Sequenza incrementata per record.

hdr__from_timestamp timestamp

La data e ora di inizio in UTC per questa versione del record. Per esempio, la colonna può indicare la data in cui un cliente example, ha iniziato a vivere a un determinato indirizzo.

Questa colonna consente di eseguire le seguenti azioni:

  • Analizzare i dati in base a informazioni storiche. Ad esempio, è possibile determinare l'intervallo di tempo in cui lo stato di un ordine è rimasto in attesa, o come il cambio di indirizzo di un cliente può avere effetto sulle vendite rispetto ai dati dell'anno precedente.
  • Analizzare i dati in base alla data, ma stavolta utilizzando i dati appresi. Al contrario, hdr__was_current_from_timestamp descritto di seguito consente di analizzare i dati in base a una data specifica, utilizzando i dati noti allora.

Per una dimensione Tipo 2 con entità denormalizzate, la data e l'ora coincidono con il set di dati aggiornato nell'asset di dati Archiviazione o Transformazione.

hdr__to_timestamp timestamp

La data e ora di fine in UTC della versione del record. La colonna viene utilizzata per delimitare l'intervallo di date per la versione di un determinato record. Ad esempio, la colonna può indicare la data in cui un cliente ha cessato di vivere presso un determinato indirizzo.

Vedere anche la descrizione della colonna hdr_from_timestamp riportata sopra.

hdr__operation varchar(1)

Operazioni di caricamento completo:

  • L: Inserito durante il caricamento completo

Cambia operazioni di elaborazione (utilizzando le tabelle Modifica):

  • D: Eliminato
  • U: Aggiornato
  • I: inserito.

Le azioni risultanti dal confronto e dall'applicazione delle operazioni:

  • d: Eliminato
  • u: Aggiornato
  • i: Inserito
hdr__was_current_from_timestamp timestamp

Mostra la data e ora in UTC dell'ultimo aggiornamento applicato al record.

Questa colonna, insieme alla colonna hdr__was_current_to_timestamp, consente di analizzare i dati in base a una data specifica, utilizzando i dati noti allora. Ad esempio, supponiamo che ogni giorno si debba calcolare il totale delle vendite effettuate il giorno precedente alle 2:00 del mattino. In questo caso, il 1 dicembre la somma totale degli ordini completati il giorno precedente sarebbe di $1.000.000. Tuttavia, il 2 dicembre viene aggiunto un record che stabilisce che il 30 novembre è stato effettuato un ordine per un totale di $500.000. In questo caso, l'importo per gli ordini per il 30 novembre, in realtà ammonterebbe $1.500.000! Però, se si genera un report per la somma totale degli ordini del 30 novembre in base ai dati di cui si disponeva il 1 dicembre alle 2:00, il risultato sarebbe ancora $1.000.000.

hdr__was_current_to_timestamp timestamp

Questa colonna viene popolata quando un record viene sostituito con uno più recente. Mostra la data e ora in UTC del giorno in cui il record è stato elaborato, e quindi non più il record più recente.

Vedere anche la descrizione della colonna hdr__was_current_from_timestamp riportata sopra.

Hai trovato utile questa pagina?

Se riscontri problemi con questa pagina o con il suo contenuto – un errore di battitura, un passaggio mancante o un errore tecnico – facci sapere come possiamo migliorare!