Estructura de vista de data mart
Este tema describe las columnas de encabezado internas (identificables por su prefijo hdr__) de las vistas de data mart. Las canalizaciones de datos a menudo culminan en data marts, que desnormalizan los datos en esquemas en estrella. Los hechos presentan una estructura adecuada para el consumo por parte de los analistas que utilizan modelos dimensionales. Por lo tanto, comprender la función de las columnas de encabezado le permitirá generar informes más enfocados para el análisis y el consumo de las aplicaciones posteriores.
Vista de hechos
Véase el formato de nombre: <ESQUEMA_ACTIVO_DATOS>.[<PREFIJO>]<HECHO>
Las siguientes columnas de encabezado se agregan a la estructura de la vista:
Columna |
Tipo |
Descripción |
---|---|---|
hdr__deleted | Booleano |
Indica si el registro se eliminó o no de la tabla de hechos. |
hdr_{dimension-name}_key_id | int64 |
Referencia a las dimensiones de Tipo 1 y Tipo 2. La vista de hechos contendrá una columna diferente por cada dimensión del hecho. Ejemplo: hdr__EMPLOYEES_key_id |
Vista de dimensión tipo 1
Véase el formato de nombre: <ESQUEMA_ACTIVO_DATOS>.[<PREFIJO>]<DIMENSIÓN>
Las siguientes columnas de encabezado se agregan a la estructura de la vista:
Columna |
Tipo |
Descripción |
---|---|---|
hdr_{dimension-name}_key_id | int64 |
Secuencia incrementada por registro. |
hdr__deleted | Booleano |
Indica si el registro se eliminó o no de la tabla de dimensiones. |
Vista de dimensión tipo 2
Véase el formato de nombre: <ESQUEMA_INTERNO>.[<PREFIJO>]<DIMENSIÓN>
Las siguientes columnas de encabezado se agregan a la estructura de la vista:
Columna |
Tipo |
Descripción |
---|---|---|
hdr_{dimension-name}_key_id |
int64 |
Secuencia incrementada por registro. |
hdr__from_timestamp | timestamp |
La marca de tiempo (fecha-hora) de inicio UTC para esta versión del registro. Por ejemplo, la columna podría indicar la fecha en que un cliente comenzó a vivir en una determinada dirección. Esta columna le permite:
Para una dimensión de tipo 2 con entidades desnormalizadas, esta es la marca de tiempo del conjunto de datos actualizado en el activo de datos de almacenamiento o transformación. |
hdr__to_timestamp | timestamp |
La marca de tiempo de finalización UTC de la versión del registro. La columna se utiliza para delimitar el rango de fechas para una versión de registro determinada. Por ejemplo, la columna podría indicar la fecha en que un cliente dejó de vivir en una determinada dirección. Vea también la descripción de la columna hdr_from_timestamp anterior. |
hdr__operation | varchar(1) |
Operaciones de Carga completa:
Operaciones de procesamiento de cambios (usando tablas de cambios):
Acciones resultantes de operaciones de comparación y aplicación:
|
hdr__was_current_from_timestamp | timestamp |
Muestra la marca de tiempo UTC de cuando se aplicó la última actualización al registro. Esta columna, junto con la columna hdr__was_current_to_timestamp, le permite analizar datos por una fecha específica, sabiendo solo lo que sabía en ese momento. Por ejemplo, digamos que todos los días calcula el total de los pedidos del día anterior a las 2:00 am. Entonces, el 1 de diciembre, la suma total de los pedidos del día anterior es de 1.000.000 USD. Sin embargo, el 2 de diciembre se inserta un registro que dice que el 30 de noviembre se realizó un pedido por un total de 500.000 USD. Así que el monto del pedido para el 30 de noviembre fue en realidad de 1.500.000 USD. Sin embargo, si genera un informe para la suma total de pedidos el 30 de noviembre en función de lo que estaba vigente el 1 de diciembre a las 2:00 a. m., el resultado seguiría siendo 1.000.000 USD. |
hdr__was_current_to_timestamp | timestamp |
Esta columna se completa cuando un registro se reemplaza por un registro más nuevo. Muestra la marca de tiempo UTC de cuando se procesó el registro y, por lo tanto, ya no es el registro más reciente. Vea también la descripción de la columna hdr__was_current_from_timestamp arriba. |