Saltar al contenido principal Saltar al contenido complementario

Estructura de vista de data mart

Este tema describe las columnas de encabezado internas (identificables por su prefijo hdr__) de las vistas de data mart. Las canalizaciones de datos a menudo culminan en data marts, que desnormalizan los datos en esquemas en estrella. Los hechos presentan una estructura adecuada para el consumo por parte de los analistas que utilizan modelos dimensionales. Por lo tanto, comprender la función de las columnas de encabezado le permitirá generar informes más enfocados para el análisis y el consumo de las aplicaciones posteriores.

Vista de hechos

Véase el formato de nombre: <ESQUEMA_ACTIVO_DATOS>.[<PREFIJO>]<HECHO>

Las siguientes columnas de encabezado se agregan a la estructura de la vista:

Campos de cabecera de la tabla

Columna

Tipo

Descripción

hdr__deleted Booleano

Indica si el registro se eliminó o no de la tabla de hechos.

hdr_{dimension-name}_key_id int64

Referencia a las dimensiones de Tipo 1 y Tipo 2. La vista de hechos contendrá una columna diferente por cada dimensión del hecho.

Ejemplo:

hdr__EMPLOYEES_key_id

Vista de dimensión tipo 1

Véase el formato de nombre: <ESQUEMA_ACTIVO_DATOS>.[<PREFIJO>]<DIMENSIÓN>

Las siguientes columnas de encabezado se agregan a la estructura de la vista:

Campos de cabecera de la tabla

Columna

Tipo

Descripción

hdr_{dimension-name}_key_id int64

Secuencia incrementada por registro.

hdr__deleted Booleano

Indica si el registro se eliminó o no de la tabla de dimensiones.

Vista de dimensión tipo 2

Véase el formato de nombre: <ESQUEMA_INTERNO>.[<PREFIJO>]<DIMENSIÓN>

Las siguientes columnas de encabezado se agregan a la estructura de la vista:

Campos de cabecera de la tabla

Columna

Tipo

Descripción

hdr_{dimension-name}_key_id

int64

Secuencia incrementada por registro.

hdr__from_timestamp timestamp

La marca de tiempo (fecha-hora) de inicio UTC para esta versión del registro. Por ejemplo, la columna podría indicar la fecha en que un cliente comenzó a vivir en una determinada dirección.

Esta columna le permite:

  • Analizar datos basados en información histórica. Por ejemplo, podría ver el tiempo que un pedido estuvo en estado pendiente o cómo un cambio en la dirección de un cliente afecta las ventas en comparación con los datos del año pasado.
  • Analiza los datos por fecha, pero sabiendo lo que sabe ahora. Por el contrario, la marca de tiempo hdr__was_current_from_timestamp que se describe a continuación le permite analizar datos por una fecha específica, sabiendo solo lo que sabía en ese momento.

Para una dimensión de tipo 2 con entidades desnormalizadas, esta es la marca de tiempo del conjunto de datos actualizado en el activo de datos de almacenamiento o transformación.

hdr__to_timestamp timestamp

La marca de tiempo de finalización UTC de la versión del registro. La columna se utiliza para delimitar el rango de fechas para una versión de registro determinada. Por ejemplo, la columna podría indicar la fecha en que un cliente dejó de vivir en una determinada dirección.

Vea también la descripción de la columna hdr_from_timestamp anterior.

hdr__operation varchar(1)

Operaciones de Carga completa:

  • L: Insertado durante la carga completa

Operaciones de procesamiento de cambios (usando tablas de cambios):

  • D: Eliminado
  • U: Actualizado
  • I: insertado

Acciones resultantes de operaciones de comparación y aplicación:

  • d: Eliminado
  • u: Actualizado
  • i: Insertado
hdr__was_current_from_timestamp timestamp

Muestra la marca de tiempo UTC de cuando se aplicó la última actualización al registro.

Esta columna, junto con la columna hdr__was_current_to_timestamp, le permite analizar datos por una fecha específica, sabiendo solo lo que sabía en ese momento. Por ejemplo, digamos que todos los días calcula el total de los pedidos del día anterior a las 2:00 am. Entonces, el 1 de diciembre, la suma total de los pedidos del día anterior es de 1.000.000 USD. Sin embargo, el 2 de diciembre se inserta un registro que dice que el 30 de noviembre se realizó un pedido por un total de 500.000 USD. Así que el monto del pedido para el 30 de noviembre fue en realidad de 1.500.000 USD. Sin embargo, si genera un informe para la suma total de pedidos el 30 de noviembre en función de lo que estaba vigente el 1 de diciembre a las 2:00 a. m., el resultado seguiría siendo 1.000.000 USD.

hdr__was_current_to_timestamp timestamp

Esta columna se completa cuando un registro se reemplaza por un registro más nuevo. Muestra la marca de tiempo UTC de cuando se procesó el registro y, por lo tanto, ya no es el registro más reciente.

Vea también la descripción de la columna hdr__was_current_from_timestamp arriba.

¿Esta página le ha sido útil?

No dude en indicarnos en qué podemos mejorar si encuentra algún problema en esta página o su contenido, como, por ejemplo, errores tipográficos, pasos que falta o errores técnicos.