Crear y administrar data marts
Una vez que haya incorporado sus datos, puede crear galerías de datos (data marts) utilizando los datos de las tareas de almacenamiento o transformación. Puede crear cualquier cantidad de galerías de datos según las necesidades de su negocio. Idealmente, sus galerías de datos deberían contener repositorios de datos resumidos y recopilados para el análisis en una sección o unidad específica dentro de una organización, por ejemplo, el departamento de Ventas.
Requisitos previos
Antes de poder crear un data mart, debe hacer lo siguiente:
- Rellene el almacenamiento con datos (desde el área de aterrizaje) que desee utilizar en su galería de datos o data mart. Para más información, vea Incorporar datos.
- Cree un modelo relacional de conjuntos de datos para definir las relaciones entre los conjuntos de datos de origen. Para más información, vea Crear un modelo de datos.
Crear una galería de datos (data mart)
Para crear un una galería de datos o data mart:
-
Abra su proyecto de datos haciendo clic en
al final de la fila y seleccionando Abrir.
-
Siga una de las opciones siguientes:
- Haga clic en el botón Agregar nuevo en la parte superior derecha y seleccione Crear data mart.
-
Localice el activo de almacenamiento y haga clic en el icono
en la esquina inferior derecha. Después seleccione Crear data mart.
Se abre el diálogo Crear data mart.
-
Proporcione un nombre para su galería data mart y, si lo desea, proporcione también una descripción.
-
Si desea configurar el data mart más adelante, desmarque la casilla de verificación Abrir y luego haga clic en Crear. De lo contrario, simplemente haga clic en Crear.
La galería de datos se abre en la pestaña Data mart.
- Seleccione su fuente de datos tal como se describe en Seleccionar sus datos de origen
- Si desea que el data mart contenga dimensiones, agregue dimensiones tal como se describe en Agregar dimensiones y un hecho al data mart
- Si desea que el data mart contenga un hecho, agregue un hecho tal como se describe en Añadir un hecho
- Si el data mart contiene dimensiones y un hecho, agregue las dimensiones a su esquema en estrella como se describe en Construir un esquema en estrella
- Cree los conjuntos de datos en su data mart y rellénelos con datos como se describe en Poblar su data mart
Seleccionar sus datos de origen
Sus datos de origen se seleccionan de los conjuntos de datos contenidos en la tarea de Almacenamiento.
Para ello:
-
Haga clic en el botón Seleccionar datos de origen en medio de la pestaña o haga clic en el botón de la barra de herramientas Seleccionar datos de origen.
Se abre el cuadro de diálogo Seleccionar datos de origen.
-
En la lista desplegable Activos de datos, seleccione una Tarea de almacenamiento o una Tarea transformación, si creó transformaciones.
-
Deje el porcentaje predeterminado para buscar todos los conjuntos de datos o indique el nombre de un conjunto de datos específico para buscar. Luego haga clic en Buscar.
-
Seleccione los conjuntos de datos que desee y luego haga clic en Agregar tablas seleccionadas.
-
Haga clic en Aceptar para cerrar el cuadro de diálogo y luego continúe con Agregar un esquema en estrella y/o Añadir dimensiones.
Agregar dimensiones y un hecho al data mart
Una vez que haya seleccionado sus datos de origen, puede proceder a construir su data mart. Un data mart puede tener un conjunto de datos de hechos, conjuntos de datos de dimensiones o una combinación de ambos (donde los conjuntos de datos de dimensiones están lógicamente relacionados con el conjunto de datos de hechos).
Añadir dimensiones
Para añadir una dimensión:
-
Haga clic en el botón Añadir dimensión.
Se abre el diálogo Añadir dimensión.
-
Están disponibles las siguientes opciones:
- Conjunto de datos con mayor nivel de granularidad: Seleccione un conjunto de datos.
- Nombre: Especifique un nombre que mostrar para la dimensión. El valor predeterminado es el nombre del conjunto de datos más granular.
- Descripción: Si lo desea, proporcione una descripción.
- Tipo de historial: Seleccione una de las siguientes opciones:
- Tipo 1: el registro de la dimensión se actualizará cada vez que se actualicen los registros correspondientes en el Almacenamiento.
- Tipo 2: se agregará un nuevo registro a la dimensión cada vez que se actualice el registro correspondiente en el Almacenamiento.
-
Conjunto de datos relacionado para desnormalizar: Cualquier conjunto de datos que se pueda desnormalizar en el conjunto de datos de dimensiones (según las relaciones en el modelo de activos de datos de origen) estará disponible para su selección aquí.
Ejemplo de una dimensión que se puede desnormalizar
-
Haga clic en Aceptar para guardar su configuración.
La dimensión se agregará a la lista de Dimensiones, a la izquierda.
Ver información sobre una dimensión
Cuando seleccione una dimensión, la pestaña Modelo relacional de origen se mostrará en el panel central. Esta pestaña muestra los conjuntos de datos de origen que están consolidados en la dimensión. Los conjuntos de datos que eligió desnormalizar cuando agregó la dimensión se mostrarán seleccionados (y atenuados).
Añadir un hecho
Para añadir un hecho:
-
Haga clic en el botón Agregar esquema en estrella.
Se abre el diálogo Agregar esquema en estrella.
-
Están disponibles las siguientes opciones:
- Hecho Seleccione un conjunto de datos para que constituya el hecho. El conjunto de datos debe definir la granularidad del hecho que está creando.
- Nombre: Especifique un nombre para mostrar para el hecho. El valor predeterminado es el nombre del hecho.
- Descripción: Si lo desea, proporcione una descripción.
- Conjuntos de datos relacionados para desnormalizar Cualquier conjunto de datos que se pueda desnormalizar en su conjunto de datos de hechos estará disponible para su selección aquí.
- Avanzado
- Usar datos actuales: Cuando se selecciona (es el valor predeterminado), el hecho no contendrá una columna de fecha de transacción.
-
Elegir la fecha de transacción: Para ubicar datos de acuerdo con una fecha de transacción específica, seleccione esta opción y luego seleccione una columna de fecha. Esto es útil si su esquema en estrella contiene dimensiones de tipo 2 y necesita encontrar los datos correctos para una transacción específica. Por ejemplo, si un cliente tiene varias direcciones, sería posible encontrar la dirección correcta según la fecha del pedido.
Caso de uso a modo de ejemplo:
Un minorista necesita crear un data mart para analizar la relación entre pedidos y clientes. El data mart debe poder dar respuesta a consultas como: ¿Qué estado de EE. UU. tuvo la mayor cantidad de pedidos en el cuarto trimestre de 2022?
Si el minorista selecciona la opción Usar datos actuales, solo se incluirá en el cálculo la versión de registro más actual en la tabla Clientes.
Ignorar la fecha de la transacción dará como resultado datos inexactos, como se ilustra a continuación:
Sin embargo, si el minorista selecciona la opción Elegir fecha de transacción, los pedidos del cliente se asociarán con la versión de registro correcta en la tabla Clientes.
Esto permitirá al minorista calcular con precisión la suma total de pedidos por estado en el cuarto trimestre de 2022.
Nota de sugerenciaTenga en cuenta que la fecha de transacción se puede aprovechar de manera diferente en cada data mart, según las necesidades comerciales. Por ejemplo, en un data mart podría usarse para analizar fechas de pedidos, mientras que en otro data mart podría usarse para analizar fechas de envío.
-
Haga clic en Aceptar para guardar su configuración.
El hecho se agregará a la lista de Esquemas en estrella a la izquierda.
Ver información sobre el hecho
Cuando selecciona un hecho, se muestran las siguientes pestañas en el panel central:
- Modelo de esquema en estrella (predeterminado): muestra una representación gráfica de las relaciones del conjunto de datos dentro del data mart.
-
Modelo de hechos: muestra cualquier conjunto de datos relacionado con el conjunto de datos de hechos. Los conjuntos de datos que eligió desnormalizar cuando agregó el hecho se mostrarán seleccionados (y atenuados).
El hecho Detalles de pedidos con un conjunto de datos Pedidos desnormalizado - Fecha de transacción: El nombre de la columna de transacción si seleccionó la opción Elegir la fecha de transacción al agregar el hecho.
Construir un esquema en estrella
Una vez que haya agregado dimensiones a su data mart, puede proceder a conectarlas con su conjunto de datos de hechos, creando así un esquema en estrella.
Para ello:
- Seleccione su esquema en estrella en la lista Esquemas en estrella, a la izquierda.
-
Seleccione qué dimensiones agregar de la lista Dimensiones recomendadas a la derecha.
Las dimensiones recomendadas se muestran conectadas con el conjunto de datos de hechos mediante una línea de puntos.
-
Haga clic en Aplicar para agregar las dimensiones.
Las dimensiones se mostrarán conectadas con el conjunto de datos de hechos mediante una línea continua.
Poblar su data mart
Una vez que haya diseñado su data mart, puede proceder a rellenarlo.
Para ello:
-
Haga clic en el botón Preparar de la barra de herramientas en la parte superior derecha.
El proceso de preparación incluye la creación de conjuntos de datos y vistas en el data mart y la actualización del catálogo.
Una vez completada la preparación, el botón Preparar cambia a Ejecutar.
-
Haga clic en el botón Ejecutar.
La ventana cambia a la vista Supervisar, mostrando el progreso de carga y el estado de los conjuntos de datos en su data mart.
Cada registro de origen será procesado por el data mart, incluso los registros eliminados. Esto se hace para garantizar que se mantenga la información histórica.
Administrar los data marts
Esta sección describe las diversas opciones disponibles para administrar sus conjuntos de datos y data marts.
Refinar los hechos o dimensiones
En la pestaña Conjuntos de datos, puede realizar varias operaciones para refinar sus hechos y dimensiones, como crear reglas de transformación (por ejemplo, reemplazar valores de columnas) y agregar expresiones a nivel de columna. La pestaña Conjuntos de datos se encuentra a la derecha de la pestaña Data mart:
Agregar reglas
Para una explicación de cómo agregar reglas globales, vea Crear reglas para transformar múltiples conjuntos de datos
Añadir columnas y expresiones
Para obtener una explicación de cómo agregar columnas y expresiones, vea Agregar columnas a un conjunto de datos.
Opciones de administración adicionales
La tabla siguiente describe opciones de administración adicionales:
Para | Haga esto |
---|---|
Agregar conjuntos de datos fuente adicionales | Vea Seleccionar sus datos de origen. |
Añadir hechos adicionales | Vea Añadir un hecho |
Agregar dimensiones adicionales | Vea Agregar dimensiones y un hecho al data mart. |
Eliminar una dimensión | Seleccione la dimensión en el panel Dimensiones y luego seleccione Eliminar en el menú |
Eliminar un hecho | Seleccione el hecho en el panel Esquemas en estrella y luego seleccione Eliminar en el menú |
Volver a crear un data mart | Haga clic en el botón |
Detener una tarea de data mart en ejecución | Haga clic en el botón Detener en la parte superior derecha. |
Programar una tarea de data mart
Puede programar una tarea de data mart para que se actualice periódicamente. Puede establecer una programación basada en el tiempo o configurar la tarea para que se ejecute cuando las tareas de datos de entrada hayan terminado de ejecutarse.
Haga clic en ... en una tarea de datos y seleccione Programación para crear una programación. La configuración de programación predeterminada se hereda de la configuración del proyecto de datos. Para obtener más información sobre la configuración predeterminada, vea Valores predeterminados del data mart.
Siempre debe establecer Programación en Activado para habilitar la programación.
Programaciones basadas en el tiempo
Puede utilizar una programación basada en el tiempo para ejecutar la tarea independientemente de cuándo se actualicen las distintas fuentes de entrada.
-
Seleccione A una hora específica en Ejecutar la tarea de datos.
Puede establecer una programación por hora, diaria, semanal o mensual.
Programaciones basadas en eventos
Puede usar un programa basado en eventos para ejecutar la tarea cuando las tareas de datos de entrada hayan terminado de ejecutarse.
-
Seleccione En un evento específico en Ejecutar la tarea de datos.
Puede seleccionar si desea ejecutar la tarea cuando cualquiera de las tareas de entrada se haya completado correctamente, o cuando alguna de las tareas de entrada seleccionadas se haya completado correctamente.
Configuración de un data mart
Haga clic en el botón de la barra de herramientas Configuración para abrir el cuadro de diálogo Configuración: <nombre-data-mart>.
La pestaña General
En la pestaña General, están disponibles los siguientes ajustes:
- Base de datos: La base de datos en la que se creará el data mart.
- Esquema de activos de datos: El esquema en el que se crearán los conjuntos de datos.
- Esquema interno: El esquema en el que se crearán los conjuntos de datos internos.
La pestaña Tiempo de ejecución
En la pestaña Tiempo de ejecución, están disponibles las siguientes opciones:
- Ejecución en paralelo: Indique el número máximo de conexiones de base de datos que se le permite abrir a Qlik Cloud para la tarea. El número predeterminado es 10.
- Almacén: solo relevante para Snowflake. El nombre del almacén de datos de Snowflake.