Crear y administrar data marts
Una vez que haya incorporado sus datos, puede crear galerías de datos (data marts) utilizando los datos de las tareas de almacenamiento o transformación. Puede crear cualquier cantidad de galerías de datos según las necesidades de su negocio. Idealmente, sus galerías de datos deberían contener repositorios de datos resumidos y recopilados para el análisis en una sección o unidad específica dentro de una organización, por ejemplo, el departamento de Ventas.
El procedimiento para crear una galería de datos o data mart es idéntico, independientemente de si su data mart se basa en una tarea de almacenamiento o en una tarea de transformación. Las instrucciones de esta sección asumen que la galería de datos está basada en una tarea de almacenamiento.
Requisitos previos
Antes de poder crear un data mart, debe hacer lo siguiente:
- Rellene el almacenamiento con datos (desde el área de aterrizaje) que desee utilizar en su galería de datos o data mart. Para obtener más información, consulte Incorporar datos.
-
Cree un modelo relacional de conjuntos de datos para definir las relaciones entre los conjuntos de datos de origen. Para obtener más información, consulte Crear un modelo de datos.
Nota de avisoTodos los conjuntos de datos de origen deben tener claves.
Crear una galería de datos (data mart)
Para crear un una galería de datos o data mart:
-
Abra su proyecto.
-
Tome una de las opciones siguientes:
- Haga clic en Añadir nuevo en la parte superior derecha y seleccione Crear data mart.
-
En la tarea de almacenamiento de datos, haga clic en en la esquina inferior derecha y seleccione Crear data mart.
Se abre el diálogo Crear data mart.
-
Proporcione un nombre para su galería data mart y, si lo desea, proporcione también una descripción.
-
Si desea configurar el data mart más adelante, desmarque la casilla de verificación Abrir y luego haga clic en Crear. De lo contrario, simplemente haga clic en Crear.
La galería de datos se abre en la pestaña Data mart.
- Seleccione su fuente de datos tal como se describe en Seleccionar sus datos de origen
- Si desea que el data mart contenga dimensiones, agregue dimensiones tal como se describe en Agregar dimensiones y un hecho al data mart
- Si desea que el data mart contenga un hecho, agregue un hecho tal como se describe en Añadir un hecho
- Si el data mart contiene dimensiones y un hecho, agregue las dimensiones a su esquema en estrella como se describe en Construir un esquema en estrella
- Cree los conjuntos de datos en su data mart y rellénelos con datos como se describe en Poblar su data mart
Seleccionar sus datos de origen
Sus datos de origen se seleccionan de los conjuntos de datos contenidos en la tarea de Almacenamiento.
Para ello:
-
Haga clic en el botón Seleccionar datos de origen en medio de la pestaña o haga clic en el botón de la barra de herramientas Seleccionar datos de origen.
Se abre el cuadro de diálogo Seleccionar datos de origen.
-
En la lista desplegable Activos de datos, seleccione una Tarea de almacenamiento o una Tarea transformación, si creó transformaciones.
-
Deje el porcentaje predeterminado para buscar todos los conjuntos de datos o indique el nombre de un conjunto de datos específico para buscar. Luego haga clic en Buscar.
-
Seleccione los conjuntos de datos que desee y luego haga clic en Agregar tablas seleccionadas.
-
Haga clic en Aceptar para cerrar el cuadro de diálogo y luego continúe con Añadir un hecho y/o Añadir dimensiones.
Agregar dimensiones y un hecho al data mart
Una vez que haya seleccionado sus datos de origen, puede proceder a construir su data mart. Un data mart puede tener un conjunto de datos de hechos, conjuntos de datos de dimensiones o una combinación de ambos (donde los conjuntos de datos de dimensiones están lógicamente relacionados con el conjunto de datos de hechos).
Añadir dimensiones
Para añadir una dimensión:
-
Haga clic en el botón Añadir dimensión.
Se abre el diálogo Añadir dimensión.
-
Están disponibles las siguientes opciones:
- Conjunto de datos con mayor nivel de granularidad: Seleccione un conjunto de datos.
- Nombre: Especifique un nombre que mostrar para la dimensión. El valor predeterminado es el nombre del conjunto de datos más granular.
- Descripción: Si lo desea, proporcione una descripción.
- Tipo de historial: Seleccione una de las siguientes opciones:
- Tipo 1: el registro de la dimensión se actualizará cada vez que se actualicen los registros correspondientes en el Almacenamiento.
- Tipo 2: se agregará un nuevo registro a la dimensión cada vez que se actualice el registro correspondiente en el Almacenamiento.
-
Conjunto de datos relacionado para desnormalizar: Cualquier conjunto de datos que se pueda desnormalizar en el conjunto de datos de dimensiones (según las relaciones en el modelo de activos de datos de origen) estará disponible para su selección aquí.
-
Haga clic en Aceptar para guardar su configuración.
La dimensión se agregará a la lista de Dimensiones, a la izquierda.
Vea también Dimensiones con varios roles.
Ver información sobre una dimensión
Cuando seleccione una dimensión, la pestaña Modelo relacional de origen se mostrará en el panel central. Esta pestaña muestra los conjuntos de datos de origen que están consolidados en la dimensión. Los conjuntos de datos que eligió desnormalizar cuando agregó la dimensión se mostrarán seleccionados (y atenuados).
Añadir un hecho
Para añadir un hecho:
-
Haga clic en el botón Añadir hecho.
Se abre el cuadro de diálogo Añadir hecho.
-
Están disponibles las siguientes opciones:
- Hecho: Seleccione un conjunto de datos para que constituya el hecho. El conjunto de datos debe definir la granularidad del hecho que está creando.
- Nombre: Especifique un nombre para mostrar para el hecho. El valor predeterminado es el nombre del hecho.
- Descripción: Si lo desea, proporcione una descripción.
- Conjuntos de datos relacionados para desnormalizar Cualquier conjunto de datos que se pueda desnormalizar en su conjunto de datos de hechos estará disponible para su selección aquí.
- Avanzado
- Usar datos actuales: Cuando se selecciona (es el valor predeterminado), el hecho no contendrá una columna de fecha de transacción.
-
Elegir la fecha de transacción: Para ubicar datos de acuerdo con una fecha de transacción específica, seleccione esta opción y luego seleccione una columna de fecha. Esto es útil si su esquema en estrella contiene dimensiones de tipo 2 y necesita encontrar los datos correctos para una transacción específica. Por ejemplo, si un cliente tiene varias direcciones, sería posible encontrar la dirección correcta según la fecha del pedido.
Caso de uso a modo de ejemplo:
Un minorista necesita crear un data mart para analizar la relación entre pedidos y clientes. El data mart deberá ser capaz de responder a preguntas como: ¿Qué estado de EE. UU. tuvo la mayor cantidad de pedidos en el cuarto trimestre de 2022?
Si el minorista selecciona la opción Usar datos actuales, solo se incluirá en el cálculo la versión de registro más actual en la tabla Clientes.
Ignorar la fecha de la transacción dará como resultado datos inexactos, como se ilustra a continuación:
Sin embargo, si el minorista selecciona la opción Elegir fecha de transacción, los pedidos del cliente se asociarán con la versión de registro correcta en la tabla Clientes.
Esto permitirá al minorista calcular con precisión la suma total de pedidos por estado en el cuarto trimestre de 2022.
Nota de sugerenciaTenga en cuenta que la fecha de transacción se puede aprovechar de manera diferente en cada data mart, según las necesidades comerciales. Por ejemplo, en un data mart podría usarse para analizar fechas de pedidos, mientras que en otro data mart podría usarse para analizar fechas de envío.
-
Haga clic en Aceptar para guardar su configuración.
El hecho se agregará a la lista de Hechos a la izquierda.
Ver información sobre el hecho
Cuando selecciona un hecho, se muestran las siguientes pestañas en el panel central:
- Modelo de esquema en estrella (predeterminado): muestra una representación gráfica de las relaciones del conjunto de datos dentro del data mart.
-
Modelo de hechos: muestra cualquier conjunto de datos relacionado con el conjunto de datos de hechos. Los conjuntos de datos que eligió desnormalizar cuando agregó el hecho se mostrarán seleccionados (y atenuados).
- Fecha de transacción: El nombre de la columna de transacción si seleccionó la opción Elegir la fecha de transacción al agregar el hecho.
Construir un esquema en estrella
Una vez que haya agregado dimensiones a su data mart, puede proceder a conectarlas con su conjunto de datos de hechos, creando así un esquema en estrella.
Para esta acción:
- Seleccione su hecho en la lista de Hechos a la izquierda.
-
Seleccione qué dimensiones agregar de la lista Dimensiones recomendadas a la derecha.
Las dimensiones recomendadas se muestran conectadas con el conjunto de datos de hechos mediante una línea de puntos.
En la imagen a continuación, algunas de las dimensiones se agregaron anteriormente y, por lo tanto, están conectadas mediante una línea continua de color gris.
-
Haga clic en Aplicar para agregar las dimensiones.
Las dimensiones se mostrarán conectadas con el conjunto de datos de hechos mediante una línea continua de color gris.
-
Para cerrar el panel Dimensiones recomendadas, haga clic en .
Poblar su data mart
Una vez que haya diseñado su data mart, puede proceder a rellenarlo.
Para ello:
-
Haga clic en el botón Preparar de la barra de herramientas en la parte superior derecha.
El proceso de preparación incluye la creación de conjuntos de datos y vistas en el data mart y la actualización del catálogo.
Puede seguir el progreso en Progreso de la preparación, en la parte inferior de la pantalla.
Una vez completada la preparación, el botón Preparar cambia a Ejecutar.
-
Opcionalmente, valide el data mart como se describe a continuación en Validar y sincronizar su data mart.
-
Haga clic en el botón Ejecutar.
La ventana cambia a la vista Supervisar, mostrando el progreso de carga y el estado de los conjuntos de datos en su data mart.
Cada registro de origen será procesado por el data mart, incluso los registros eliminados. Esto se hace para garantizar que se mantenga la información histórica.
Validar y sincronizar su data mart
La validación del data mart garantiza que los metadatos del data mart sean idénticos a los metadatos correspondientes en el almacenamiento (o transformación, si se definió). La validación del data mart también compara los metadatos creados con el diseño del esquema en estrella actual. Por ejemplo, si ejecuta la validación después de agregar una dimensión a un data mart ya creado, la validación fallará.
Para validar el data mart:
-
Seleccione Validar conjuntos de datos en el menú a la derecha del botón Ejecutar o haga clic en el botón Validar conjuntos de datos en la parte inferior derecha de la ventana.
Se mostrará el mensaje: Se ha completado la validación.
-
Si los metadatos no están sincronizados o si hay conflictos de diseño con el esquema en estrella, el panel Validar y ajustar en la parte inferior de la ventana se abrirá automáticamente con el informe de validación.
Ejemplo de un data mart con un conflicto de diseño en el esquema en estrella: Ejemplo de un data mart con errores de validación:
-
Para resolver cualquier problema de Cambios de diseño pendientes, haga clic en el botón , en la esquina superior derecha y seleccione Preparar. Si el valor de la columna Se puede modificar sin pérdida de datos es Sí, se realizará una operación de ALTERACIÓN. De lo contrario, se volverán a crear las tablas del data mart.
Tenga en cuenta que todos los errores de validación se deben resolver manualmente.
Administrar los data marts
Esta sección describe las diversas opciones disponibles para administrar sus conjuntos de datos y data marts.
Refinar los hechos o dimensiones
En la pestaña Conjuntos de datos, puede realizar varias operaciones para refinar sus hechos y dimensiones, como crear reglas de transformación (por ejemplo, reemplazar valores de columnas) y agregar expresiones a nivel de columna. La pestaña Conjuntos de datos se encuentra a la derecha de la pestaña Data mart:
Agregar reglas
Para una explicación de cómo agregar reglas globales, vea Crear reglas para transformar conjuntos de datos
Añadir nuevas columnas
Puede añadir columnas nuevas al conjunto de datos de destino.
-
Añadir una columna nueva desde cero
Haga clic en + Añadir.
Proporcione un nombre para la columna y establezca una expresión para definir los datos de la columna.
Para más información, consulte Agregar columnas a un conjunto de datos.
-
Añadir una columna desde la fuente de origen
Haga clic en junto a Añadir y seleccione Añadir columna desde origen.
Seleccione una columna del conjunto de datos de origen.
Reordenación de columnas
Puede modificar la posición ordinal de una columna.
-
Seleccione una columna.
-
Haga clic en y luego en Reordenar.
-
Utilice las flechas para mover la columna en sentido ascendente o descendente.
-
Cierre Cambiar ordinal cuando esté listo.
Dimensiones con varios roles
Una dimensión con varios roles quiere decir que tenemos una misma dimensión utilizada varias veces dentro del mismo esquema en estrella, pero con distintos significados. Esto se ve habitualmente con las dimensiones de Fecha y Cliente. Por ejemplo, su esquema en estrella puede contener dos entidades de fecha, una que representa la fecha del pedido y otra que representa la fecha de recepción.
Para agregar o editar el nombre del rol de una dimensión:
- Haga clic en el icono del nodo de dimensión y seleccione Editar rol.
En el cuadro de diálogo Editar rol, escriba un nombre (o edite el nombre existente) en el campo Nombre del rol en el esquema de estrella y pulse Aceptar.
El nombre del rol aparecerá debajo del nombre de la dimensión.
Opciones de administración adicionales
La tabla siguiente describe opciones de administración adicionales:
Para | Haga esto |
---|---|
Agregar conjuntos de datos fuente adicionales | Vea Seleccionar sus datos de origen. |
Añadir hechos adicionales | Vea Añadir un hecho |
Agregar dimensiones adicionales | Vea Agregar dimensiones y un hecho al data mart. |
Eliminar una dimensión | Seleccione la dimensión en el panel Dimensiones y luego seleccione Eliminar en el menú . |
Eliminar un hecho | Seleccione el hecho en el panel de Hechos y luego seleccione Eliminar en el menú . |
Volver a crear un data mart | Haga clic en el botón en la parte superior derecha y seleccione Volver a crear tablas. Es posible que sea necesario volver a crear un data mart si, por ejemplo, hay cambios en el almacenamiento que no se pueden sincronizar automáticamente con el data mart. |
Detener una tarea de data mart en ejecución | Haga clic en el botón Detener en la parte superior derecha. |
Preparar una tarea de data mart | Haga clic en el botón en la esquina superior derecha y seleccione Preparar para sincronizar los conjuntos de datos con los activos de Transformación o Almacenamiento y resolver cualquier conflicto de diseño. Esto prepara la tarea para su ejecución. Esto incluye:
Puede seguir el progreso en Progreso de la preparación, en la parte inferior de la pantalla. |
Programar una tarea de data mart
Puede programar una tarea de data mart para que se actualice periódicamente. Puede establecer una programación basada en el tiempo o configurar la tarea para que se ejecute cuando las tareas de datos de entrada hayan terminado de ejecutarse.
Haga clic en ... en una tarea de datos y seleccione Programación para crear una programación. La configuración de programación predeterminada se hereda de la configuración del proyecto. Para obtener más información sobre la configuración predeterminada, vea Valores predeterminados del data mart.
Debe configurar Programación en Activado para habilitar la programación.
Programaciones basadas en el tiempo
Puede utilizar una programación basada en el tiempo para ejecutar la tarea independientemente de cuándo se actualicen las distintas fuentes de entrada.
Seleccione A una hora específica en Ejecutar la tarea de datos.
Puede establecer una programación por hora, diaria, semanal o mensual.
Programaciones basadas en eventos
Puede usar un programa basado en eventos para ejecutar la tarea cuando las tareas de datos de entrada hayan terminado de ejecutarse.
Seleccione En un evento específico en Ejecutar la tarea de datos.
Puede seleccionar si desea ejecutar la tarea cuando cualquiera de las tareas de entrada se haya completado correctamente, o cuando alguna de las tareas de entrada seleccionadas se haya completado correctamente.
Recargar datos
Puede realizar una recarga manual de los datos. Esto resulta útil cuando hay problemas con una o más tablas.
Abra la tarea de datos y seleccione la pestaña Supervisar.
Seleccione las tablas que desea cargar.
Cuando se selecciona una dimensión para recargarla, todos los hechos que utilizan esa dimensión también se recargarán para mantener la integridad.
Haga clic en Cargar tablas.
Puede cancelar la recarga de las tablas pendientes de recarga haciendo clic en Cancelar recarga. Esto no afectará a las tablas que ya estén recargadas, y las recargas que se estén ejecutando en ese momento se completarán.
La recarga se realiza:
Truncando las dimensiones y los hechos seleccionados.
Cargando las tablas de dimensiones seleccionadas desde la tarea de datos previa.
Cargando las tablas de hechos desde la tarea de datos previa. Esto incluye:
Tablas de hechos seleccionadas explícitamente.
Tablas de hechos relacionadas con una dimensión que se recarga.
Configuración de un data mart
Haga clic en el botón de la barra de herramientas Configuración para abrir el cuadro de diálogo Configuración: <nombre-data-mart>.
Configuración general
En la pestaña General, están disponibles las siguientes opciones:
- Base de datos: la base de datos en la que se creará el data mart.
- Esquema de la tarea de datos: el esquema en el que se crearán los conjuntos de datos.
- Esquema interno: el esquema en el que se crearán los conjuntos de datos internos.
- Prefijo para todas las tablas y vistas
Puede establecer un prefijo para todas las tablas y vistas creadas con esta tarea.
Nota informativaDebe usar un prefijo único cuando desee usar un esquema de base de datos en varias tareas de datos.
Configuración de tiempo de ejecución
En la pestaña Tiempo de ejecución, están disponibles las siguientes opciones:
- Ejecución en paralelo: indique el número máximo de conexiones de base de datos que se le permite abrir a Qlik Cloud para la tarea. El número predeterminado es 10.
- Almacén: solo relevante para Snowflake. El nombre del almacén de datos de Snowflake.
Configuración del catálogo
Publicar en el catálogo
Seleccione esta opción para publicar esta versión de los datos en el Catálogo como un conjunto de datos. El contenido del catálogo se actualizará la próxima vez que prepare esta tarea.
Para obtener más información sobre el catálogo, consulte Comprender sus datos con las herramientas del catálogo.