Saltar al contenido principal Saltar al contenido complementario

Almacenar conjuntos de datos

Puede almacenar conjuntos de datos utilizando una tarea de datos de almacenamiento. La tarea de almacenamiento de datos consume los datos que una tarea de ubicación de destino aterrizó en el área de destino en la nube. Puede utilizar las tablas en una app de análisis, por ejemplo.

  • Puede diseñar una tarea de almacenamiento de datos cuando el estado de la tarea de ubicación de destino esté al menos Listo para preparar.

  • Puede preparar una tarea de almacenamiento de datos cuando el estado de la tarea de datos de ubicación de destino esté al menos Listo para ejecución.

La tarea de almacenamiento de datos utilizará el mismo modo de operación (carga completa o carga completa y CDC) que la tarea de datos de destino consumidos. Las propiedades de configuración son diferentes entre los dos modos de funcionamiento, así como las opciones de supervisión y control. Si usa una tarea de datos de ubicación de destino en la nube solo con carga completa, la tarea de almacenamiento de datos creará vistas para las tablas de aterrizaje en lugar de generar tablas físicas.

Nota informativaLas tareas de datos operan en el contexto de su propietario. Para más información sobre los roles y permisos necesarios, vea Roles y permisos en un espacio de datos.

Crear una tarea de almacenamiento de datos

Puede crear una tarea de almacenamiento de datos de tres formas:

  • Haga clic en ... en una tarea de datos de destino y seleccione Almacenar datos para crear una tarea de almacenamiento de datos basada en este activo de datos de destino.

  • Haga clic en Añadir nuevo y luego en Almacenar datos. En este caso, deberá especificar qué tarea de aterrizaje de datos usar.

  • Cuando incorpora datos, se crea una tarea de almacenamiento de datos. Está conectado a la tarea de aterrizaje de datos también creada al incorporar datos.

    Para más información, vea Incorporar datos.

Cuando haya creado la tarea de almacenamiento de datos:

  1. Abra la tarea de almacenamiento de datos haciendo clic en ... y seleccionando Abrir.
    Se abre la tarea de almacenamiento de datos y puede obtener una vista previa de los conjuntos de datos de salida en función de las tablas del activo de datos de destino.

  2. Haga todos los cambios necesarios en los conjuntos de datos incluidos, como transformaciones, filtrado de datos o adición de columnas.

    Para más información, vea Administrar conjuntos de datos.

  3. Cuando haya agregado las transformaciones que desea, puede validar los conjuntos de datos haciendo clic en Validar conjuntos de datos. Si la validación encuentra errores, corríjalos antes de continuar.

    Para más información, vea Validar y ajustar los conjuntos de datos.

  4. Crear un modelo de datos

    Haga clic en Modelo para establecer las relaciones entre los conjuntos de datos incluidos.

    Para más información, vea Crear un modelo de datos.

  5. Haga clic en Preparar para preparar la tarea de datos y todos los artefactos necesarios. Esto puede tomar un poco de tiempo.

    Puede seguir el progreso en Progreso de la preparación en la parte inferior de la pantalla.

  6. Cuando el estado muestra Listo para ejecución, puede ejecutar la tarea de datos.

    Haga clic en Ejecutar.

    La tarea de datos ahora comenzará a crear conjuntos de datos para almacenar los datos.

Mantener datos históricos

Puede conservar los datos de cambios históricos de tipo 2 para permitirle recrear fácilmente los datos tal como se veían en un punto específico en el tiempo. Esto crea un almacén de datos históricos completo (HDS).

  • Se admiten las dimensiones de cambio lento de tipo 2.

  • Cuando se fusiona un registro modificado, crea un nuevo registro para almacenar los datos modificados y deja intacto el registro anterior.

  • Los nuevos registros de HDS se marcan automáticamente con la hora, para permitirle crear análisis de tendencias y otros data marts analíticos orientados al tiempo.

Puede habilitar los datos históricos haciendo clic en:

  • Replication con los datos actuales y el historial de datos anteriores en Configuración cuando incorpora datos.

  • Mantener registros de cambios históricos y cambiar el archivo de registros en el cuadro de diálogo Configuración de una tarea de almacenamiento.

Nota informativaLos datos históricos no están disponibles cuando se utiliza Qlik Cloud como plataforma de datos.

Los datos HDS se almacenan en la tabla anterior en el esquema de datos interno. Puede usar las vistas de historial y las vistas de historial en vivo en el esquema de datos externos para ver datos históricos.

  • La vista de historial combina datos de la tabla actual y la tabla anterior. Esta vista incluye todos los cambios que se fusionaron.

  • La vista de historial en vivo combina datos de la tabla actual, la tabla anterior y la tabla de cambios. Esta vista también incluye todos los cambios que aún no se fusionaron.

Para más información, vea Arquitectura de conjuntos de datos en un almacén de datos en la nube.

Programar una tarea de almacenamiento

Puede programar una tarea de almacenamiento para que se actualice periódicamente.

  • Si la tarea de entrada de datos de aterrizaje utiliza Carga completa y CDC, solo puede establecer una programación basada en el tiempo.

  • Si la tarea de entrada de datos de aterrizaje utiliza Carga completa, puede establecer una programación basada en el tiempo o configurar la tarea para que se ejecute cuando la tarea de entrada de datos de aterrizaje haya terminado de ejecutarse.

    Nota informativaCuando ejecuta una programación basada en el tiempo con una tarea de entrada de datos de aterrizaje usando Carga completa, tenga en cuenta que todas las tablas completadas en el aterrizaje están disponibles mientras la tarea de aterrizaje aún se está ejecutando. Esto le permite ejecutar el aterrizaje y el almacenamiento al mismo tiempo, lo que puede mejorar el tiempo total de carga.

Haga clic en ... en una tarea de datos y seleccione Programación para crear una programación. La configuración de programación predeterminada se hereda de la configuración del proyecto de datos. Para obtener más información sobre la configuración predeterminada, vea Valores predeterminados de almacenamiento. Siempre debe establecer Programación en Activado para habilitar la programación.

Programaciones basadas en el tiempo

Puede utilizar una programación basada en el tiempo para ejecutar la tarea de almacenamiento de datos independientemente del tipo de aterrizaje.

  • Seleccione A una hora específica en Ejecutar la tarea de datos.

Puede establecer una programación por hora, diaria, semanal o mensual.

Programaciones basadas en eventos

  • Seleccione Al finalizar con éxito cualquier tarea de entrada de datos en Ejecutar la tarea de datos.

La tarea de almacenamiento se ejecutará cada vez que la tarea de entrada de datos de aterrizaje se haya completado con éxito.

Nota informativaEsta opción no está disponible cuando la tarea de entrada de datos de aterrizaje utiliza Carga completa y CDC ya que el aterrizaje se ejecuta continuamente.

Supervisar una tarea de almacenamiento

Puede supervisar el estado y el progreso de una tarea de almacenamiento haciendo clic en Supervisar.

Para más información, vea Supervisión de una tarea de datos individual.

Resolución de problemas en una tarea de almacenamiento de datos

Cuando hay problemas con una o más tablas en una tarea de almacenamiento de datos, es posible que tenga que recargar o volver a crear los datos. Existen varias opciones para hacer esto. Considere qué opción utilizar en el siguiente orden:

  1. Puede recargar el conjunto de datos en el aterrizaje. La recarga del conjunto de datos en el aterrizaje desencadenará el proceso de comparación en el almacenamiento y corregirá los datos conservando el historial de tipo 2. Esta opción también debe considerarse cuando:

    • La carga completa se realizó hace mucho tiempo y hay un gran número de cambios.

    • Si la carga completa y los registros de la tabla de cambios que se han procesado se han eliminado como parte del mantenimiento de la zona de aterrizaje.

    Transferir datos desde fuentes de datos

  2. Puede recargar datos durante la tarea de datos de almacenamiento.

    Si los datos históricos están activados, una recarga en el almacenamiento puede causar una pérdida de datos históricos. Si esto es un problema, considere la posibilidad de volver a cargar el aterrizaje desde la fuente en su lugar.

    Recargar datos

  3. Puede volver a crear las tablas. Esto vuelve a crear los conjuntos de datos a partir de la fuente.

    Esto debería considerarse como la última opción, ya que también debe volver a crear todas las tareas de datos posteriores que consumen esta tarea de datos.

    • Haga clic en ... y después clic en Volver a crear las tablas.

Recargar datos

Puede realizar una recarga manual de las tablas. Esto resulta útil cuando hay problemas con una o más tablas.

  1. Abra la tarea de datos y seleccione la pestaña Supervisar.

  2. Seleccione las tablas que desea cargar.

  3. Haga clic en Cargar tablas.

La recarga se producirá la próxima vez que se ejecute la tarea y se realiza de la siguiente manera:

  1. Truncando las tablas.

  2. Cargando los datos de aterrizaje en las tablas.

  3. Cargando los cambios acumulados desde el momento de la recarga.

Las tareas posteriores se recargarán para aplicar los cambios y evitar la retroactivación. Esto lo realiza:

  1. Comparando con la carga completa y aplicando los cambios.

  2. Aplicando los cambios de después de la recarga.

Puede cancelar la recarga de las tablas pendientes de recarga haciendo clic en Cancelar recarga. Esto no afectará a las tablas que ya estén recargadas, y las recargas que se estén ejecutando en ese momento se completarán.

En algunos casos se recomienda recargar el conjunto de datos en el aterrizaje en su lugar:

  • Si los datos históricos están activados, una recarga en el almacenamiento puede causar una pérdida de datos históricos. La recarga del conjunto de datos en el aterrizaje desencadenará el proceso de comparación en el almacenamiento y corregirá los datos conservando el historial de tipo 2.

  • Cuando la carga completa se realizó hace mucho tiempo y hay un gran número de cambios.

  • Si la carga completa y los registros de la tabla de cambios que se han procesado se han eliminado como parte del mantenimiento de la zona de aterrizaje.

Nota informativaLa recarga de tablas no se admite en proyectos de datos con Qlik Cloud como plataforma de datos de destino.

Configuración de almacenamiento

Puede establecer propiedades para la tarea de almacenamiento de datos cuando la plataforma de datos es un almacén de datos en la nube. Si utiliza Qlik Cloud como plataforma de datos, vea Configuración de almacenamiento para proyectos de datos con Qlik Cloud como plataforma de datos.

  • Haga clic en Configuración.

Nota de avisoSi la tarea ya se ejecutó, cambiar una configuración que no sea la configuración de tiempo de ejecución requiere volver a crear los conjuntos de datos.

Configuración general

  • Base de datos

    Base de datos que se utilizará en el origen de datos.

  • Esquema de tarea de datos

    Puede cambiar el nombre del esquema de la tarea de almacenamiento de datos. El nombre predeterminado es el nombre de la tarea de almacenamiento.

  • Esquema interno

    Puede cambiar el nombre del esquema de activos de datos de almacenamiento interno. El nombre predeterminado es el nombre de la tarea de almacenamiento con el sufijo _internal adjunto.

  • Prefijo para todas las tablas y vistas

    Puede establecer un prefijo para todas las tablas y vistas creadas con esta tarea.

    Nota informativaDebe usar un prefijo único cuando desee usar un esquema de base de datos en varias tareas de datos.
  • Historial

    Puede conservar los datos de cambios históricos para permitirle recrear fácilmente los datos tal y como se veían en un punto específico en el tiempo. Puede usar las vistas del historial y las vistas del historial en vivo para ver los datos históricos. Seleccione Mantener registros históricos y el archivo de registro de cambios para habilitar los datos de cambios históricos.

  • Al comparar el almacenamiento con el aterrizaje en destino, puede elegir cómo administrar los registros que no existen en el destino.

    • Marcar como eliminado

      Esto realizará una eliminación temporal de los registros que no existen en el destino.

    • Mantener

      Esto mantendrá todos los registros que no existen en el rellano.

    Nota informativaLos conjuntos de datos en la tarea de almacenamiento de datos deben tener un conjunto de claves principales. De lo contrario, cada vez que se vuelvan a cargar los datos de ubicación temporal, se realizará una carga inicial en la tarea de almacenamiento de datos.

Configuración de vistas

  • Vistas en vivo

    Utilice las vistas en vivo para leer las tablas con la menor latencia.

    Para más información sobre las vistas en vivo, vea Usar vistas en vivo.

    Nota informativaLas vistas en vivo son menos eficientes que las vistas estándar y requieren más recursos, ya que los datos aplicados se han de recalcular.

Configuración de tiempo de ejecución

  • Ejecución en paralelo

    Puede establecer el número máximo de conexiones de datos para cargas completas en un número del 1 al 5.

  • Almacén

    El nombre del almacén de datos en la nube. Esta configuración solo se aplica a Snowflake.

Configuración de almacenamiento para proyectos de datos con Qlik Cloud como plataforma de datos

Puede establecer qué carpeta usar en el almacenamiento cuando la plataforma de datos sea Qlik Cloud como plataforma de datos.

  1. Haga clic en Configuración.

  2. Seleccione qué carpeta usar en el almacenamiento.

  3. Haga clic en Aceptar cuando esté listo.

Operaciones en la tarea de almacenamiento de datos

Puede realizar las siguientes operaciones en una tarea de almacenamiento de datos desde el menú de tareas.

  • Abrir

    Esto abre la tarea de almacenamiento de datos. Puede ver la estructura de la tabla y los detalles sobre la tarea de datos y supervisar el estado de la carga completa y los lotes de cambios.

  • Editar

    Puede editar el nombre y la descripción de la tarea y agregar etiquetas.

  • Eliminar

    Puede eliminar la tarea de datos.

  • Preparar

    Esto prepara la tarea para su ejecución. Esto incluye:

    • Validar que el diseño sea válido.

    • Crear o modificar las tablas físicas y las vistas para que coincidan con el diseño.

    • Generar el código SQL para la tarea de datos.

    • Crear o modificar las entradas de catálogo para los conjuntos de datos de salida de la tarea.

    Puede seguir el progreso en Progreso de la preparación en la parte inferior de la pantalla.

  • Validar conjuntos de datos

    Esto valida todos los conjuntos de datos que están incluidos en la tarea de datos.

    Expanda Validar y ajustar para ver todos los errores de validación y cambios en el diseño.

  • Volver a crear las tablas

    Esto vuelve a crear los conjuntos de datos a partir de la fuente.

    También debe volver a crear todas las tareas de datos descendentes que consumen este activo de datos.

  • Detener

    Puede detener el funcionamiento de la tarea de datos. La tarea de datos no continuará actualizando las tablas.

    Nota informativaEsta opción está disponible cuando se está ejecutando la tarea de datos.
  • Reiniciar

    Puede reanudar la operación de una tarea de datos desde el punto en que se detuvo.

    Nota informativaEsta opción está disponible cuando se detiene la tarea de datos.
  • Transformar datos

    Cree transformaciones de nivel de fila reutilizables basadas en reglas y SQL personalizado. Esto crea una tarea de Transformación de datos.

    Transformar datos

  • Crear data mart

    Cree un data mart para aprovechar sus tareas de datos. Esto crea una tarea de datos de Data Mart.

    Crear y administrar data marts

Limitaciones

  • Si la tarea de datos contiene conjuntos de datos y cambia cualquier parámetro en la conexión, por ejemplo, el nombre de usuario, la base de datos o el esquema, se supone que los datos existen en la nueva ubicación. Si este no fuera el caso, puede elegir una de la opciones siguientes:

    • Mueva los datos desde el origen a la nueva ubicación.

    • Cree una nueva tarea de datos con la misma configuración.

¿Esta página le ha sido útil?

No dude en indicarnos en qué podemos mejorar si encuentra algún problema en esta página o su contenido, como, por ejemplo, errores tipográficos, pasos que falta o errores técnicos.