Saltar al contenido principal Saltar al contenido complementario

Almacenar conjuntos de datos

Puede almacenar los conjuntos de datos utilizando una tarea de almacenamiento de datos. La tarea de almacenamiento de datos consume los datos que una tarea de aterrizaje de datos transfirió al área de destino en la nube. Puede utilizar las tablas en una aplicación de análisis, por ejemplo.

  • Puede diseñar una tarea de almacenamiento de datos cuando el estado de la tarea de aterrizaje de datos esté al menos Listo para preparar.

  • Puede preparar una tarea de almacenamiento de datos cuando el estado de la tarea de aterrizaje de datos esté al menos Listo para ejecución.

La tarea de almacenamiento de datos utilizará el mismo modo de operación (Carga completa o Carga completa y CDC) que la tarea de datos de destino consumidos. Las propiedades de configuración son diferentes entre los dos modos de funcionamiento, así como las opciones de supervisión y control. Si usa una tarea de aterrizaje de datos en la nube solo con carga completa, la tarea de almacenamiento de datos creará vistas para las tablas de aterrizaje en lugar de generar tablas físicas.

Nota informativaLas tareas de datos operan en el contexto del propietario del proyecto al que pertenecen. Para más información sobre los roles y permisos necesarios, vea Roles y permisos en un espacio de datos.

Crear una tarea de almacenamiento de datos

Puede crear una tarea de almacenamiento de datos de tres formas:

  • Haga clic en ... en una tarea de aterrizaje de datos y seleccione Almacenar datos para crear una tarea de almacenamiento de datos basada en este activo de aterrizaje de datos.

  • Haga clic en Añadir nuevo y luego en Almacenar datos. En este caso, deberá especificar qué tarea de aterrizaje de datos usar.

  • Cuando incorpora datos, se crea una tarea de almacenamiento de datos. Está conectado a la tarea de aterrizaje de datos también creada al incorporar datos.

    Para obtener más información, consulte Incorporar datos.

Cuando haya creado la tarea de almacenamiento de datos:

  1. Abra la tarea de almacenamiento de datos haciendo clic en ... y seleccionando Abrir.
    Se abre la tarea de almacenamiento de datos y puede obtener una vista previa de los conjuntos de datos de salida en función de las tablas del activo de aterrizaje de datos.

  2. Haga todos los cambios necesarios en los conjuntos de datos incluidos, como transformaciones, filtrado de datos o adición de columnas.

    Para obtener más información, consulte Administrar conjuntos de datos.

  3. Cuando haya agregado las transformaciones que desea, puede validar los conjuntos de datos haciendo clic en Validar conjuntos de datos. Si la validación encuentra errores, corríjalos antes de continuar.

    Para obtener más información, consulte Validar y ajustar los conjuntos de datos.

  4. Crear un modelo de datos

    Haga clic en Modelo para establecer las relaciones entre los conjuntos de datos incluidos.

    Para obtener más información, consulte Crear un modelo de datos.

  5. Haga clic en Preparar para preparar la tarea de datos y todos los artefactos necesarios. Esto puede tomar un poco de tiempo.

    Puede seguir el progreso en Progreso de la preparación en la parte inferior de la pantalla.

  6. Cuando el estado muestra Listo para ejecución, puede ejecutar la tarea de datos.

    Haga clic en Ejecutar.

    La tarea de datos ahora comenzará a crear conjuntos de datos para almacenar los datos.

Mantener datos históricos

Puede conservar los datos de cambios históricos de tipo 2 para permitirle recrear fácilmente los datos tal como se veían en un punto específico en el tiempo. Esto crea un almacén de datos históricos completo (HDS).

  • Se admiten las dimensiones de cambio lento de tipo 2.

  • Cuando se fusiona un registro modificado, crea un nuevo registro para almacenar los datos modificados y deja intacto el registro anterior.

  • Los nuevos registros de HDS se marcan automáticamente con la hora, para permitirle crear análisis de tendencias y otros data marts analíticos orientados al tiempo.

Puede habilitar los datos históricos haciendo clic en:

  • Replication con los datos actuales y el historial de datos anteriores en Configuración cuando incorpora datos.

  • Mantener registros de cambios históricos y cambiar el archivo de registros en el cuadro de diálogo Configuración de una tarea de almacenamiento.

Nota informativaLos datos históricos no están disponibles cuando se utiliza Qlik Cloud como plataforma de datos.

Los datos HDS se almacenan en la tabla anterior en el esquema de datos interno. Puede usar las vistas de historial y las vistas de historial en vivo en el esquema de datos externos para ver datos históricos.

  • La vista de historial combina datos de la tabla actual y la tabla anterior. Esta vista incluye todos los cambios que se fusionaron.

  • La vista de historial en vivo combina datos de la tabla actual, la tabla anterior y la tabla de cambios. Esta vista también incluye todos los cambios que aún no se fusionaron.

Para obtener más información, consulte Arquitectura de conjuntos de datos en un almacén de datos en la nube.

Programar una tarea de almacenamiento

Puede programar una tarea de almacenamiento para que se actualice periódicamente.

  • Si la tarea de entrada y aterrizaje de datos utiliza Carga completa y CDC, solo puede establecer una programación basada en el tiempo.

  • Si la tarea de entrada y aterrizaje de datos utiliza Carga completa, puede establecer una programación basada en el tiempo o configurar la tarea para que se ejecute cuando la tarea de entrada y aterrizaje de datos haya terminado de ejecutarse.

    Nota informativaCuando ejecuta una programación basada en el tiempo con una tarea de entrada y aterrizaje de datos usando Carga completa, tenga en cuenta que todas las tablas completadas en el aterrizaje están disponibles mientras la tarea de aterrizaje aún se está ejecutando. Esto le permite ejecutar el aterrizaje y el almacenamiento al mismo tiempo, lo que puede mejorar el tiempo de carga total.

Haga clic en ... en una tarea de datos y seleccione Programación para crear una programación. La configuración de programación predeterminada se hereda de la configuración del proyecto de datos. Para obtener más información sobre la configuración predeterminada, consulte Valores predeterminados de almacenamiento. Siempre debe establecer Programación en Activado para habilitar la programación.

Programaciones basadas en el tiempo

Puede utilizar una programación basada en el tiempo para ejecutar la tarea de almacenamiento de datos independientemente del tipo de aterrizaje.

  • Seleccione A una hora específica en Ejecutar la tarea de datos.

Puede establecer una programación por hora, diaria, semanal o mensual.

Programaciones basadas en eventos

  • Seleccione Al finalizar con éxito cualquier tarea de entrada de datos en Ejecutar la tarea de datos.

La tarea de almacenamiento se ejecutará cada vez que la tarea de entrada de datos de aterrizaje se haya completado con éxito.

Nota informativaEsta opción no está disponible cuando la tarea de entrada de datos de aterrizaje utiliza Carga completa y CDC ya que el aterrizaje se ejecuta continuamente.

Supervisar una tarea de almacenamiento

Puede supervisar el estado y el progreso de una tarea de almacenamiento haciendo clic en Supervisar.

Para obtener más información, consulte Supervisión de una tarea de datos individual.

Resolución de problemas en una tarea de almacenamiento de datos

Cuando hay problemas con una o más tablas en una tarea de almacenamiento de datos, es posible que tenga que recargar o volver a crear los datos. Existen varias opciones para hacer esto. Considere qué opción utilizar en el siguiente orden:

  1. Puede recargar el conjunto de datos en el aterrizaje. La recarga del conjunto de datos en el aterrizaje desencadenará el proceso de comparación en el almacenamiento y corregirá los datos conservando el historial de tipo 2. Esta opción también debe considerarse cuando:

    • La carga completa se realizó hace mucho tiempo y hay un gran número de cambios.

    • Si la carga completa y los registros de la tabla de cambios que se han procesado se han eliminado como parte del mantenimiento de la zona de aterrizaje.

    Transferir datos desde fuentes de datos

  2. Puede recargar datos durante la tarea de datos de almacenamiento.

    Si los datos históricos están activados, una recarga en el almacenamiento puede causar una pérdida de datos históricos. Si esto es un problema, considere la posibilidad de volver a cargar el aterrizaje desde la fuente en su lugar.

    Recargar datos

  3. Puede volver a crear las tablas. Esto vuelve a crear los conjuntos de datos a partir de la fuente.

    • Haga clic en ... y después clic en Volver a crear las tablas. Al volver a crear una tabla, la tarea posterior reaccionará como si se hubiera producido una acción de truncamiento y recarga en los conjuntos de datos de origen.

Recargar datos

Puede realizar una recarga manual de las tablas. Esto resulta útil cuando hay problemas con una o más tablas.

  1. Abra la tarea de datos y seleccione la pestaña Supervisar.

  2. Seleccione las tablas que desea cargar.

  3. Haga clic en Cargar tablas.

La recarga se producirá la próxima vez que se ejecute la tarea y se realiza de la siguiente manera:

  1. Truncando las tablas.

  2. Cargando los datos de aterrizaje en las tablas.

  3. Cargando los cambios acumulados desde el momento de la recarga.

Nota informativa

En general, lo mejor es recargar el conjunto de datos durante el aterrizaje. Esto es especialmente cierto en los siguientes casos:

  • Si los datos históricos están activados, una recarga en el almacenamiento puede causar una pérdida de datos históricos. La recarga del conjunto de datos en el aterrizaje desencadenará el proceso de comparación en el almacenamiento y corregirá los datos conservando el historial de tipo 2.

  • Cuando la carga completa se realizó hace mucho tiempo y hay un gran número de cambios.

  • Si la carga completa y los registros de la tabla de cambios que se han procesado se han eliminado como parte del mantenimiento de la zona de aterrizaje.

Las tareas posteriores se recargarán para aplicar los cambios y evitar la retroactivación. Si se realiza una recarga truncando y recargando, todos los objetos posteriores se recargarán también truncando y recargando.

Impacto en sentido descendente tras recargar una tarea de datos de aterrizaje o almacenamiento

Impacto posterior de la recarga de almacenamiento

El impacto en sentido descendente depende del tipo de operación de recarga ejecutada y del tipo de conjunto de datos inmediatamente posterior. El procesamiento estándar significa que el conjunto de datos reaccionará y procesará los datos utilizando el método configurado para el conjunto de datos específico.

  • En tareas de transformación posteriores:

    Las transformaciones de conjuntos de datos se recargan truncando y cargando.

    Las transformaciones de SQL y los flujos de transformación se recargan comparándolos con la carga completa y aplicando los cambios.

  • Las tareas del data mart inmediatamente posteriores a una tarea de almacenamiento se recargan truncando y cargando.

Puede cancelar la recarga de las tablas pendientes de recarga haciendo clic en Cancelar recarga. Esto no afectará a las tablas que ya estén recargadas, y las recargas que se estén ejecutando en ese momento se completarán.

Nota informativaLa recarga de tablas no se admite en proyectos de datos con Qlik Cloud como plataforma de datos de destino.

Configuración de almacenamiento

Puede establecer propiedades para la tarea de almacenamiento de datos cuando la plataforma de datos es un almacén de datos en la nube. Si utiliza Qlik Cloud como plataforma de datos, consulte Configuración del almacenamiento para proyectos con Qlik Cloud como plataforma de datos.

  • Haga clic en Configuración.

Nota de avisoSi la tarea ya se ejecutó, cambiar una configuración que no sea la configuración de tiempo de ejecución requiere volver a crear los conjuntos de datos.

Configuración general

  • Base de datos

    Base de datos que se utilizará en el origen de datos.

  • Esquema de tarea

    Puede cambiar el nombre del esquema de la tarea de almacenamiento de datos. El nombre predeterminado es el nombre de la tarea de almacenamiento.

  • Esquema interno

    Puede cambiar el nombre del esquema de activos de datos de almacenamiento interno. El nombre predeterminado es el nombre de la tarea de almacenamiento con el sufijo _internal adjunto.

  • Prefijo para todas las tablas y vistas

    Puede establecer un prefijo para todas las tablas y vistas creadas con esta tarea.

    Nota informativaDebe usar un prefijo único cuando desee usar un esquema de base de datos en varias tareas de datos.
  • Historial

    Puede conservar los datos de cambios históricos para permitirle recrear fácilmente los datos tal y como se veían en un punto específico en el tiempo. Puede usar las vistas del historial y las vistas del historial en vivo para ver los datos históricos. Seleccione Mantener registros históricos y el archivo de registro de cambios para habilitar los datos de cambios históricos.

  • Al comparar el almacenamiento con el aterrizaje en destino, puede elegir cómo administrar los registros que no existen en el destino.

    • Marcar como eliminado

      Esto realizará una eliminación temporal de los registros que no existen en el destino.

    • Mantener

      Esto mantendrá todos los registros que no existen en el destino.

    Nota informativaLos conjuntos de datos en la tarea de almacenamiento de datos deben tener un conjunto de claves principales. De lo contrario, cada vez que se vuelvan a cargar los datos de ubicación temporal, se realizará una carga inicial en la tarea de almacenamiento de datos.

Configuración de vistas

  • Vistas en vivo

    Utilice las vistas en vivo para leer las tablas con la menor latencia.

    Para obtener más información sobre las vistas en vivo, consulte Usar vistas en vivo.

    Nota informativaLas vistas en vivo son menos eficientes que las vistas estándar y requieren más recursos, ya que los datos aplicados se han de recalcular.

Configuración de tiempo de ejecución

  • Ejecución en paralelo

    Puede establecer el número máximo de conexiones para cargas completas en un número del 1 al 5.

  • Almacén

    El nombre del almacén de datos en la nube. Esta configuración solo se aplica a Snowflake.

Configuración del catálogo

  • Publicar en el catálogo

    Seleccione esta opción para publicar esta versión de los datos en el Catálogo como un conjunto de datos. El contenido del catálogo se actualizará la próxima vez que prepare esta tarea.

Para obtener más información sobre el catálogo, consulte Comprender sus datos con las herramientas del catálogo.

Configuración del almacenamiento para proyectos con Qlik Cloud como plataforma de datos

Puede establecer qué carpeta usar en el almacenamiento cuando la plataforma de datos sea Qlik Cloud como plataforma de datos.

  1. Haga clic en Configuración.

  2. Seleccione qué carpeta usar en el almacenamiento.

  3. Haga clic en Aceptar cuando esté listo.

Operaciones en la tarea de almacenamiento de datos

Puede realizar las siguientes operaciones en una tarea de almacenamiento de datos desde el menú de tareas.

  • Abrir

    Esto abre la tarea de almacenamiento de datos. Puede ver la estructura de la tabla y los detalles sobre la tarea de datos y supervisar el estado de la carga completa y los lotes de cambios.

  • Editar

    Puede editar el nombre y la descripción de la tarea y agregar etiquetas.

  • Eliminar

    Puede eliminar la tarea de datos.

  • Preparar

    Esto prepara la tarea para su ejecución. Esto incluye:

    • Validar que el diseño sea válido.

    • Crear o modificar las tablas físicas y las vistas para que coincidan con el diseño.

    • Generar el código SQL para la tarea de datos.

    • Crear o modificar las entradas de catálogo para los conjuntos de datos de salida de la tarea.

    Puede seguir el progreso en Progreso de la preparación en la parte inferior de la pantalla.

  • Validar conjuntos de datos

    Esto valida todos los conjuntos de datos que están incluidos en la tarea de datos.

    Expanda Validar y ajustar para ver todos los errores de validación y cambios en el diseño.

  • Volver a crear las tablas

    Esto vuelve a crear los conjuntos de datos a partir de la fuente. Al volver a crear una tabla, la tarea posterior reaccionará como si se hubiera producido una acción de truncamiento y recarga en los conjuntos de datos de origen. Para obtener más información, consulte Resolución de problemas en una tarea de almacenamiento de datos.

  • Detener

    Puede detener el funcionamiento de la tarea de datos. La tarea de datos no continuará actualizando las tablas.

    Nota informativaEsta opción está disponible cuando se está ejecutando la tarea de datos.
  • Reiniciar

    Puede reanudar la operación de una tarea de datos desde el punto en que se detuvo.

    Nota informativaEsta opción está disponible cuando se detiene la tarea de datos.
  • Transformar datos

    Cree transformaciones de nivel de fila reutilizables basadas en reglas y SQL personalizado. Esto crea una tarea de Transformación de datos.

    Transformar datos

  • Crear data mart

    Cree un data mart para aprovechar sus tareas de datos. Esto crea una tarea de datos de Data Mart.

    Crear y administrar data marts

Limitaciones

  • Si la tarea de datos contiene conjuntos de datos y cambia cualquier parámetro en la conexión, por ejemplo, el nombre de usuario, la base de datos o el esquema, se supone que los datos existen en la nueva ubicación. Si este no fuera el caso, puede elegir una de las opciones siguientes:

    • Mueva los datos desde el origen a la nueva ubicación.

    • Cree una nueva tarea de datos con la misma configuración.

  • No es posible cambiar claves principales en tareas de almacenamiento en proyectos con Qlik Cloud (QVD) como destino. Actualice las claves principales en la tarea de aterrizaje, vuelva a crear la tarea de aterrizaje y luego vuelva a crear la tarea de almacenamiento.

¿Esta página le ha sido útil?

No dude en indicarnos en qué podemos mejorar si encuentra algún problema en esta página o su contenido, como, por ejemplo, errores tipográficos, pasos que falta o errores técnicos.