Replicar datos con una suscripción Estándar, Premium o Enterprise

Para configurar una tarea de replicación:

En Integración de datos > Proyectos, haga clic en Crear nuevo > Proyecto.
En el cuadro de diálogo Nuevo proyecto, haga lo siguiente:
1. Dé un Nombre a su proyecto.
2. Seleccione el Espacio en el que desea que se cree el proyecto.
3. Si lo desea, proporcione una Descripción.
4. Seleccione Replication como el Caso de uso.
5. Opcionalmente, desmarque la casilla de verificación Abrir si desea crear un proyecto vacío sin configurar ninguna opción.
6. Haga clic en Crear.
  
  Ocurrirá una de las siguientes situaciones:
  - Si seleccionó la casilla de verificación Abrir en el cuadro de diálogo Nuevo proyecto (opción predeterminada), se abrirá el proyecto.
  - Si desmarcó la casilla de verificación Abrir en el cuadro de diálogo Nuevo proyecto, el proyecto se agregará a su lista de proyectos. Puede abrir el proyecto más tarde seleccionando Abrir en el menú del proyecto .
Una vez abierto el proyecto, haga clic en Replicar datos.

Se abre el asistente Replicar datos.
En la pestaña General, especifique un nombre y una descripción para la tarea de replicación. Haga clic en Siguiente.
En la pestaña Seleccionar conexión de fuente, seleccione una conexión con los datos de origen. Opcionalmente, puede editar la configuración de conexión seleccionando Editar en el menú en la columna Acciones.

Si aún no ha creado una conexión con su fuente de datos, primero debe crear una haciendo clic en Crear conexión en la parte superior derecha de la pestaña.

Puede filtrar la lista de conexiones usando los filtros a la izquierda. Las conexiones se pueden filtrar según el tipo de fuente, puerta de enlace, espacio y propietario. El botón Todos los filtros encima de la lista de conexiones muestra el número de filtros actuales. Puede utilizar este botón para cerrar o abrir el panel Filtros a la izquierda. Los filtros actualmente activos también se muestran encima de la lista de conexiones disponibles.

También puede ordenar la lista seleccionando Modificado por última vez, Creado por última vez o Alfabéticamente en la lista desplegable de la derecha. Haga clic en la flecha a la derecha de la lista para cambiar el criterio de ordenación.

Una vez que haya seleccionado una conexión de fuente de datos, haga clic si lo desea en Probar conexión, en la parte superior derecha de la pestaña (recomendado) y, a continuación, haga clic en Siguiente.
En la pestaña Seleccionar conjuntos de datos, seleccione las tablas y/o vistas que desee incluir en la tarea de replicación. También puede utilizar comodines y crear reglas de selección, como se describe en Seleccionar datos de una base de datos.
En la pestaña Seleccionar conexión de destino, seleccione el destino de la lista de conexiones disponibles y luego haga clic en Siguiente. En términos de funcionalidad, la pestaña es la misma que la pestaña Seleccionar conexión de fuente descrita anteriormente.
En la pestaña Configuración, cambie si lo desea los siguientes parámetros y luego haga clic en Siguiente.

Modo de replicación

Nota informativaCuando se replica desde fuentes de aplicaciones SaaS, el modo de replicación de Carga completa está activado por defecto y no se puede desactivar.
- Carga completa: Carga los datos de las tablas de origen seleccionadas en la plataforma de destino y crea las tablas de destino si es necesario. La carga completa se produce automáticamente cuando se inicia la tarea, pero también se puede realizar manualmente si surge la necesidad.
  
  Nota informativaEsta opción no está disponible cuando se utiliza un conector de vista previa de aplicaciones SaaS. Los conectores de vista previa se indican mediante un botón , tanto en el diálogo Crear conexión como en la ayuda online.
- Aplicar cambios: Mantiene las tablas de destino actualizadas con cualquier cambio realizado en las tablas de origen.
- Guardar cambios: Almacena los cambios en las tablas de origen en las Tablas de cambios (una por cada tabla de origen) .
  
  Para obtener más información, consulte Guardar cambios.
Cuando se trabaja con Data Movement gateway, los cambios se capturan desde la fuente casi en tiempo real. Cuando se trabaja sin Data Movement gateway (configurando Pasarela de datos como Ninguna en los ajustes del conector ), los cambios se capturan según la configuración del programador. El intervalo de captura de cambios predeterminado es cada seis horas. Para obtener más información, consulte Configuración de la tarea de replicación de datos.

Modo de aplicar cambios

Nota informativaAl replicar en destinos de almacén de datos, no puede seleccionar qué modo de Aplicar cambios se usará. Los cambios siempre se aplicarán en el modo Optimizado por lotes para lograr la máxima eficiencia.

Los cambios se aplican a las tablas de destino utilizando uno de los siguientes métodos:
- Optimizado por lotes: esta es la opción predeterminada. Cuando se selecciona esta opción, los cambios se aplican por lotes. Se produce una acción de preprocesamiento para agrupar las transacciones en lotes de la forma más eficiente.
- Por transacción: Seleccione esta opción para aplicar cada transacción individualmente, en el orden en que se haya confirmado. En este caso, se asegura la integridad referencial estricta de todas las tablas.
Conexión con el área de preparación

Al replicar en los almacenes de datos que se indican a continuación, debe configurar un área de preparación. Los datos se procesan y preparan en el área de preparación antes de ser transferidos al almacén de datos.
Seleccione un área de preparación o haga clic en Crear nueva para definir una nueva área de preparación y siga las instrucciones en Conectar con el almacenamiento en la nube.

Para editar la configuración de conexión, haga clic en Editar. Para probar la conexión (recomendado), haga clic en Probar conexión.

Para obtener información sobre qué áreas de preparación son compatibles con qué almacenes de datos, consulte la columna Compatible como área de preparación en Casos de uso de la plataforma de destino y versiones compatibles.

Programador de replicación
Nota informativa
Este ajuste solo está disponible en los siguientes casos de uso:
- Cuando utilice un conector Preview de aplicaciones SaaS. Los conectores Preview están marcados con una etiqueta , tanto en el diálogo Crear conexión como en la ayuda online.
- Al acceder a fuentes de datos sin Data Movement gateway.
Para obtener información sobre las ventajas de Data Movement gateway y los casos de uso que lo requieren, consulte Qlik Data Gateway - Data Movement.
- Replicar datos cada: Puede programar con qué frecuencia capturar los cambios de la fuente de datos y establecer una Hora de inicio y una Fecha de inicio. Si los conjuntos de datos de origen admiten CDC (Captura de datos de cambios), solo se replicarán los cambios de los datos de origen y se aplicarán a las tablas de destino correspondientes. Si los conjuntos de datos de origen no admiten CDC (por ejemplo, Vistas), los cambios se aplicarán recargando todos los datos de origen en las tablas de destino correspondientes. Si algunos de los conjuntos de datos de origen admiten CDC y otros no, se crearán dos subtareas separadas (suponiendo que el sea Aplicar cambios o se hayan seleccionado las opciones de replicación Almacenar cambios): una para recargar los conjuntos de datos que no admiten CDC y la otra para capturar los cambios en los conjuntos de datos que sí admiten CDC.
  
  El asistente de configuración de la incorporación le permite programar un intervalo de horas. Una vez que haya completado el asistente de incorporación, puede explorar diferentes opciones de programación, tal como se describe en Configuración de la tarea de replicación de datos.
Para obtener información sobre los intervalos mínimos de programación según el tipo de fuente de datos y el nivel de suscripción, consulte Intervalos de programación mínimos permitidos.
En la pestaña Resumen se muestra una vista de la canalización de datos. Si algunos de los conjuntos de datos seleccionados no admiten CDC, se mostrarán dos canalizaciones: una para la tarea de CDC y otra para la tarea Recargar. Elija si desea Abrir la tarea de datos <nombre> o No hacer nada y después haga clic en Crear.

Dependiendo de su elección, se abrirá la tarea o se mostrará una lista de proyectos.
Si decide abrir la tarea, la pestaña Conjuntos de datos mostrará la estructura y los metadatos de las tablas de fuentes seleccionadas. Esto incluye todas las tablas enumeradas explícitamente, así como las tablas que coinciden con las reglas de selección.

Si desea agregar más tablas del origen de datos, haga clic en Seleccionar datos de origen.
Opcionalmente, cambie la configuración de la tarea como se describe en Configuración de la tarea de replicación de datos.
Puede realizar transformaciones en los conjuntos de datos, filtrar datos o agregar columnas.

Para obtener más información, consulte Administrar conjuntos de datos.
Cuando haya agregado las transformaciones que desea, puede validar los conjuntos de datos haciendo clic en Validar conjuntos de datos. Si la validación falla, resuelva los errores antes de continuar.

Para obtener más información, consulte Validar y ajustar los conjuntos de datos.
Cuando esté listo, haga clic en Preparar para catalogar la tarea de datos y prepararlo para su ejecución.
Una vez preparada la tarea de datos, haga clic en Ejecutar.

Para obtener información sobre la recuperación de tareas y otros métodos de ejecución de tareas, consulte Opciones de ejecución avanzadas.
La replicación ahora debería comenzar y puede ver el progreso en Supervisar. Para más información, vea Supervisar una tarea de datos individual.

Establecer prioridad de carga para conjuntos de datos

Puede controlar el orden de carga de los conjuntos de datos en su tarea de datos asignando una prioridad de carga a cada conjunto de datos. Esto puede resultar útil, por ejemplo, si desea cargar conjuntos de datos más pequeños antes que conjuntos de datos grandes.

Haga clic en Prioridad de carga.
Seleccione una prioridad de carga para cada conjunto de datos.

La prioridad de carga predeterminada es Normal. Los conjuntos de datos se cargarán en el siguiente orden de prioridad:
- La más alta
- Más alta
- Alta
- Normal
- Baja
- Más baja
- La más baja
Los conjuntos de datos con la misma prioridad se cargan sin ningún orden en particular.
Haga clic en Aceptar.

Los conjuntos de datos de fuentes de aplicaciones SaaS pueden contener dependencias en el orden de carga. Tenga esto en cuenta al establecer la prioridad de carga.

Actualizar los metadatos

Puede actualizar los metadatos de la tarea para alinearlos con los cambios en los metadatos de la fuente en la vista Diseño de una tarea. Para aplicaciones SaaS que utilizan el administrador de metadatos, este debe actualizarse antes de poder actualizar los metadatos en la tarea de datos.

Esta operación no está disponible cuando se utiliza un conector de previsualización de aplicaciones SaaS. Los conectores de vista previa se indican mediante un botón Imagen del botón de Vista previa

, tanto en el diálogo Crear conexión como en la ayuda online.

Esta operación solo afecta a las tablas en la vista de Diseño de una tarea.

Tiene una de dos opciones:
- Haga clic en ... y luego en Actualizar metadatos para actualizar los metadatos de todos los conjuntos de datos de la tarea.
- Haga clic en ... en un conjunto de datos de Conjuntos de datos y luego en Actualizar metadatos, para actualizar los metadatos de un único conjunto de datos.
Puede ver el estado de la actualización de metadatos en Actualizar metadatos en la parte inferior de la pantalla. Puede ver cuándo se actualizaron los metadatos por última vez pasando el cursor del ratón sobre .
Prepare la tarea de datos para aplicar los cambios.

Una vez preparada la tarea de datos y aplicados los cambios, estos se eliminan de Actualizar metadatos.

Debe preparar tareas de almacenamiento que consuman esta tarea para propagar los cambios.

Si se elimina una columna, se añade una transformación con valores Null para garantizar que el almacenamiento no perderá datos históricos.

Limitaciones en la actualización de metadatos

Un cambio de nombre con una columna eliminada antes de eso, en el mismo intervalo de tiempo, se traducirá en el cambio de nombre de la columna eliminada si tienen el mismo tipo y longitud de datos.

Ejemplo:

Antes: a b c d

Después: a c1 d

En este ejemplo, se eliminó b y se cambió el nombre de c a c1, y b y c tienen el mismo tipo y longitud de datos.

Esto se identificará como un cambio de nombre de b a c1 y una eliminación de c.
El cambio de nombre de la última columna no se reconoce, incluso si se eliminó la última columna y se cambió el nombre de la anterior.

Ejemplo:

Antes: a b c d

Después: a b c1

En este ejemplo, se eliminó d y se cambió el nombre de c a c1.

Esto se identificará como una eliminación de c y d y una adición de c1.
Se supone que se agregarán nuevas columnas al final. Si se agregan columnas en el medio con el mismo tipo de datos que la siguiente columna, pueden interpretarse como retirar y cambiar el nombre.

Evolución del esquema

La evolución del esquema le permite detectar fácilmente cambios estructurales en múltiples fuentes de datos y luego controlar cómo se aplicarán esos cambios a su tarea. La evolución del esquema puede utilizarse para detectar cambios de DDL realizados en el esquema de datos de origen. También puede aplicar algunos cambios automáticamente.

La evolución del esquema no está disponible para las tareas definidas con conectores Lite de aplicaciones SaaS o con una suscripción a Qlik Talend Cloud Starter. Está parcialmente disponible para las tareas definidas con conectores de vista previa de aplicaciones SaaS.

Para cada tipo de cambio, puede seleccionar cómo gestionar los cambios en la sección Evolución del esquema de la configuración de tareas. Puede aplicar los cambios, ignorar los cambios, suspender la tabla o detener el procesamiento de tareas.

Puede definir qué acción usar para gestionar los cambios en los DDL en cada tipo de cambio. Algunas acciones no están disponibles para todos los tipos de cambios.

Aplicar al objetivo

Aplica los cambios automáticamente.
Ignorar

Ignora los cambios.
Suspender tabla

Suspende la tabla. La tabla se mostrará como que da error en Supervisar.
Detener tarea

Detiene el procesamiento de la tarea. Esto es útil si desea manejar todos los cambios de esquema manualmente. Esto también detendrá la programación, es decir, no se realizarán las ejecuciones programadas.

Se admiten los siguientes cambios:

Añadir columna
Renombrar columna
Cambiar tipo de datos de columna
Eliminar tabla
Descartar columna
Añadir tabla que coincida con el patrón de selección

Si ha utilizado una regla de selección para añadir conjuntos de datos que coinciden con un patrón, se detectarán y añadirán nuevas tablas que cumplan el patrón.

Para más información sobre la configuración de tareas, consulte Evolución del esquema

También puede recibir notificaciones sobre los cambios que se gestionan con la evolución del esquema. Para más información, vea Configuración de notificaciones sobre cambios.

Limitaciones en la evolución del esquema

Las siguientes limitaciones se aplican a la evolución del esquema:

La evolución de un esquema solo se admite cuando se utiliza CDC como método de actualización.
Cuando haya modificado las opciones de evolución del esquema, deberá preparar de nuevo la tarea.
Si cambia el nombre de las tablas, no se admitirá la evolución del esquema. En ese caso deberá actualizar los metadatos antes de preparar la tarea.
Si está diseñando una tarea, debe actualizar el navegador para recibir los cambios de evolución del esquema. Puede configurar notificaciones para recibir alertas sobre los cambios.
En las tareas de ubicación de destino/aterrizaje, no es posible soltar una columna. Si elimina una columna y la añade, se producirá un error en la tabla.
En las tareas de ubicación de destino o aterrizaje, una operación de soltar tabla no soltará la tabla. Si se elimina una tabla y luego se añade otra, solo se truncará la tabla antigua y no se añadirá una nueva tabla.
Modificar la longitud de una columna no es posible para todos los objetivos dependiendo del soporte en la base de datos de destino.
Si se cambia el nombre de una columna, las transformaciones explícitas definidas utilizando esa columna no surtirán efecto, ya que se basan en el nombre de la columna.
Las limitaciones para actualizar los metadatos también se aplican a la evolución de los esquemas.

Al capturar cambios DDL, se aplican las siguientes limitaciones:

Cuando se produce una secuencia rápida de operaciones en la base de datos de origen (por ejemplo, DDL>DML>DDL), Qlik Talend Data Integration podría analizar el registro en el orden incorrecto, lo que provocaría la falta de datos o un comportamiento impredecible. Para minimizar las posibilidades de que esto ocurra, la mejor práctica consiste en esperar a que los cambios se apliquen al objetivo antes de realizar la siguiente operación.

Como ejemplo de ello, durante la captura de cambios, si una tabla de origen se renombra varias veces en rápida sucesión (y la segunda operación la nombra de nuevo como su nombre original), puede producirse un error que indique que la tabla ya existe en la base de datos de destino.
Si cambia el nombre de una tabla utilizada en una tarea y luego detiene la tarea, Qlik Talend Data Integration no capturará ningún cambio realizado en esa tabla después de reanudar la tarea.
No es posible renombrar una tabla de origen mientras una tarea está detenida.
No se admite la reasignación de las columnas de clave primaria de una tabla (y, por tanto, no se escribirá en la tabla de control del historial de DDL).
Cuando se cambia el tipo de datos de una columna y luego se cambia el nombre de la (misma) columna mientras la tarea está detenida, el cambio de DDL aparecerá en la tabla de control del Historial de DDL como "Soltar columna" y luego como "Añadir columna" cuando se reanude la tarea. Tenga en cuenta que el mismo comportamiento también puede producirse como resultado de una latencia prolongada.
Las operaciones CREATE TABLE realizadas en el origen mientras una tarea está detenida se aplicarán en el destino cuando se reanude la tarea, pero no se registrarán como DDL en la tabla de control del Historial de DDL.
Las operaciones asociadas a cambios en los metadatos (como ALTER TABLE, reorg, reconstrucción de un índice agrupado, etc.) pueden provocar un comportamiento impredecible si se realizan:
- Durante la carga completa
  
  O bien:
- Entre la hora especificada en Comenzar a procesar cambios desde y la hora actual (es decir, el momento en que el usuario hace clic en Aceptar en el cuadro de diálogo Opciones de ejecución avanzadas ).
  
  Ejemplo:
  
  SI:
  
  La hora especificada para Comenzar a procesar cambios desde son las 10:00 horas.
  
  Y:
  
  Se ha añadido una columna denominada Edad a la tabla de Empleados a las 10:10 horas.
  
  Y:
  
  El usuario hace clic en Aceptar en el cuadro de diálogo Opciones de ejecución avanzadas a las 10:15 horas.
  
  ENTONCES
  
  Los cambios ocurridos entre las 10:00 y las 10:10 pueden provocar errores en el CDC.
Nota informativa
En cualquiera de los casos anteriores, la(s) tabla(s) afectada(s) deberá(n) recargarse para que los datos se transfieran o desplazado correctamente al destino.

La sentencia ALTER TABLE ADD/MODIFY <column> <data_type> DEFAULT <> del DDL no replica el valor por defecto en el destino y la columna nueva/modificada se establece en NULL. Tenga en cuenta que esto puede ocurrir incluso si el DDL que añadió/modificó la columna se ejecutó en el pasado. Si la columna nueva/modificada es anulable, el punto final de origen actualiza todas las filas de la tabla antes de registrar el propio DDL. Como resultado, Qlik Talend Data Integration captura los cambios pero no actualiza el destino. Como la columna nueva/modificada se establece en NULL, si la tabla de destino no tiene clave primaria/índice único, las actualizaciones posteriores generarán un mensaje de "cero filas afectadas".
Las modificaciones de las columnas de precisión TIMESTAMP y DATE no se capturarán.

Manejo de cambios que no se aplican automáticamente

A continuación se describe cómo gestionar los cambios que no pueden aplicarse al objetivo, es decir, la acción es Ignorar, Suspender o Detener la tarea.

Cambio en DDL	Aplicar el cambio	Preservar el estado actual
Añadir columna	Actualice los metadatos, prepare la tarea y luego ejecútela.	No se requiere ninguna acción
Crear tabla	Actualice los metadatos, prepare la tarea y ejecútela.	No se requiere ninguna acción
Cambiar tipo de datos de columnas	Revise las limitaciones, si no se aplica ninguna limitación: Actualice los metadatos, prepare la tarea y ejecútela.	No siempre es posible conservar el estado actual. Posibles soluciones: Cambie manualmente el tipo de datos de la columna. Esto debe repetirse en las tareas posteriores. Cree una nueva columna y dirija la columna antigua a la nueva, después cree manualmente una vista que combine las dos columnas.
Renombrar tabla	Revise las limitaciones, si no se aplica ninguna limitación: Prepare la tarea y ejecútela.	Defina una regla explícita de renombramiento al nombre antiguo.
Renombrar columna	Revise las limitaciones, si no se aplica ninguna limitación: Actualice los metadatos, prepare la tarea y ejecútela.	Actualice los metadatos y, a continuación, defina una regla explícita de cambio de nombre al nombre antiguo.

Limitaciones y consideraciones al replicar datos

Las transformaciones están sujetas a las siguientes limitaciones:

No se admiten transformaciones en columnas con idiomas que se escriben de derecha a izquierda.
Las transformaciones no pueden llevarse a cabo en columnas que contengan caracteres especiales (por ejemplo #, \, /, -) en el nombre.
La única transformación admitida para los tipos de datos LOB/CLOB consiste en soltar la columna en el objetivo.
No se admite el uso de una transformación para renombrar una columna y luego añadir otra nueva con el mismo nombre.

No se admite la modificación de la anulabilidad en columnas desplazadas, ya sea cambiándola directamente o utilizando una regla de transformación. Sin embargo, las nuevas columnas creadas en la tarea son anulables por defecto.

¿Esta página le ha sido útil?

No dude en indicarnos en qué podemos mejorar si encuentra algún problema en esta página o su contenido, como, por ejemplo, errores tipográficos, pasos que falta o errores técnicos.

Deje aquí sus comentarios