Opciones de configuración de un proyecto de canalización de datos

Puede cambiar la configuración de un proyecto de canalización de datos en Qlik Talend Data Integration. Las propiedades son comunes al proyecto y a todas las tareas de datos incluidas. Algunas configuraciones solo están disponibles para plataformas de datos específicas.

Haga clic en Configuración, en el proyecto.

Configuración para proyectos de procesos de datos de almacén de datos

Plataforma de datos

Puede cambiar los siguientes ajustes:

Conexión

La conexión para el proyecto.
Conexión con el área de preparación

Esta opción no está disponible cuando la plataforma de datos es Snowflake.

No es posible cambiar el tipo de plataforma de un proyecto, por ejemplo, de Snowflake a Google BigQuery.

Metadatos

Puede establecer un sufijo para artefactos internos y sufijos predeterminados para las vistas que se crean.

Preferencias de artefactos
- Prefijo para todos los esquemas: El prefijo que se agregará a los esquemas de datos que se crean en el proyecto. Esto es útil cuando un proyecto importado está en el mismo almacén de datos en la nube que un proyecto exportado.
- Sufijo para esquema interno: el sufijo que se utilizará para los esquemas empleados para almacenar artefactos internos.
- Uso de mayúsculas predeterminado del nombre de esquema: el uso de mayúsculas predeterminado para todos los nombres de esquema. Si su base de datos está configurada para obligar al uso de mayúsculas, esta opción no tendrá efecto.
Sufijos para vistas externas

Establezca sufijos predeterminados para las vistas que se crean en las tareas de datos incluidas en el proyecto.

Configuración por defecto para nuevas tareas

Puede establecer valores predeterminados para las tareas de datos que se creen en el proyecto. Cuando crea una tarea de datos, puede cambiar el valor.

Puede configurar la base de datos predeterminada para crear artefactos de destino para todos los tipos de tareas de datos.

Ajustes predeterminados de tareas de aterrizaje

Base de datos predeterminada

Puede utilizar la base de datos predeterminada del proyecto o especificar otra base de datos.

Acceso al destino a través de un proxy al usar Data Movement gateway

Esta opción solo está disponible cuando se accede a los objetivos a través de Data Movement gateway.

Al utilizar la pasarela de movimiento de datos Data Movement gateway, conéctese a través de un proxy a

Al usar Data Movement gateway, puede conectarse a la plataforma de destino y a la plataforma (área) de ensayo a través de un proxy.

Para más información sobre cómo configurar Data Movement gateway para usar un servidor proxy, vea Configurar el espacio empresarial inquilino de Qlik Cloud y un servidor proxy.
- Plataforma de destino
  
  Nota informativaDisponible cuando se usan Snowflake, Google BigQuery y Databricks.
- Plataforma de preparación
  
  Nota informativaDisponible cuando se usan Azure Synapse Analytics, Amazon Redshift y Databricks.

Ajustes predeterminados de tareas de almacenamiento

Almacén de datos históricos (Tipo 2)

Puede conservar los datos de cambios históricos para permitirle recrear fácilmente los datos tal y como se veían en un punto específico en el tiempo. Puede usar las vistas del historial y vistas del historial en vivo para ver los datos históricos.
Vistas en vivo

Las vistas en vivo muestran una vista por cada tabla de origen seleccionada. Dicha vista fusiona la tabla con los cambios de la tabla de cambios. Esto proporciona a las consultas una vista en vivo de los datos sin tener que esperar al siguiente ciclo de solicitud.

Base de datos predeterminada

Puede utilizar la base de datos predeterminada del proyecto o especificar otra base de datos.

Catálogo

Publicar en el catálogo

Seleccione esta opción para publicar esta versión de los datos en el Catálogo como un conjunto de datos. El contenido del catálogo se actualizará la próxima vez que prepare esta tarea.

Tipo de vista predeterminada

Disponible solo cuando se utiliza la plataforma de datos Snowflake.

Vistas estándar

Utilice las vistas estándar para mostrar los resultados de una consulta como si se tratara de una tabla.
Vistas seguras de Snowflake

Utilice las vistas seguras de Snowflake para aquellas vistas que precisen protección de la privacidad de datos o de la información sensible, como las vistas creadas para limitar el acceso a datos sensibles que no deban estar expuestos a todos los usuarios de las tablas. Las vistas seguras de Snowflake pueden ejecutarse más lentamente que las vistas Estándar.

Ajustes predeterminados de tareas de datos registrados

Base de datos predeterminada

Puede utilizar la base de datos predeterminada del proyecto o especificar otra base de datos.

Catálogo

Publicar en el catálogo

Seleccione esta opción para publicar esta versión de los datos en el Catálogo como un conjunto de datos. El contenido del catálogo se actualizará la próxima vez que prepare esta tarea.

Configuraciones de carga incremental

Estos ajustes están disponibles cuando se selecciona Incremental usando límite máximo.

Tablas de cambios

Si los cambios están en la misma tabla, seleccione Los cambios están dentro de la misma tabla.

De lo contrario, borre Los cambios están dentro de la misma tabla y especifique un patrón para la tabla de cambios.
Columna de límite máximo

Establezca el nombre de la columna de límite máximo en Nombre.
Columna "Desde la fecha"

Puede indicar la "Fecha de inicio" por la hora de inicio o mediante una columna seleccionada.

Si selecciona Columna "Desde la fecha" seleccionada, debe definir un Patrón "Desde la fecha".
Eliminación temporal

Puede incluir eliminaciones temporales en los cambios seleccionando Los cambios incluyen eliminaciones temporales y definiendo una expresión que lo indique.

La expresión de la indicación debe evaluarse como True si el cambio es una eliminación temporal.

Ejemplo: ${is_deleted} = 1
Antes de la imagen

Puede filtrar los registros de imágenes antes de que cambien las tablas de cambios seleccionando Antes de la imagen y definiendo una expresión de indicación.

La expresión de la indicación debe evaluarse como True si la fila contiene la imagen antes de la actualización.

Ejemplo: ${header__change_oper} = 'B'

Valores predeterminados de la tarea de transformación

Almacén de datos históricos (Tipo 2)

Puede conservar los datos de cambios históricos para permitirle recrear fácilmente los datos tal y como se veían en un punto específico en el tiempo. Puede usar las vistas del historial y vistas del historial en vivo para ver los datos históricos.

Materialización

No materializado (solo vistas)

Seleccione esta opción para crear únicamente vistas que realicen transformaciones sobre la marcha.
Materializadas (tablas y vistas)

Seleccione esta opción para crear tablas y vistas.

Base de datos predeterminada

Puede utilizar la base de datos predeterminada del proyecto o especificar otra base de datos.

Catálogo

Publicar en el catálogo

Seleccione esta opción para publicar esta versión de los datos en el Catálogo como un conjunto de datos. El contenido del catálogo se actualizará la próxima vez que prepare esta tarea.

Tipo de vista predeterminada

Disponible solo cuando se utiliza la plataforma de datos Snowflake.

Vistas estándar

Utilice las vistas estándar para mostrar los resultados de una consulta como si se tratara de una tabla.
Vistas seguras de Snowflake

Utilice las vistas seguras de Snowflake para aquellas vistas que precisen protección de la privacidad de datos o de la información sensible, como las vistas creadas para limitar el acceso a datos sensibles que no deban estar expuestos a todos los usuarios de las tablas. Las vistas seguras de Snowflake pueden ejecutarse más lentamente que las vistas Estándar.

Tipo de tabla predeterminada

Disponible solo cuando se utiliza la plataforma de datos Snowflake.

Estos ajustes solo están disponibles en proyectos con Snowflake como plataforma de datos.

Tipo de tabla

Puede seleccionar el tipo de tabla que desea utilizar:
- Tablas de Snowflake
- Tablas Iceberg gestionadas por Snowflake
  
  Debe establecer el nombre predeterminado del volumen externo en Volumen externo de Snowflake.
Carpeta de almacenamiento en la nube que usar

Seleccione la carpeta que se utilizará para el destino/aterrizaje de los datos.
- Carpeta predeterminada
  
  Esto crea una carpeta con el nombre predeterminado: <nombre de proyecto>/<nombre de la tarea de datos>.
- Carpeta raíz
  
  Almacene los datos en la carpeta raíz del almacenamiento.
- Carpeta
  
  Especifique un nombre de carpeta que usar.
Sincronizar con el catálogo abierto de Snowflake

Actívelo para permitir que Snowflake Open Catalog gestione los archivos del almacenamiento de archivos en la nube.

Valores predeterminados de la tarea de data mart

Base de datos predeterminada

Puede utilizar la base de datos predeterminada del proyecto o especificar otra base de datos.

Catálogo

Publicar en el catálogo

Seleccione esta opción para publicar esta versión de los datos en el Catálogo como un conjunto de datos. El contenido del catálogo se actualizará la próxima vez que prepare esta tarea.

Valores predeterminados de tiempo de ejecución

Puede definir la configuración predeterminada del rendimiento del tiempo de ejecución para los activos de datos que se incluyen en el proyecto.

Valores predeterminados de aterrizaje

Puede establecer el número máximo de conexiones de bases de datos en Ejecución en paralelo.

Valores predeterminados de almacenamiento

Puede establecer la configuración de programación predeterminada en una programación basada en el tiempo. Este será el valor predeterminado para cada tarea de almacenamiento creada.
Puede establecer el almacén de datos predeterminado si la plataforma del proyecto es Snowflake.

Valores predeterminados de transformación

Puede establecer la configuración de programación predeterminada en una programación basada en el tiempo o Al completar con éxito cualquier tarea de datos de entrada. Este será el valor predeterminado para cada tarea de transformación creada.
Puede establecer el almacén de datos predeterminado si la plataforma del proyecto es Snowflake.

Valores predeterminados del data mart

Puede establecer la configuración de programación predeterminada en una programación basada en el tiempo o Al completar con éxito cualquier tarea de datos de entrada. Este será el valor predeterminado para cada tarea de data mart creada.
Puede establecer el almacén de datos predeterminado si la plataforma del proyecto es Snowflake.

Valores predeterminados del reflejo

Puede establecer el almacén de datos predeterminado si la plataforma del proyecto es Snowflake.

Configuración para proyectos de canalización de datos Qlik Open Lakehouse

Plataforma de datos

Puede cambiar los siguientes ajustes:

Conexión con el catálogo de datos: Seleccione una conexión existente o haga clic en Crear nueva para añadir una nueva conexión al catálogo de datos. También puede editar una conexión existente y verificar que la conexión funciona haciendo clic en Probar conexión.
Conexión de aterrizaje en destino: seleccione el depósito de S3 para el destino temporal o aterrizaje de los datos, o haga clic en Crear nuevo para añadir una nueva ubicación del depósito. También puede editar una conexión existente y verificar que la conexión funciona haciendo clic en Probar conexión.

No es posible cambiar el tipo de plataforma de un proyecto, por ejemplo, de Snowflake a Google BigQuery.

Metadatos

Puede establecer un sufijo para artefactos internos y sufijos predeterminados para las vistas que se crean.

Preferencias de artefactos
- Prefijo para todos los esquemas: El prefijo que se agregará a los esquemas de datos que se crean en el proyecto. Esto es útil cuando un proyecto importado está en el mismo almacén de datos en la nube que un proyecto exportado.
- Sufijo para esquema interno: el sufijo que se utilizará para los esquemas empleados para almacenar artefactos internos.
- Uso de mayúsculas predeterminado del nombre de esquema: el uso de mayúsculas predeterminado para todos los nombres de esquema. Si su base de datos está configurada para obligar al uso de mayúsculas, esta opción no tendrá efecto.
Sufijos para vistas externas

Establezca sufijos predeterminados para las vistas que se crean en las tareas de datos incluidas en el proyecto.

Hash

Puede establecer una cadena de sal de hash para usarla al aplicar hash a una columna, por ejemplo, para enmascarar información confidencial. Esto generará un hash SHA-256 de la columna de entrada después de concatenarla con la cadena de sal de hash.

Puede usar el ID de proyecto como cadena de sal, o establecer una cadena de sal personalizada.

Configuración por defecto para nuevas tareas

Puede establecer valores predeterminados para las tareas de datos que se creen en el proyecto. Cuando crea una tarea de datos, puede cambiar el valor.

Puede configurar la base de datos predeterminada para crear artefactos de destino para todos los tipos de tareas de datos.

Valores predeterminados de las tareas de aterrizaje en un lago de datos

Carpeta que usar

Seleccione una de las siguientes opciones, según la carpeta de depósitos en la que desee que se escriban los archivos:

Carpeta predeterminada

El formato de carpeta por defecto es <nombre-de-su-proyecto>/<nombre-de-su-tarea>.
Carpeta raíz

Los archivos se escribirán en la carpeta raíz del depósito.
Carpeta

Especifique un nombre de carpeta. La carpeta se creará durante la tarea de datos si aún no existe.

Nota informativa El nombre de la carpeta no puede incluir caracteres especiales (por ejemplo, @, #, !, etc.).

Valores predeterminados de las tareas de almacenamiento

Almacén de datos históricos (Tipo 2)

Puede conservar los datos de cambios históricos para permitirle recrear fácilmente los datos tal y como se veían en un punto específico en el tiempo. Puede usar las vistas del historial y vistas del historial en vivo para ver los datos históricos.

Catálogo

Publicar en el catálogo

Seleccione esta opción para publicar esta versión de los datos en el Catálogo como un conjunto de datos. El contenido del catálogo se actualizará la próxima vez que prepare esta tarea.

Carpeta para usar en el área de preparación

Seleccione una de las siguientes opciones, según la carpeta de depósitos en la que desee que se escriban los archivos:

Carpeta predeterminada

El formato de carpeta por defecto es <nombre-de-su-proyecto>/<nombre-de-su-tarea>.
Carpeta raíz

Los archivos se escribirán en la carpeta raíz del depósito.
Carpeta

Especifique un nombre de carpeta. La carpeta se creará durante la tarea de datos si aún no existe.

Nota informativa El nombre de la carpeta no puede incluir caracteres especiales (por ejemplo, @, #, !, etc.).

Valores predeterminados de las tareas de aterrizaje de streaming

Puede establecer valores predeterminados para las tareas de aterrizaje de transmisión creadas en el proyecto.

Carpeta que usar

Seleccione una de las siguientes opciones, según la carpeta de depósitos en la que desee que se escriban los archivos:

Carpeta predeterminada

El formato de carpeta por defecto es <nombre-de-su-proyecto>/<nombre-de-su-tarea>.
Carpeta raíz

Los archivos se escribirán en la carpeta raíz del depósito.
Carpeta

Especifique un nombre de carpeta. La carpeta se creará durante la tarea de datos si aún no existe.

Nota informativa El nombre de la carpeta no puede incluir caracteres especiales (por ejemplo, @, #, !, etc.).

Retención de carpetas

Seleccione cuánto tiempo retener los datos:

Los datos y metadatos no se eliminan

Ni los datos ni los metadatos se eliminan.
Eliminar datos y metadatos después del período de retención

Los datos y metadatos se eliminan una vez transcurrido el período de retención.
Eliminar metadatos después del periodo de retención. Los datos son eliminados por un sistema externo.

Los metadatos se purgan una vez transcurrido este período. Los datos subyacentes, por ejemplo el objeto S3, no son eliminados por Qlik, sino por un sistema externo.

Valores predeterminados de las tareas de transformación de streaming

Puede establecer valores predeterminados para las tareas de transformación de streaming creadas en el proyecto.

Catálogo

Publicar en el catálogo

Seleccione esta opción para publicar esta versión de los datos en el Catálogo como un conjunto de datos. El contenido del catálogo se actualizará la próxima vez que prepare esta tarea.

Carpeta que usar

Seleccione una de las siguientes opciones, según la carpeta de depósitos en la que desee que se escriban los archivos:

Carpeta predeterminada

El formato de carpeta por defecto es <nombre-de-su-proyecto>/<nombre-de-su-tarea>.
Carpeta raíz

Los archivos se escribirán en la carpeta raíz del depósito.
Carpeta

Especifique un nombre de carpeta. La carpeta se creará durante la tarea de datos si aún no existe.

Nota informativa El nombre de la carpeta no puede incluir caracteres especiales (por ejemplo, @, #, !, etc.).

Definiciones de tabla

Configure las columnas de encabezado de vista estándar que aparecen por defecto en las vistas estándar para todas las tareas de transformación de streaming en este proyecto.

hdr__from_timestamp

Cuando esta opción está habilitada, la columna de encabezado hdr__from_timestamp aparecerá en las vistas estándar. Además, cuando se selecciona Particionar por fecha de ingesta de eventos en el asistente de incorporación, hdr__from_timestamp se utilizará como columna de partición predeterminada. Puede anular esta configuración a nivel de tarea o de conjunto de datos.

Nota informativaLas vistas de historial siempre incluyen todas las columnas de encabezado de vista estándar, independientemente de esta configuración.

Tiempo de ejecución

Puede definir la configuración predeterminada del rendimiento del tiempo de ejecución para las tareas de datos que se incluyen en el proyecto.

Valores predeterminados de las tareas de aterrizaje en el lago de datos

Puede establecer el número máximo de conexiones de bases de datos en Ejecución en paralelo.

Valores predeterminados de las tareas de almacenamiento

Clúster de lakehouse

Opcionalmente, elija un clúster de Lakehouse dedicado para las tareas de almacenamiento.

Valores predeterminados de la tarea de destino de streaming

Número de lectores

Seleccione el número de lectores que va a utilizar. El valor debe estar entre 1 y 1.000.

Clúster de lakehouse

Opcionalmente, elija un clúster de Lakehouse dedicado para las tareas de almacenamiento.

Valores predeterminados de la tarea de transformación de streaming

Clúster de lakehouse

Opcionalmente, elija un clúster de Lakehouse dedicado para las tareas de almacenamiento.

Reflejar los valores predeterminados

Puede establecer el almacén de datos predeterminado si la plataforma del proyecto es Snowflake.

¿Esta página le ha sido útil?

Si encuentra algún problema con esta página o su contenido (errores tipográficos, pasos que faltan o errores técnicos), no dude en ponerse en contacto con nosotros.

Deje aquí sus comentarios