Saltar al contenido principal Saltar al contenido complementario

Crear un sprint de resolución desde un archivo CSV

Puede crear un sprint de resolución desde un archivo CSV que contenga los datos que se deben validar.

Requisitos previos

Antes de crear el sprint, necesitamos:

  • Un espacio para poder utilizarlo al crear el sprint.

    Los propietarios/creadores del sprint deben tener los siguientes permisos en el espacio: Puede administrar, Puede editar, Puede ver, Puede ver datos

    Los administradores de datos deben tener los siguientes permisos en el espacio: Puede editar, Puede ver, Puede ver datos

  • Una conexión al almacén de datos de Snowflake que desee usar para almacenar datos del sprint. No utilice una pasarela de datos para la conexión.

    Todos los usuarios del sprint deben tener los siguientes permisos en el espacio de la conexión: Puede editar, Puede ver, Puede ver datos

    Puede crear una conexión en Conexiones en el centro de actividades Qlik Talend Data Integration.

    Para más información sobre las conexiones de Snowflake, vea Snowflake.

Creación de un sprint

Para crear un sprint de resolución, haga clic en Crear sprint en Administración de datos en el centro de actividades Qlik Talend Data Integration.

Configuración general del sprint

  1. Nombre

    Añada un nombre para el sprint.

  2. Espacio

    Seleccione un espacio en el que crear el sprint.

  3. Descripción

    Añada una descripción para el sprint.

  4. Fuente para rellenar el sprint

    Seleccione Archivo.

    Importe el archivo CSV que contiene los datos que desea validar.

Haga clic en Siguiente cuando esté listo para continuar y definir el esquema de datos.

Definir el esquema de datos

Ahora puede validar el esquema de datos utilizado para validar los datos y adaptarlo a sus requisitos. Se muestran indicadores de calidad de datos para cada columna y los valores no válidos posiblemente se resaltan. Esto se basa en una muestra de los datos.

Bloquear columnas

Haga clic en ... en una columna y seleccione Bloquear para bloquear la columna para su edición en el sprint. Los datos de la columna seguirán siendo visibles, pero los administradores de datos no podrán editarlos.

Excluir columnas

Haga clic en ... en una columna y seleccione Excluir para excluir la columna del sprint. Los datos de la columna no estarán visibles para los administradores de datos.

Aplicar un tipo semántico a una columna

La columna utilizará su tipo de datos nativo por defecto. Puede aplicar un tipo semántico a la columna para ayudar a los administradores de datos al validar los datos.

  • Seleccione la columna y haga clic en Editar junto a Tipo de datos. Ahora puede seleccionar un tipo semántico para aplicar a la columna.

También puede cambiar el nombre y la descripción de cada columna.

Haga clic en Siguiente cuando esté listo para continuar y definir el almacenamiento de datos.

Añadir una regla de validación a una columna

Puede aplicar reglas de validación a una columna para facilitar la detección de datos no válidos. Los datos no válidos se resaltarán en la columna.

  • Seleccione la columna y haga clic en Aplicar regla de validación. Puede seleccionar una regla de validación existente o crear una nueva regla de validación.

Para obtener más información sobre la creación de reglas de validación, consulte Crear una regla de validación.

Conectarse al almacenamiento de datos

Debe conectarse al almacén de datos en la nube que desee utilizar para almacenar los datos del sprint. Snowflake es actualmente el único almacén de datos compatible.

  1. Seleccione la conexión al almacén de datos.

  2. Seleccione qué base de datos utilizar.

  3. Seleccione si desea usar un esquema de base de datos existente o un nuevo esquema de base de datos.

    Si selecciona Nuevo esquema de base de datos, indique el nombre del nuevo esquema.

  4. Escriba el nombre de la tabla que se utilizará para los datos de sprint resueltos en Nombre de la tabla para registros resueltos.

Haga clic en Siguiente cuando esté listo para continuar y definir los roles y otras configuraciones para el flujo de trabajo del sprint.

Definir roles y configuraciones para el flujo de trabajo del sprint

El último paso es definir los roles y otras configuraciones.

  1. Agregar propietarios

    Agregue todos los usuarios que deban ser propietarios del sprint.

  2. Agregar administradores

    Agregue todos los administradores de datos para este sprint.

  3. Flujo de trabajo de registros

    Puede seleccionar si desea añadir un segundo paso que supondrá la validación por parte de los propietarios del sprint.

    Nota informativaSi un usuario que es a la vez propietario del sprint y administrador de datos valida un registro, se omite el segundo paso de validación.
  4. Asignación de registros

    Seleccione si desea asignar registros automáticamente o si desea asignar registros manualmente a los administradores de datos.

    • Automático

      Los registros se asignan automáticamente a los administradores de datos con una distribución equitativa. Los registros no se asignarán a los propietarios del sprint que no sean también administradores de datos.

    • Manual

      Los registros inicialmente no se asignarán a un administrador de datos. Los propietarios de sprints y los administradores de datos pueden asignar registros desde No asignado.

  5. Prioridad

    Puede establecer la prioridad para el sprint.

Haga clic en Guardar cuando esté listo para crear el sprint.

El sprint ya está creado y los administradores de datos asignados pueden empezar a validar los datos.

 

¿Esta página le ha sido útil?

Si encuentra algún problema con esta página o su contenido (errores tipográficos, pasos que faltan o errores técnicos), no dude en ponerse en contacto con nosotros.