Saltar al contenido principal

Validar y corregir sus datos con la administración de datos

Con la administración de datos en Qlik Talend Cloud, puede recurrir a expertos en la materia para validar y corregir sus datos. Utilice los tipos semánticos y las reglas de validación existentes para asegurarse de que los datos estén formados de manera sistematizada y coherente. Esto amplía las canalizaciones automatizadas con la corrección de errores en la calidad de datos con intervención humana basada en la experiencia del dominio. Cuando los datos se validan, puede volver a inyectarlos en la fuente de datos original o en cualquier otro sistema posterior.

Nota informativa Disponible en Qlik Talend Cloud Enterprise.

Se crea un sprint, que es el cuerpo principal de trabajo para la validación y la corrección de errores. El sprint contiene información sobre:

  • Los datos de origen

  • El esquema de datos que se utilizará para la validación

  • Los propietarios del sprint

  • Los administradores de datos que se han definido

  • El almacenamiento de datos utilizado para los datos del sprint

  • Configuración del flujo de trabajo

Durante el sprint, todos los datos del sprint se almacenan en su propio almacén de datos en la nube, y no en Qlik Talend Cloud. Actualmente, Snowflake es el único almacén de datos compatible en la nube.

Puede definir los siguientes roles de usuario:

  • Propietario de sprint

    Los propietarios de sprint pueden validar registros que son resueltos por los administradores de datos. También pueden acceder a los registros que están resueltos y exportar datos.

  • Administrador de datos

    A un administrador de datos se le asignan registros para resolver problemas de calidad.

Se crean sprints en Administración de datos en el centro de actividades Qlik Talend Data Integration. Puede crear sprints de resolución que corrijan y organicen datos en uno o más campos del conjunto de datos que requiera validación. Este es el flujo de trabajo:

  1. Crear un sprint de resolución

    Cree un sprint y defina los datos que se han de validar. Puede rellenar el sprint con un trabajo de Talend Studio o importar un archivo CSV con datos.

    Se definen administradores de datos para realizar la validación. Los registros se pueden asignar manual o automáticamente.

  2. Trabajar en un sprint de resolución

    Los administradores de datos validan los datos en los registros asignados.

  3. Gestión de registros resueltos

    • Si ha rellenado el sprint con un trabajo de Talend Studio, cree un trabajo de Talend Studio para recuperar los registros validados y devolverlos al origen de datos fuente, o a cualquier otro destino requerido.

    • Si ha rellenado el sprint con un archivo CSV, el sprint se concluye exportando los datos validados a un archivo CSV. Puede actualizar el origen de datos con datos validados importando el archivo CSV exportado.

¿Esta página le ha sido útil?

Si encuentra algún problema con esta página o su contenido (errores tipográficos, pasos que faltan o errores técnicos), no dude en ponerse en contacto con nosotros.