Validar y corregir sus datos con la administración de datos
Con la administración de datos en Qlik Talend Cloud, puede recurrir a expertos en la materia para validar y corregir sus datos. Utilice los tipos semánticos y las reglas de validación existentes para asegurarse de que los datos estén formados de manera sistematizada y coherente. Esto amplía las canalizaciones automatizadas con la corrección de errores en la calidad de datos con intervención humana basada en la experiencia del dominio. Cuando los datos se validan, puede volver a inyectarlos en la fuente de datos original o en cualquier otro sistema posterior.
Se crea un sprint, que es el cuerpo principal de trabajo para la validación y la corrección de errores. El sprint contiene información sobre:
-
Los datos de origen
-
El esquema de datos que se utilizará para la validación
-
Los propietarios del sprint
-
Los administradores de datos que se han definido
-
El almacenamiento de datos utilizado para los datos del sprint
-
Configuración del flujo de trabajo
Durante el sprint, todos los datos del sprint se almacenan en su propio almacén de datos en la nube, y no en Qlik Talend Cloud. Actualmente, Snowflake es el único almacén de datos compatible en la nube.
Puede definir los siguientes roles de usuario:
-
Propietario de sprint
Los propietarios de sprint pueden validar registros que son resueltos por los administradores de datos. También pueden acceder a los registros que están resueltos y exportar datos.
-
Administrador de datos
A un administrador de datos se le asignan registros para resolver problemas de calidad.
Se crean sprints en Administración de datos en el centro de actividades Qlik Talend Data Integration. Puede crear sprints de resolución que corrijan y organicen datos en uno o más campos del conjunto de datos que requiera validación. Este es el flujo de trabajo:
-
Cree un sprint y defina los datos que se han de validar. Puede rellenar el sprint con un trabajo de Talend Studio o importar un archivo CSV con datos.
Se definen administradores de datos para realizar la validación. Los registros se pueden asignar manual o automáticamente.
-
Trabajar en un sprint de resolución
Los administradores de datos validan los datos en los registros asignados.
-
Gestión de registros resueltos
-
Si ha rellenado el sprint con un trabajo de Talend Studio, cree un trabajo de Talend Studio para recuperar los registros validados y devolverlos al origen de datos fuente, o a cualquier otro destino requerido.
-
Si ha rellenado el sprint con un archivo CSV, el sprint se concluye exportando los datos validados a un archivo CSV. Puede actualizar el origen de datos con datos validados importando el archivo CSV exportado.
-