Validando e corrigindo seus dados com a gestoria de dados
Com a Gestoria de dados no Qlik Talend Cloud, você pode contar com especialistas no assunto para validar e corrigir seus dados. Use seus tipos semânticos e regras de validação existentes para garantir que os dados sejam formados de forma consistente. Isso estende os fluxos de trabalho automatizados com a intervenção humana para correção, com base em conhecimento especializado do domínio. Quando os dados são validados, você pode reinjetá-los na fonte de dados original ou em qualquer sistema de fluxo downstream.
Você cria um sprint que é o corpo principal de trabalho para a validação e remediação. O sprint contém informações sobre:
-
Os dados de origem
-
O esquema de dados a ser usado para validação
-
Os proprietários do sprint
-
Os gestores de dados que são definidos
-
O armazenamento de dados usado para dados de sprint
-
Configurações de fluxo de trabalho
Durante o sprint, todos os dados de sprint são armazenados em seu próprio armazém de dados na nuvem, e não no Qlik Talend Cloud. Atualmente, o Snowflake é o único armazém de dados na nuvem com suporte.
Você pode definir as seguintes funções de usuário:
-
Proprietário do Sprint
Proprietários de sprint podem validar registros que são resolvidos por gestores de dados. Eles também podem acessar registros que foram resolvidos e exportar dados.
-
Organizador de dados
Um gestor de dados recebe registros para resolver problemas de qualidade.
Você cria sprints em Gestoria de dados no centro de atividades do Qlik Talend Data Integration. Você pode criar sprints de resolução que corrigem e organizam dados em um ou mais campos do conjunto de dados que requerem validação. Este é o fluxo de trabalho:
-
Criando um sprint de resolução
Crie um sprint e defina os dados a serem validados. Você pode preencher o sprint com um trabalho do Talend Studio ou importar um arquivo CSV com dados.
Gestores de dados são definidos para realizar a validação. Os registros podem ser atribuídos manual ou automaticamente.
-
Trabalhando em um sprint de resolução
Gestores de dados validam os dados nos registros atribuídos.
-
Gerenciando registros resolvidos
-
Se você preencheu o sprint com um trabalho do Talend Studio, deve criar um trabalho do Talend Studio para recuperar os registros validados e retorná-los à fonte de dados original, ou para qualquer outro destino necessário.
-
Se você preencheu o sprint com um arquivo CSV, o sprint será concluído exportando os dados validados para um arquivo CSV. Você pode atualizar a fonte de dados com dados validados importando o arquivo CSV exportado.
-