Ir para conteúdo principal Pular para conteúdo complementar

Criando um sprint de resolução a partir de um arquivo CSV

Você pode criar um sprint de resolução a partir de um arquivo CSV que contém os dados a serem validados.

Pré-requisitos

Antes de criar o sprint, você precisa:

  • Um espaço para usar ao criar o sprint.

    Os proprietários/criadores do sprint devem ter as seguintes permissões no espaço: Pode gerenciar, Pode editar, Pode visualizar, Pode visualizar dados

    Os gestores de dados devem ter as seguintes permissões no espaço: Pode editar, Pode visualizar, Pode visualizar dados

  • Uma conexão com o armazém de dados do Snowflake que você deseja usar para armazenar os dados do sprint. Não use um gateway de dados para a conexão.

    Todos os usuários do sprint devem ter as seguintes permissões no espaço da conexão: Pode editar, Pode visualizar, Pode visualizar dados

    Você pode criar uma conexão em Conexões no centro de atividades do Qlik Talend Data Integration.

    Para obter mais informações sobre conexões do Snowflake, consulte Snowflake.

Criando um sprint

Para criar um sprint de resolução, clique em Criar sprint em Gestoria de dados no centro de atividades do Qlik Talend Data Integration.

Configurações gerais do sprint

  1. Nome

    Adicione um nome para o sprint.

  2. Espaço

    Selecione o espaço onde o sprint será criado.

  3. Descrição

    Adicione uma descrição do sprint.

  4. Fonte para preenchimento do sprint

    Selecione Arquivo.

    Importe o arquivo CSV que contém os dados que você deseja validar.

Clique em Avançar quando estiver pronto para definir o esquema de dados.

Definir o esquema de dados

Agora você pode validar o esquema de dados usado para validar dados e adaptá-los aos seus requisitos. Os indicadores de qualidade dos dados são exibidos para cada coluna, e os dados possivelmente inválidos são destacados. Isso é baseado em uma amostra dos dados.

Bloquear colunas

Clique em ... em uma coluna e selecione Bloquear para bloquear a coluna para edição no sprint. Os dados da coluna ainda estarão visíveis, mas não poderão ser editados pelos gestores de dados.

Excluir colunas

Clique em ... em uma coluna e selecione Excluir para excluir a coluna do sprint. Os dados da coluna não estarão visíveis aos gestores de dados.

Aplicar um tipo semântico a uma coluna

A coluna usará seu tipo de dados nativo como padrão. Você pode aplicar um tipo semântico à coluna para auxiliar os gestores na validação de dados.

  • Selecione a coluna e clique em Editar ao lado de Tipo de dados. Agora você pode selecionar um tipo semântico para aplicar à coluna.

Você também pode alterar o nome e a descrição de cada coluna.

Clique em Avançar quando estiver pronto para definir o armazenamento de dados.

Adicionar uma regra de validação a uma coluna

Você pode aplicar regras de validação a uma coluna para facilitar a identificação de dados inválidos. Dados inválidos serão destacados na coluna.

  • Selecione a coluna e clique em Aplicar regra de validação. Você pode selecionar uma regra de validação existente ou criar uma nova regra de validação.

Para obter mais informações sobre como criar regras de validação, consulte Criando uma regra de validação.

Conectar-se ao armazenamento de dados

Você precisa se conectar ao armazém de dados na nuvem que deseja usar para armazenar os dados do sprint. O Snowflake é atualmente o único armazém de dados com suporte.

  1. Selecione a conexão ao armazém de dados.

  2. Selecione qual banco de dados usar.

  3. Selecione se você deseja usar um esquema de banco de dados existente ou um novo esquema de banco de dados.

    Se você selecionar Novo esquema de banco de dados, defina o nome do novo esquema.

  4. Defina o nome da tabela a ser usada para os dados de sprint resolvidos em Nome da tabela para registros resolvidos.

Clique em Avançar quando estiver pronto para definir funções e outras configurações para o fluxo de trabalho do sprint.

Definir funções e configurações para o fluxo de trabalho do sprint

A última etapa é definir funções e outras configurações.

  1. Adicionar proprietários

    Adicione todos os usuários que devem ser proprietários do sprint.

  2. Adicionar gestores

    Adicione todos os gestores de dados para este sprint.

  3. Fluxo de trabalho de gravação

    Você pode selecionar se deseja adicionar uma segunda etapa de validação pelos proprietários do sprint.

    Nota informativaSe um usuário que é tanto proprietário do sprint quanto gestor de dados validar um registro, a segunda etapa de validação será ignorada.
  4. Atribuição de registro

    Selecione se você deseja atribuir registros automaticamente ou se deseja atribuir registros manualmente a gestores de dados.

    • Automático

      Os registros são atribuídos automaticamente a gestores de dados com uma distribuição uniforme. Os registros não serão atribuídos a proprietários de sprint que não sejam também um gestor de dados.

    • Manual

      Os registros inicialmente não serão atribuídos a um gestor de dados. Proprietários de sprint e gestores de dados podem atribuir registros de Não Atribuído.

  5. Prioridade

    Você pode definir a prioridade para o sprint.

Clique em Salvar quando estiver pronto para criar o sprint.

Agora o sprint foi criado e os gestores de dados atribuídos podem começar a validar os dados.

 

Esta página ajudou?

Se você encontrar algum problema com esta página ou seu conteúdo – um erro de digitação, uma etapa ausente ou um erro técnico – avise-nos!