Ir para conteúdo principal Pular para conteúdo complementar

Configurando o cálculo da qualidade dos dados

Depois de calcular a qualidade dos dados no seu conjunto de dados pela primeira vez, você tem a possibilidade de atualizar esse cálculo e personalizá-lo de acordo com suas necessidades.

Nota informativaVocê precisa de uma assinatura do Qlik Talend Cloud Enterprise.

Selecionando o tamanho da amostra e o modo de processamento

Para poder personalizar o tamanho da amostra para o cálculo da qualidade, você precisa ter clicado previamente em Calcular uma vez no seu conjunto de dados.

  1. No Qlik Talend Data Integration > Catálogo, abra seu conjunto de dados.

  2. Dependendo de como você deseja calcular a qualidade dos dados:

    • Clique em Atualizar para recalcular a qualidade dos dados usando os parâmetros aplicados anteriormente.

    • Clique na seta para baixo ao lado do botão Atualizar para expandir o painel Qualidade e perfil e personalizar o recálculo.

  3. Em Tamanho da amostra, insira o tamanho da amostra na qual você deseja calcular a qualidade dos dados:

    • Número de linhas: insira o número de linhas nas quais você deseja calcular a qualidade dos dados. O valor máximo é de 100.000 linhas no modo pull-up; não há valor máximo no modo push-down.

    • Porcentagem do conjunto de dados: como alternativa, insira a porcentagem do conjunto de dados no qual você deseja calcular a qualidade dos dados. Valores decimais não são permitidos. Para conjuntos de dados grandes, se 1% do conjunto de dados for maior que o número máximo de linhas permitidas (100.000 linhas), essa opção não será exibida.

  4. Em Modo de processamento, selecione o modo de processamento a ser usado ao calcular a qualidade dos dados:

    • Push-down: atualmente disponível apenas para conjuntos de dados do Snowflake e Databricks. Isso aciona o cálculo de qualidade no lado do banco de dados, custando créditos Snowflake ou Databricks.

    • Pull-up: disponível para todos os conjuntos de dados. Ele aciona a computação da qualidade no Qlik Cloud.

  5. Clique em Atualizar para recalcular a qualidade dos dados de acordo com suas configurações.

Os indicadores de qualidade dos dados, assim como o tamanho da amostra, são exibidos na Visão geral. O tempo de processamento varia dependendo do tamanho da amostra. Observe que a visualização de dados sempre exibe apenas 100 registros.

O cálculo da qualidade dos dados também pode ser acionado e personalizado por meio da API pública da Qlik.

Para o agendamento da qualidade dos dados, o modelo do Qlik Automate Agendar cálculos de qualidade de dados pode ser usado. Para obter mais informações, consulte All templates.

Esta página ajudou?

Se você encontrar algum problema com esta página ou seu conteúdo – um erro de digitação, uma etapa ausente ou um erro técnico – avise-nos!