Configurando o cálculo da qualidade dos dados
Depois de calcular a qualidade dos dados no seu conjunto de dados pela primeira vez, você tem a possibilidade de atualizar esse cálculo e personalizá-lo de acordo com suas necessidades.
Selecionando o tamanho da amostra e o modo de processamento
Para poder personalizar o tamanho da amostra para o cálculo da qualidade, você precisa ter clicado previamente em Calcular uma vez no seu conjunto de dados.
-
No Qlik Talend Data Integration > Catálogo, abra seu conjunto de dados.
-
Dependendo de como você deseja calcular a qualidade dos dados:
-
Clique em Atualizar para recalcular a qualidade dos dados usando os parâmetros aplicados anteriormente.
-
Clique na seta para baixo ao lado do botão Atualizar para expandir o painel Qualidade e perfil e personalizar o recálculo.
-
-
Em Tamanho da amostra, insira o tamanho da amostra na qual você deseja calcular a qualidade dos dados:
-
Número de linhas: insira o número de linhas nas quais você deseja calcular a qualidade dos dados. O valor máximo é de 100.000 linhas no modo pull-up; não há valor máximo no modo push-down.
-
Porcentagem do conjunto de dados: como alternativa, insira a porcentagem do conjunto de dados no qual você deseja calcular a qualidade dos dados. Valores decimais não são permitidos. Para conjuntos de dados grandes, se 1% do conjunto de dados for maior que o número máximo de linhas permitidas (100.000 linhas), essa opção não será exibida.
-
-
Em Modo de processamento, selecione o modo de processamento a ser usado ao calcular a qualidade dos dados:
-
Push-down: atualmente disponível apenas para conjuntos de dados do Snowflake e Databricks. Isso aciona o cálculo de qualidade no lado do banco de dados, custando créditos Snowflake ou Databricks.
-
Pull-up: disponível para todos os conjuntos de dados. Ele aciona a computação da qualidade no Qlik Cloud.
-
-
Clique em Atualizar para recalcular a qualidade dos dados de acordo com suas configurações.
Os indicadores de qualidade dos dados, assim como o tamanho da amostra, são exibidos na Visão geral. O tempo de processamento varia dependendo do tamanho da amostra. Observe que a visualização de dados sempre exibe apenas 100 registros.
O cálculo da qualidade dos dados também pode ser acionado e personalizado por meio da API pública da Qlik.
Para o agendamento da qualidade dos dados, o modelo do Qlik Automate Agendar cálculos de qualidade de dados pode ser usado. Para obter mais informações, consulte All templates.