Avaliando a qualidade dos dados
Depois de abrir um conjunto de dados, você pode dar uma olhada em várias partes da visão geral para saber mais sobre sua qualidade geral, seu esquema, as estatísticas de qualidade e os tipos semânticos de cada coluna.
Indicadores de qualidade do conjunto de dados
Ao abrir a visão geral de um conjunto de dados que acabou de ser registrado, a maior parte das informações fica esmaecida. Para calcular a qualidade dos dados pela primeira vez, clique no botão Calcular. Se a qualidade já foi calculada uma vez, mas você deseja ter certeza de que os dados estão atualizados, clique no botão Atualizar.
Cada computação ou atualização no pushdown induzirá alguns custos no seu armazém de dados na nuvem (Snowflake ou Databricks). Para obter mais informações, consulte Qualidade de dados para conjuntos de dados baseados em conexão.
Existem duas seções principais onde a qualidade é exibida.
-
A área de Qualidade de dados, que inclui:
-
A repartição de valores válidos, inválidos e vazios em todo o conjunto de dados na forma de uma barra de qualidade com três cores e suas respectivas porcentagens.
-
Uma pontuação de Validade, que expressa a porcentagem de valores válidos, sem levar em consideração valores vazios.
-
Uma pontuação de Integridade, que expressa a porcentagem de valores que não estão vazios.
-
-
A área de Esquema que mostra os diferentes campos do conjunto de dados, qual tipo de dados ou tipo semântico foi aplicado, e uma barra de qualidade para cada campo do conjunto de dados.
Descoberta de tipos semânticos
Cada coluna de um conjunto de dados recebe automaticamente um tipo semântico para descrever melhor seu conteúdo. Nos bastidores, ocorre uma operação de descoberta de dados para determinar qual tipo atribuir.
Você também pode criar tipos semânticos e gerenciar os valores em cada tipo semântico.
Para obter mais informações, consulte Gerenciando tipos semânticos.