Qlik Trust Score™
O Qlik Trust Score™ ajuda você a responder à pergunta "Quão confiável é meu conjunto de dados?". Esse indicador de qualidade global agrega várias métricas em uma pontuação única e fácil de entender, fornecendo visibilidade não apenas sobre a integridade de conjuntos de dados individuais, mas também no nível do produto de dados.
O Qlik Trust Score™ geral para um produto de dados é a média das pontuações de confiança de todos os conjuntos de dados incluídos, inclusive os que não estão visíveis, permitindo avaliar e monitorar a qualidade dos dados em todo o seu ambiente de dados.
O Qlik Trust Score™ pode ser adaptado de acordo com as necessidades de qualidade de dados da sua empresa e lhe dá visibilidade sobre a integridade de qualquer conjunto ou produto de dados.
- Qlik Talend Cloud Enterprise
- Qlik Talend Cloud Premium
- Qlik Cloud Analytics Premium
- Qlik Cloud Analytics Enterprise
- Qlik Sense Enterprise SaaS
Visão geral
A partir de uma visão geral do conjunto de dados, você pode encontrar o Qlik Trust Score™ e insights abrangentes, como:
-
O Qlik Trust Score™ global para os conjuntos de dados selecionados e uma porcentagem ou classificação de 5 pontos que indica sua integridade.
-
Os diferentes fatores que podem aumentar ou diminuir o Qlik Trust Score™ de um conjunto de dados. Eles são reagrupados nestas dimensões principais:
-
Validade, que avalia a qualidade do próprio conjunto de dados, incluindo o uso de tipos semânticos e as regras de validação aplicadas, e reflete a proporção de valores válidos na amostra do conjunto de dados. Os valores vazios não são considerados válidos no cálculo dessa dimensão.
-
Integridade, que depende do número de registros vazios na amostra do conjunto de dados.
-
Capacidade de descoberta, que mede a facilidade com que os usuários podem encontrar e entender seu conjunto de dados por meio de seus metadados, afetando diretamente as taxas de adoção.
Leva em consideração o fato de que esse conjunto de dados é referenciado em produtos de dados ativos e reflete o grau de documentação do seu conjunto de dados. Um conjunto de dados bem documentado usa metadados adequados, como descrições ou tags, tanto no conjunto de dados em si quanto nos campos do conjunto de dados.
-
Uso, que mostra o quanto seu conjunto de dados é usado em dependências como aplicativos do Analytics, preparações de dados, fluxos de dados etc. Também leva em conta o número de visualizações que essas dependências têm.
Nota informativaSe não houver uma pontuação exibida para essa dimensão, verifique se as métricas de uso estão habilitadas. Navegue até Administração > Configurações e, em seguida, ative Métricas de uso na seção Controle de recursos. -
Atualidade, que verifica a atualidade dos dados em relação ao limite que você configurou. Para obter mais informações, consulte Originalidade dos dados. Para definir o limite, clique em
para abrir o painel de configuração correspondente:-
Limite de atualização: escolha a idade máxima aceitável dos dados selecionando um valor e uma unidade (minutos, horas, dias ou meses). Esse limite representa a frequência com que o conjunto de dados deve ser atualizado para permanecer relevante para as suas necessidades. Quando a atualidade do conjunto de dados excede o limite especificado, a pontuação de pontualidade diminui, indicando que os dados podem estar desatualizados ou menos confiáveis para a análise atual.
Definir um limite de atualização garante que seu conjunto de dados seja atualizado regularmente e atenda às suas expectativas de dados relevantes e oportunos. A configuração afeta apenas o conjunto de dados selecionado.
-
-
Acurácia, que leva em conta o resultado das regras de validação da qualidade dos dados que têm a categoria Acurácia, bem como seus níveis de gravidade.
Se não houver nenhuma pontuação exibida para essa dimensão, isso significa que não há regras de validação aplicadas a nenhum dos campos do conjunto de dados. Para obter mais informações sobre regras de validação, consulte Trabalhando com regras de validação.
-
Diversidade, que leva em conta a diversidade do conjunto de dados, incluindo as expectativas em relação à uniformidade do conteúdo e à distribuição do volume. Para configurar essa dimensão, clique em
para abrir o painel de configuração correspondente e definir o número desejado de campos e linhas:-
Campos: essa opção avalia a diversidade entre os campos (colunas) em seu conjunto de dados. Ela verifica a distribuição uniforme dos dados entre as colunas e se cada coluna contribui com dados significativos e variados para o conjunto de dados.
-
Linhas: essa opção avalia a distribuição e a variabilidade dos dados entre os registros (linhas) do conjunto de dados. Ajuda a identificar se o conjunto de dados contém uma amostra equilibrada e representativa de registros, sem super ou sub-representação de valores específicos.
Definir valores mínimos aceitáveis para esses parâmetros garante que seu conjunto de dados atenda aos seus requisitos de estrutura (campos) e tamanho da amostra (linhas). A configuração afeta apenas o conjunto de dados selecionado.
-
-
Para poder ver o Qlik Trust Score™ do seu conjunto de dados, você precisa ter calculado a qualidade dos dados pelo menos uma vez.
Se você não vir todas as dimensões do Qlik Trust Score™ do seu conjunto ou produto de dados, verifique se elas estão habilitadas na página de configuração do Qlik Trust Score™.
Configurando o Qlik Trust Score™
Na página Qlik Trust score™, você pode configurar e personalizar o peso de cada dimensão usada para calcular o Qlik Trust Score™, e também o formato de exibição. Observe que essa configuração será aplicada a todos os conjuntos de dados existentes do seu locatário.
Antes de configurar o Qlik Trust Score™, certifique-se de que a qualidade dos dados seja compatível com seu locatário. Os mesmos recursos e limitações que se aplicam à qualidade dos dados também se aplicam ao Qlik Trust Score™, como os tipos de arquivos compatíveis. Para obter mais informações, consulte Qualidade de dados para conjuntos de dados baseados em conexão e Qualidade dos dados para conjuntos de dados baseados em arquivos.
-
No Qlik Talend Data Integration > Qualidade dos dados, clique em Qlik Trust Score™.
-
Para ativar ou desativar uma dimensão, clique no botão de alternância à esquerda.
A Validade e a Integridade não podem ser desativadas, pois são os parâmetros mais essenciais para determinar o Qlik Trust Score™.
-
Para ajustar o peso de cada dimensão, clique nos sinais de mais e menos à direita.
O total de porcentagens de todas as dimensões deve ser igual a 100%.
-
Para personalizar a exibição do Qlik Trust Score™, selecione Uma pontuação de 5 ou Uma porcentagem, dependendo do formato de exibição que você deseja.
Visualizando o histórico do Qlik Trust Score™
O Qlik Trust Score™ evolui continuamente junto com o ciclo de vida de seu conjunto de dados, incluindo alterações nos pesos das dimensões, cálculo de qualidade, tags, descrições, uso, etc.
O recurso de historização permite que você consulte as tendências e a evolução do Qlik Trust Score™ diretamente da visão geral do conjunto ou produto de dados:
-
As principais tendências são exibidas diretamente na visão geral, ao lado do Qlik Trust Score™, e ao lado de cada uma de suas dimensões, representando a alteração em comparação com a pontuação anterior.
-
Você pode acessar o painel detalhado do Histórico do Qlik Trust Score™ de duas maneiras:
-
Em uma visão geral do conjunto de dados: Clique em
ao lado do Qlik Trust score™ e selecione Exibir histórico. -
Na visão geral do produto de dados: clique em
ao lado do conjunto de dados na lista e selecione Histórico do Qlik Trust Score™.
O histórico do Qlik Trust Score™ exibe todos os eventos que resultaram em uma alteração de pontuação, organizados em ordem cronológica. Para cada evento, ele fornece um carimbo de data/hora, uma breve descrição da ação desencadeadora e a dimensão ou dimensões específicas que foram afetadas pela alteração.
-
Por padrão, o histórico do Qlik Trust Score™ é mostrado como um gráfico. Para exibir os dados em um formato de tabela, clique no ícone de tabela localizado no lado direito do gráfico. Os 500 eventos mais recentes são carregados inicialmente, e você pode carregar eventos adicionais diretamente da exibição de tabela.