Ir para conteúdo principal Pular para conteúdo complementar

Gerenciando metadados e perfis de dados em nível de campo

Com a definição de perfis, os administradores de dados acessam informações técnicas valiosas sobre seus conjuntos de dados. Os desenvolvedores de aplicativos usam estatísticas de perfil e amostragem de dados para obter ideias e orientações de criação de aplicativos e planejamento de visualizações. A definição de perfil de campos pode ajudar analistas de dados e usuários corporativos a obter insights com mais rapidez. Eles podem exibir e visualizar métricas valiosas de perfil de campo rapidamente sem precisar criar um aplicativo primeiro. Metadados em nível de campo permitem que os usuários apliquem aliases, descrições e classificações aos campos. Esses recursos ajudam a identificar dados específicos e campos confidenciais.

Nota informativaO Qlik Cloud somente define perfis de até 12 milhões de linhas em um conjunto de dados. Se um conjunto de dados exceder 12 milhões de linhas, apenas as primeiras 12 milhões de linhas terão um perfil definido. Metadados para todos os campos ainda são adicionados, independentemente do número de linhas com perfil definido.

Gerenciando metadados em nível de campo

Você pode acessar e editar metadados de cada campo em seu conjunto de dados na guia Campos. Selecione qualquer cartão da exibição Selecione o ícone de bloco para a exibição em bloco Tile, qualquer linha da exibição Selecione o ícone de lista para a exibição em lista List ou qualquer coluna da exibição Dados para abrir o painel Detalhes desse campo à direita da grade. Os campos de metadados em nível de campo — Alias do campo, Descrição, Tags e Classificação— são opcionais e podem ser definidos e editados a partir desse painel.

Campos de metadados de campo
Detalhes Descrição
Alias do campo Insira um nome alternativo opcional para tornar os nomes de campo mais significativos na análise do perfil. Os nomes dos campos de alias são exibidos somente na análise do perfil e não afetam os nomes das colunas técnicas.
Descrição

Insira qualquer informação que possa ser útil para que os usuários visualizem os metadados do campo e criem o perfil do campo.

Marcas Insira trechos de texto para definir e categorizar esse campo e seus dados.
Classificação Marque a caixa de seleção para Informações pessoais ou Informações confidenciais.
Nota informativaClassificações selecionadas em nível de campo Informações pessoais e e Informaçõesconfidenciais aparecem na guia Visão geral do conjunto de dados listada por campo abaixo dos metadados técnicos do conjunto de dados.
Nota informativaAs classificações aplicadas aos campos em arquivos do Excel com várias pastas serão listadas com o nome da pasta e o nome do campo (exemplo: Informações pessoais: Sheet1/EmpID).

Metadados em nível de campo para um arquivo XLSX com várias pastas

Selecione um cartão de campo na exibição em mosaico para abrir o painel Detalhes

Definir perfis de dados

Estatísticas de perfil fornecem análises de colunas que medem a incidência, os intervalos e os valores que ocorrem em conjuntos de dados. Essas métricas descrevem relacionamentos entre valores de campos, como:

  • Contagem de valores distintos (cardinalidade)
  • Valores de amostra, valores mais comuns e frequência de valor
  • Redundâncias úteis na identificação de valores padrão ou potencialmente duplicados
  • Contagens de valores nulos, numéricos ou de cadeias
  • Informações sobre intervalos de valores, incluindo mínimo, máximo, média, soma e desvio padrão

O catálogo fornece três exibições de dados de perfil de campo: Tile view, List view e Data view.

Tile view é uma representação visual baseada em cartão de campos dispostos como uma grade.

List view é um resumo tabular de estatísticas de perfil configuráveis.

Table view lista os nomes das colunas de campo e até os primeiros vinte registros do conjunto de dados.

Selecione o TileSelecione o ícone de bloco para a exibição em bloco, ListSelecione o ícone de lista para a exibição em lista ou o ícone Dados para alternar entre exibições de perfil.

Exibição Perfil lado a lado

A exibição Perfil lado a lado é um perfil de campo visual projetado para exibir o conteúdo mais informativo para aquele tipo de campo. O tipo de cartão de visualização padrão mostrado é determinado dependendo de o número de valores numéricos ou de texto ser maior ou não para aquele campo. Por exemplo, para campos com texto e valores numéricos, o tipo de cartão Most Common Values (Valores mais comuns) será exibido por padrão se houver mais valores de texto, e o tipo de cartão de distribuição numérico Binned Frequency (Frequência compartimentada) será exibido se houver mais valores numéricos no campo. Uma chave suspensa é fornecida para que você possa alternar para o tipo de cartão Most Common Values Frequency (Frequência de valores mais comuns) para qualquer campo que tenha valores não exclusivos quando ícone de Valores mais comuns for selecionado. Outra opção é retornar ao cartão de distribuição numérica se Binned Frequency (Frequência compartimentada) ícone de Frequência compartimentada estiver selecionado. Observe que todos os tipos de cartão incluem o número de valores nulos, caso o campo tenha valores nulos.

Exibição lado a lado: O perfil dos campos é definido por métricas que são significativas para o tipo de dados contidos nesses campos (por exemplo: texto versus valores numéricos)

Exibição de bloco de perfil do conjunto de dados

Cartão Sample values (Valores de amostra)

O cartão Sample values (Valores de amostra) é mostrado quando todos os valores são únicos e somente texto. Ele listará (até) os primeiros três valores e o número total de valores exclusivos adicionais.

Cartão de exibição de blocos: Valores de amostra
Bloco de valores de amostra

Critérios de perfil de Sample values (Valores de amostra): Os perfis dos valores de campo são definidos com esse cartão quando a cardinalidade é alta (todos os valores distintos). No caso em que todos os valores são baseados em texto e exclusivos, alguns valores de amostra fornecem a melhor exibição inicial dos tipos dos dados desse campo.

Cada cartão de perfil Sample values (Valores de amostra) fornece: 

  • Nome do campo
  • Cardinalidade (valores distintos)
  • Até três valores de amostra (os campos podem ter menos de três valores)

Cartão Most common values frequency (Frequência de valores mais comuns)

O cartão Frequência de valores mais comuns mostra os cinco valores mais comuns e sua frequência. Se houver mais valores do que cinco valores distintos, eles serão combinados e exibidos como Outros. Se algum campo não tiver valores, o total será exibido como Nulo. Esse cartão de perfil pode ser aplicado a valores de dados de texto, numéricos ou mistos.

Cartão de exibição de blocos: Frequência de valores mais comuns
Frequência de valores mais comuns do bloco

Critérios de Most common values frequency (Frequência de valores mais comuns): Campos que têm poucos valores ou uma distribuição distorcida de valores têm o perfil definido com o cartão de frequência de valores mais comuns. Essa definição de perfil é aplicada apenas quando há várias instâncias dos mesmos valores. Os usuários podem obter um insight rápido da distribuição dos valores dos campos. Se os dados do campo incluírem texto e valores numéricos e houver mais texto do que valores numéricos, o cartão Most common values frequency (Frequência de valores mais comuns) será mostrado. O botão de alternância Binned frequency (Frequência compartimentada) é fornecido quando há mais de três valores numéricos no campo.

Cada cartão de perfil Most common values frequency (Frequência de valores mais comuns) fornece: 

  • Nome do campo
  • Cardinalidade (valores distintos)
  • Valores mais comuns e sua frequência
  • Outra frequência combinada dos valores restantes

Cartão Binned frequency (Frequência compartimentada)

O cartão Binned frequency (Frequência compartimentada) mostra informações de distribuição e definição de perfil que são relevantes para campos numéricos, incluindo valores de dados mínimos, médios e máximos. Se os dados do campo incluírem texto e valores numéricos e houver mais valores numéricos do que de texto, o cartão Binned frequency (Frequência compartimentada) será exibido. O tipo de cartão Most Common Values Frequency (Frequência de valores mais comuns) está disponível para todos os campos que possuem valores não exclusivos.

Cartão de exibição de blocos: Distribuição numérica Binned Frequency (Frequência compartimentada)

Bloco Binned Frequency (Frequência compartimentada)

Cada cartão de perfil Binned frequency (Frequência compartimentada) fornece: 

  • Nome do campo
  • Cardinalidade (valores distintos)
  • Histograma mostrando a distribuição de dados numéricos
  • Valor mínimo
  • Valor médio (a soma dos números dividida pelo número total de valores no conjunto de dados)
  • Valor máximo

Exibição em lista de perfis

A exibição em lista de perfis fornece uma tabela com opções de estatísticas de perfil. Os usuários verificam as métricas de interesse que são mais significativas para o conjunto de dados no ColumnPicker colunas de ícone, que pode ser encontrado rolando até a borda direita da tabela. As primeiras nove estatísticas são pré-selecionadas por padrão.

Exibição em lista: Selecione estatísticas de perfil de interesse no menu suspenso ColumnPicker, visível ao rolar para a direita na tabela

Exibição de lista de perfil do conjunto de dados

Exibição de dados de perfil

A exibição de dados de perfil mostra seu conjunto de dados como uma tabela de dados simples com nomes de coluna de campo e (até) os primeiros vinte valores.

Exibição de dados: Os nomes de colunas do conjunto de dados e os primeiros vinte registros são exibidos

Exibição de dados de perfil do conjunto de dados

Permissões

Permissões são necessárias para definir perfis e obter amostras de dados. Você deve ter uma função no espaço do conjunto de dados que permita criar perfis de fontes de dados. Para obter mais informações, consulte Gerenciando permissões em espaços compartilhados ou Gerenciando permissões em espaços gerenciados.

Saiba mais

Esta página ajudou?

Se você encontrar algum problema com esta página ou seu conteúdo - um erro de digitação, uma etapa ausente ou um erro técnico - informe-nos como podemos melhorar!