Práticas recomendadas para a modelagem de dados

Esta seção descreve várias maneiras diferentes de carregar seus dados no documento do QlikView, dependendo de como os dados estão estruturados e de qual modelo de dados você deseja alcançar.

Em geral, a maneira como os dados são carregados no documento pode ser explicada pelo processo Extrair, Transformar e Carregar:

  1. Extrair

    O primeiro passo é extrair os dados do sistema da fonte de dados. No script, você pode usar os comandos SELECT ou LOAD para definir isso. As diferenças entre esses comandos são:

    • SELECT é usado para selecionar dados de uma fonte de dados ODBC ou provedor OLE DB. O comando SELECT SQL é avaliado pelo provedor de dados, e não pelo QlikView.
    • LOAD é usado para carregar dados de um arquivo, de dados definidos no script, de uma tabela carregada anteriormente, de uma página da web, do resultado de um comando SELECT subsequente ou gerando dados automaticamente
  2. Transformar

    A fase de transformação envolve a manipulação dos dados utilizando funções de script e regras para derivar a estrutura do modelo de dados desejado. As operações típicas são:

    • Cálculo de novos valores
    • Tradução de valores codificados
    • Renomeando campos
    • União de tabelas
    • Agregação de valores
    • Criação de tabela dinâmica
    • Validação de dados
  3. Carregar

    Na etapa final, execute o script para carregar o modelo de dados definido no documento.

Seu objetivo deve ser o de criar um modelo de dados que permita uma manipulação eficiente dos dados no QlikView. Geralmente, isso significa que você deve apontar para um esquema de estrela ou de floco de neve razoavelmente normalizado, sem referências circulares, isto é, um modelo no qual cada entidade seja mantida em uma tabela separada. Em outras palavras, um modelo de dados típico teria a seguinte aparência:

  • uma tabela central de fatos que contém as chaves para as dimensões e os números usados para calcular medidas (como o número de unidades, o volume das vendas e os valores do orçamento).
  • tabelas adjacentes contendo as dimensões com todos os seus atributos (como produtos, clientes, categorias, calendário e fornecedores).
Nota: Em muitos casos é possível resolver uma tarefa (por exemplo, agregações) criando um modelo de dados mais rico no script de carregamento ou executando as agregações nas expressões do gráfico. Como regra geral, o desempenho será melhor se você mantiver as transformações de dados no script de carregamento.
Dica: Recomenda-se esboçar seu modelo de dados no papel. Isso ajuda a fornecer uma estrutura de quais dados extrair e quais transformações executar.

Cada tabela do modelo de dados geralmente corresponde a um comando SELECT ou LOAD. As diferenças entre esses comandos são:

  • SELECT é usado para selecionar dados de uma fonte de dados ODBC ou provedor OLE DB. O comando SELECT SQL é avaliado pelo provedor de dados, e não pelo QlikView.
  • LOAD é usado para carregar dados de um arquivo, de dados definidos no script, de uma tabela carregada anteriormente, de uma página da web, do resultado de um comando SELECT subsequente ou gerando dados automaticamente