Ir para conteúdo principal Pular para conteúdo complementar

Criando e gerenciando datamarts

Depois de integrar seus dados, você pode criar datamarts usando os dados das tarefas de Armazenamento ou Transformação. Você pode criar qualquer número de datamarts, dependendo das necessidades da sua empresa. Idealmente, seus datamarts devem conter repositórios de dados resumidos coletados para análise em uma seção ou unidade específica dentro de uma organização, por exemplo, o departamento de vendas.

Nota informativaA criação de datamart está disponível com uma assinatura do Qlik Talend Cloud Premium ou Qlik Talend Cloud Enterprise.

O procedimento para criar um data mart é idêntico, independentemente de seu datamart ser baseado em uma tarefa de armazenamento ou em uma tarefa de transformação. As instruções nesta seção pressupõem que o datamart seja baseado em uma tarefa de armazenamento.

Nota informativaTarefas de dados operam no contexto do proprietário do projeto ao qual pertencem. Para obter mais informações sobre funções e permissões necessárias, consulte Funções e permissões do espaço de dados.

Pré-requisitos

Antes de criar um datamart, você precisa fazer o seguinte:

  • Preencher o armazenamento com dados (da aterrissagem) que você deseja usar no seu datamart. Para obter mais informações, consulte Integrando dados.
  • Criar um modelo relacional de conjunto de dados para definir as relações entre os conjuntos de dados de origem. Para obter mais informações, consulte Criando um modelo de dados.

    Nota de advertênciaTodos os conjuntos de dados de origem devem ter chaves.

Criando um datamart

Para criar um datamart:

  1. Abra seu projeto.

  2. Realize uma das seguintes ações:

    • Clique em Adicionar novo no canto superior direito e selecione Criar datamart.
    • Na tarefa de armazenamento de dados, clique em no canto inferior direito e selecione Criar datamart.

    O diálogo Criar datamart é aberto.

  3. Forneça um nome para seu datamart e, opcionalmente, também forneça uma descrição.

  4. Se quiser configurar o datamart posteriormente, desmarque a caixa de seleção Abrir e clique em Criar. Caso contrário, basta clicar em Criar.

    O datamart é aberto na guia Datamart.

  5. Selecione seus dados de origem conforme descrito em Selecionando seus dados de origem
  6. Se quiser que o datamart contenha dimensões, adicione dimensões conforme descrito em Adicionar dimensões e um fato ao datamart
  7. Se você quiser que o datamart contenha um fato, adicione um fato conforme descrito em Adicionando um fato
  8. Se o datamart contiver dimensões e um fato, adicione as dimensões ao seu esquema em estrelas, conforme descrito em Construindo um esquema em estrela
  9. Crie os conjuntos de dados em seu datamart e preencha-os com dados conforme descrito em Preenchendo seu datamart

Selecionando seus dados de origem

Você seleciona seus dados de origem a partir dos conjuntos de dados na tarefa de dados de armazenamento.

Para fazer isso:

  1. Clique no botão Selecionar dados de origem no meio da guia ou clique no botão Selecionar dados de origem da barra de ferramentas.

    O diálogo Selecionar dados de origem é aberto.

  2. Na lista suspensa Ativos de dados, selecione uma tarefa de armazenamento ou uma tarefa de transformação, se você criou transformações.

  3. Deixe o % padrão para pesquisar todos os conjuntos de dados ou insira o nome de um conjunto de dados específico para encontrar. Em seguida, clique em Pesquisar.

  4. Selecione os conjuntos de dados desejados e clique em Adicionar tabelas selecionadas.

  5. Clique em OK para fechar a caixa de diálogo e, em seguida, vá para Adicionar um fato e/ou Adicionar dimensões.

Nota informativaVocê pode repetir o processo para adicionar conjuntos de dados de outras tarefas de dados.

Adicionar dimensões e um fato ao datamart

Depois de selecionar os dados de origem, você pode prosseguir com a criação do seu datamart. Um datamart pode ter um conjunto de dados de fatos, conjuntos de dados de dimensões ou uma combinação de ambos (onde os conjuntos de dados de dimensão estão logicamente relacionados ao conjunto de dados de fatos).

Adicionando dimensões

Para adicionar uma dimensão.

  1. Clique no botão Adicionar dimensão.

    O diálogo Adicionar dimensão é aberto.

  2. As seguintes configurações estão disponíveis:

    • Conjunto de dados mais granular: Selecione um conjunto de dados.
    • Nome: Especifique um nome de exibição para a dimensão. O padrão é o nome mais granular do conjunto de dados.
    • Descrição: Opcionalmente, forneça uma descrição.
    • Tipo de histórico: Selecione uma das seguintes opções:
      • Tipo 1: o registro existente na dimensão será atualizado sempre que o registro correspondente no Armazenamento for atualizado.
      • Tipo 2: um novo registro será adicionado à dimensão sempre que o registro correspondente no Storage for atualizado.
    • Conjunto de dados relacionado para desnormalizar: Qualquer conjunto de dados que possa ser desnormalizado no conjunto de dados da dimensão (de acordo com os relacionamentos no modelo de ativo de dados de origem) estará disponível para seleção aqui.

       

      Exemplo de uma dimensão que pode ser desnormalizada

      Exemplo de uma dimensão com dimensões relacionadas

  3. Clique em OK para salvar suas configurações.

    A dimensão será adicionada à lista Dimensões à esquerda.

Consulte também Dimensões de interpretação de funções.

Visualizando informações sobre uma dimensão

Quando você seleciona uma dimensão, a guia Modelo relacional de origem é mostrada no painel central. Essa guia mostra os conjuntos de dados de origem que estão consolidados na dimensão. Os conjuntos de dados que você optou por desnormalizar ao adicionar a dimensão serão mostrados selecionados (e esmaecidos).

Dimensão Produtos desnormalizada com o conjunto de dados Categorias e Fornecedores

Adicionando um fato

Para adicionar um fato:

  1. Clique no botão Adicionar fato.

    A caixa de diálogo Adicionar fato é aberta.

  2. As seguintes configurações estão disponíveis:

    • Fato: Selecione um conjunto de dados para ser o fato. O conjunto de dados deve definir a granularidade do fato que você está criando.
    • Nome: Especifique um nome de exibição para o fato. O padrão é o nome do fato.
    • Descrição: Opcionalmente, forneça uma descrição.
    • Conjuntos de dados relacionados para desnormalizar: Qualquer conjunto de dados que possa ser desnormalizado em seu conjunto de dados de fatos estará disponível para seleção aqui.
    • Avançado
      • Usar dados atuais: Quando selecionado (o padrão), o fato não conterá uma coluna de dados de transação.
      • Escolher data da transação: Para localizar dados de acordo com uma data de transação específica, selecione esta opção e, em seguida, selecione uma coluna de data. Isso é útil se seu esquema em estrela contiver dimensões do tipo 2 e você precisar localizar os dados corretos para uma transação específica. Por exemplo, se um cliente tiver vários endereços, pode ser possível encontrar o endereço correto de acordo com a data do pedido.

        Exemplo de caso de uso:

        Um varejista precisa criar um datamart para analisar a relação entre pedidos e clientes. O data mart deve ser capaz de responder a consultas como: Qual estado dos EUA teve a maior soma de pedidos no quarto trimestre de 2022?

         

        Se o varejista selecionar a opção Usar dados atuais, somente a versão de registro mais atual na tabela Clientes será incluída no cálculo.

        Ignorar a data da transação resultará em dados imprecisos, conforme ilustrado abaixo:

         

        Mostra a relação entre a tabela de fatos Pedidos e a dimensão Clientes quando a opção Usar dados atuais é selecionada.

         

        No entanto, se o varejista selecionar a opção Escolher data da transação, os pedidos do cliente serão associados à versão correta do registro na tabela Clientes .

        Isso permitirá que o varejista calcule com precisão a soma total de pedidos por estado no quarto trimestre de 2022.

         

        Mostra a relação entre a tabela de fatos Pedidos e a dimensão Clientes quando a data da transação Usar é selecionada.

        Nota de dicaObserve que a data da transação pode ser aproveitada de forma diferente em cada datamart, de acordo com as necessidades de negócios. Por exemplo, em um datamart, ela pode ser usada para analisar datas de pedidos, enquanto em outro datamart, pode ser usada para analisar datas de envio.
  3. Clique em OK para salvar suas configurações.

    O fato será adicionado à lista Fatos à esquerda.

Visualizando informações sobre o fato

Quando você seleciona um fato, as seguintes guias são mostradas no painel central:

  • Modelo de esquema em estrela (padrão): mostra uma representação gráfica dos relacionamentos do conjunto de dados dentro do datamart.
  • Modelo de fato: mostra todos os conjuntos de dados relacionados ao conjunto de dados de fatos. Os conjuntos de dados que você optou por desnormalizar ao adicionar o fato serão mostrados selecionados (e esmaecidos).

     

    Fato de Detalhes de pedidos com conjunto de dados de Pedidos desnormalizado

  • Data da transação: O nome da coluna da transação se você selecionou a opção Escolher data da transação ao adicionar o fato.

Construindo um esquema em estrela

Depois de adicionar dimensões ao seu datamart, você pode então conectá-las ao seu conjunto de dados de fatos, criando assim um esquema em estrela.

Para fazer isso:

  1. Selecione seu fato na lista Fatos à esquerda.
  2. Selecione as dimensões a serem adicionadas na lista Dimensões recomendadas à direita.

    Dimensões recomendadas são mostradas conectadas ao conjunto de dados de fatos com uma linha pontilhada.

    Na imagem abaixo, algumas das dimensões foram adicionadas anteriormente e, portanto, estão conectadas com uma linha cinza sólida.

  3. Clique em Aplicar para adicionar as dimensões.

    As dimensões serão mostradas conectadas ao conjunto de dados de fatos com uma linha cinza sólida.

  4. Para fechar o painel Dimensões recomendadas, clique em .

Preenchendo seu datamart

Depois de projetar seu datamart, você pode então continuar a preenchê-lo.

Para fazer isso:

  1. Clique no botão Preparar da barra de ferramentas no canto superior direito.

    O processo de preparação inclui a criação de conjuntos de dados e exibições no datamart e a atualização do catálogo.

    Você pode acompanhar o progresso em Progresso da preparação na parte inferior da tela.

    Depois que a preparação estiver concluída, o botão Preparar será alterado para Executar.

  2. Opcionalmente, valide o datamart conforme descrito em Validando e sincronizando seu datamart abaixo.

  3. Clique no botão Executar.

    A janela muda para a exibição Monitor, mostrando o progresso do carregamento e o status dos conjuntos de dados no seu datamart.

Cada registro de origem será processado pelo datamart, até mesmo os registros excluídos. Isso é feito para garantir que as informações históricas sejam mantidas.

Nota informativaPara conjuntos de dados de dimensão com histórico do tipo 2, a contagem de registros processados incluirá todas as linhas de versão de um registro e mostrará um valor maior do que o número de registros reais processados.

Validando e sincronizando seu datamart

A validação do datamart garante que os metadados do datamart sejam idênticos aos metadados correspondentes no Armazenamento (ou Transformação, se definido). A validação do datamart também compara os metadados criados com o projeto de esquema em estrela atual. Por exemplo, se você executar a validação depois de incluir uma dimensão em um datamart já criado, a validação falhará.

Para validar o datamart:

  1. Selecione Validar conjuntos de dados no menu à direita do botão Executar ou clique no botão Validar conjuntos de dados no canto inferior direito da janela.

    A mensagem Validação concluída será mostrada.

  2. Se os metadados não estiverem sincronizados ou se houver conflitos de design de esquema em estrela, o painel Validar e ajustar na parte inferior da janela será aberto automaticamente com o relatório de validação.

  3. Para resolver qualquer problema de Alterações de design pendentes, clique no botão no canto superior direito e selecione Preparar. Se o valor da coluna Pode ser alterado sem perda de dados for Sim, uma operação ALTER será executada. Caso contrário, as tabelas de datamart serão recriadas.

    Observe que todos Erros de validação precisam ser resolvidos manualmente.

Gerenciando datamarts

Esta seção descreve as várias opções disponíveis para gerenciar seus conjuntos de dados e datamarts.

Refinando fatos ou dimensões

Na guia Conjuntos de dados, você pode realizar várias operações para refinar seus fatos e dimensões, como criar regras de transformação (por exemplo, substituir valores de colunas) e adicionar expressões em nível de coluna. A guia Conjuntos de dados está localizada à direita da guia Datamart:

Guia Conjuntos de dados

Guia Conjuntos de dados para gerenciar conjuntos de dados de fatos e dimensões

Adicionando regras

Para obter uma explicação sobre como adicionar regras globais, consulte Criando regras para transformar conjuntos de dados

Nota informativaPara obter mais informações sobre regras e outras operações que você pode realizar em seus conjuntos de dados, consulte Gerenciando conjuntos de dados. Observe que algumas das opções, como filtrar e renomear conjuntos de dados, não estão disponíveis para tarefas de dados do datamart.

Adicionando novas colunas

Você pode adicionar novas colunas ao conjunto de dados de destino.

  • Clique em + Adicionar.

    Forneça um nome para a coluna e defina uma expressão para definir os dados da coluna.

    Para obter mais informações, consulte Adicionando colunas a um conjunto de dados.

  • Clique em abaixo ao lado de Adicionar e selecione Adicionar coluna da origem.

    Selecione uma coluna do conjunto de dados de origem.

Reordenando colunas

Você pode alterar a posição ordinal de uma coluna.

  1. Selecione uma coluna.

  2. Clique em mais e, em seguida, em Reordenar.

  3. Use as setas para mover a coluna para cima ou para baixo.

  4. Fechae Alterar ordinal quando estiver pronto.

Dimensões de interpretação de funções

Uma dimensão de interpretação de funções é a mesma dimensão usada várias vezes no mesmo esquema em estrela, mas com significados diferentes. Isso é comumente visto com as dimensões Data e Cliente. Por exemplo, seu esquema em estrela pode ter duas entidades de data, uma representando a data do pedido e a outra representando a data de recebimento.

Para adicionar ou editar o nome da função de uma dimensão:

  1. Clique no ícone no nó de dimensão e selecione Editar função.
  2. Na caixa de diálogo Editar papel, digite um nome (ou edite o nome existente) no campo Nome da função no esquema em estrela e clique em OK.

    O nome da função aparecerá abaixo do nome da dimensão.

Opções adicionais de gerenciamento

A tabela a seguir descreve as opções adicionais de gerenciamento:

AtéFaça isto
Adicionar mais conjuntos de dados de origemConsulte Selecionando seus dados de origem.
Adicionar mais fatosConsulte Adicionando um fato
Adicionar mais dimensõesConsulte Adicionar dimensões e um fato ao datamart.
Excluir uma dimensão Selecione a dimensão no painel Dimensões e, em seguida, selecione Excluir no menu.
Excluir um fatoSelecione o fato no painel Fatos e, em seguida, selecione Excluir no menu .
Recriar um datamart Clique no botão no canto superior direito e selecione Recriar tabelas. A recriação de um datamart pode ser necessária se, por exemplo, houver alterações no armazenamento que não possam ser sincronizadas automaticamente com o datamart.
Interromper uma tarefa de datamart em execuçãoClique no botão Parar no canto superior direito.
Preparar uma tarefa de data mart

Clique no botão no canto superior direito e selecione Preparar para sincronizar os conjuntos de dados com os ativos de Transformação ou Armazenamento e resolva todos os conflitos de design. Isso prepara uma tarefa para execução. Isso inclui:

  • Validar que o design é válido.

  • Criar ou alterar as tabelas e exibições físicas para corresponder ao design.

  • Gerar o código SQL para a tarefa de dados.

  • Criar ou alterar as entradas do catálogo para os conjuntos de dados de saída da tarefa.

Você pode acompanhar o progresso em Progresso da preparação na parte inferior da tela.

Programando uma tarefa de datamart

Você pode programar uma tarefa de datamart para ser atualizada periodicamente. Você pode definir uma programação com base no horário ou definir a tarefa a ser executada quando a execução de tarefas de entrada de dados tiver sido concluída.

Clique em ... em uma tarefa de dados e selecione Programação para criar uma programação. A configuração de programação padrão é herdada das configurações no projeto. Para obter mais informações sobre as configurações padrão, consulte Valores padrão do Data Mart.

Você precisa definir Programação como Ativada para ativar a programação.

Programações baseadas no tempo

Você pode usar uma programação baseada no tempo para executar a tarefa independentemente de quando as diferentes fontes de entrada são atualizadas.

  • Selecione Em momento específico em Executar a tarefa de dados.

Você pode definir uma programação por hora, dia, semana ou mês.

Programações baseadas em eventos

Você pode usar uma programação baseada em eventos para executar a tarefa quando a execução de tarefas de entrada de dados tiver sido concluída.

  • Selecione Em um evento específico em Executar a tarefa de dados.

É possível selecionar se você deseja executar a tarefa quando qualquer uma das tarefas de entrada for concluída com êxito ou quando qualquer uma de uma seleção de tarefas de entrada tiver sido concluída com êxito.

Nota informativaA tarefa não será executada se alguma tarefa de entrada ou posterior estiver em execução quando a programação for acionada. A tarefa será ignorada até a próxima execução programada.

Carregando dados

Você pode executar um recarregamento manual de dados. Isso é útil quando há problemas com uma ou mais tabelas.

  1. Abra a tarefa de dados e selecione a guia Monitor.

  2. Selecione as tabelas que deseja carregar.

    Quando uma dimensão é selecionada para recarga, todos os fatos que usam essa dimensão também serão recarregados para manter a integridade.

  3. Clique em Carregar tabelas.

Você pode cancelar o recarregamento das tabelas que estão pendentes de recarregamento clicando em Cancelar recarregamento. Isso não afetará as tabelas que já foram recarregadas, e os recarregamentos que estiverem em andamento serão concluídos.

O recarregamento é realizado fazendo o seguinte:

  1. Truncando as dimensões e os fatos selecionados.

  2. Carregando as tabelas de dimensão selecionadas da tarefa de dados upstream.

  3. Carregando as tabelas de fatos da tarefa de dados upstream. Isso inclui:

    • Tabelas de fatos selecionadas explicitamente.

    • Tabelas de fatos que estão relacionadas a uma dimensão que é recarregada.

Nota informativaSe você recarregar a dimensão x e o fato relacionado a e, em seguida, crie um novo fato b usando a dimensão x também, o fato b não será recarregado automaticamente. É necessário recarregar o novo fato b manualmente.

Configurações do datasmart

Clique no botão Configurações da barra de ferramentas para abrir o diálogo Configurações: <nome do datamart>.

Nota de advertênciaSe a tarefa já tiver sido executada, alterar uma configuração diferente das configurações de Tempo de Execução exigirá que você recrie os conjuntos de dados.

Configurações gerais

Na guia Geral, as seguintes configurações estão disponíveis:

  • Banco de dados: O banco de dados no qual o datamart será criado
  • Esquema da tarefa de dados: O esquema no qual os conjuntos de dados serão criados
  • Esquema interno: O esquema no qual os conjuntos de dados internos serão criados
  • Prefixo para todas as tabelas e visualizações

    Você pode definir um prefixo para todas as tabelas e exibições criadas com essa tarefa.

    Nota informativaVocê deve usar um prefixo exclusivo quando quiser usar um esquema de banco de dados em várias tarefas de dados.

Configurações de tempo de execução

Na guia Tempo de execução, as seguintes configurações estão disponíveis:

  • Execução paralela: Insira o número máximo de conexões de banco de dados que o Qlik Cloud pode abrir para a tarefa. O número padrão é 10.
  • Armazém: relevante apenas para o Snowflake. O nome do armazém de dados do Snowflake.

Configurações do catálogo

  • Publicar no catálogo

    Selecione esta opção para publicar esta versão dos dados no Catálogo como um conjunto de dados. O conteúdo do Catálogo será atualizado na próxima vez que você preparar esta tarefa.

Para obter mais informações sobre o Catálogo, consulte Compreendendo seus dados com ferramentas de catálogo.

Esta página ajudou?

Se você encontrar algum problema com esta página ou seu conteúdo - um erro de digitação, uma etapa ausente ou um erro técnico - informe-nos como podemos melhorar!