Ir para conteúdo principal Pular para conteúdo complementar

Construindo um fluxo de dados

Resumo do vídeo

video thumbnail

Criando um fluxo de dados

Comece criando um novo fluxo de dados.

  1. No menu do iniciador, selecione Analytics > Criar ou Analytics > Preparar dados.

  2. Clique em Fluxo de dados.

    O diálogo Criar um novo fluxo de dados é aberto.

  3. No campo correspondente, insira um Nome para o fluxo de dados.

  4. Na lista suspensa correspondente, selecione em qual Espaço você deseja salvar o fluxo de dados.

  5. Adicione uma Descrição para documentar a finalidade do fluxo de dados.

  6. Adicione algumas Tags ao fluxo de dados para facilitar sua localização.

  7. Opcionalmente, marque a caixa de seleção Abrir fluxo de dados para visualizar diretamente o fluxo de dados depois que ele for criado.

  8. Clique em Criar.

Seu fluxo de dados vazio é aberto e você chega à guia Visão geral do cabeçalho de navegação. O novo fluxo de dados também pode ser encontrado posteriormente em Analytics > Página inicial do Qlik Cloud.

Para obter mais informações sobre as informações que você pode encontrar na visão geral do seu fluxo de dados, consulte Navegando pelos fluxos de dados.

Para começar a projetar seu fluxo de dados, vá para a guia Editor do cabeçalho de navegação.

Selecionando uma fonte

O primeiro bloco de construção do seu fluxo de dados é a fonte que contém os dados que o você deseja preparar. Você pode usar quaisquer dados do seu catálogo ou de uma conexão.

Adicionando dados de um conjunto de dados

Os conjuntos de dados armazenados no seu catálogo podem ser baseados em arquivos (.qvd, .xls, .csv, .parquet, .json, etc.) ou tabelas de bancos de dados e armazéns de dados.

Consulte Formatos de arquivo para obter a lista de formatos compatíveis.

Para selecionar um conjunto de dados como fonte para seu fluxo de dados:

  1. Na guia Fontes no painel esquerdo, arraste uma fonte de Conjuntos de dados e solte-a na tela.

    A janela Catálogo de dados é aberta, onde você pode procurar conjuntos de dados carregados anteriormente ou clicar em Carregar arquivo de dados para procurar arquivos no seu computador e carregá-los na hora.

    Nota de advertênciaAo fazer upload de arquivos grandes, com mais de 300 MB, o processo pode levar algum tempo. Não feche a janela, pois o progresso é exibido em um botão giratório que pode parecer vazio no início.
  2. Usando a pesquisa e os filtros, marque a caixa de seleção na frente de um ou mais conjuntos de dados de sua lista e clique em Avançar.

  3. Na guia Resumo, você pode revisar os conjuntos de dados selecionados, verificar os campos que eles contêm e excluir alguns, se quiser. Clique em Carregar no fluxo de dados.

    A fonte ou fontes são adicionadas à tela, com um aviso dizendo que você precisa conectá-las a outros nós.

    Uma fonte recém-adicionada à tela

Depois que uma fonte é colocada na tela, você pode clicar nela e acessar o painel Propriedades para editar os campos selecionados, se necessário, caso o esquema da fonte tenha sido atualizado, por exemplo.

Carregando e configurando um arquivo csv

Se você estiver usando um conjunto de dados de arquivo csv como fonte, carregado anteriormente no seu catálogo ou carregado diretamente durante o processo, e os dados não forem exibidos corretamente na visualização, isso pode significar que o arquivo não está formatado corretamente.

Por exemplo, esses dados de cliente que usam vírgula como separador são exibidos em uma única coluna.

dados separados por vírgula que são exibidos incorretamente em uma única coluna

O arquivo estava mal formatado ou o separador não foi detectado corretamente durante o upload. Para solucionar esse problema, você precisará acessar as configurações do conjunto de dados.

  1. No menu do iniciador, selecione Analytics > Catálogo.

  2. Abra o conjunto de dados para corrigir.

    Na visão geral do conjunto de dados, você pode ver um aviso informando que há um possível erro de formatação.

  3. Clique no link para as Configurações de formato de arquivo da mensagem de aviso ou use o menu Mais ações no canto superior direito da visão geral.

    Você pode ver que o delimitador foi definido erroneamente como Ponto e vírgula.

    delimitador de arquivo csv definido como ponto e vírgula

  4. Na lista suspensa Delimitador, selecione Vírgula.

    Com o delimitador esperado, a visualização agora mostra corretamente os diferentes campos.

    Menu de configurações de formato de arquivo para um arquivo csv

  5. Clique em Salvar.

  6. De volta ao seu fluxo de dados, exclua a fonte desatualizada se a tela não estiver vazia e adicione-a novamente. Dessa vez, a fonte refletirá a configuração correta do conjunto de dados.

Adicionando dados de uma conexão

O Qlik Cloud e os fluxos de dados são compatíveis com diversas conexões com fontes de dados. Consulte a Lista de fontes de dados compatíveis para obter mais informações.

Os únicos tipos de conexão que não são compatíveis no momento são os seguintes:

Nota informativaAI21 Labs (Amazon Bedrock), Advanced Analytics, Amazon Comprehend, Amazon SageMaker, Amazon Titan (Amazon Bedrock), Anthropic (Amazon Bedrock), Azure ML, Azure OpenAI, Cohere (Amazon Bedrock, DataRobot, Databricks MLflow, Google Ads, Google Calendar, Hugging Face, Meta (Amazon Bedrock), MeaningCloud, OData, OpenAI, Qlik AutoML, Qlik Big Data Index (QBDI), Qlik GeoOperations, Qlik GeoOperations GeoJSON, Qlik GeoOperations Shapefile, Sentiment140, SMTP, Watson Natural Language Understanding, YouTube Analytics.

Para selecionar uma conexão como fonte para seu fluxo de dados:

  1. Na guia Fontes no painel esquerdo, arraste uma fonte de Conexões e solte-a na tela.

    A janela Selecionar conexão é aberta, onde você pode procurar conexões criadas anteriormente ou clicar em Criar conexão para definir uma nova imediatamente após a autenticação.

  2. Usando a pesquisa e os filtros, marque a caixa de seleção na frente de uma conexão da sua lista e clique em Avançar.

  3. Dependendo da conexão, você poderá procurar arquivos, inserir um caminho para seus dados ou selecionar tabelas de um banco de dados.

  4. Depois de selecionar a fonte de dados, clique em Salvar ou em Concluir.

    A fonte é adicionada à tela, com um aviso dizendo que você precisa conectá-la a outro nó.

    Uma fonte de tipo de conexão acabou de ser adicionada à tela

Depois que uma fonte é colocada na tela, você pode clicar nela e acessar o painel Propriedades para editar os campos selecionados, se necessário, caso o esquema da fonte tenha sido atualizado, por exemplo.

Adicionando processadores

Processadores são os blocos de construção que contêm as diferentes funções de preparação disponíveis em um fluxo de dados. Eles recebem os dados de entrada e retornam os dados preparados para a próxima etapa do fluxo. Os processadores permitem que você execute operações complexas de extração, melhoria e limpeza em dados diversos com uma visualização ao vivo. Veja a Processadores de fluxo de dados completa para obter mais informações sobre as funções disponíveis.

Para conectar um primeiro processador à sua fonte de dados:

  1. Você pode:

    • Na guia Processadores do painel esquerdo, arraste o processador de sua escolha e solte-o na tela ao lado da fonte.

      Você precisará conectar manualmente a fonte e o processador. Crie um link clicando no ponto à direita do nó de origem, mantendo-o pressionado e arrastando o link até o ponto à esquerda do nó do processador.

      Criando um link entre uma fonte e um processador

    • Clique no menu de ação da fonte, selecione Adicionar processador e clique no processador de sua escolha.

      O processador é colocado na tela e conectado automaticamente à fonte.

  2. Clique no processador para começar a configurá-lo no painel direito.

    As diferentes funções disponíveis e os parâmetros a serem configurados dependem de cada processador. Consulte a documentação do processador individual para obter mais informações:

  3. Clique em Salvar.

  4. Adicione e conecte quantos processadores forem necessários para preparar seus dados.

    Ative o botão Visualização de dados no painel Visualização para ver os efeitos de um processador em uma amostra de seus dados. Clique no ícone de engrenagem para abrir as Configurações de visualização e configure o tamanho da amostra para até 10.000 linhas. Você também pode ativar o botão Script para ver o equivalente do Script Qlik do seu fluxo de dados nesse ponto.

Selecionando um alvo

Para encerrar o fluxo de dados, você precisa conectar o último processador a um nó de destino. Você pode escolher entre dois tipos de destino:

  • Arquivos de dados para arquivos armazenados em seu catálogo no Qlik Cloud.

  • Conexões para gravar em uma fonte externa adicionada como conexão no Qlik Cloud.

Ambas as opções permitem que você exporte os dados preparados como um arquivo .qvd, .parquet, .txt ou .csv.

Para conectar um destino ao restante do fluxo:

  1. Você pode:

    • Na guia Destinos no painel esquerdo, arraste o tipo de destino de sua escolha e solte-o na tela ao lado do último processador.

      Adicionando um destino por meio de arrastar e soltar

      Conecte manualmente o último processador ao destino da mesma forma que você conectou os processadores anteriormente.

    • Clique no menu de ação do último processador, selecione Adicionar destino e clique no destino de sua escolha.

      Adicionando um destino por meio do menu de ação

  2. Clique no destino para começar a configurá-lo no painel direito.

    Nota informativaNo caso de Arquivos de dados, você pode gravar em uma pasta específica do espaço desejado. Se você tiver criado uma pasta chamada folder_name em seu espaço pessoal, por exemplo, use folder_name/data_flow_output.qvd como nome de arquivo para o destino. O arquivo resultante será enviado diretamente para sua pasta.
  3. Clique em Salvar.

    Com um mínimo de uma fonte, um destino e um processador opcional, o fluxo de dados agora pode ser executado.

Executando o fluxo de dados

Quando todos os nós do seu fluxo de dados estiverem conectados, configurados e marcados como OK, uma marca de seleção verde mostrará que o fluxo de dados é considerado válido e pode ser executado. Nesse ponto, é possível usar o botão Visualizar script no canto superior direito da tela para ver todo o script que será gerado nos bastidores.

Um fluxo de dados válido pronto para ser executado

  1. Clique em Executar fluxo para iniciar o processamento dos dados.

    Uma notificação é aberta para mostrar o status da execução.

  2. Quando o fluxo de dados é concluído com êxito, os dados preparados que foram emitidos podem ser encontrados em diferentes locais, de acordo com o destino:

    • No Catálogo, entre outros ativos de dados, e na seção Saídas da Visão geral do fluxo de dados dos arquivos de dados

    • Na seção Saídas da Visão geral do fluxo de dados para conjuntos de dados baseados em conexão.

Agora, você pode usar esses dados preparados como fonte limpa para alimentar um experimento do AutoML, ou em um aplicativo de visualização.

Esta página ajudou?

Se você encontrar algum problema com esta página ou seu conteúdo - um erro de digitação, uma etapa ausente ou um erro técnico - informe-nos como podemos melhorar!