Replicando dados com uma assinatura do Iniciante do Qlik Talend Cloud
Usando o assistente de configuração de tarefas, você pode configurar facilmente uma tarefa de replicação com apenas alguns cliques.
As configurações mostradas no assistente refletem o tipo de destino selecionado. Por exemplo, ao replicar para destinos de armazenamento como o Amazon S3, será solicitado um local de armazenamento. No entanto, ao replicar para destinos como o Amazon Redshift que exigem uma área de preparação, você será solicitado a definir ou selecionar uma área de preparação.
A tabela a seguir irá ajudá-lo a navegar neste tópico de acordo com o seu público-alvo.
Replicando para bancos de dados e armazéns de dados sem preparação
Configure uma tarefa de replicação para bancos de dados ou armazéns de dados que não requerem preparação, que são os seguintes:
- Google BigQuery
- Snowflake
Replicando para armazéns de dados com preparação
Configure uma tarefa de replicação para armazéns de dados que exigem preparação, que são as seguintes:
- Amazon Redshift
- Microsoft Fabric
- Databricks
Replicando para armazenamento na nuvem
Configure uma tarefa de replicação para armazenamento na nuvem.
Replicando para bancos de dados e armazéns de dados sem preparação
Esta seção explica como configurar uma tarefa de replicação para bancos de dados e armazéns de dados que não exigem uma área de teste separada.
Para fazer isso:
-
Em Integração de dados > Início, clique em Replicar dados.
O assistente para Replicar dados é aberto.
-
Na guia Geral, faça o seguinte:
-
Nome da tarefa
Especifique um nome para sua tarefa.
-
Descrição
Opcionalmente, insira uma descrição para sua tarefa.
-
Projeto
Realize uma das seguintes ações:
- Selecione um projeto existente
-
Especifique um nome para um novo projeto e clique em Adicionar novo projeto: <nome-do-seu-projeto> abaixo do campo Projeto.
O nome do projeto será adicionado ao campo Projeto.
-
Espaço
Selecione um espaço de dados para seu projeto de replicação. Se você não criou nenhum espaço de dados, siga um destes procedimentos:
-
Selecione Espaço de Dados (o espaço de dados do locatário padrão)
Nota informativaO Espaço de Dados tem permissões completas para todos os membros. Você pode editar as funções e permissões que cada membro possui posteriormente, conforme descrito em Funções e permissões do espaço de dados. -
Cancele o assistente, crie seu próprio espaço de dados conforme descrito em Criando um espaço de dados e, em seguida, execute o assistente novamente.
Para obter mais informações sobre espaços de dados, consulte Trabalhando em espaços no Qlik Talend Data Integration.
-
-
-
Clique em Próximo. Na guia Selecionar conexão de origem, selecione uma conexão com os dados de origem. Opcionalmente, você pode editar as configurações de conexão selecionando Editar no menu da coluna Ações.
Se você ainda não criou uma conexão com sua fonte de dados, será necessário criar uma clicando em Criar conexão no canto superior direito da guia.
Você pode filtrar a lista de conexões usando os filtros à esquerda. As conexões podem ser filtradas de acordo com tipo de origem, gateway, espaço e proprietário. O botão Todos os filtros acima da lista de conexões mostra o número de filtros atuais. Você pode usar este botão para fechar ou abrir o painel Filtros à esquerda. Os filtros atualmente ativos também são mostrados acima da lista de conexões disponíveis.
Você também pode classificar a lista selecionando Última modificação, Última criação ou Alfabético na lista suspensa à direita. Clique na seta à direita da lista para alterar a ordem de classificação.
Depois de selecionar uma conexão de fonte de dados, opcionalmente clique em Testar conexão no canto superior direito da guia (recomendado) e clique em Avançar.
-
Na guia Selecionar conjuntos de dados, selecione tabelas e/ou exibições para incluir na tarefa de replicação. Você também pode usar curingas e criar regras de seleção conforme descrito em Selecionando dados de um banco de dados.
-
Na guia Selecionar conexão de destino, selecione o destino na lista de conexões disponíveis e clique em Avançar. Em termos de funcionalidade, a guia é igual à guia Selecionar conexão de origem descrita anteriormente.
-
Na guia Configurações, altere opcionalmente as configurações a seguir e clique em Avançar.
Modo de replicação
Nota informativaAo replicar a partir de fontes de aplicativos SaaS, o modo de replicação Carregamento total é habilitado por padrão e não pode ser desabilitado.- Carregamento total: Carrega os dados das tabelas de origem selecionadas na plataforma de destino e cria as tabelas de destino, se necessário. O carregamento total ocorre automaticamente quando a tarefa é iniciada, mas também pode ser realizado manualmente se necessário.
-
Aplicar alterações: Mantém as tabelas de destino atualizadas com quaisquer alterações feitas nas tabelas de origem.
-
Armazenar alterações: Armazena as alterações nas tabelas de origem em Tabelas de alterações (uma por tabela de origem).
Para obter mais informações, consulte Armazenar alterações.
A frequência de captura de dados alterados é determinada pelas configurações do agendador. O intervalo de captura de alterações padrão é a cada seis horas. Para obter mais informações, consulte Agendando tarefas ao trabalhar sem o Data Movement gateway.
Esquemas personalizados
- Esquema do conjunto de dados de destino: Opcionalmente, selecione o esquema no qual deseja que os conjuntos de dados sejam criados no destino.
- Esquema da tabela de controle: opcionalmente, selecione o esquema no qual deseja que as tabelas de controle sejam criadas no destino.
Agendador de replicação
-
Replicar dados a cada: Você pode agendar a frequência de captura de alterações da fonte de dados e definir uma Hora de início e uma Data de início. Se os conjuntos de dados de origem forem compatíveis com CDC (Captura de dados de alterações), apenas as alterações nos dados de origem serão replicadas e aplicadas às tabelas de destino correspondentes. Se os conjuntos de dados de origem não forem compatíveis com CDC (por exemplo, Visualizações), as alterações serão aplicadas recarregando todos os dados de origem nas tabelas de destino correspondentes. Se alguns dos conjuntos de dados de origem forem compatíveis com CDC e outros não, duas subtarefas separadas serão criadas (assumindo que o Aplicar alterações ou Armazenar alterações , as opções de replicação serão selecionadas): um para recarregar os conjuntos de dados que não são compatíveis com CDC e outro para capturar as alterações nos conjuntos de dados que são compatíveis com CDC.
O assistente de configuração de tarefas permite agendar um intervalo de hora em hora. Depois de concluir a configuração da tarefa, você poderá explorar diferentes opções de programação, conforme descrito em Agendando tarefas ao trabalhar sem o Data Movement gateway.
Para obter informações sobre os intervalos mínimos de agendamento de acordo com o tipo de fonte de dados e o nível de assinatura, consulte Intervalos mínimos de agendamento permitidos.
Você pode alterar as configurações posteriormente, conforme descrito em Configurações de tarefa de replicação de dados.
-
Na guia Resumo, um visual do pipeline de dados é exibido. Escolha uma das seguintes ações Após a criação do pipeline:
- Abra o projeto <nome> (o padrão)
-
Abrir a tarefa de dados <nome>
Nota informativaSe alguns dos conjuntos de dados selecionados não forem compatíveis com CDC, dois pipelines serão exibidos: um para a tarefa de CDC e outro para a tarefa Recarregar.
Em seguida, clique em Criar e executar (o padrão) ou em Criar para criar a tarefa sem executá-la.
Se você clicou em Criar e executar, a tarefa será criada e começará a ser executada (o que pode levar alguns instantes).
-
Se você clicou em Criar, uma das seguintes situações acontecerá de acordo com a ação Após a criação do pipeline selecionada anteriormente:
- O projeto será aberto mostrando a tarefa recém-criada.
-
A tarefa será aberta na guia Conjuntos de dados. A guia Conjuntos de dados mostra a estrutura e os metadados das tabelas de origem selecionadas. Isso inclui todas as tabelas listadas explicitamente, bem como as tabelas que correspondem às regras de seleção.
Se quiser adicionar mais tabelas da fonte de dados, clique em Selecionar dados de origem.
-
Você pode realizar transformações nos conjuntos de dados, filtrar dados ou adicionar colunas.
Para obter mais informações, consulte Gerenciando conjuntos de dados.
-
Depois de adicionar as transformações desejadas, você pode validar os conjuntos de dados clicando em Validar conjuntos de dados. Se a validação falhar, resolva os erros antes de continuar.
Para obter mais informações, consulte Validando e ajustando os conjuntos de dados.
-
Quando estiver pronto, clique em Preparar e executar para preparar e executar a tarefa de dados.
Para obter informações sobre como recuperar tarefas e outros métodos de execução de tarefas, consulte Opções avançadas de execução.
-
A tarefa de replicação deve começar agora, e você pode ver o progresso em Monitor. Para obter mais informações, consulte Monitorando uma tarefa de dados individual
Replicando para armazéns de dados com preparação
Esta seção explica como configurar uma tarefa de replicação para armazéns de dados que exigem uma área de teste separada.
Para fazer isso:
-
Em Integração de dados> Início, clique em Replicar dados.
O assistente para Replicar dados é aberto.
-
Na guia Geral, faça o seguinte:
-
Nome da tarefa
Especifique um nome para sua tarefa.
-
Descrição
Opcionalmente, insira uma descrição para sua tarefa.
-
Projeto
Realize uma das seguintes ações:
- Selecione um projeto existente
-
Especifique um nome para um novo projeto e clique em Adicionar novo projeto: <nome-do-seu-projeto> abaixo do campo Projeto.
O nome do projeto será adicionado ao campo Projeto.
-
Espaço
Selecione um espaço de dados para seu projeto de replicação. Se você não criou nenhum espaço de dados, siga um destes procedimentos:
-
Selecione Espaço de Dados (o espaço de dados do locatário padrão)
Nota informativaO Espaço de Dados tem permissões completas para todos os membros. Você pode editar as funções e permissões que cada membro possui posteriormente, conforme descrito em Funções e permissões do espaço de dados. -
Cancele o assistente, crie seu próprio espaço de dados conforme descrito em Criando um espaço de dados e execute o assistente novamente.
Para obter mais informações sobre espaços de dados, consulte Trabalhando em espaços no Qlik Talend Data Integration.
-
-
-
Clique em Próximo. Na guia Selecionar conexão de origem, selecione uma conexão com os dados de origem. Opcionalmente, você pode editar as configurações de conexão selecionando Editar no menu da coluna Ações.
Se você ainda não criou uma conexão com sua fonte de dados, será necessário criar uma clicando em Criar conexão no canto superior direito da guia.
Você pode filtrar a lista de conexões usando os filtros à esquerda. As conexões podem ser filtradas de acordo com tipo de origem, gateway, espaço e proprietário. O botão Todos os filtros acima da lista de conexões mostra o número de filtros atuais. Você pode usar este botão para fechar ou abrir o painel Filtros à esquerda. Os filtros atualmente ativos também são mostrados acima da lista de conexões disponíveis.
Você também pode classificar a lista selecionando Última modificação, Última criação ou Alfabético na lista suspensa à direita. Clique na seta à direita da lista para alterar a ordem de classificação.
Depois de selecionar uma conexão de fonte de dados, opcionalmente clique em Testar conexão no canto superior direito da guia (recomendado) e clique em Avançar.
-
Na guia Selecionar conjuntos de dados, selecione tabelas e/ou exibições para incluir na tarefa de replicação. Você também pode usar curingas e criar regras de seleção conforme descrito em Selecionando dados de um banco de dados.
-
Na guia Selecionar conexão de destino, selecione o destino na lista de conexões disponíveis e clique em Avançar. Em termos de funcionalidade, a guia é igual à guia Selecionar conexão de origem descrita anteriormente.
-
Na guia Configurações, altere opcionalmente as configurações a seguir e clique em Avançar.
Modo de replicação
Nota informativaAo replicar a partir de fontes de aplicativos SaaS, o modo de replicação Carregamento total é habilitado por padrão e não pode ser desabilitado.- Carregamento total: Carrega os dados das tabelas de origem selecionadas na plataforma de destino e cria as tabelas de destino, se necessário. O carregamento total ocorre automaticamente quando a tarefa é iniciada, mas também pode ser realizado manualmente se necessário.
-
Aplicar alterações: Mantém as tabelas de destino atualizadas com quaisquer alterações feitas nas tabelas de origem.
-
Armazenar alterações: Armazena as alterações nas tabelas de origem em Tabelas de alterações (uma por tabela de origem).
Para obter mais informações, consulte Armazenar alterações.
A frequência de captura de dados alterados é determinada pelas configurações do agendador. O intervalo de captura de alterações padrão é a cada seis horas. Para obter mais informações, consulte Agendando tarefas ao trabalhar sem o Data Movement gateway.
Conexão com a área de preparação
Ao replicar para os armazéns de dados listados abaixo, você precisa definir uma área de teste. Os dados são processados e preparados na área de preparação antes de serem transferidos para o armazém.
Selecione uma área de preparação existente ou clique em Criar nova para definir uma nova área de preparação e siga as instruções em Conectando ao armazenamento na nuvem.
Para editar as configurações de conexão, clique em Editar. Para testar a conexão (recomendado), clique em Testar conexão.
Para obter informações sobre quais áreas de preparo são suportadas com quais armazéns de dados, consulte a coluna Compatível como uma área de teste em Casos de uso da plataforma alvo e versões compatíveis.
Esquemas personalizados
- Esquema do conjunto de dados de destino: Opcionalmente, selecione o esquema no qual deseja que os conjuntos de dados sejam criados no destino.
- Esquema da tabela de controle: opcionalmente, selecione o esquema no qual deseja que as tabelas de controle sejam criadas no destino.
Agendador de replicação
-
Replicar dados a cada: Você pode agendar a frequência de captura de alterações da fonte de dados e definir uma Hora de início e uma Data de início. Se os conjuntos de dados de origem forem compatíveis com CDC (Captura de dados de alterações), apenas as alterações nos dados de origem serão replicadas e aplicadas às tabelas de destino correspondentes. Se os conjuntos de dados de origem não forem compatíveis com CDC (por exemplo, Visualizações), as alterações serão aplicadas recarregando todos os dados de origem nas tabelas de destino correspondentes. Se alguns dos conjuntos de dados de origem forem compatíveis com CDC e outros não, duas subtarefas separadas serão criadas (assumindo que o Aplicar alterações ou Armazenar alterações , as opções de replicação serão selecionadas): um para recarregar os conjuntos de dados que não são compatíveis com CDC e outro para capturar as alterações nos conjuntos de dados que são compatíveis com CDC.
O assistente de configuração de tarefas permite agendar um intervalo de hora em hora. Depois de concluir a configuração da tarefa, você poderá explorar diferentes opções de programação, conforme descrito em Agendando tarefas ao trabalhar sem o Data Movement gateway.
Você pode alterar as configurações posteriormente, conforme descrito em Configurações de tarefa de replicação de dados.
-
Na guia Resumo, um visual do pipeline de dados é exibido. Escolha uma das seguintes ações Após a criação do pipeline:
- Abra o projeto <nome> (o padrão)
-
Abrir a tarefa de dados <nome>
Nota informativaSe alguns dos conjuntos de dados selecionados não forem compatíveis com CDC, dois pipelines serão exibidos: um para a tarefa de CDC e outro para a tarefa Recarregar.
Em seguida, clique em Criar e executar (o padrão) ou em Criar para criar a tarefa sem executá-la.
Se você clicou em Criar e executar, a tarefa será criada e começará a ser executada (o que pode levar alguns instantes).
-
Se você clicou em Criar, uma das seguintes situações acontecerá de acordo com a ação Após a criação do pipeline selecionada anteriormente:
- O projeto será aberto mostrando a tarefa recém-criada.
-
A tarefa será aberta na guia Conjuntos de dados. A guia Conjuntos de dados mostra a estrutura e os metadados das tabelas de origem selecionadas. Isso inclui todas as tabelas listadas explicitamente, bem como as tabelas que correspondem às regras de seleção.
Se quiser adicionar mais tabelas da fonte de dados, clique em Selecionar dados de origem.
-
Você pode realizar transformações nos conjuntos de dados, filtrar dados ou adicionar colunas.
Para obter mais informações, consulte Gerenciando conjuntos de dados.
-
Depois de adicionar as transformações desejadas, você pode validar os conjuntos de dados clicando em Validar conjuntos de dados. Se a validação falhar, resolva os erros antes de continuar.
Para obter mais informações, consulte Validando e ajustando os conjuntos de dados.
-
Quando estiver pronto, clique em Preparar e executar para preparar e executar a tarefa de dados.
Para obter informações sobre como recuperar tarefas e outros métodos de execução de tarefas, consulte Opções avançadas de execução.
-
A tarefa de replicação deve começar agora, e você pode ver o progresso em Monitor. Para obter mais informações, consulte Monitorando uma tarefa de dados individual
Replicando para armazenamento na nuvem
Esta seção explica como configurar uma tarefa de replicação para armazenamento na nuvem.
Para fazer isso:
-
Em Integração de dados> Início, clique em Replicar dados.
O assistente para Replicar dados é aberto.
-
Na guia Geral, faça o seguinte:
-
Nome da tarefa
Especifique um nome para sua tarefa.
-
Descrição
Opcionalmente, insira uma descrição para sua tarefa.
-
Projeto
Realize uma das seguintes ações:
- Selecione um projeto existente
-
Especifique um nome para um novo projeto e clique em Adicionar novo projeto: <nome-do-seu-projeto> abaixo do campo Projeto.
O nome do projeto será adicionado ao campo Projeto.
-
Espaço
Selecione um espaço de dados para seu projeto de replicação. Se você não criou nenhum espaço de dados, siga um destes procedimentos:
-
Selecione Espaço de Dados (o espaço de dados do locatário padrão)
Nota informativaO Espaço de Dados tem permissões completas para todos os membros. Você pode editar as funções e permissões que cada membro possui posteriormente, conforme descrito em Funções e permissões do espaço de dados. -
Cancele o assistente, crie seu próprio espaço de dados conforme descrito em Criando um espaço de dados e execute o assistente novamente.
Para obter mais informações sobre espaços de dados, consulte Trabalhando em espaços no Qlik Talend Data Integration.
-
-
-
Clique em Próximo. Na guia Selecionar conexão de origem, selecione uma conexão com os dados de origem. Opcionalmente, você pode editar as configurações de conexão selecionando Editar no menu da coluna Ações.
Se você ainda não criou uma conexão com sua fonte de dados, será necessário criar uma clicando em Criar conexão no canto superior direito da guia.
Você pode filtrar a lista de conexões usando os filtros à esquerda. As conexões podem ser filtradas de acordo com tipo de origem, gateway, espaço e proprietário. O botão Todos os filtros acima da lista de conexões mostra o número de filtros atuais. Você pode usar este botão para fechar ou abrir o painel Filtros à esquerda. Os filtros atualmente ativos também são mostrados acima da lista de conexões disponíveis.
Você também pode classificar a lista selecionando Última modificação, Última criação ou Alfabético na lista suspensa à direita. Clique na seta à direita da lista para alterar a ordem de classificação.
Depois de selecionar uma conexão de fonte de dados, opcionalmente clique em Testar conexão no canto superior direito da guia (recomendado) e clique em Avançar.
-
Na guia Selecionar conjuntos de dados, selecione tabelas e/ou exibições para incluir na tarefa de replicação. Você também pode usar curingas e criar regras de seleção conforme descrito em Selecionando dados de um banco de dados.
-
Na guia Selecionar conexão de destino, selecione o destino na lista de conexões disponíveis e clique em Avançar. Em termos de funcionalidade, a guia é igual à guia Selecionar conexão de origem descrita anteriormente.
-
Na guia Configurações, altere opcionalmente as configurações a seguir e clique em Avançar.
Método de atualização
-
Captura de dados de alterações (CDC) As tarefas de preparação de data lake começam com um carregamento total (durante o qual todas as tabelas selecionadas são preparadas). Os dados preparados então permanecem atualizados usando a tecnologia de CDC (Captura de dados de alterações).
Nota informativaNão há suporte para a CDC (Captura de dados de alterações) de operações DDL.A frequência de captura de dados alterados é determinada pelas configurações do agendador. O intervalo de captura de alterações padrão é a cada seis horas. Para obter mais informações, consulte Agendando tarefas ao trabalhar sem o Data Movement gateway.
- Recarregamento: Faz um carregamento total dos dados das tabelas de origem selecionadas na plataforma de destino e cria as tabelas de destino, se necessário. O carregamento total ocorre automaticamente quando a tarefa é iniciada, mas também pode ser realizado manualmente ou agendado para ocorrer periodicamente, se necessário.
Se você selecionar Change data capture (CDC) e seus dados também contiverem tabelas que não suportam CDC ou visualizações, dois pipelines de dados serão criados. Um pipeline com todas as tabelas compatíveis com CDC e outro pipeline com todas as outras tabelas e exibições usando a opção Recarregar.
Pasta para uso
Selecione uma das seguintes opções, de acordo com a pasta do bucket na qual você deseja que os arquivos sejam gravados:
- Pasta padrão: O formato de pasta padrão é <nome-do-seu-projeto>/<nome-da-sua-tarefa>
- Pasta raiz: os arquivos serão gravados diretamente no bucket.
-
Pasta: insira o nome da pasta. A pasta será criada durante a tarefa de preparo do data lake se ainda não existir.
Nota informativa O nome da pasta não pode incluir caracteres especiais (por exemplo, @, #,! e assim por diante).
Agendador de replicação
-
Replicar dados a cada: Você pode agendar a frequência de captura de alterações da fonte de dados e definir uma Hora de início e uma Data de início. Se os conjuntos de dados de origem forem compatíveis com CDC (Captura de dados de alterações), apenas as alterações nos dados de origem serão replicadas e aplicadas às tabelas de destino correspondentes. Se os conjuntos de dados de origem não forem compatíveis com CDC (por exemplo, Visualizações), as alterações serão aplicadas recarregando todos os dados de origem nas tabelas de destino correspondentes. Se alguns dos conjuntos de dados de origem forem compatíveis com CDC e outros não, duas subtarefas separadas serão criadas (assumindo que o método de atualização Captura de dados de alterações seja selecionadas): um para recarregar os conjuntos de dados que não são compatíveis com CDC e outro para capturar as alterações nos conjuntos de dados que são compatíveis com CDC.
O assistente de configuração de tarefas permite agendar um intervalo de hora em hora. Depois de concluir a configuração da tarefa, você poderá explorar diferentes opções de programação, conforme descrito em Agendando tarefas ao trabalhar sem o Data Movement gateway.
Você pode alterar as configurações da tarefa posteriormente, conforme descrito em Configurações para destinos de armazenamento em nuvem.
-
-
Na guia Resumo, um visual do pipeline de dados é exibido. Escolha uma das seguintes ações Após a criação do pipeline:
- Abra o projeto <nome> (o padrão)
-
Abrir a tarefa de dados <nome>
Nota informativaSe alguns dos conjuntos de dados selecionados não forem compatíveis com CDC, dois pipelines serão exibidos: um para a tarefa de CDC e outro para a tarefa Recarregar.
Em seguida, clique em Criar e executar (o padrão) ou em Criar para criar a tarefa sem executá-la.
Se você clicou em Criar e executar, a tarefa será criada e começará a ser executada (o que pode levar alguns instantes).
-
Se você clicou em Criar, uma das seguintes situações acontecerá de acordo com a ação Após a criação do pipeline selecionada anteriormente:
- O projeto será aberto mostrando a tarefa recém-criada.
-
A tarefa será aberta na guia Conjuntos de dados. A guia Conjuntos de dados mostra a estrutura e os metadados das tabelas de origem selecionadas. Isso inclui todas as tabelas listadas explicitamente, bem como as tabelas que correspondem às regras de seleção.
Se quiser adicionar mais tabelas da fonte de dados, clique em Selecionar dados de origem.
-
Você pode realizar transformações nos conjuntos de dados, filtrar dados ou adicionar colunas.
Para obter mais informações, consulte Gerenciando conjuntos de dados.
-
Depois de adicionar as transformações desejadas, você pode validar os conjuntos de dados clicando em Validar conjuntos de dados. Se a validação falhar, resolva os erros antes de continuar.
Para obter mais informações, consulte Validando e ajustando os conjuntos de dados.
-
Quando estiver pronto, clique em Preparar e executar para preparar e executar a tarefa de dados.
Para obter informações sobre como recuperar tarefas e outros métodos de execução de tarefas, consulte Opções avançadas de execução.
-
A tarefa de replicação deve começar agora, e você pode ver o progresso em Monitor. Para obter mais informações, consulte Monitorando uma tarefa de dados individual
Definindo prioridade de carregamento para conjuntos de dados
Você pode controlar a ordem de carregamento dos conjuntos de dados em sua tarefa de dados atribuindo uma prioridade de carregamento a cada conjunto de dados. Isso pode ser útil, por exemplo, se você quiser carregar conjuntos de dados menores antes de conjuntos de dados grandes.
-
Clique em Prioridade de carregamento.
-
Selecione uma prioridade de carregamento para cada conjunto de dados.
A prioridade de carregamento padrão é Normal. Os conjuntos de dados serão carregados na seguinte ordem de prioridade:
-
Maior
-
Mais alta
-
Alta
-
Normal
-
Baixa
-
Mais baixa
-
Menor
Conjuntos de dados com a mesma prioridade não são carregados em nenhuma ordem específica.
-
-
Clique em OK.
Atualizando metadados
Você pode atualizar os metadados na tarefa para alinhá-los com as alterações nos metadados da origem na visualização Design de uma tarefa. Para aplicativos SaaS que usam o Metadata Manager, o Metadata Manager deve ser atualizado antes de você poder atualizar os metadados na tarefa de dados.
-
Você pode:
-
Clique em ... e em Atualizar metadados para atualizar os metadados de todos os conjuntos de dados na tarefa.
-
Clique em ... em um conjunto de dados em Conjuntos de dados e, em seguida, em Atualizar metadados para atualizar os metadados de um único conjunto de dados.
Você pode visualizar o status da atualização de metadados em Atualizar metadados na parte inferior da tela. Você pode ver quando os metadados foram atualizados pela última vez passando o cursor sobre .
-
-
Prepare a tarefa de dados para aplicar as alterações.
Depois de preparar a tarefa de dados e as alterações serem aplicadas, elas serão removidas de Atualizar metadados.
Você deve preparar tarefas de armazenamento que consumam essa tarefa para propagar as alterações.
Se uma coluna for removida, uma transformação com valores nulos será adicionada para garantir que o armazenamento não perca dados históricos.
Limitações para atualização de metadados
-
Uma renomeação com uma coluna descartada antes dessa, no mesmo intervalo de tempo, será convertida para a renomeação da coluna descartada se elas tiverem o mesmo tipo e comprimento de dados.
Exemplo:
Antes: a b c d
Depois: a c1 d
Neste exemplo, b foi descartada, e c foi renomeada como c1. b e c têm o mesmo tipo e comprimento de dados.
Isso será identificado como uma renomeação de b para c1 e um descarte de c.
-
A renomeação da última coluna não é reconhecida, mesmo que a última coluna tenha sido descartada e a anterior tenha sido renomeada.
Exemplo:
Antes: a b c d
Depos: a b c1
Neste exemplo, d foi descartada e c foi renomeada como c1.
Isso será identificado como um descarte de c e d e uma adição de c1.
-
Presume-se que novas colunas sejam adicionadas no final. Se forem adicionadas colunas no meio com o mesmo tipo de dados que a coluna seguinte, elas poderão ser interpretadas como uma ação de descarte e renomeação.
Limitações e considerações ao replicar dados
As transformações estão sujeitas às seguintes limitações:
- Transformações não são compatíveis para colunas com idiomas da direita para a esquerda.
-
As transformações não podem ser realizadas em colunas que contenham caracteres especiais (por exemplo, #, \, /, -) no nome.
- A única transformação compatível com os tipos de dados LOB/CLOB é eliminar a coluna no destino.
- Não há suporte para o uso de uma transformação para renomear uma coluna e depois adicionar uma nova coluna com o mesmo nome.
Não é possível alterar a nulidade em colunas que são movidas, seja alterando-a diretamente ou usando uma regra de transformação. No entanto, novas colunas criadas na tarefa são anuláveis por padrão.