Ir para conteúdo principal Pular para conteúdo complementar

AWS Glue Data Catalog

Conecte-se ao seu AWS Glue Data Catalog para usá-lo como destino em seus projetos do Qlik Open Lakehouse.

O uso do AWS Glue Data Catalog como destino fornece integração com o ecossistema de análise do AWS e permite que o Qlik Open Lakehouse interopere com um armazenamento de metadados centralizado. O AWS Glue Data Catalog atua como a camada unificada de metadados, permitindo que o Qlik grave tabelas do Iceberg que são imediatamente consultáveis por serviços nativos da AWS, como o Amazon Athena, sem configuração adicional. Os dados gravados pelo Qlik também estão disponíveis para ferramentas de terceiros sem replicação.

Pré-requisitos

Para criar uma conexão com o AWS Glue Data Catalog, você precisa:

  • Um compartimento de destino do Amazon S3.

  • Se estiver usando a autenticação baseada em função para acessar o compartimento, você precisará:

    • Permissão para acessar a integração de rede que você deseja usar para a conexão.

    • A função ARN.

  • Se você estiver usando autenticação de chave de acesso para acessar o compartimento, precisará:

    • Seu ID da chave de acesso da AWS.

    • Sua chave de acesso secreto da AWS.

Configurando propriedades de conexão do AWS Glue Data Catalog

Para configurar a conexão, faça o seguinte:

  1. Em Conexões, clique em Criar conexão.

  2. Selecione o Espaço onde você deseja criar a conexão ou escolha Criar novo espaço de dados.

  3. Selecione AWS Glue Data Catalog na lista Nome do conector ou use a caixa Pesquisar.

  4. Clique em Criar e configure as propriedades:

    • Região do catálogo: na lista, selecione a região para seu catálogo.

    • Compartimento de destino S3: digite o nome do compartimento.

  5. Configure o Tipo de autenticação. Na lista, selecione a autenticação Baseada em função ou Chave de acesso e preencha as informações a seguir para sua seleção:

Baseado em função

  • Integração de rede: selecione a integração de rede na lista.

  • Função ARN: insira a função ARN criada na AWS.

Nota informativaClique no link Clique aqui para obter orientação para exibir as instruções a seguir para acessar a política de entidade confiável e criar o ARN da função.

Criar uma função do AWS

Para criar uma função do AWS, faça o seguinte:

  1. No Console do AWS, acesse IAM.

  2. Em Funções, clique em Criar função.

  3. Em Tipo de entidade confiável, selecione Política de confiança personalizada.

  4. No Qlik Cloud, na caixa de diálogo Criar uma função do AWS, copie a Entidade confiável, que é a entidade atribuída aos clusters em sua integração. Cole-o no console do AWS.

  5. Clique em Funções e selecione a função que você criou acima.

  6. Em Políticas de permissão, clique em Adicionar permissões e selecione Criar política inline.

  7. No Qlik Cloud, na caixa de diálogo Criar uma função do AWS, copie a política inline abaixo e cole-a no console do AWS e altere o valor <bucket_name> para a localização do seu compartimento:

  8. 
    						{
    						"Version": "2012-10-17",
    						"Statement": [
    						{
    						"Effect": "Allow",
    						"Action": [
    						"glue:CreateTable",
    						"glue:UpdateTable",
    						"glue:DeleteTable",
    						"glue:BatchDeleteTable",
    						"glue:GetTable",
    						"glue:GetTables",
    						"glue:CreateDatabase",
    						"glue:UpdateDatabase",
    						"glue:GetDatabase",
    						"glue:GetDatabases",
    						"glue:GetUserDefinedFunction"
    						],
    						"Resource": [
    						"arn:aws:glue:us-east-2:*:catalog",
    						"arn:aws:glue:us-east-2:*:database/*", 
    						"arn:aws:glue:us-east-2:*:table/*/*"
    						]
    						},
    						{
    						"Effect": "Allow",
    						"Action": [
    						"s3:ListBucket",
    						"s3:GetBucketLocation"
    						],
    						"Resource": "arn:aws:s3:::<bucket_name>"
    							},
    							{
    							"Effect": "Allow",
    							"Action": [
    							"s3:PutObject",
    							"s3:DeleteObject",
    							"s3:DeleteObjectVersion",
    							"s3:GetObject",
    							"s3:GetObjectVersion"
    							],
    							"Resource": "arn:aws:s3:::<bucket_name>/*"
    								}
    								]
    								}
  9. Na página Função, em Resumo, copie o ARN.

  10. No Qlik Cloud, feche a caixa de diálogo Criar uma função do AWS e cole o valor do ARN na função do ARN.

Chave de acesso

  • Chave de acesso: digite o ID exclusivo da chave de acesso da AWS a ser usado para autenticação.

  • Chave secreta: digite sua chave de acesso secreta da AWS para usar com sua chave de acesso.

Nota informativaClique no link Clique aqui para obter orientação para exibir as seguintes instruções para criar a política inline para a função.

Definir permissões do usuário

Para criar uma política inline no AWS, faça o seguinte:

  1. No Console do AWS, acesse IAM.

  2. Navegue até Políticas > Criar política.

  3. No Qlik Cloud, na caixa de diálogo Criar uma função do AWS, copie a política.

  4. No AWS, no Editor de políticas, cole a política e altere o parâmetro <bucket_name> para a localização do seu compartimento:

  5. 
    						{
    						"Version": "2012-10-17",
    						"Statement": [
    						{
    						"Effect": "Allow",
    						"Action": [
    						"glue:CreateTable",
    						"glue:UpdateTable",
    						"glue:DeleteTable",
    						"glue:BatchDeleteTable",
    						"glue:GetTable",
    						"glue:GetTables",
    						"glue:CreateDatabase",
    						"glue:UpdateDatabase",
    						"glue:GetDatabase",
    						"glue:GetDatabases",
    						"glue:GetUserDefinedFunction"
    						],
    						"Resource": [
    						"arn:aws:glue:us-east-2:*:catalog",
    						"arn:aws:glue:us-east-2:*:database/*",
    						"arn:aws:glue:us-east-2:*:table/*/*"
    						]
    						},
    						{
    						"Effect": "Allow",
    						"Action": [
    						"s3:ListBucket",
    						"s3:GetBucketLocation"
    						],
    						"Resource": "arn:aws:s3:::<bucket_name>"
    						},
    						{
    						"Effect": "Allow",
    						"Action": [
    						"s3:PutObject",
    						"s3:DeleteObject",
    						"s3:DeleteObjectVersion",
    						"s3:GetObject",
    						"s3:GetObjectVersion"
    						],
    						"Resource": "arn:aws:s3:::<bucket_name>/*"
    						}
    						]
    						}				
    					
  6. Adicione a política ao usuário que dá acesso ao Qlik.

Em Nome, insira o nome de exibição da conexão.

Tipos de dados suportados

A tabela a seguir mostra os tipos de dados de origem compatíveis do Iceberg e seu mapeamento padrão para tipos de dados do Qlik Talend Data Integration.

Tipos de dados do Iceberg Tipos de dados do Qlik Talend Data Integration.
BOOLEAN BOOLEAN
BYTES BINARY
DATE DATE
TIME TIME
DATETIME TIMESTAMP
INT1 INT
INT2 INT
INT4 INT
INT8 LONG
NUMERIC DECIMAL(precision, scale)
REAL4 FLOAT
REAL8 DOUBLE
UINT1 INT
UINT2 LONG
UINT4 LONG
UINT8 DECIMAL(20, 0)
STRING STRING
WSTRING STRING
BLOB BINARY
NCLOB STRING
CLOB STRING

Esta página ajudou?

Se você encontrar algum problema com esta página ou seu conteúdo – um erro de digitação, uma etapa ausente ou um erro técnico – avise-nos!