Bucket S3
Le definizioni dei metadati, le configurazioni e i dati intermedi per la gestione de cluster lakehouse Iceberg sono archiviati in un apposito bucket Amazon S3.
Un bucket Amazon S3 è un contenitore basato su cloud utilizzato per archiviare e organizzare i dati sotto forma di oggetti. I bucket offrono un'archiviazione scalabile, durevole e altamente disponibile per un'ampia gamma di casi d'uso.
Nell'architettura Qlik Open Lakehouse, un bucket S3 archivia le definizioni degli oggetti di metadati, i file di configurazione e i dati intermedi necessari per la gestione del lakehouse basato su Iceberg. Questo bucket funge da posizione di archiviazione centrale che supporta le operazioni principali come la catalogazione dei dati, il controllo delle versioni e l'esecuzione dei processi.
Per garantire funzionalità coerenti, il bucket S3 deve essere creato e deve essere accessibile nella stessa regione AWS delle risorse lakehouse dell'utente.
Prerequisiti
Assicurarsi di aver creato il VPC, la sottorete e le zone di disponibilità per l'hosting del Qlik Open Lakehouse.
Creazione di un bucket S3
Per creare un bucket S3, fare quanto segue:
-
Nella Console AWS, andare all'opzione S3 e fare clic su Bucket.
-
In Bucket per scopi generali, fare clic su Crea bucket e configurarlo:
-
Tipo di bucket: assicurarsi di selezionare Uso generico.
-
Nome bucket: fornire un nome per il bucket, ad esempio, qlik-open-lakehouse-bucket.
-
Creare il bucket e annotare il nome del bucket.