Passaggio 4: creare un progetto Qlik Open Lakehouse

Creare un progetto di pipeline Qlik Open Lakehouse per ingerire i dati da qualsiasi sorgente. Archiviare i dati nel formato di tabella aperto Iceberg.

Prerequisiti

Per creare un progetto Qlik Open Lakehouse, sono necessari:

Un'integrazione di rete per consentire a Qlik di fornire e gestire le risorse di calcolo per suo conto.
Un cluster lakehouse configurato per eseguire l'attività di archiviazione dei dati all'interno del progetto Iceberg.
Una connessione a un catalogo dati da utilizzare come destinazione dati per il progetto, oppure i dettagli necessari per creare una nuova connessione.

Attività supportate

Le seguenti attività sono supportate in un progetto Qlik Open Lakehouse:

Attività dati di trasferimento su data lake

Trasferire i dati in formato CSV in S3, da qualsiasi sorgente supportata da Qlik, compresi i flussi di dati ad alto volume.
Attività dati di archiviazione

L'attività dati di archiviazione consuma i dati che sono stati trasferiti nel cloud da un'attività di trasferimento su data lake. L'attività scrive i dati nelle tabelle Iceberg per operazioni di archiviazione ed esecuzione delle query efficienti.
Mirroring delle attività dati

Mirroring delle tabelle Iceberg da Qlik Open Lakehouse su Snowflake. Gli utenti possono eseguire query sui dati tramite tabelle esterne senza dover migrare i dati su Snowflake.

Esempio di creazione di un progetto Qlik Open Lakehouse

L'esempio che segue crea un progetto di pipeline Qlik Open Lakehouse, esegue l'onboarding dei dati e li memorizza in tabelle formato Iceberg. Questo esempio crea una semplice pipeline che è possibile espandere mediante l'onboarding di altre sorgenti dati. È possibile aggiungere un'attività di mirroring dei dati per rispecchiare le tabelle in Snowflake senza duplicare i dati, oppure utilizzare questo progetto come sorgente per un progetto che richiede di completare trasformazioni in Snowflake.

Per creare un progetto Qlik Open Lakehouse, fare quanto segue:

Nella home di Data Integration, fare clic su Crea pipeline e configurarla:

Nome: inserire il nome del progetto.
Spazi selezionare lo spazio a cui apparterrà il progetto.
Descrizione: facoltativamente, inserire una descrizione per il progetto.

In Caso di utilizzo, selezionare Pipeline di dati.
Configurare la Piattaforma dati:

Piattaforma dati: selezionare Qlik Open Lakehouse dall'elenco.
Connessione al catalogo dati: nell'elenco, selezionare una connessione esistente o fare clic su Crea nuovo per aggiungere una nuova connessione al catalogo dati.
Trasferimento della connessione di destinazione: selezionare il bucket S3 per il trasferimento dei dati o fare clic su Crea nuovo per aggiungere una nuova posizione per il bucket.
Cluster di elaborazione archiviazione: selezionare il cluster lakehouse che eseguirà l'attività di archiviazione.

Creare il progetto.
Seguire i passaggi nella procedura guidata per l'onboarding dei dati. Per ulteriori informazioni, vedere Inserimento dati.

Ulteriori informazioni

Hai trovato utile questa pagina?

Se riscontri problemi con questa pagina o con il suo contenuto – un errore di battitura, un passaggio mancante o un errore tecnico – ti pregiamo di farcelo sapere!

Lascia qui il tuo feedback