Onboarding dei dati in Qlik Open Lakehouse
Qlik Open Lakehouse facilita lo spostamento dei dati da qualsiasi sorgente supportata alle tabelle Apache Iceberg. Il formato di tabella aperto Iceberg offre l'interoperabilità tra le app e le piattaforme di dati, consentendo di leggere i dati da una varietà di strumenti, riducendo la necessità di duplicare i dati. È possibile eseguire il mirroring delle tabelle dei progetti Qlik Open Lakehouse in Snowflake, e gli utenti possono eseguire le query sui dati direttamente in Snowflake.
Per effettuare l'onboarding dei dati in Qlik Open Lakehouse e archiviare i dati nelle tabelle in formato Iceberg, è necessario innanzitutto stabilire un'integrazione di rete con il VPC di AWS. Un'integrazione consente a Qlik di fornire e gestire in modo sicuro le risorse nell'ambiente cloud. Successivamente, è necessario creare un cluster lakehouse per fornire un ambiente di calcolo per l'elaborazione e l'archiviazione dei dati. La fase finale della preparazione dei dati consiste nell'impostare una connessione per il catalogo dati a un repository di metadati centralizzato.
È possibile creare una pipeline di dati utilizzando i progetti Qlik Open Lakehouse quando questi componenti sono configurati. Le pipeline di dati ingeriscono i dati e li archiviano nelle tabelle Iceberg. È possibile accedere ed eseguire query sulle tabelle Iceberg da un'ampia gamma di strumenti, anche direttamente da Snowflake.
Architettura di Qlik Open Lakehouse
Con Qlik Open Lakehouse è possibile creare un lakehouse scalabile e performante, utilizzando il formato di tabella aperto Iceberg.
Configurazione di Qlik Open Lakehouse
Configurare l'ambiente cloud con un'integrazione di rete e un cluster lakehouse per eseguire i progetti del Qlik Open Lakehouse.
Creare un progetto Qlik Open Lakehouse
Creare un progetto per effettuare l'onboarding dei dati e archiviarli nel formato di tabella aperto Iceberg e, opzionalmente, per eseguire il mirroring delle tabelle in Snowflake senza duplicare i dati.