Qlik Open Lakehouse へのデータのオンボーディング
Qlik Open Lakehouse は、サポートされているあらゆるデータ ソースから Apache Iceberg テーブルへのデータ移動を容易にします。Iceberg のオープン テーブル形式は、アプリやデータプラットフォーム間の相互運用性を提供し、さまざまなツールからデータを読み込むことができるため、データの複製を減らすことができます。Qlik Open Lakehouse プロジェクトのテーブルを Snowflake にミラーリングし、ユーザーは Snowflake で直接データを照会できます。
Qlik Open Lakehouse にデータを搭載し、Iceberg 形式のデータテーブルにデータを保存するには、まず AWS VPC とのネットワーク統合を確立します。この統合により、クラウド環境内のリソースの Qlik による安全なプロビジョニングと管理が可能になります。次に、データの処理と保存のための計算環境を提供するレイクハウス クラスターを作成します。データの準備の最終段階は、集中メタデータ リポジトリへのデータ カタログ接続のセットアップです。
これらのコンポーネントが設定されている場合、Qlik Open Lakehouse プロジェクトを使用してデータ パイプラインを作成できます。データ パイプラインはデータを取り込み、Iceberg テーブルに格納します。Snowflake からの直接アクセスを含め、さまざまなツールから Iceberg テーブルにアクセスしてクエリを実行できます。
Qlik Open Lakehouseのアーキテクチャー
Qlik Open Lakehouse は、Iceberg のオープン テーブル形式を使用して、スケーラブルで高性能なレイクハウスを作ることができます。
Qlik Open Lakehouse の設定
Qlik Open Lakehouse プロジェクトを実行するために、ネットワーク統合とレイクハウス クラスターでクラウド環境を構成します。
Qlik Open Lakehouse プロジェクトの作成
Iceberg のオープン テーブル形式のストレージにデータを搭載し、オプションでデータを複製せずに Snowflake にテーブルをミラーリングするプロジェクトを作成します。