データのオンボーディング | Qlik Cloud ヘルプ

メインコンテンツをスキップする補完的コンテンツへスキップ

Qlik リソース

データのオンボーディング

このページ上

メインコンテンツをスキップする

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。

データのオンボーディング

Qlik Open Lakehouse プロジェクトでデータパイプラインを作成する最初のステップは、データのオンボーディングです。このプロセスでは、ソースからデータを転送し、最適化された Iceberg テーブルにデータセットを格納します。

オンボーディングは 1 回の操作で作成されますが、2 つのステップで実行されます。データソースのタイプ (CDC またはストリーミング) に応じて、プロジェクトのタスクが決定されます。

CDC ソース

データのランディング

これには、ランディングデータタスクを使用して、オンプレミスデータソースからランディングエリアにデータを連続的なミニバッチとして転送することが含まれます。

データソースからのランディングデータ

データをレイクハウスにランディングし、そこから S3 ファイルストレージにデータをランディングすることもできます。

Qlik Open Lakehouse へのランディングデータ
データセットの保管

これは、ランディングデータの初期ロードまたは増分ロードを読み取り、ストレージデータタスクを使用して読み取りに最適化されたフォーマットでデータを適用します。

データセットの保管

ストリーミングソース

データのランディング

これは、ストリーミングランディングデータ侑を使用して、ソースからランディングエリアへデータを継続的にストリーミングすることが含まれます。

Qlik Open Lakehouse へのストリーミングデータのランディング
データセットの保管

これは、ランディングデータの初期ロードを読み取り、ストレージ変換データタスクを使用して読み取りに最適化されたフォーマットでデータを適用します。

ストリーミングデータセットの保存

オンボードされたデータの使用

データをオンボードすると、保管されたデータセットを次のいくつかの方法などで使用できます。

データセットを分析アプリケーションで使用できます。
CDC ソースの場合はストレージデータに、ストリーミングソースの場合はストリーミング変換侑にミラーデータタスクを直接追加することで、Amazon Redshift や Snowflake を含む 1 つ以上のクラウドデータウェアハウスにデータをミラーリングできます。

詳細については、「クラウドデータウェアハウスへのデータのミラーリング」を参照してください。
オンボーディングプロジェクトからデータを消費するクロスプロジェクトパイプラインを作成することで、クラウドデータウェアハウスでデータの変換を実行できます。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。

こちらにフィードバックをお寄せください