Qlik Cloud データ統合 について
Qlik Cloud データ統合 を使用して、Qlik Cloud または Snowflake、Google Cloud BigQuery、Azure Synapse Analytics などのクラウド データ ウェアハウスに、すぐに利用できるデータを配信できます。データ ソースはオンプレミスにすることもクラウドにすることもできます。CDC(データキャプチャの変更)やスケジュール再読み込みなどのバッチ技術により、人手を介さずにデータを最新に保つことができます。データ パイプラインを作成し、目的に応じた変換を実行して、データ マートを作成できます。
Qlik Cloud データ統合 ホームへは、ランチャーメニュー () から [データ統合] を選択してアクセスできます。
Qlik Cloud データ統合 のアーキテクチャの詳細については、「クラウド データ ウェアハウスのデータセット アーキテクチャ」を参照してください。
サブスクリプション オプション
Qlik Cloud データ統合 のサブスクリプションは、データ移動の量を主な計測基準とする容量モデルに基づきます。
Qlik Cloud データ統合 は、次の 3 つのティアのサブスクリプション オプションで利用できます。Standard、Premium、Enterprise。上位のエディションでは、より高度なデータ ソースと変換が提供されます。すべてのサブスクリプションには Qlik Cloud 分析スタンダード が含まれます。
サブスクリプション オプションの詳細については、「Qlik Cloud データ統合 サブスクリプション オプション」を参照してください
データ スペース
データ スペースは、データ プロジェクトの作成と保存に使用される Qlik Cloud テナントの管理領域です。スペース内では、コネクタを使用して新しいデータ接続を作成し、データ移動ゲートウェイへのアクセスを管理することもできます。 すべてのデータ アセットは、それらが属するデータ プロジェクトのスペースに作成されます。
詳細については、「Qlik Cloud データ統合 のスペースでの作業」を参照してください。
データ プロジェクト
データ プロジェクトは、データ タスクを使用してデータ統合フローを作成する場所です。データ プロジェクトは、すべての出力のターゲットとして使用されるデータ プラットフォームに関連付けられています。次のいずれかのユース ケースでデータ プロジェクトを作成できます。
-
データ パイプライン
シンプルな線形パイプライン、または複数のデータ ソースを使用して多数の出力を生成する複雑なパイプラインを作成します。
-
レプリケーション
サポートされているデータ ソースから、サポートされている任意のターゲットにデータをレプリケートするか、データをデータ レイクにランディングします。
データ タスク
データ タスクとは、データ プロジェクトにおける主要な作業単位のことです。データ プロジェクトでは、次のタイプのデータ タスクを作成できます。新しいデータ タスクを作成するには、上部のバーにある [新規追加] をクリックし、適切なタスクをクリックします。
データ パイプライン プロジェクトのデータ タスク
-
ランディング
データ ソースからランディング エリアにデータをコピーします。データ ソースはオンプレミスにすることもクラウドにすることもできます。ランディング エリアは、クラウド ターゲットまたは Amazon S3 データ バケット (QVD データセットを作成する場合のみ) にできます。
CDC を使用するか、定期的にリロードするようにスケジュールされたフル ロードを実行することで、手動で介入することなくデータを最新の状態に保つことができます。
-
登録済みデータ
データ プラットフォームに既存のデータを登録するこれにより、Qlik Cloud データ統合 以外のツール (Qlik Replicate など) を使ってオンボーディングされたデータを使用できます。
-
ストレージ
ランディング データ タスクによってコピーされたデータから、クラウド データ ウェアハウスまたは Qlik Cloud ですぐに利用できるデータセットを作成します。データセットは、手動で介入することなくランディング データで最新の状態に保たれます。
-
変換
データ パイプラインの一部として、ルールとカスタム SQL に基づいた再利用可能なデータ変換を作成します。行レベルの変換を実行し、テーブルとして具体化されるか、その場で変換を実行するビューとして作成されるデータセットを作成できます。
-
データ マート
データ マートを作成して、ストレージ データ タスクまたは変換データ タスクを活用します。ビジネス ニーズに応じて、任意の数のデータ マートを作成できます。理想的には、データ マートには、組織内の特定のセクションまたはユニットで分析するために収集された要約データのリポジトリが含まれている必要があります。
レプリケーション データ プロジェクトのデータ タスク
-
レプリケーション
サポートされているデータ ソースから、サポートされている任意のターゲットにデータをレプリケートします。
-
レイクのランディング
データ レイクにデータをランディングします。
データ タスクの監視
モニター ビューを使用して、データ タスクのステータスと進行状況を監視できます。モニター ビューを使用すると、テナント内のすべてのデータ タスクのステータス、またはフィルターに基づくデータ タスクのサブセットを表示できます。複数のビューを作成して、データ パイプラインのさまざまな側面を監視できます。詳細については、「データ タスクの監視と操作」を参照してください。
接続
データ接続は、データ タスクがデータ ソース、外部ストレージ、クラウド データ プラットフォームにアクセスし、データ配信とプッシュダウン変換を実行するために使用されます。
接続の所有者のみが接続を更新できます。
接続を表示する
Qlik Cloud データ統合 ホームの左側のメニューにある [データ接続] をクリックすると、すべてのデータ接続が表示されます。
-
自分が所有する接続を編集できます。
[...] をクリックしてから、[編集] をクリックします。
-
接続をテストできます。
[...] をクリックしてから、[接続をテスト] をクリックします。
-
接続を削除できます。
[...] をクリックしてから、[削除] をクリックします。
接続の作成
次の手順で新しい接続を作成します。
-
上部にあるバーで [新規追加] をクリックし、 [データ接続] をクリックします。
-
接続を選択する場所で、 [新規作成] をクリックします。
-
ソース接続がリストに挙げられているところで、 [接続を作成] をクリックします。
-
[データ接続] ビューで、[接続を作成] をクリックします。
次でコネクタをフィルタリングできます。
-
カテゴリ
データ ウェアハウス、クラウド ストレージ、データベース、アプリケーション。
-
タイプ
ソースまたはターゲット。
最近使用したコネクタから選択することもできます。
データ ソースのタイプを選択し、アドレスと認証情報を入力する必要があります。
参照先: