Qlik Talend Data Integration について
Qlik Talend Data Integration を使用して、Qlik Cloud または Snowflake、Google Cloud BigQuery、Azure Synapse Analytics などのクラウド データ ウェアハウスに、すぐに利用できるデータを配信できます。データ ソースはオンプレミスにすることもクラウドにすることもできます。CDC(データキャプチャの変更)やスケジュール再読み込みなどのバッチ技術により、人手を介さずにデータを最新に保つことができます。データ パイプラインを作成し、目的に応じた変換を実行して、データ マートを作成できます。
Qlik Talend Data Integration ホームへは、ランチャーメニュー () から [データ統合] を選択してアクセスできます。
Qlik Talend Data Integration のアーキテクチャの詳細については、「クラウド データ ウェアハウスのデータセット アーキテクチャ」を参照してください。
サブスクリプション オプション
Qlik Talend Cloud のサブスクリプションは、データ移動の量を主な計測基準とする容量モデルに基づきます。
Qlik Talend Cloud には、Starter、Standard、Premium、Enterprise の 4 つのティアのサブスクリプション オプションがあります。上位のエディションでは、より高度なデータ ソースと変換が提供されます。これには、Qlik Cloud および Talend Cloud でホストされている機能が含まれます。すべてのサブスクリプションには Qlik Cloud Analytics Standard が含まれます。
サブスクリプション オプションの詳細については、「Qlik Talend Cloud サブスクリプション オプション」を参照してください
データスペース
データ スペースは、プロジェクトの作成と保存に使用される Qlik Cloud テナントの管理領域です。スペース内では、コネクタを使用して新しい接続を作成し、Data Movement gateway へのアクセスを管理することもできます。すべてのデータ アセットは、それらが属するプロジェクトのスペースに作成されます。
詳細は、Qlik Talend Data Integration のスペースでの作業をご覧ください。
プロジェクト
プロジェクトは、データ タスクを使用してデータ統合フローを作成する場所です。プロジェクトは、すべての出力のターゲットとして使用されるデータ プラットフォームに関連付けられています。次のいずれかのユース ケースでプロジェクトを作成できます。
-
データ パイプライン
シンプルな線形パイプライン、または複数のデータ ソースを使用して多数の出力を生成する複雑なパイプラインを作成します。
-
レプリケーション
サポートされているデータ ソースから、サポートされている任意のターゲットにデータをレプリケートするか、データをデータ レイクにランディングします。
データ タスク
データ タスクとは、プロジェクトにおける主要な作業単位のことです。プロジェクトでは、次のタイプのデータ タスクを作成できます。新しいデータ タスクを作成するには、上部のバーにある [作成] をクリックし、適切なタスクをクリックします。
データ パイプライン プロジェクトのデータ タスク
-
ランディング
データ ソースからランディング エリアにデータをコピーします。データ ソースはオンプレミスにすることもクラウドにすることもできます。ランディング エリアは、クラウド ターゲットまたは Amazon S3 データ バケット (QVD データセットを作成する場合のみ) にできます。
CDC を使用するか、定期的にリロードするようにスケジュールされたフル ロードを実行することで、手動で介入することなくデータを最新の状態に保つことができます。
-
登録済みデータ
データ プラットフォームに既存のデータを登録するこれにより、Qlik Talend Data Integration 以外のツール (Qlik Replicate など) を使ってオンボーディングされたデータを使用できます。
-
ストレージ
ランディング データ タスクによってコピーされたデータから、クラウド データ ウェアハウスまたは Qlik Cloud ですぐに利用できるデータセットを作成します。データセットは、手動で介入することなくランディング データで最新の状態に保たれます。
-
変換
データ パイプラインの一部として、ルールとカスタム SQL に基づいた再利用可能なデータ変換を作成します。行レベルの変換を実行し、テーブルとして具体化されるか、その場で変換を実行するビューとして作成されるデータセットを作成できます。
-
データ マート
データ マートを作成して、ストレージ データ タスクまたは変換データ タスクを活用します。ビジネス ニーズに応じて、任意の数のデータ マートを作成できます。理想的には、データ マートには、組織内の特定のセクションまたはユニットで分析するために収集された要約データのリポジトリが含まれている必要があります。
レプリケーション プロジェクトのデータ タスク
-
レプリケーション
サポートされているデータ ソースから、サポートされている任意のターゲットにデータをレプリケートします。
-
レイクのランディング
データ レイクにデータをランディングします。
Standard、Premium、または Enterprise サブスクリプションを使用して、データ レイクにデータをランディングします
データ タスクの監視
モニター ビューを使用して、データ タスクのステータスと進行状況を監視できます。モニター ビューを使用すると、テナント内のすべてのデータ タスクのステータス、またはフィルターに基づくデータ タスクのサブセットを表示できます。複数のビューを作成して、データ パイプラインのさまざまな側面を監視できます。詳細は、データ タスクの監視と操作をご覧ください。
データ製品
データ プロジェクトまたは手動アップロードから登録され、カタログに追加されたデータセットは、データ製品の形式でグループ化およびパッケージ化できます。たとえば、データセットをビジネス ドメイン別にグループ化し、分析ユーザーがアプリで使用できるようにデータ マーケットプレイスで公開できます。詳細は、Working with data productsをご覧ください。
接続
接続は、データ タスクがデータ ソース、外部ストレージ、ターゲット プラットフォームにアクセスし、データ配信とプッシュダウン変換を実行するために使用されます。
接続を管理する
左側にある [接続] をクリックすると、すべての接続が表示されます。
自分が所有する接続を編集できます。
情報メモ自分が所有者であるか、「管理可能」ロールを持っているデータ スペース内の、すべての接続を編集することもできます。[...] をクリックしてから、[編集] をクリックします。
接続をテストできます。
[...] をクリックしてから、[接続をテスト] をクリックします。
接続を削除できます。
[...] をクリックしてから、[削除] をクリックします。
接続の作成
接続を作成するにはいくつかの方法があります。
左側の [接続] をクリックし、 [接続を作成] をクリックします。
接続を選択するデータ タスク セットアップ ウィザードで、 [新規作成] をクリックします。
[接続] ビューで、[接続を作成] をクリックします。
次でコネクタをフィルタリングできます。
カテゴリ
データ ウェアハウス、クラウド ストレージ、データベース、アプリケーション。
タイプ
ソースまたはターゲット。
最近使用したコネクタから選択することもできます。
データ ソースのタイプを選択し、アドレスと認証情報を入力する必要があります。
参照先: