メイン コンテンツをスキップする 補完的コンテンツへスキップ

データ プラットフォームに既存のデータを登録する

データ プラットフォームにある既存のデータを登録し、データをキュレーションして変換し、データ マートを作成できます。これにより、Qlik Cloud データ統合 以外のツール (Qlik Replicate など) を使ってオンボーディングされたデータを使用できます。

データを登録すると、2 つのデータ タスクが作成されます。

  • 登録済みデータ

    データを登録する際には、データセット作成にすぐ使用できるデータを準備するためのビューを作成する必要があります。

  • ストレージ

    これには、登録済みデータに基づいたデータセットの生成と保存が含まれます。

    データセットの生成と保存

データを登録すると、いくつかの方法で生成済みのデータを使用できます。

  • 分析アプリ内にあるデータセットを使用できます。

  • 変換を作成できます。

  • データ マートを作成できます。

データを登録する

データ プロジェクトで定義したクラウド データ ウェアハウスに存在するデータを登録できます。生成したデータセットは、同じクラウド データ ウェアハウスに保存されます。

データ プロジェクトの詳細については、「データ プロジェクトでのデータ パイプラインの作成」を参照してください。

  1. [新規追加] をクリックしてから、[データの登録] をクリックします。

  2. データ タスクの [名前] と [説明] を追加します。

    [次へ] をクリックします。

  3. 登録するデータを選択します。

    含めるデータの選択

    [次へ] をクリックします。

    [設定] が表示されます。

  4. [データのロード] でデータの更新方法を選択します。

    • データが 1 回だけロードされる、またはフル リロードを使って更新される場合は、[フル ロード] を選択します。

    • 変更を保存している Qlik Replicate タスクを使ってデータがレプリケートされる場合は、[Qlik Replicate 保存変更を使用した増分ロードを使用] を使用します。

      推奨されるQlik Replicate構成

  5. サマリーで作成された 2 つのデータ タスクをプレビューし、必要に応じて名前を変更します。

    ヒント メモこの名前は、ストレージ データ タスクでデータベース スキーマに名前を付けるときに使用されます。スキーマは 1 つのタスクにのみ関連付けることができるため、同じデータ プラットフォームを使用する他のデータ プロジェクトのデータ タスクとの競合を避けるために、一意の名前を使用することを検討してください。
  6. 必要に応じて、登録済みデータ タスクを開くか、データ プロジェクトに戻ります。

    準備ができたら、 [完了]をクリックします。

2 つのデータ タスクが作成されました。データのレプリケーションを開始するには、次のことが必要です。

  • 登録済みデータ タスクを準備します。

    データ タスクで [準備] をクリックします。

    アーチファクトが作成されると、データ タスクのスタータスが登録済みに変わります。

  • ストレージ データ タスクを準備して実行します。

    詳しくは「データセットの生成と保存」を参照してください。

含めるデータの選択

含めるデータを選択する際、特定のテーブルまたはビューを選択することや、選択ルールを使用してテーブルのグループを含めるか除外することができます。

% をワイルドカードとして使用して、スキーマとテーブルの選択基準を定義します。

  • %.% は、すべてのスキーマのすべてのテーブルを定義します。

  • Public.% は、スキーマの [パブリック] のすべてのテーブルを定義します。

[選択基準] により、選択内容に基づいたプレビューが表示されます。

次のいずれかを実行できるようになりました。

  • 選択基準に基づいて、テーブルのグループを含めるまたは除外するルールを作成します。

    [選択条件からルールを追加] をクリックしてルールを作成し、 [含める] または [除外] のいずれかを選択します。

    [選択ルール] の下にルールが表示されます。

  • 1 つ以上のデータセットを選択し、 [選択したデータセットを追加] をクリックします。

    [明示的に選択したデータセット] の下に、追加されたデータセットが表示されます。

選択ルールは、現在のテーブルとビューのセットにのみ適用され、将来追加されるテーブルとビューには適用されません。

登録済みのデータ設定

登録済みデータ タスクのプロパティを設定できます。

  • [設定] をクリックします。

基本設定

  • データベース

    ターゲットで使用するデータベースです。

  • データ アセット スキーマ

    データ アセット スキーマの名前を変更できます。

推奨されるQlik Replicate構成

これらの Qlik Replicate タスク設定は、Qlik Replicate タスク保存変更を使ってレプリケートされたデータを登録する際に推奨されます。

  • Qlik Replicate タスクは、オプション [フル ロード] と [変更の保存先] を使って構成する必要があります。

  • [変更設定の保存] > [変更テーブル] で、次の変更テーブル列が既定名を使って含まれていることを確認します。

    • [header__]change_seq

    • [header__]change_oper

    • [header__] timestamp

  • [変更設定の保存] > [変更テーブル] で、[更新時] を [変更後画像のみを保存] に設定します。

    これにより、変更前の画像が含まれなくなるため、各更新のスペースが減少します。変更前の画像を使用する予定がない場合、このオプションを使用します。

  • [変更設定の保存] > [変更テーブル] で、[サフィックス] を既定値 __ct に設定します。

  • 次のグローバル変換は適用しないでください。

    • 変更テーブルの名前を変更

    • 変更テーブルの名前を変更 スキーマ

  • ソース テーブルのプライマリ キーが更新できる場合、[変更処理の調整] でプライマリ キー列オプションを更新する際、[削除] と [挿入] を有効にします。

    古いレコードの履歴は、新しいレコードで保存されません。

    情報メモこのオプションは、Qlik Replicate 2022 年 11 月以降サポートされていません。

登録済みデータ タスクの操作

タスク メニューから登録済みデータ タスクに対して以下の操作を行うことができます。

  • 開く

    これにより、データ タスクが開きます。テーブル構造とデータ タスクの詳細を表示できます。

  • 編集

    タスクの名前と説明を編集したり、タグを追加したりできます。

  • 削除

    データ タスクを削除できます。

    ソース データは削除されません。

  • データセットの同期

    これにより、自動的に調整できない設計変更が同期されます。

  • テーブルを再作成

    これにより、ソースからデータセットが再作成されます。

    また、このデータ タスクを消費するすべてのダウンストリーム データ タスクを作成する必要もあります。

  • データを保存

    このランディング データ タスクからデータを使用するストレージ データ タスクを作成できます。

データ容量に関する考慮事項

  • 登録されたテーブルに主キーがない場合、実行のたびにフル リロードが実行されます。これは、毎月の登録済みデータ容量クォータにカウントされます。ストレージが変更を見つけるために、すべてのレコードを比較する必要があるためです。

  • 登録済みデータのデータ容量は、ストレージにカウントされます。つまり、登録済みデータの削除は、ストレージの挿入または更新 (論理的な削除) に変換され、データ容量にカウントされます。

  • 登録済みデータのテーブルが 2 つのストレージ データ タスクで使用されている場合、論理的な削除、挿入、更新は、データ容量に対して 2 回カウントされます。

このページは役に立ちましたか?

このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。