メイン コンテンツをスキップする 補完的コンテンツへスキップ

ターゲット更新方法の概要

使用する更新方法は、タスクの初期セットアップ中、または後でデータ タスクの [設定] で設定できます。データ タスクが準備されると、更新方法は変更できません。使用できる更新方法は、タスクの種類 (ランディング、レプリケーション、データ レイクへのデータのランディング) に応じて異なります。

ランディング データの更新方法

  • 変更データキャプチャ (CDC)

    データ タスクはフル ロードで開始されます。ターゲット データは、日付項目に基づいた増分ローディングによって最新に保たれます。CDC は、すべてのデータ ソースでサポートされていない可能性があります。

    情報メモDELETE 操作はサポートされていません。つまり、ソースで行が削除されても、ランディング データでは削除されません。削除処理が重要な場合は、代わりに [リロードして比較] を使用してください。

    Data Movement gateway および SaaS アプリケーションからのランディング データを使用する場合は、 [設定] > [実行時間] で、ソースから変更を読み取る間隔を設定します。Data Movement gateway を使用しない場合は、スケジューラを使用して間隔を設定します。詳細については、「Data Movement gateway を使用しない場合の CDC タスクのスケジュール設定」を参照してください。

  • リロードして比較

    データ タスクはソースからのみフル ロードを実行します。これは、ソースが CDC をサポートしていない場合や、DELETE 操作 (CDC ではサポートされていない) をターゲットにプロパゲートする場合に役立ちます。リロードと比較は、サポートされている任意のデータ ソースで使用でき、定期的に実行するようにスケジュールできます。

データベースまたはデータ ウェアハウス ターゲットにレプリケートする場合の更新方法

  • フル ロード: 選択したソース テーブルからターゲット プラットフォームにデータをロードし、必要に応じてターゲット テーブルを作成します。フル ロードはタスクの開始時に自動的に実行されますが、必要に応じて手動で実行することもできます。
  • 変更を適用: ソース テーブルに加えられた変更を反映して、ターゲット テーブルを最新の状態に保ちます。

  • 保存先の変更: ソース テーブルへの変更を変更テーブル (ソース テーブルごとに 1 つ) に保存します。

    詳細は、変更の保存をご覧ください。

Data Movement gateway を使用する場合、変更はソースからほぼリアルタイムでキャプチャされます。Data Movement gateway を使用せずに作業する場合 (例: Qlik Talend Cloud スターター サブスクリプションを使用する場合、または [なし] を選択した場合 )、変更はスケジューラーの設定に従ってキャプチャされます。詳細については、「Data Movement gateway を使用しない場合のタスクのスケジュール設定」を参照してください。

クラウド ストレージ (データ レイク) にレプリケートする場合の更新方法

  • 変更データキャプチャ (CDC): データ レイクのランディング タスクは、フル ロードから開始されます (その間、選択されたすべてのテーブルがランディングされます)。ランディング データは、CDC (変更データ キャプチャ) テクノロジーを使用して最新の状態に保たれます。

    情報メモDDL 操作の CDC (変更データ キャプチャ) はサポートされていません。

    Data Movement gateway を使用する場合、変更はソースからほぼリアルタイムでキャプチャされます。Data Movement gateway を使用せずに作業する場合、変更はスケジューラーの設定に従ってキャプチャされます。詳細は、Data Movement gateway を使用しない場合のタスクのスケジュール設定をご覧ください。

  • リロード: 選択したソーステーブルからターゲットプラットフォームへのデータのフル ロードを実行し、必要に応じてターゲット テーブルを作成します。フル ロードはタスクの開始時に自動的に実行されますが、必要に応じて手動で実行することや、定期的に実行するようにスケジュールすることもできます。
情報メモ

クラウド ストレージにレプリケーションを設定する手順は、サブスクリプション ティアに応じて異なります。

スケジュールされた変更データキャプチャ (CDC) を理解する

Data Movement gateway を使用しない場合、変更はスケジュールされた間隔に従ってキャプチャされます。スケジュールがどのように機能するかを知っておくことは重要であり、例を挙げて説明するのが最適です。次の例では、タスクは 9:00 から 30 分ごとに実行されるようにスケジュールされています。

  • タスクは 9:00 にフル ロードで開始されます。
  • フルロードは 9:40 に終了するため、9:30 の実行はスキップされます。
  • 次の実行は 10:00 に開始され、10:00 までにコミットされたすべての変更がキャプチャされます。
  • 10:00 の実行は 10:15 に終了します。
  • 次の実行は 10:30 に開始され、10:00 から 10:30 の間に発生した変更がキャプチャされます。
情報メモシステムの負荷、同時実行タスクの数、使用可能なポッドの数によっては、次にスケジュールされたインスタンスがスケジュールされた時刻に正確に開始されない可能性があります。

制限事項

SaaS アプリケーションによって返される一部のテーブルは、変更データ キャプチャ (CDC) でサポートされていません。この場合、[検証エラー] に警告メッセージが表示されます。次のいずれかの方法が可能です。

  • データ タスクからテーブルを削除します。

  • データ タスクの更新方法を [リロードして比較] に変更します。

このページは役に立ちましたか?

このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。