ターゲット更新方法の概要
使用する更新方法は、タスクの初期セットアップ中、または後でデータ タスクの [設定] で設定できます。データ タスクが準備されると、更新方法は変更できません。使用できる更新方法は、タスクの種類 (ランディング、レプリケーション、データ レイクへのデータのランディング) に応じて異なります。
ランディング データの更新方法
-
変更データキャプチャ (CDC)
データ タスクはフル ロードで開始されます。ターゲット データは、日付項目に基づいた増分ローディングによって最新に保たれます。CDC は、すべてのデータ ソースでサポートされていない可能性があります。
情報メモDELETE 操作はサポートされていません。つまり、ソースで行が削除されても、ランディング データでは削除されません。削除処理が重要な場合は、代わりに [リロードして比較] を使用してください。Data Movement gateway および SaaS アプリケーションからのランディング データを使用する場合は、 [設定] > [実行時間] で、ソースから変更を読み取る間隔を設定します。Data Movement gateway を使用しない場合は、スケジューラを使用して間隔を設定します。詳細については、「Data Movement gateway を使用しない場合の CDC タスクのスケジュール設定」を参照してください。
-
リロードして比較
データ タスクはソースからのみフル ロードを実行します。これは、ソースが CDC をサポートしていない場合や、DELETE 操作 (CDC ではサポートされていない) をターゲットにプロパゲートする場合に役立ちます。リロードと比較は、サポートされている任意のデータ ソースで使用でき、定期的に実行するようにスケジュールできます。
データベースまたはデータ ウェアハウス ターゲットにレプリケートする場合の更新方法
- フル ロード: 選択したソース テーブルからターゲット プラットフォームにデータをロードし、必要に応じてターゲット テーブルを作成します。フル ロードはタスクの開始時に自動的に実行されますが、必要に応じて手動で実行することもできます。
-
変更を適用: ソース テーブルに加えられた変更を反映して、ターゲット テーブルを最新の状態に保ちます。
-
保存先の変更: ソース テーブルへの変更を変更テーブル (ソース テーブルごとに 1 つ) に保存します。
詳細は、変更の保存をご覧ください。
Data Movement gateway を使用する場合、変更はソースからほぼリアルタイムでキャプチャされます。Data Movement gateway を使用せずに作業する場合 (例: Qlik Talend Cloud スターター サブスクリプションを使用する場合、または [なし] を選択した場合 )、変更はスケジューラーの設定に従ってキャプチャされます。詳細については、「Data Movement gateway を使用しない場合のタスクのスケジュール設定」を参照してください。
クラウド ストレージ (データ レイク) にレプリケートする場合の更新方法
-
変更データキャプチャ (CDC): データ レイクのランディング タスクは、フル ロードから開始されます (その間、選択されたすべてのテーブルがランディングされます)。ランディング データは、CDC (変更データ キャプチャ) テクノロジーを使用して最新の状態に保たれます。
情報メモDDL 操作の CDC (変更データ キャプチャ) はサポートされていません。Data Movement gateway を使用する場合、変更はソースからほぼリアルタイムでキャプチャされます。Data Movement gateway を使用せずに作業する場合、変更はスケジューラーの設定に従ってキャプチャされます。詳細は、Data Movement gateway を使用しない場合のタスクのスケジュール設定をご覧ください。
- リロード: 選択したソーステーブルからターゲットプラットフォームへのデータのフル ロードを実行し、必要に応じてターゲット テーブルを作成します。フル ロードはタスクの開始時に自動的に実行されますが、必要に応じて手動で実行することや、定期的に実行するようにスケジュールすることもできます。
クラウド ストレージにレプリケーションを設定する手順は、サブスクリプション ティアに応じて異なります。
- Standard、Enterprise、Premium サブスクリプションを利用している場合は、「Standard、Premium、または Enterprise サブスクリプションを使用して、データ レイクにデータをランディングします」を参照してください
- Starter サブスクリプションを利用している場合は、「Qlik Talend Cloud スターター サブスクリプションを利用したデータのレプリケート」を参照してください
スケジュールされた変更データキャプチャ (CDC) を理解する
Data Movement gateway を使用しない場合、変更はスケジュールされた間隔に従ってキャプチャされます。スケジュールがどのように機能するかを知っておくことは重要であり、例を挙げて説明するのが最適です。次の例では、タスクは 9:00 から 30 分ごとに実行されるようにスケジュールされています。
- タスクは 9:00 にフル ロードで開始されます。
- フルロードは 9:40 に終了するため、9:30 の実行はスキップされます。
- 次の実行は 10:00 に開始され、10:00 までにコミットされたすべての変更がキャプチャされます。
- 10:00 の実行は 10:15 に終了します。
- 次の実行は 10:30 に開始され、10:00 から 10:30 の間に発生した変更がキャプチャされます。
制限事項
SaaS アプリケーションによって返される一部のテーブルは、変更データ キャプチャ (CDC) でサポートされていません。この場合、[検証エラー] に警告メッセージが表示されます。次のいずれかの方法が可能です。
-
データ タスクからテーブルを削除します。
-
データ タスクの更新方法を [リロードして比較] に変更します。