Standard、Premium、または Enterprise サブスクリプションを使用して、データをレプリケートします

レプリケーションタスクを設定するには:

[データ統合] > [パイプラインプロジェクト] で、 [新規作成] > [プロジェクト] をクリックします。
[新しいプロジェクト] ダイアログで、次の操作を実行します。
1. プロジェクトの [名前] を入力します。
2. プロジェクトを作成する [スペース] を選択します。
3. 必要に応じて [説明] を入力します。
4. [ユースケース] として [レプリケーション] を選択します。
5. 必要に応じて、何も構成せずに空のプロジェクトを作成する場合は、 [開く] チェックボックスをオフにします。
6. [作成] をクリックします。
  
  次のいずれかが発生します。
  - [新しいプロジェクト] ダイアログの [開く] チェックボックスがオンになっている場合 (既定)、プロジェクトが開きます。
  - [新しいプロジェクト] ダイアログの [開く] チェックボックスがオフの場合、プロジェクトはプロジェクトのリストに追加されます。プロジェクトのメニューから [開く] を選択すると、後でプロジェクトを開くことができます。
プロジェクトが開いたら、 [データをレプリケートする] をクリックします。

[データをレプリケートする] ウィザードが開きます。
[基本設定] タブで、レプリケーションタスクの名前と説明を指定します。その後、[Next] (次へ)をクリックします。
[ソース接続を選択] タブで、ソースデータへの接続を選択します。必要に応じて、 [アクション] 列のメニューから [編集] を選択して、接続設定を編集できます。

情報メモタスクの準備が完了した後にソース接続またはソースデータゲートウェイを変更する場合は、すべてのデータセットを再作成する必要があります。

データソースへの接続をまだ作成していない場合は、タブの右上にある [接続を作成] をクリックして接続を作成する必要があります。

左側のフィルターを使用して、接続のリストをフィルタリングできます。接続は、ソースタイプ、ゲートウェイ、スペース、所有者でフィルタリングできます。接続リストの上にある [すべてのフィルター] ボタンには、現在のフィルターの数が表示されます。このボタンを使用して、左側の [フィルター] パネルを閉じたり開いたりできます。現在アクティブなフィルターは、使用可能な接続のリストの上にも表示されます。

右側のドロップダウンリストから [最終更新日]、 [最終作成日]、または [アルファベット順] を選択してリストを並べ替えることもできます。ソート順を変更するには、リストの右側にある矢印をクリックします。

データソース接続を選択した後、必要に応じて、タブの右上にある [接続をテスト] をクリックし (推奨)、[次へ] をクリックします。
[データセットを選択] タブで、レプリケーションタスクに含めるテーブルやビューを選択します。データベースからのデータの選択 で説明されているように、ワイルドカードを使用して選択ルールを作成することもできます。
[ターゲット接続を選択] タブで、使用可能な接続のリストからターゲットを選択し、[次へ] をクリックします。機能的には、このタブは前述の [ソース接続を選択] タブと同じです。

情報メモタスクの準備が完了した後にターゲット接続を変更する場合は、すべてのデータセットを再作成する必要があります。
[設定] タブで、必要に応じて次の設定を変更し、[次へ] をクリックします。

レプリケーションモード

情報メモSaaS アプリケーションソースからレプリケートする場合、フルロードレプリケーションモードが既定で有効になっており、無効にすることはできません。
- フルロード: 選択したソーステーブルからターゲットプラットフォームにデータをロードし、必要に応じてターゲットテーブルを作成します。フルロードはタスクの開始時に自動的に実行されますが、必要に応じて手動で実行することもできます。
  
  情報メモこの設定は、SaaS アプリケーションコネクタを使用する場合は利用できません。
- 変更を適用: ソーステーブルに加えられた変更を反映して、ターゲットテーブルを最新の状態に保ちます。
- 保存先の変更: ソーステーブルへの変更を変更テーブル (ソーステーブルごとに 1 つ) に保存します。
  
  詳細については、「変更の保存」を参照してください。
Data Movement gateway を使用する場合、変更はソースからほぼリアルタイムでキャプチャされます。Data Movement gateway を使用しない場合 (コネクタ設定で [データゲートウェイ] を [なし] に設定)、変更はスケジューラ設定に従ってキャプチャされます。既定の変更キャプチャの間隔は 6 時間ごとです。詳細については、「レプリケーションの設定」を参照してください。

変更適用モード

情報メモデータウェアハウスターゲットにレプリケートする場合、または Qlik Talend Cloud スターターサブスクリプションを利用している場合は、使用する [変更の適用] モードを選択することはできません。効率を最大限に高めるために、変更は常にバッチ最適化モードで適用されます。ただし、Snowflake ターゲットにレプリケートし、 [ロード方法] が Snowpipe streaming に設定されている場合、例外となります。このような場合、どの [変更を適用] モードを使用するかを選択することはできませんが、変更は常に [トランザクション] モードで適用されます。

変更は、次のいずれかの方法でターゲットテーブルに適用されます。
- バッチ最適化: これが既定です。このオプションを選択すると、変更はバッチで適用されます。トランザクションをもっとも効率的な方法でバッチにグループ化するための前処理アクションが発生します。
- トランザクション: このオプションを選択すると、各トランザクションをコミットされた順序で個別に適用します。この場合、すべてのテーブルで厳密な参照整合性が確保されます。
ステージングエリアへの接続

以下にリストされているデータウェアハウスにレプリケーションする場合は、ステージングエリアを設定する必要があります。データは、ウェアハウスに転送される前にステージングエリアで処理および準備されます。
既存のステージングエリアを選択するか、[新規作成] をクリックして新しいステージングエリアを定義し、クラウドストレージへの接続 の指示に従います。

接続設定を編集するには、[編集] をクリックします。接続をテストするには (推奨)、[接続のテスト] をクリックします。

どのステージングエリアがどのデータウェアハウスでサポートされているかについては、ターゲットプラットフォームのユースケースとサポートされるバージョン の [ステージングエリアとしてサポート] 列を参照してください。

レプリケーションスケジューラー
情報メモ
この設定は、次のユースケースでのみ使用できます。
- SaaS アプリケーションコネクタを使用する場合。
- Data Movement gateway を使用せずにデータソースにアクセスする場合。
Data Movement gateway の利点とそれを必要とするユースケースの詳細については、「Qlik データゲートウェイ - データ移動」を参照してください。
- 毎回データをレプリケートする: データソースから変更をキャプチャする頻度をスケジュールし、開始日時を設定できます。タスクのセットアップウィザードを使用すると、基本的なスケジュール頻度を設定できます。タスクのセットアップが完了すると、追加のスケジュールオプションを利用できるようになります。
  
  すべてのスケジュールオプションの説明については、「Scheduling tasks」を参照してください。
データソースの種類とサブスクリプションティアに応じた最小スケジュール間隔の詳細については、「許容される最小スケジュール間隔」を参照してください。
[概要] タブに、データパイプラインのビジュアルが表示されます。選択したデータセットの一部が CDC をサポートしていない場合は、CDC タスク用とリロードタスク用の 2 つのパイプラインが表示されます。[<名前> データタスクを開く]、または [Do nothing] (何もしない) を選択し、 [作成] をクリックします。

選択に応じて、タスクが開かれるか、プロジェクトのリストが表示されます。
タスクを開くことを選択した場合、 [データセット] タブには、選択したソーステーブルの構造とメタデータが表示されます。これには、明示的にリストされたすべてのテーブルと、選択ルールに一致するテーブルが含まれます。

データソースからさらにテーブルを追加する場合は、 [ソースデータの選択] をクリックします。
必要に応じて、レプリケーションの設定 の説明に従ってタスク設定を変更します。
データセットの変換を実行し、データをフィルタリングし、列を追加できます。

詳細については、「データセットを管理」を参照してください。
必要な変換を追加したら、[データセットの検証] をクリックしてデータセットを検証できます。検証に失敗した場合は、先に進む前にエラーを修正してください。

詳細については、「データセットの検証と調整」を参照してください。
準備ができたら、 [準備] をクリックしてデータタスクをカタログ化し、実行の準備をします。
情報メモ
- [フルロード] レプリケーションモードで構成されたデータタスクを準備すると、タスク設定のフルロードタブで定義された設定が適用されます。
- 既定では、最初の準備操作により、既存のターゲットテーブルはすべて削除され、再作成されます。既定をオーバーライドするには、以下の 最初の準備中に既存のターゲットテーブルを保持する のステップに従ってください。
データタスクの準備が完了したら、[実行] をクリックします。

タスクの復元、およびタスクを実行するその他の方法については、「詳細な実行オプション」を参照してください。
レプリケーションタスクが開始され、 [モニター] で進行状況を確認できます。詳細については、「個々のデータタスクの監視」を参照してください。

最初の準備中に既存のターゲットテーブルを保持する

既定では、最初の準備操作により、既存のターゲットテーブルはすべて削除され、再作成されます。ただし、状況によっては、既存のターゲットテーブルの保持が必要になる場合もあります。たとえば、すでに実行されたデータタスクを含むプロジェクトをインポートする場合、既存のターゲットレコードの最後のタイムスタンプまたは位置の直後からデータタスクを開始 (再開) できます。

SaaS アプリケーションソースからの複製ではサポートされていません。

これを実行するには、次の手順に従います。

[フルロードタスク設定] で、 [ターゲットテーブルが既に存在する場合] を [無視] に設定します。

情報メモこの設定は、データタスクの準備段階で適用されるだけでなく、テーブルがリロードされるたびに適用されます。
[高度な実行オプション] ダイアログを開き、「テーブルはすでにロードされています」を選択します。からプロセスの変更を開始: ターゲットレコードの重複を防ぐには、既存のターゲットレコードの最後のタイムスタンプまたは位置の直後に、日付と時刻または位置 (データソースに応じて異なる) を入力してください。
タスクを準備して実行します。

データセットのロードの優先度の設定

各データセットにロード優先度を割り当てることで、データタスクでのデータセットのロード順を制御できます。この機能は、大きなデータセットの前に小さなデータセットをロードする場合などに便利です。

[ロードの優先度] をクリックします。
各データセットのロードの優先度を選択します。

既定のロードの優先度は [標準] です。データセットは次の優先順位でロードされます。
- 最高
- より高く
- 高
- 標準
- 低
- より低く
- 最低
同じ優先度のデータセットは順不同でロードされます。
[OK] をクリックします。

SaaS アプリケーションソースからのデータセットには、ロード順序の依存関係が含まれている可能性があります。ロードの優先順位を設定するときは、この点を考慮してください。

スキーマの進化

スキーマの進化により、複数のデータソースに対する構造的な変更を簡単に検出し、それらの変更がタスクにどのように適用されるかを制御できます。スキーマの進化を使用すると、ソースデータスキーマに対して実行された DDL 変更を検出できます。一部の変更を自動的に適用することもできます。

スキーマの進化は、Qlik Talend Cloud スターターサブスクリプションでは使用できません。SaaS アプリケーションコネクタを使用する場合、データ型の変更のみがサポートされます。

変更タイプごとに、タスク設定の [スキーマの進化] セクションで変更を処理する方法を選択できます。変更を適用、変更を無視、テーブルを一時停止、またはタスクの処理を停止できます。

変更タイプごとに、DDL 変更を処理するために使用するアクションを設定できます。すべての変更タイプで、一部のアクションは使用できません。

ターゲットに適用
変更を自動的に適用します。
無視
変更を無視します。
テーブルを一時停止
テーブルを一時停止します。[モニター] では、テーブルがエラーとして表示されます。
タスクを停止
タスクの処理を停止します。これは、すべてのスキーマ変更を手動で処理する場合に便利です。これにより、スケジュールも停止され、スケジュール済みの実行は行われなくなります。

次の変更がサポートされています。

列を追加
列名を変更
列のデータ型を変更
テーブルをドロップ
列をドロップ
選択パターンに一致するテーブルを追加する
[選択ルール] を使用してパターンに一致するデータセットを追加した場合、パターンを満たす新しいテーブルが検出され、追加されます。

タスク設定の詳細については、「スキーマの自動進化」を参照してください。

スキーマの進化によって処理される変更に関する通知を受け取ることもできます。詳細については、「動作変更時の通知の設定」を参照してください。

スキーマの進化に関する制限

スキーマの進化には次の制限が適用されます。

スキーマの進化は、更新方法として CDC を使用する場合にのみサポートされます。
スキーマの進化の設定を変更した場合は、再度タスクを準備する必要があります。
テーブルの名前を変更すると、スキーマの進化はサポートされません。この場合、タスクを準備する前にメタデータを更新する必要があります。
タスクを設計している場合は、スキーマの進化の変更を受け取るためにブラウザを更新する必要があります。変更があった場合に通知を受け取るように設定できます。
ランディングタスクでは、列のドロップはサポートされていません。列をドロップして追加すると、テーブルエラーが発生します。
ランディングタスクでは、テーブルのドロップ操作を実行してもテーブルはドロップされません。テーブルをドロップしてからテーブルを追加しても、古いテーブルが切り捨てられるだけで、新しいテーブルは追加されません。
ターゲットデータベースのサポートによっては、すべてのターゲットで列の長さを変更できない場合があります。
列名が変更されると、その列を使用して定義された明示的な変換は列名に基づいているため反映されません。
メタデータの更新に対する制限は、スキーマの進化にも適用されます。
タスクにまだ準備されていない設計変更が含まれており、タスクの実行時にソーススキーマの進化変更が検出された場合、競合を回避するためにタスクは停止されます。ペンディングの設計変更を準備し、タスクを再度実行します。

DDL の変更をキャプチャする場合、次の制限が適用されます。

ソースデータベースで一連の操作が高速に実行されると (例: DDL > DML > DDL)、Qlik Talend Data Integration はログを間違った順序で解析し、データが欠落したり、予期しない動作が発生したりする可能性があります。このような事態が発生する可能性を最小限に抑えるベストプラクティスとして、次の操作を実行する前に、変更がターゲットに適用されるまで待機してください。
たとえば、変更キャプチャ中に、ソーステーブルの名前が立て続けに複数回変更されると (2 回目の操作で元の名前に戻される)、ターゲットデータベースにテーブルが既に存在するというエラーが発生する可能性があります。
タスクで使用されるテーブルの名前を変更してからタスクを停止すると、タスクの再開後に Qlik Talend Data Integration はそのテーブルに加えられた変更をキャプチャしません。
タスクが停止している間にソーステーブルの名前を変更することはサポートされていません。
テーブルのプライマリキー列の再割り当てはサポートされていません (したがって、DDL 履歴コントロールテーブルには書き込まれません)。
タスクが停止している間に列のデータ型が変更され、(同じ) 列の名前が変更されると、タスクが再開されたときに DDL の変更が DDL 履歴コントロールテーブルに「列をドロップ」として表示され、その後「列を追加」として表示されます。待機時間が長引いた場合にも、同じ動作が起こる可能性があることに注意してください。
タスクが停止している間にソースで実行された CREATE TABLE 操作は、タスクが再開されるとターゲットに適用されますが、DDL 履歴コントロールテーブルに DDL として記録されません。
メタデータの変更に関連する操作 (ALTER TABLE、再編成、クラスター化インデックスの再構築など) は、次のいずれかの方法で実行された場合、予期しない動作を引き起こす可能性があります。
- フルロード時
  -または-
- [プロセスの変更開始] のタイムスタンプと現在の時刻 (つまり、ユーザーが [詳細な実行オプション] ダイアログで [OK] をクリックした時点) の間。
  例:
  次の場合:
  指定された [プロセスの変更開始] 時刻は午前 10:00 です。
  および:
  午前 10 時 10 分に、 [年齢] という列が [従業員] テーブルに追加されました。
  および:
  ユーザーは午前 10 時 15 分に [詳細な実行オプション] ダイアログで [OK] をクリックします。
  その結果:
  10:00 から 10:10 の間に発生した変更により、CDC エラーが発生する可能性があります。
情報メモ
上記のいずれの場合でも、データがターゲットに適切に移動済みされるように、影響を受けるテーブルをリロードする必要があります。

DDL ステートメント ALTER TABLE ADD/MODIFY <column> <data_type> DEFAULT <> は、既定値をターゲットにレプリケートせず、新しい列または変更された列は NULL に設定されます。列を追加または変更した DDL が過去に実行された場合でも、発生する可能性があることに注意してください。新しい列または変更された列が NULL 可能である場合、ソースエンドポイントは DDL 自体をログに記録する前にすべてのテーブル行を更新します。その結果、Qlik Talend Data Integration は変更をキャプチャしますが、ターゲットは更新しません。新しい列または変更された列が NULL に設定されているため、ターゲットテーブルにプライマリキーまたは一意のインデックスがない場合、後続の更新では「影響を受ける行は 0 行です」というメッセージが生成されます。
TIMESTAMP および DATE 精度列への変更はキャプチャされません。

自動的に適用されない変更の処理

ここでは、ターゲットに適用できない変更 (アクションの無視、一時停止、タスクの停止) を処理する方法について説明します。

DDL の変更	変更を実施するには	現在の状態を維持するには
列を追加	メタデータを更新し、タスクを準備してから、タスクを実行します。	必要なアクションはありません
テーブルを作成	メタデータを更新し、タスクを準備してから、タスクを実行します。	必要なアクションはありません
列のデータ型を変更	制限を確認してください。制限が適用されない場合: メタデータを更新し、タスクを準備してから、タスクを実行します。	現在の状態の保持は、常にサポートされているわけではありません。考えられる回避策: 列のデータ型を手動で変更します。この操作をダウンストリームのタスクで繰り返す必要があります。新しい列を作成し、古い列を新しい列に移動してから、2 つの列を結合するビューを手動で作成します。
テーブルの名前を変更	制限を確認してください。制限が適用されない場合: タスクを準備してから、タスクを実行します。	古い名前に対する明示的な名前変更ルールを定義します。
列名を変更	制限を確認してください。制限が適用されない場合: メタデータを更新し、タスクを準備してから、タスクを実行します。	メタデータを更新し、古い名前に対する明示的な名前変更ルールを定義します。

ゲートウェイまたは接続の変更

ターゲット/ソースの接続、またはソースゲートウェイを変更する場合は、テーブルを再作成する必要があります。

プロジェクト情報の表示

メニューバーでをクリックして、次のようなプロジェクト情報を表示します。

所有者
スペース
データプラットフォーム
プロジェクトID

データをレプリケートする際の制限と考慮事項

変換には次の制限があります。

右から左に記述する言語の列では、変換はサポートされません。
名前に特殊文字 (例: #、\、/、-) が含まれる列では変換を実行できません。
LOB/CLOB データ型でサポートされている唯一の変換は、ターゲット上の列をドロップすることです。
変換を使用して列の名前を変更し、同じ名前の新しい列を追加することはサポートされていません。

移動された列では、直接変更または変換ルールを使用して Null 可能性を変更することはサポートされていません。ただし、タスクで作成された新しい列は、既定で Null 可能です。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。

こちらにフィードバックをお寄せください