データをレプリケートする
サポートされているデータ ソースから、サポートされている任意のターゲットにデータをレプリケートできます。
データ レプリケーション プロセスは次の操作で構成されます。
- データソースからデータを取得する
- データを変換する (任意)
- データをターゲットにロードする
- リアルタイムの変更キャプチャでデータを最新の状態に保つ
データ ソースへの接続を設定する方法については、「データ ソースへの接続」を参照してください。
ターゲット データベースへの接続を設定する方法については、「ターゲットへの接続」を参照してください。
レプリケーション タスクを設定するには:
右上隅にある [新規追加] ボタンをクリックし、ドロップダウンメニューから [アプリをアップロード] を選択します。
[新しいデータ プロジェクト] ダイアログで、次の操作を実行します。
- プロジェクトの [名前] を入力します。
- プロジェクトを作成する [スペース] を選択します。
- 必要に応じて [説明] を入力します。
- [ユースケース] として [レプリケーション] を選択します。
- 必要に応じて、何も構成せずに空のプロジェクトを作成する場合は、 [開く] チェック ボックスをオフにします。
[作成] をクリックします。
次のいずれかが発生します。
- [新しいデータ プロジェクト] ダイアログの [開く] チェック ボックスがオンになっている場合 (既定)、プロジェクトが開きます。
- [新しいデータ プロジェクト] ダイアログの [開く] チェック ボックスがオフの場合、プロジェクトはプロジェクトのリストに追加されます。プロジェクトの メニューから [開く] を選択すると、後でプロジェクトを開くことができます。
プロジェクトが開いたら、 [データをレプリケートする] をクリックします。
[データをレプリケートする] ウィザードが開きます。
[基本設定] タブで、レプリケーション タスクの名前と説明を指定します。[次へ] をクリックします。
[ソース接続を選択] タブで、ソース データへの接続を選択します。必要に応じて、 [アクション] 列のメニューから [編集] を選択して、接続設定を編集できます。
データ ソースへの接続をまだ作成していない場合は、タブの右上にある [接続を作成] をクリックして接続を作成する必要があります。
左側のフィルターを使用して、接続のリストをフィルタリングできます。接続は、ソース タイプ、ゲートウェイ、スペース、所有者でフィルタリングできます。接続リストの上にある [すべてのフィルター] ボタンには、現在のフィルターの数が表示されます。このボタンを使用して、左側の [フィルター] パネルを閉じたり開いたりできます。現在アクティブなフィルターは、使用可能なデータ接続のリストの上にも表示されます。
右側のドロップダウン リストから [最終更新日]、 [最終作成日]、または [アルファベット順] を選択してリストを並べ替えることもできます。ソート順を変更するには、リストの右側にある矢印をクリックします。
データ ソース接続を選択した後、必要に応じて、タブの右上にある [接続をテスト] をクリックし (推奨)、[次へ] をクリックします。
[データセットを選択] タブで、レプリケーション タスクに含めるテーブルやビューを選択します。データベースからのデータの選択 で説明されているように、ワイルドカードを使用して選択ルールを作成することもできます。
[ターゲット接続を選択] タブで、使用可能な接続のリストからターゲットを選択し、[次へ] をクリックします。機能的には、このタブは前述の [ソース接続を選択] タブと同じです。
[設定] タブで、必要に応じて次の設定を変更し、[次へ] をクリックします。
レプリケーションの設定:
情報メモSaaS アプリケーション ソースからレプリケートする場合、フル ロード レプリケーション モードが既定で有効になっており、無効にすることはできません。- フル ロード: 選択したソース テーブルからターゲット プラットフォームにデータをロードし、必要に応じてターゲット テーブルを作成します。フル ロードはタスクの開始時に自動的に実行されますが、必要に応じて手動で実行することもできます。
- 変更を適用: ソース テーブルに加えられた変更を反映して、ターゲット テーブルを常に最新の状態に保ちます。
保存先の変更: ソース テーブルへの変更を変更テーブル (ソース テーブルごとに 1 つ) に保存します。
詳細については、「変更の保存」を参照してください。
情報メモALTER TABLE DDL 操作は現在サポートされていません。DROP TABLE や TRUNCATE TABLE など、他の DDL 操作はサポートされています。変更適用モード:
変更は、次のいずれかの方法でターゲット テーブルに適用されます。
- バッチ最適化: これが既定です。このオプションを選択すると、変更はバッチで適用されます。トランザクションをもっとも効率的な方法でバッチにグループ化するための前処理アクションが発生します。
- トランザクション: このオプションを選択すると、各トランザクションをコミットされた順序で個別に適用します。この場合、すべてのテーブルで厳密な参照整合性が確保されます。
[概要] タブに、データ パイプラインのビジュアルが表示されます。[<名前> タスクを開く]、または [Do nothing] (何もしない) を選択し、 [作成] をクリックします。
選択に応じて、タスクが開かれるか、プロジェクトのリストが表示されます。
タスクを開くことを選択した場合、 [データセット] タブには、選択したデータ アセット テーブルの構造とメタデータが表示されます。これには、明示的にリストされたすべてのテーブルと、選択ルールに一致するテーブルが含まれます。
データ ソースからさらにテーブルを追加する場合は、 [ソース データの選択] をクリックします。
必要に応じて、 データ レプリケーションの設定 の説明に従ってタスク設定を変更します。
データセットの変換を実行し、データをフィルタリングし、列を追加できます。
詳細については、「データセットの管理」を参照してください。
必要な変換を追加したら、[データセットの検証] をクリックしてデータセットを検証できます。検証に失敗した場合は、先に進む前にエラーを修正してください。
詳細については、「データセットの検証と調整」を参照してください。
準備ができたら、 [準備] をクリックしてデータ タスクをカタログ化し、実行の準備をします。
データ タスクの準備が完了したら、[実行] をクリックします。
タスクの復元、およびタスクを実行するその他の方法については、「詳細な実行オプション」を参照してください。
レプリケーション タスクが開始され、 [モニター] で進行状況を確認できます。詳細については、「個々のデータ タスクの監視」を参照してください。
データセットのロードの優先度の設定
各データセットにロード優先度を割り当てることで、データ タスクでのデータセットのロード順を制御できます。この機能は、大きなデータセットの前に小さなデータセットをロードする場合などに便利です。
[ロードの優先度] をクリックします。
各データセットのロードの優先度を選択します。
既定のロードの優先度は [標準] です。データセットは次の優先順位でロードされます。
最高
より高く
高
標準
低
より低く
最低
同じ優先度のデータセットは順不同でロードされます。
[OK] をクリックします。