Qlik Talend Cloud スターターサブスクリプションを使用したデータのレプリケート

タスクのセットアップウィザードを使用すると、わずか数回のクリックでレプリケーションタスクを簡単に設定できます。

ウィザードに表示される設定は、選択されたターゲットタイプを反映しています。たとえば、Amazon S3 などのストレージターゲットにレプリケートする場合は、ストレージの場所を指定するように求められます。ただし、Amazon Redshift などのステージングエリアを必要とするターゲットにレプリケートする場合は、ステージングエリアを定義または選択するように求められます。

次の表は、ターゲットに応じてこのトピックをナビゲートするのに役立ちます。

ステージングなしでデータベースやデータウェアハウスにレプリケートする

ステージングを必要としない次のデータベースまたはデータウェアハウスへのレプリケーションタスクを設定します。

Google BigQuery
Snowflake

ステージングを使用してデータウェアハウスにレプリケートする

ステージングを必要とする次のデータウェアハウスへのレプリケーションタスクを設定します。

Amazon Redshift
Microsoft Fabric
Databricks

クラウドストレージへのレプリケート

クラウドストレージへのレプリケーションタスクを設定します。

ステージングなしでデータベースやデータウェアハウスにレプリケートする

このセクションでは、個別のステージングエリアを必要としないデータベースおよびデータウェアハウスへのレプリケーションタスクを設定する方法について説明します。

これを行うには、次の手順に従います。

データ統合 > ホームで、 [データをレプリケート] をクリックします。

[データをレプリケートする] ウィザードが開きます。
[一般] タブで、次を実行します。
- タスク名
  
  タスクの名前を指定します。
- 説明
  
  必要に応じて、タスクの説明を入力します。
- プロジェクト
  
  以下のいずれかを行います。
  - 既存のプロジェクトを選択します
  - 新しいプロジェクトの名前を指定し、 [プロジェクト] 項目の下にある [新しいプロジェクトを追加: <プロジェクト名>] をクリックします。
    
    [プロジェクト] 項目にプロジェクト名が追加されます。
- スペース
  
  レプリケーションプロジェクトのデータスペースを選択します。データスペースを作成していない場合は、次のいずれかを実行します。
  - [データスペース] (既定のテナントデータスペース) を選択します。
    
    情報メモ[データスペース] はすべてのメンバーに対する完全な権限を持ちます。データスペースのロールと権限 で説明されているように、各メンバーのロールと権限は後で編集できます。
  - ウィザードをキャンセルし、データスペースの作成の説明に従って独自のデータスペースを作成してから、ウィザードを再度実行します。
  データスペースの詳細については、「Qlik Talend Data Integration のスペースでの作業」を参照してください。
[次へ] をクリックします。[ソース接続を選択] タブで、ソースデータへの接続を選択します。必要に応じて、 [アクション] 列のメニューから [編集] を選択して、接続設定を編集できます。

データソースへの接続をまだ作成していない場合は、タブの右上にある [接続を作成] をクリックして接続を作成する必要があります。

左側のフィルターを使用して、接続のリストをフィルタリングできます。接続は、ソースタイプ、ゲートウェイ、スペース、所有者でフィルタリングできます。接続リストの上にある [すべてのフィルター] ボタンには、現在のフィルターの数が表示されます。このボタンを使用して、左側の [フィルター] パネルを閉じたり開いたりできます。現在アクティブなフィルターは、使用可能な接続のリストの上にも表示されます。

右側のドロップダウンリストから [最終更新日]、 [最終作成日]、または [アルファベット順] を選択してリストを並べ替えることもできます。ソート順を変更するには、リストの右側にある矢印をクリックします。

データソース接続を選択した後、必要に応じて、タブの右上にある [接続をテスト] をクリックし (推奨)、[次へ] をクリックします。
[データセットを選択] タブで、レプリケーションタスクに含めるテーブルやビューを選択します。データベースからのデータの選択 で説明されているように、ワイルドカードを使用して選択ルールを作成することもできます。
[ターゲット接続を選択] タブで、使用可能な接続のリストからターゲットを選択し、[次へ] をクリックします。機能的には、このタブは前述の [ソース接続を選択] タブと同じです。
[設定] タブで、必要に応じて次の設定を変更し、[次へ] をクリックします。

レプリケーションモード

情報メモSaaS アプリケーションソースからレプリケートする場合、フルロードレプリケーションモードが既定で有効になっており、無効にすることはできません。
- フルロード: 選択したソーステーブルからターゲットプラットフォームにデータをロードし、必要に応じてターゲットテーブルを作成します。フルロードはタスクの開始時に自動的に実行されますが、必要に応じて手動で実行することもできます。
  
  情報メモこの設定は、SaaS アプリケーションプレビューコネクタを使用する場合は使用できません。[Create Connection] (接続を作成) ダイアログおよびオンラインヘルプの両方で、プレビューコネクタはボタンで表示されます。
- 変更を適用: ソーステーブルに加えられた変更を反映して、ターゲットテーブルを最新の状態に保ちます。
- 保存先の変更: ソーステーブルへの変更を変更テーブル (ソーステーブルごとに 1 つ) に保存します。
  
  詳細は、変更の保存をご覧ください。
変更データキャプチャの頻度は、スケジューラーの設定によって決まります。既定の変更キャプチャの間隔は 6 時間ごとです。詳細は、 データレプリケーションタスクの設定をご覧ください。

カスタムスキーマ
- ターゲットデータセットスキーマ: 必要に応じて、ターゲットにデータセットを作成するスキーマを選択します。
- コントロールテーブルスキーマ: 必要に応じて、ターゲットにコントロールテーブルを作成するスキーマを選択します。
レプリケーションスケジューラー
- 毎回データをレプリケートする: データソースから変更をキャプチャする頻度をスケジュールし、開始時刻と開始日を設定できます。ソースデータセットが CDC (変更データキャプチャ) をサポートしている場合は、ソースデータへの変更のみがレプリケーションされ、対応するターゲットテーブルに適用されます。ソースデータセットが CDC をサポートしていない場合 (ビューなど)、すべてのソースデータを対応するターゲットテーブルに再ロードすることによって変更が適用されます。一部のソースデータセットが CDC をサポートし、一部がサポートしない場合は、2 つの個別のサブタスクが作成されます ( [変更の適用] または [変更の保存] レプリケーションオプションが選択されていると想定)。 1 つは CDC をサポートしないデータセットを再ロードするためのもので、もう 1 つは CDC をサポートするデータセットへの変更をキャプチャするためのものです。
  
  タスクのセットアップウィザードを使用すると、1 時間間隔でスケジュールを設定できます。タスクの設定が完了したら、 データレプリケーションタスクの設定 で説明されているように、さまざまなスケジュールオプションを検討できます。
データソースの種類とサブスクリプションティアに応じた最小スケジュール間隔の詳細については、「許容される最小スケジュール間隔」を参照してください。

データレプリケーションタスクの設定 で説明されているように、後で設定を変更できます。
[概要] タブに、データパイプラインのビジュアルが表示されます。次のいずれかの [パイプラインの作成後] アクションを選択します。
- <名前> プロジェクトを開く (既定)
- <名前> データタスクを開く
  
  情報メモ選択したデータセットの一部が CDC をサポートしていない場合は、CDC タスク用とリロードタスク用の 2 つのパイプラインが表示されます。
次に、 [作成して実行する] (既定) をクリックするか、 [作成] をクリックしてタスクを実行せずに作成します。

[作成して実行する] をクリックすると、タスクが作成され、実行が開始されます (数分かかる場合があります)。
[作成] をクリックすると、前に選択した [パイプラインの作成後] のアクションに応じて、次のいずれかが実行されます。
- プロジェクトが開き、新しく作成されたタスクが表示されます。
- タスクは [データセット] タブで開きます。[データセット] タブには、選択したソーステーブルの構造とメタデータが表示されます。これには、明示的にリストされたすべてのテーブルと、選択ルールに一致するテーブルが含まれます。
  
  データソースからさらにテーブルを追加する場合は、 [ソースデータの選択] をクリックします。
データセットの変換を実行し、データをフィルタリングし、列を追加できます。

詳細については、「データセットの管理」を参照してください。
必要な変換を追加したら、[データセットの検証] をクリックしてデータセットを検証できます。検証に失敗した場合は、先に進む前にエラーを修正してください。

詳細は、データセットの検証と調整をご覧ください。
準備ができたら、 [準備して実行] をクリックして、データタスクを準備して実行します。

タスクの復元、およびタスクを実行するその他の方法については、「詳細な実行オプション」を参照してください。
レプリケーションタスクが開始され、 [モニター] で進行状況を確認できます。詳細については、「個々のデータタスクの監視」を参照してください。

ステージングを使用してデータウェアハウスにレプリケートする

このセクションでは、個別のステージングエリアを必要とするデータウェアハウスへのレプリケーションタスクを設定する方法について説明します。

これを行うには、次の手順に従います。

データ統合> ホームで、 [データをレプリケート] をクリックします。

[データをレプリケートする] ウィザードが開きます。
[一般] タブで、次を実行します。
- タスク名
  
  タスクの名前を指定します。
- 説明
  
  必要に応じて、タスクの説明を入力します。
- プロジェクト
  
  以下のいずれかを行います。
  - 既存のプロジェクトを選択します
  - 新しいプロジェクトの名前を指定し、 [プロジェクト] 項目の下にある [新しいプロジェクトを追加: <プロジェクト名>] をクリックします。
    
    [プロジェクト] 項目にプロジェクト名が追加されます。
- スペース
  
  レプリケーションプロジェクトのデータスペースを選択します。データスペースを作成していない場合は、次のいずれかを実行します。
  - [データスペース] (既定のテナントデータスペース) を選択します。
    
    情報メモ[データスペース] はすべてのメンバーに対する完全な権限を持ちます。データスペースのロールと権限 で説明されているように、各メンバーのロールと権限は後で編集できます。
  - ウィザードをキャンセルし、データスペースの作成の説明に従って独自のデータスペースを作成して、ウィザードを再度実行します。
  データスペースの詳細については、「Qlik Talend Data Integration のスペースでの作業」を参照してください。
[次へ] をクリックします。[ソース接続を選択] タブで、ソースデータへの接続を選択します。必要に応じて、 [アクション] 列のメニューから [編集] を選択して、接続設定を編集できます。

データソースへの接続をまだ作成していない場合は、タブの右上にある [接続を作成] をクリックして接続を作成する必要があります。

左側のフィルターを使用して、接続のリストをフィルタリングできます。接続は、ソースタイプ、ゲートウェイ、スペース、所有者でフィルタリングできます。接続リストの上にある [すべてのフィルター] ボタンには、現在のフィルターの数が表示されます。このボタンを使用して、左側の [フィルター] パネルを閉じたり開いたりできます。現在アクティブなフィルターは、使用可能な接続のリストの上にも表示されます。

右側のドロップダウンリストから [最終更新日]、 [最終作成日]、または [アルファベット順] を選択してリストを並べ替えることもできます。ソート順を変更するには、リストの右側にある矢印をクリックします。

データソース接続を選択した後、必要に応じて、タブの右上にある [接続をテスト] をクリックし (推奨)、[次へ] をクリックします。
[データセットを選択] タブで、レプリケーションタスクに含めるテーブルやビューを選択します。データベースからのデータの選択 で説明されているように、ワイルドカードを使用して選択ルールを作成することもできます。
[ターゲット接続を選択] タブで、使用可能な接続のリストからターゲットを選択し、[次へ] をクリックします。機能的には、このタブは前述の [ソース接続を選択] タブと同じです。
[設定] タブで、必要に応じて次の設定を変更し、[次へ] をクリックします。

レプリケーションモード

情報メモSaaS アプリケーションソースからレプリケートする場合、フルロードレプリケーションモードが既定で有効になっており、無効にすることはできません。
- フルロード: 選択したソーステーブルからターゲットプラットフォームにデータをロードし、必要に応じてターゲットテーブルを作成します。フルロードはタスクの開始時に自動的に実行されますが、必要に応じて手動で実行することもできます。
  
  情報メモこの設定は、SaaS アプリケーションプレビューコネクタを使用する場合は使用できません。[Create Connection] (接続を作成) ダイアログおよびオンラインヘルプの両方で、プレビューコネクタはボタンで表示されます。
- 変更を適用: ソーステーブルに加えられた変更を反映して、ターゲットテーブルを最新の状態に保ちます。
- 保存先の変更: ソーステーブルへの変更を変更テーブル (ソーステーブルごとに 1 つ) に保存します。
  
  詳細は、変更の保存をご覧ください。
変更データキャプチャの頻度は、スケジューラーの設定によって決まります。既定の変更キャプチャの間隔は 6 時間ごとです。詳細は、 データレプリケーションタスクの設定をご覧ください。

ステージングエリアへの接続

以下にリストされているデータウェアハウスにレプリケーションする場合は、ステージングエリアを設定する必要があります。データは、ウェアハウスに転送される前にステージングエリアで処理および準備されます。
既存のステージングエリアを選択するか、[新規作成] をクリックして新しいステージングエリアを定義し、クラウドストレージへの接続 の指示に従います。

接続設定を編集するには、[編集] をクリックします。接続をテストするには (推奨)、[接続のテスト] をクリックします。

どのステージングエリアがどのデータウェアハウスでサポートされているかについては、ターゲットプラットフォームのユースケースとサポートされるバージョン の [ステージングエリアとしてサポート] 列を参照してください。

カスタムスキーマ
- ターゲットデータセットスキーマ: 必要に応じて、ターゲットにデータセットを作成するスキーマを選択します。
- コントロールテーブルスキーマ: 必要に応じて、ターゲットにコントロールテーブルを作成するスキーマを選択します。
レプリケーションスケジューラー
- 毎回データをレプリケートする: データソースから変更をキャプチャする頻度をスケジュールし、開始時刻と開始日を設定できます。ソースデータセットが CDC (変更データキャプチャ) をサポートしている場合は、ソースデータへの変更のみがレプリケーションされ、対応するターゲットテーブルに適用されます。ソースデータセットが CDC をサポートしていない場合 (ビューなど)、すべてのソースデータを対応するターゲットテーブルに再ロードすることによって変更が適用されます。一部のソースデータセットが CDC をサポートし、一部がサポートしない場合は、2 つの個別のサブタスクが作成されます ( [変更の適用] または [変更の保存] レプリケーションオプションが選択されていると想定)。 1 つは CDC をサポートしないデータセットを再ロードするためのもので、もう 1 つは CDC をサポートするデータセットへの変更をキャプチャするためのものです。
  
  タスクのセットアップウィザードを使用すると、1 時間間隔でスケジュールを設定できます。タスクの設定が完了したら、 データレプリケーションタスクの設定 で説明されているように、さまざまなスケジュールオプションを検討できます。
データレプリケーションタスクの設定 で説明されているように、後で設定を変更できます。
[概要] タブに、データパイプラインのビジュアルが表示されます。次のいずれかの [パイプラインの作成後] アクションを選択します。
- <名前> プロジェクトを開く (既定)
- <名前> データタスクを開く
  
  情報メモ選択したデータセットの一部が CDC をサポートしていない場合は、CDC タスク用とリロードタスク用の 2 つのパイプラインが表示されます。
次に、 [作成して実行する] (既定) をクリックするか、 [作成] をクリックしてタスクを実行せずに作成します。

[作成して実行する] をクリックすると、タスクが作成され、実行が開始されます (数分かかる場合があります)。
[作成] をクリックすると、前に選択した [パイプラインの作成後] のアクションに応じて、次のいずれかが実行されます。
- プロジェクトが開き、新しく作成されたタスクが表示されます。
- タスクは [データセット] タブで開きます。[データセット] タブには、選択したソーステーブルの構造とメタデータが表示されます。これには、明示的にリストされたすべてのテーブルと、選択ルールに一致するテーブルが含まれます。
  
  データソースからさらにテーブルを追加する場合は、 [ソースデータの選択] をクリックします。
データセットの変換を実行し、データをフィルタリングし、列を追加できます。

詳細については、「データセットの管理」を参照してください。
必要な変換を追加したら、[データセットの検証] をクリックしてデータセットを検証できます。検証に失敗した場合は、先に進む前にエラーを修正してください。

詳細は、データセットの検証と調整をご覧ください。
準備ができたら、 [準備して実行] をクリックして、データタスクを準備して実行します。

タスクの復元、およびタスクを実行するその他の方法については、「詳細な実行オプション」を参照してください。
レプリケーションタスクが開始され、 [モニター] で進行状況を確認できます。詳細については、「個々のデータタスクの監視」を参照してください。

クラウドストレージへのレプリケート

このセクションでは、クラウドストレージへのレプリケーションタスクを設定する方法について説明します。

これを行うには、次の手順に従います。

データ統合> ホームで、 [データをレプリケート] をクリックします。

[データをレプリケートする] ウィザードが開きます。
[一般] タブで、次を実行します。
- タスク名
  
  タスクの名前を指定します。
- 説明
  
  必要に応じて、タスクの説明を入力します。
- プロジェクト
  
  以下のいずれかを行います。
  - 既存のプロジェクトを選択します
  - 新しいプロジェクトの名前を指定し、 [プロジェクト] 項目の下にある [新しいプロジェクトを追加: <プロジェクト名>] をクリックします。
    
    [プロジェクト] 項目にプロジェクト名が追加されます。
- スペース
  
  レプリケーションプロジェクトのデータスペースを選択します。データスペースを作成していない場合は、次のいずれかを実行します。
  - [データスペース] (既定のテナントデータスペース) を選択します。
    
    情報メモ[データスペース] はすべてのメンバーに対する完全な権限を持ちます。データスペースのロールと権限 で説明されているように、各メンバーのロールと権限は後で編集できます。
  - ウィザードをキャンセルし、データスペースの作成の説明に従って独自のデータスペースを作成して、ウィザードを再度実行します。
  データスペースの詳細については、「Qlik Talend Data Integration のスペースでの作業」を参照してください。
[次へ] をクリックします。[ソース接続を選択] タブで、ソースデータへの接続を選択します。必要に応じて、 [アクション] 列のメニューから [編集] を選択して、接続設定を編集できます。

データソースへの接続をまだ作成していない場合は、タブの右上にある [接続を作成] をクリックして接続を作成する必要があります。

左側のフィルターを使用して、接続のリストをフィルタリングできます。接続は、ソースタイプ、ゲートウェイ、スペース、所有者でフィルタリングできます。接続リストの上にある [すべてのフィルター] ボタンには、現在のフィルターの数が表示されます。このボタンを使用して、左側の [フィルター] パネルを閉じたり開いたりできます。現在アクティブなフィルターは、使用可能な接続のリストの上にも表示されます。

右側のドロップダウンリストから [最終更新日]、 [最終作成日]、または [アルファベット順] を選択してリストを並べ替えることもできます。ソート順を変更するには、リストの右側にある矢印をクリックします。

データソース接続を選択した後、必要に応じて、タブの右上にある [接続をテスト] をクリックし (推奨)、[次へ] をクリックします。
[データセットを選択] タブで、レプリケーションタスクに含めるテーブルやビューを選択します。データベースからのデータの選択 で説明されているように、ワイルドカードを使用して選択ルールを作成することもできます。
[ターゲット接続を選択] タブで、使用可能な接続のリストからターゲットを選択し、[次へ] をクリックします。機能的には、このタブは前述の [ソース接続を選択] タブと同じです。
[設定] タブで、必要に応じて次の設定を変更し、[次へ] をクリックします。

更新方法
- 変更データキャプチャ (CDC): データレイクのランディングタスクは、フルロードから開始されます (その間、選択されたすべてのテーブルがランディングされます)。ランディングデータは、CDC (変更データキャプチャ) テクノロジーを使用して最新の状態に保たれます。
  
  情報メモDDL 操作の CDC (変更データキャプチャ) はサポートされていません。
  
  変更データキャプチャの頻度は、スケジューラーの設定によって決まります。既定の変更キャプチャの間隔は 6 時間ごとです。詳細は、 データレプリケーションタスクの設定をご覧ください。
- リロード: 選択したソーステーブルからターゲットプラットフォームへのデータのフルロードを実行し、必要に応じてターゲットテーブルを作成します。フルロードはタスクの開始時に自動的に実行されますが、必要に応じて手動で実行することや、定期的に実行するようにスケジュールすることもできます。
  
  情報メモこの設定は、SaaS アプリケーションプレビューコネクタを使用する場合は使用できません。[Create Connection] (接続を作成) ダイアログおよびオンラインヘルプの両方で、プレビューコネクタはボタンで表示されます。
[変更データキャプチャ (CDC)] を選択し、データに CDC またはビューをサポートしていないテーブルも含まれている場合、2 つのデータパイプラインが作成されます。CDC をサポートするすべてのテーブルを含む 1 つのパイプラインと、 [リロード] を使用する他のすべてのテーブルとビューを含む別のパイプライン。

使用するフォルダー

ファイルを書き込むバケットフォルダーに応じて、次のいずれかを選択します。
- 既定のフォルダー: 既定のフォルダー形式は <your-project-name>/<your-task-name> です。
- ルートフォルダー: ファイルはバケットに直接書き込まれます。
- フォルダー: フォルダー名を入力します。フォルダーが存在しない場合は、データレイクのランディングタスク中に作成されます。
  
  情報メモフォルダー名に特殊文字 (@、#、! など) を含めることはできません。
レプリケーションスケジューラー
- 毎回データをレプリケートする: データソースから変更をキャプチャする頻度をスケジュールし、開始時刻と開始日を設定できます。ソースデータセットが CDC (変更データキャプチャ) をサポートしている場合は、ソースデータへの変更のみがレプリケーションされ、対応するターゲットテーブルに適用されます。ソースデータセットが CDC をサポートしていない場合 (ビューなど)、すべてのソースデータを対応するターゲットテーブルに再ロードすることによって変更が適用されます。一部のソースデータセットが CDC をサポートし、一部がサポートしない場合は、2 つの個別のサブタスクが作成されます (変更データキャプチャ (CDC) 更新方法としてが選択されていると想定)。 1 つは CDC をサポートしないデータセットを再ロードするためのもので、もう 1 つは CDC をサポートするデータセットへの変更をキャプチャするためのものです。
  
  タスクのセットアップウィザードを使用すると、1 時間間隔でスケジュールを設定できます。タスクの設定が完了したら、クラウドストレージターゲットの設定 で説明されているように、さまざまなスケジュールオプションを検討できます。
クラウドストレージターゲットの設定 で説明されているように、後でタスクの設定を変更できます。
[概要] タブに、データパイプラインのビジュアルが表示されます。次のいずれかの [パイプラインの作成後] アクションを選択します。
- <名前> プロジェクトを開く (既定)
- <名前> データタスクを開く
  
  情報メモ選択したデータセットの一部が CDC をサポートしていない場合は、CDC タスク用とリロードタスク用の 2 つのパイプラインが表示されます。
次に、 [作成して実行する] (既定) をクリックするか、 [作成] をクリックしてタスクを実行せずに作成します。

[作成して実行する] をクリックすると、タスクが作成され、実行が開始されます (数分かかる場合があります)。
[作成] をクリックすると、前に選択した [パイプラインの作成後] のアクションに応じて、次のいずれかが実行されます。
- プロジェクトが開き、新しく作成されたタスクが表示されます。
- タスクは [データセット] タブで開きます。[データセット] タブには、選択したソーステーブルの構造とメタデータが表示されます。これには、明示的にリストされたすべてのテーブルと、選択ルールに一致するテーブルが含まれます。
  
  データソースからさらにテーブルを追加する場合は、 [ソースデータの選択] をクリックします。
データセットの変換を実行し、データをフィルタリングし、列を追加できます。

詳細については、「データセットの管理」を参照してください。
必要な変換を追加したら、[データセットの検証] をクリックしてデータセットを検証できます。検証に失敗した場合は、先に進む前にエラーを修正してください。

詳細は、データセットの検証と調整をご覧ください。
準備ができたら、 [準備して実行] をクリックして、データタスクを準備して実行します。

タスクの復元、およびタスクを実行するその他の方法については、「詳細な実行オプション」を参照してください。
レプリケーションタスクが開始され、 [モニター] で進行状況を確認できます。詳細については、「個々のデータタスクの監視」を参照してください。

データセットのロードの優先度の設定

各データセットにロード優先度を割り当てることで、データタスクでのデータセットのロード順を制御できます。この機能は、大きなデータセットの前に小さなデータセットをロードする場合などに便利です。

[ロードの優先度] をクリックします。
各データセットのロードの優先度を選択します。

既定のロードの優先度は [標準] です。データセットは次の優先順位でロードされます。
- 最高
- より高く
- 高
- 標準
- 低
- より低く
- 最低
同じ優先度のデータセットは順不同でロードされます。
[OK] をクリックします。

SaaS アプリケーションソースからのデータセットには、ロード順序の依存関係が含まれている可能性があります。ロードの優先順位を設定するときは、この点を考慮してください。

メタデータの更新

タスクのメタデータを更新して、タスクの [設計] ビューのソースのメタデータの変更に合わせることができます。Metadata Manager を使用する SaaS アプリケーションの場合、データタスクでメタデータを更新する前に、Metadata Manager を更新する必要があります。

この操作は、SaaS アプリケーションプレビューコネクタを使用する場合は使用できません。[Create Connection] (接続を作成) ダイアログおよびオンラインヘルプの両方で、プレビューコネクタはプレビューボタンの画像

ボタンで表示されます。

この操作は、タスクの [デザイン] ビュー内のテーブルにのみ影響します。

次のいずれかを実行できます:
- [...] をクリックし、 [メタデータを更新] をクリックして、タスク内のすべてのデータセットのメタデータを更新します。
- [データセット] 内のデータセットで [...] をクリックし、 [メタデータを更新] をクリックして、単一のデータセットのメタデータを更新します。
画面の下部にある [メタデータを更新] でメタデータの更新のステータスを確認できます。にカーソルを合わせると、メタデータが最後に更新された日時を確認できます。
変更を適用するには、データタスクを準備します。

データタスクを準備し、変更を適用すると、変更は [メタデータを更新] から削除されます。

変更をプロパゲートするには、このタスクを使用するストレージタスクを準備する必要があります。

列が削除されると、ストレージから履歴データが失われないように、Null 値を使用した変換が追加されます。

メタデータの更新に関する制限

同じ時間スロットで、それ以前に削除された列を含む名前変更は、同じデータ型とデータ長である場合、削除された列の名前変更に変換されます。

前: a b c d

後: a c1 d

この例では、b が削除され、c の名前が c1 に変更され、b と c のデータ型とデータ長は同じになります。

これは、b から c1 への名前変更と c の削除として識別されます。
最後の列が削除され、その前の列の名前が変更された場合でも、最後の列の名前変更は認識されません。

前: a b c d

後: a b c1

この例では、d が削除され、c の名前が c1 に変更されました。

これは、c と d の削除と c1 の追加として識別されます。
新しい列は最後に追加されると想定されます。途中に次の列と同じデータ型の列が追加されると、削除と名前変更として解釈される可能性があります。

データをレプリケートする際の制限と考慮事項

変換には次の制限があります。

右から左に記述する言語の列では、変換はサポートされません。
名前に特殊文字 (例: #、\、/、-) が含まれる列では変換を実行できません。
LOB/CLOB データ型でサポートされている唯一の変換は、ターゲット上の列をドロップすることです。
変換を使用して列の名前を変更し、同じ名前の新しい列を追加することはサポートされていません。

移動された列では、直接変更または変換ルールを使用して Null 可能性を変更することはサポートされていません。ただし、タスクで作成された新しい列は、既定で Null 可能です。

このページは役に立ちましたか?

このページまたはコンテンツに、タイポ、ステップの省略、技術的エラーなどの問題が見つかった場合は、お知らせください。改善に役立たせていただきます。

こちらにフィードバックをお寄せください

Qlik Talend Cloud スターター サブスクリプションを使用したデータのレプリケート

ステージングなしでデータベースやデータウェアハウスにレプリケートする

ステージングを使用してデータウェアハウスにレプリケートする

クラウド ストレージへのレプリケート

ステージングなしでデータベースやデータウェアハウスにレプリケートする

ステージングを使用してデータウェアハウスにレプリケートする

クラウド ストレージへのレプリケート

データセットのロードの優先度の設定

メタデータの更新

メタデータの更新に関する制限

データをレプリケートする際の制限と考慮事項

このページは役に立ちましたか?

Qlik Talend Cloud スターターサブスクリプションを使用したデータのレプリケート

クラウドストレージへのレプリケート

クラウドストレージへのレプリケート