クラウドストレージターゲットの設定

必要に応じて、既定のデータレイクランディング設定を変更できます。

一般

更新方法

2 種類の異なるモードでデータをランディングできます。データレイクのランディングタスクの準備が完了すると、モードの変更はできません。

変更テーブルを使用した変更データキャプチャ (CDC): データレイクのランディングタスクは、フルロード (選択されたすべてのテーブルがターゲットにロードされる) から開始されます。ターゲットデータは、CDC (変更データキャプチャ) テクノロジーを使用して最新の状態に保たれます。

情報メモDDL 操作の CDC (変更データキャプチャ) はサポートされていません。

Data Movement gateway を使用する場合、変更はソースからほぼリアルタイムでキャプチャされます。Data Movement gateway を使用せずに作業する場合、変更はスケジューラーの設定に従ってキャプチャされます。詳細は、クラウドストレージターゲットの設定をご覧ください。
リロード: 選択したソーステーブルからターゲットプラットフォームへのデータのフルロードを実行し、必要に応じてターゲットテーブルを作成します。フルロードはタスクの開始時に自動的に実行されますが、必要に応じて手動で実行することや、定期的に実行するようにスケジュールすることもできます。

使用するフォルダー

ファイルを書き込むバケットフォルダーに応じて、次のいずれかを選択します。

既定のフォルダー: 既定のフォルダー形式は <your-project-name>/<your-task-name> です。
ルートフォルダー: ファイルはバケットに直接書き込まれます。
フォルダー: フォルダー名を入力します。フォルダーが存在しない場合は、データレイクのランディングタスク中に作成されます。

情報メモフォルダー名に特殊文字 (@、#、! など) を含めることはできません。

データパーティションの変更

このオプションは、更新方法が変更データキャプチャ (CDC) の場合にのみ使用できます。

標準的なランディングタスクでは、変更は順不同でターゲットにランディングされます。データパーティションの変更により、多くのテーブルからの変更データを一貫した方法で処理できるようになります。パーティションの期間とパーティション化の基準時間を定義できるため、パーティション化されたデータの全体的な一貫性が確保されます (部分的なトランザクションがない、注文行のない注文ヘッダーがない、など)。

パーティションに関する情報は、ターゲットデータベースの attrep_cdc_partitions コントロールテーブルに記録されます。この情報は、さらに処理が必要なパーティション化されたデータを識別するために使用できます。

パーティション化のオプションは次のとおりです。

パーティション間隔 - 各パーティションの長さ (時間と分) を指定します。

情報メモ
パーティションの長さは 1 時間を超えるように指定することをお勧めします。パーティションの長さを 1 時間未満に指定すると待機時間が改善される可能性がありますが、ターゲット上に多数のパーティションを作成すると、(ターゲットの) パフォーマンスに影響を与える可能性もあります (特に大量の変更を伴うシステムの場合)。

最後のパーティションが作成された時刻より前からタスクを再開すると、データレイクのランディングタスクは、すでに閉じられたパーティションに書き込みます。
パーティション基準時間 - パーティションは 24 時間の期間内に作成されます。これは、ソースデータベースで指定された UTC 時間の「パーティション基準時間」に従って計算されます。たとえば、パーティション間隔が 8 時間、「パーティション基準時間」時刻が 02:00 の場合、02:00-10:00、10:00-18:00、18:00-02:00 のパーティションが作成されます。ただし、必ずしもこの順序である必要はありません。たとえば、タスクが 01:00 に開始された場合、最初のパーティションのタイムフレームは 18:00-02:00 になります。さらに、タスクがパーティションの途中 (04:00 など) で開始された場合、04:00 より前に変更がキャプチャされなかったとしても、その変更データは 02:00-10:00 のパーティションに挿入されます。

データのアップロード

ファイル属性

形式

ターゲットファイルを CSV、JSON、または Parquet 形式で作成することを選択できます。

Parquet ファイル形式を使用する場合、1 MB を超える LOB 列はサポートされません

JSON ファイルでは、各レコードは次の例のように 1 行で表示されます。

{ "book_id": 123, "title": "Alice in Wonderland", "price": 6.99, "is_hardcover": false }

{ "book_id": 456, "title": "Winnie the Pooh", "price": 6.49, "is_hardcover": true }

{ "book_id": 789, "title": "The Cat in the Hat", "price": 7.23, "is_hardcover": true }

参照先: Content-Type と Content-Encoding のプロパティ

タスクが停止状態にあるときに形式を変更 (例: CSV から JSON へ、または JSON から CSV へ) してからタスクを再開することはサポートされていません。

JSON または Parquet 形式を選択した場合、次の項目は CSV 形式にのみ関連するため非表示になります: フィールド区切り文字、レコード区切り文字、Null 値、引用文字、引用エスケープ文字、メタデータヘッダーの追加。
次の項目は、Parquet 形式にのみ関連します: Parquet バージョン、Parquet 日付と時刻単位、および Parquet 最大 LOB サイズ (KB)。

Parquet 形式を使用する場合のデータ型マッピングと制限については、「Mapping from Qlik Cloud data types to Parquet 」を参照してください

項目区切り記号

ターゲットファイル内の項目 (列) を区切るために使用される区切り記号。既定はカンマです。

区切り記号としてカンマを使用する例:

"mike","male"

区切り記号には、標準文字または 16 進数値を使用できます。「0x」というプレフィックスは、16 進数の区切り記号 (例: 0x01 = SOH) を示すために使用する必要があります。[項目区切り記号]、 [レコード区切り記号]、 [Null 値] 項目では、区切り記号は連結された 16 進数値 (例: 0x0102 = SOHSTX) で構成できますが、 [引用符] および [エスケープ文字を引用符で囲む] 項目では、単一の 16 進数値のみを使用できます。

16 進数 0x00 はサポートされていません (0x01-0xFF のみがサポートされます)。

Null 値

ターゲットファイル内で Null 値を示すために使用される文字列。

例 (\n はレコード区切り記号、@ は Null 値):

"mike","male",295678\n

"sara","female",@\n

レコード区切り記号

ターゲットファイル内のレコード (行) を区切るために使用される区切り記号。既定は改行 (\n) です。

例:

"mike","male"\n

"sara","female"\n

引用符

テキスト列の最初と最後に使用される文字。既定は二重引用符 (") です。列区切り記号を含む列が二重引用符で囲まれている場合、列区切り記号は列区切り記号としてではなく、実際のデータとして解釈されます。

例 (@ は引用符):

@mike@,@male@

エスケープ文字を引用符で囲む

実際のデータで引用符をエスケープするために使用される文字。既定は二重引用符 (") です。

例 (" は引用符、\ はエスケープ文字):

1955,"old, \"rare\", Chevrolet","$1000"

Parquet バージョン

ターゲットプラットフォームがサポートするバージョンに応じて、使用するバージョンを選択します。Parquet バージョン 1.0 は MICRO タイムスタンプユニットのみをサポートしますが、Parquet バージョン 2.6 は MICRO タイムスタンプユニットと NANO タイムスタンプユニットの両方をサポートします。

Parquet タイムスタンプユニット

Parquet バージョンが 2.6 に設定されている場合は、MICRO または NANO を選択します。Parquet バージョンが 1.0 に設定されている場合は、MICRO のみがサポートされます。

Parquet 最大 LOB サイズ (KB)

既定の最大 LOB サイズは 64 KB で、この項目に入力できる最大値は 10,000 KB です。LOB 列の処理にはより多くのリソースが必要となり、パフォーマンスに影響を与えます。64 KB を超える LOB データをレプリケートしており、すべての LOB データをターゲットにレプリケートする必要がある場合にのみ、この値を増やします。

最大ファイルサイズ

ファイルが閉じる (および必要に応じて圧縮される) 前に到達できる最大サイズ。

ファイルが閉じる前に到達できる最大サイズ。並列実行オプションと併用すると、小さいファイルの方がアップロードが速くなり (ネットワークに応じて異なる)、パフォーマンスが向上する可能性があります。ただし、小さなファイルでデータベースを乱雑にすることは一般的に悪い習慣であると考えられています。

次を使用してファイルを圧縮:

圧縮オプションの 1 つを選択してターゲットファイルを圧縮するか、圧縮しない場合は [NONE] (既定) を選択します。使用できる圧縮オプションは、選択したファイル形式に応じて決定されます。

メタデータヘッダーを追加

必要に応じて、データファイルにヘッダー行を追加できます。ヘッダー行には、ソース列名および/または中間 (例:Qlik Talend Data Integration) データタイプを含めることができます。

[列名あり] と [データタイプあり] の両方が選択されている場合の、ヘッダー行のあるターゲットファイルの例:

Position:DECIMAL(38,0),Color:VARCHAR(10)

1,"BLUE"

2,"BROWN"

3,"RED"

...

変更処理

このセクションでは、変更処理の条件設定について説明します。

変更の適用/保存のタイミング

ファイルサイズが到達: ファイルをターゲットにアップロードする前に蓄積する変更データの最大サイズを指定します。
経過時間が到達: 経過時間が x に達しました。

メタデータファイル

[ターゲットフォルダにメタデータファイルを作成] オプションが選択されている場合、各データファイルに対応する拡張子 .dfm のメタデータファイルが、指定したターゲットフォルダの下に作成されます。メタデータファイルは、ソースコネクタタイプ、ソーステーブル名、データファイル内のレコード数など、タスク/データに関する追加情報を提供します。

メタデータファイルの詳細な説明と使用方法については、「メタデータファイルの説明 」を参照してください

メタデータ

LOB 列

この設定は、SaaS アプリケーションプレビューコネクタを使用する場合は使用できません。[接続を作成] ダイアログおよびオンラインヘルプの両方で、Preview コネクタはプレビューボタンの画像

ボタンで表示されます。

LOB 列を含めて列サイズを次に制限 (KB)

タスクに LOB 列を含めることを選択でき、さらに最大 LOB サイズを設定できます。最大サイズより大きい LOB は切り捨てられます。

JSON 列のマッピング

互換性のあるソース JSON 列とターゲット JSON 列のマッピング

Data Movement gateway を使用してデータソースにアクセスする場合、バージョン 2024.11.70 以降が必要です。
SaaS アプリケーションのプレビューコネクタでのみサポートされます。

このオプションを選択すると、ソース上の JSON カラムはターゲット上の JSON カラムに自動的にマッピングされます。

このオプションの状態や見え方は、以下の要因によって決まります。

新規タスク: このオプションは、ソースとターゲットの両方が JSON データ型をサポートしている場合、デフォルトで有効になります。
既存のタスク: このオプションは、ソースとターゲットの両方が JSON データ型をサポートしている場合でも、デフォルトで無効になります。これは、ターゲットデータが STRING 形式であることを期待する (レガシー動作) 変換などの下流プロセスとの後方互換性を維持するためです。このオプションを無効のままにすることも、下流のプロセスを編集して JSON 形式と互換性を持たせてからこのオプションを有効にすることもできます。
新規および既存のタスク: ソースのみが JSON データ型をサポートしている場合、このオプションは表示されません。後の段階でターゲットに JSON サポートが追加された場合、このオプションは表示されるようになりますが、無効のままになります。これは、ターゲットデータが STRING 形式であることを期待する (レガシー動作) 変換などの下流プロセスとの後方互換性を維持するためです。

コントロールテーブル

ターゲットプラットフォームに作成するコントロールテーブルを次の中から選択します。

レプリケーションステータス: タスクのステータス、タスクによって消費されるメモリ量、データプラットフォームにまだ適用されていない変更の数、現在データが読み取られているデータソース内の位置など、現在のランディングタスクに関する詳細を提供します。
一時停止のテーブル: 一時停止されたテーブルのリストと、それらが一時停止された理由を提供します。
レプリケーション履歴: ランディングタスク中に処理されたレコードの数と量、CDC タスク終了時の待機時間などを含む、タスク履歴に関する情報を提供します。
データパーティションを変更:データパーティションの変更 によりターゲットデータベースに作成されたパーティションのレコードを提供します。この情報を使用して、さらに処理が必要なパーティションデータを特定できます。

各コントロールテーブルの詳細については、「コントロールテーブル」を参照してください

フルロード

これらの設定は、SaaS アプリケーションプレビューコネクタで定義されたタスクでは使用できません。[Create Connection] (接続を作成) ダイアログおよびオンラインヘルプの両方で、プレビューコネクタはプレビューボタンの画像

ボタンで表示されます。

パフォーマンスのチューニング

並行してロードするテーブルの最大数: ターゲットに一度にロードする、テーブルの最大数を入力します。既定値は 5 です。
トランザクション整合性タイムアウト (秒): フルロード操作を開始する前に、開いているトランザクションが閉じるまで待機する秒数を入力します。既定値は 600 (10 分) です。オープンになっているトランザクションがある場合でも、タイムアウト値に達するとフルロードが開始されます。

情報メモフルロードの開始時にオープンしていたが、タイムアウト値に達した後にのみコミットされたトランザクションをレプリケートするには、ターゲットテーブルをリロードする必要があります。
フルロード時のコミットレート:一緒に転送できるイベントの最大数。既定値は 10000 です。

フルロードの完了後

主キーまたは一意を作成: フルロードが完了するまで、データプラットフォームの主キーまたは一意のインデックスの作成を遅らせる場合は、このオプションを選択します。

初期ロード用

SaaS アプリケーションソースからデータを移動する場合、初期フルロードを実行する方法を設定できます。

Data Movement gateway を使用してデータソースにアクセスする場合、これらの設定にはバージョン 2022.11.74 以降が必要です。

キャッシュされたデータを使用

このオプションを使用すると、 [フルデータスキャン] を選択してメタデータを生成するときに読み込まれたキャッシュデータを使用できます。

データはすでにソースから読み込まれているため、API の使用とクォータに関するオーバーヘッドが軽減されます。最初のデータスキャン以降の変更は、変更データキャプチャ (CDC) によって取得できます。

ソースからデータをロード

このオプションは、データソースから新しいロードを実行します。このオプションは次の場合に有効です。

メタデータのスキャンが最近実行されていない。
ソースデータセットが小さく頻繁に変更されるため、変更履歴をすべて管理したくない。

変更の保存を処理

変更テーブルのヘッダー列には、操作のタイプ (例: INSERT) やコミット時間など、変更処理操作に関する情報が表示されます。この情報が必要ない場合は、ヘッダー列の一部またはすべてを含まない変更テーブルを作成するようにデータタスクを構成して、ターゲットデータベースでのフットプリントを削減できます。これを実行するには、除外するヘッダー列のチェックボックスをオフにします。

タスクの実行中は、追加の列の削除や、列の復元はできないことに注意してください。最初の選択を変更するには、まずタスクを停止し、次に選択を変更し、最後にターゲットテーブルをリロードする必要があります。

データパーティションの変更 が有効になっている場合、「partition_name」という名前の追加のヘッダー列が変更テーブルに追加され、UI で自動的に選択されます。この列は必須であり、除外することはできません。

ヘッダー列の説明については、「変更テーブルの使用」を参照してください。

エラー処理

データエラー

データエラー処理は、更新方法が変更データキャプチャ (CDC) の場合にのみサポートされます。

データ切り捨てエラー

データ切り捨てエラーの場合: 1 つ以上の特定のレコードで切り捨てが発生した場合に実行する処理を選択します。リストから次のいずれかを選択できます。

無視: タスクは続行され、エラーは無視されます。
テーブルを一時停止: タスクは続行されますが、エラーレコードのあるテーブルのデータはエラー状態に移行し、そのデータはレプリケートされません
タスクを停止: タスクは停止され、手動による操作が必要となります。

その他のデータエラー

その他のデータエラーの場合: 1 つ以上の特定のレコードでエラーが発生した場合に実行する処理を選択します。リストから次のいずれかを選択できます。

無視: タスクは続行され、エラーは無視されます。
テーブルを一時停止: タスクは続行されますが、エラーレコードのあるテーブルのデータはエラー状態に移行し、そのデータはレプリケートされません
タスクを停止: タスクは停止され、手動による操作が必要となります。

データエラー処理のエスカレーション

その他のデータエラーが発生した場合にエラー処理をエスカレートします (テーブルごと): このチェックボックスをオンにすると、非切り捨てデータエラーの数 (テーブルごと) が指定された量に達したときにエラー処理がエスカレートされます。有効な値は 1 ～ 10,000 です。

エスカレーションアクション: エラー処理がエスカレートされたときに実行される処理を選択します。使用できるアクションは、上記の [その他のデータエラーの場合] ドロップダウンリストから選択したアクションに応じて異なります。

テーブルを一時停止 (既定): タスクは続行されますが、エラーレコードのあるテーブルのデータはエラー状態に移行し、そのデータは landed されません。
タスクを停止: タスクは停止され、手動による操作が必要となります。

テーブルエラー

テーブルエラーを返す前の再試行回数

このオプションを使用すると、テーブルエラー処理ポリシーがトリガーされるタイミングを制御できます。既定では、テーブルエラーが発生すると、3 回の再試行後にテーブルが一時停止されるか、タスクが停止されます (選択したアクションに応じて)。SaaS アプリケーションの計画メンテナンスにより、テーブルエラーが発生する場合があります。このような場合、テーブルエラー処理ポリシーがトリガーされる前にメンテナンスを完了するには、既定の再試行回数では不十分な可能性があります。タスクが実行されるたびに再試行が実行されるため、これはタスクのスケジュール間隔にも依存します。たとえば、タスクを 1 時間ごとに実行するようにスケジュールし、タスクの実行開始と同時に SaaS アプリケーションがメンテナンスのためにオフラインになった場合、既定の 3 回の再試行により、テーブルエラー処理ポリシーがトリガーされることなく、SaaS アプリケーションを最大 3 時間オフラインにすることができます。メンテナンス期間が長くなると、テーブルエラー処理ポリシーがトリガーされないように、再試行回数を増やす (またはスケジュールを変更する) 必要があります。

まとめると、SaaS アプリケーションが定期的にメンテナンスされることがわかっている場合、テーブルエラー処理ポリシーがトリガーされることなくメンテナンスを完了できるように、スケジュールに従って再試行回数を増やすことがベストプラクティスとなります。

このオプションは、Lite または Standard SaaS アプリケーションコネクタで構成されたタスクにのみ表示されます。
Data Movement gateway を使用している場合は、バージョン 2024.11.70 以降が必要です。

テーブルエラーが発生した場合: ドロップダウンリストから次のいずれかを選択します。

テーブルを一時停止 (既定): タスクは続行されますが、エラーレコードのあるテーブルのデータはエラー状態に移行し、そのデータはレプリケートされません。
タスクを停止: タスクは停止され、手動による操作が必要となります。

テーブルエラーが次の値に達した場合に処理をエスカレート (テーブルごと): このチェックボックスをオンにすると、テーブルエラーの数 (テーブルごと) が指定された量に達した場合にエラー処理をエスカレートします。有効な値は 1 ～ 10,000 です。

エスカレーションアクション: テーブルエラーのエスカレーションポリシーは [タスクを停止] に設定されており、変更できません。

環境

最大再試行数: このオプションを選択すると、復元可能な環境エラーが発生した場合にタスクを再試行する最大回数を指定できます。タスクが指定された回数再試行されると、タスクは停止され、手動による操作が必要となります。

タスクを再試行しない場合は、チェックボックスをオフにするか、「0」を指定します。

タスクを無限に再試行するには、「-1」を指定します。
- 再試行の間隔 (秒): カウンターを使用して、システムがタスクを再試行するまでに待機する秒数を選択または入力します。
  
  有効な値は 0 ～ 2,000 です。
長時間の停止の場合は再試行間隔を長くする: 長時間停止した場合の再試行間隔を長くするには、このチェックボックスをオンにします。このオプションを有効にすると、最大再試行間隔に達するまで、各再試行と次の再試行の間隔が 2 倍になります (指定された最大間隔に従って再試行を継続します)。
- 最大再試行間隔 (秒): [長時間の停止の場合は再試行間隔を長くする] オプションが有効になっている場合、カウンターを使用して、タスクの再試行間隔を待機する秒数を選択または入力します。有効な値は 0 ～ 2,000 です。

変更処理のチューニング

このタブは、更新方法が変更データキャプチャ (CDC) の場合にのみ使用できます。

トランザクションオフロードのチューニング

次の場合に進行中のトランザクションをディスクにオフロード:

トランザクションデータは通常、ソースまたはターゲットに完全にコミットされるまでメモリ内に保持されます。ただし、割り当てられたメモリより大きいトランザクション、または指定された制限時間内にコミットされないトランザクションは、ディスクにオフロードされます。
- 全トランザクションの総メモリサイズが超過 (MB): すべてのトランザクションがディスクにオフロードされる前に、メモリで占有できる最大サイズ。規定値は 1024 です。
- トランザクション期間が次を超えています (秒): 各トランザクションがディスクにオフロードされるまでに、メモリに留まることができる最大時間。期間は、Qlik Talend Data Integration がトランザクションのキャプチャを開始した時間から計算されます。規定値は 60 です。

バッチチューニング

トランザクションごとの最小変更数: 各トランザクションに含める変更の最小数。既定値は 1000 です。

情報メモ
変更の数がトランザクションごとの最小変更数の値以上の場合、または以下で説明する適用前にトランザクションをバッチ処理する最大時間 (秒) の値に達した場合の、いずれかの先に発生したほうのタイミングでターゲットに変更を適用します。ターゲットに適用される変更の頻度はこれら 2 つのパラメーターによって制御されるため、ソースレコードへの変更がターゲットレコードにすぐに反映されない場合があります。
適用前にトランザクションをバッチ処理する最大時間 (秒): タイムアウトを宣言するまでにトランザクションをバッチで収集する最大時間。既定値は 1 です。

Interval (インターバル)

SAP ODP および SaaS アプリケーション (Lite) コネクタを使用する場合の設定

次の頻度で変更を読み込む (分)

ソースからの変更の読み取り間隔 (分単位)。有効な範囲は 1 ～ 1440 です。
情報メモ
このオプションは、データタスクが次のように定義されている場合にのみ使用できます。
- Data Movement gateway
- 次のいずれかのソース。
  - SaaS アプリケーション (Lite コネクタ経由のみ)
  - SAP ODP
- 変更データキャプチャ (CDC) の更新方法

SAP OData コネクタを使用する場合の設定

変更をチェック

デルタ抽出間隔に従う: このオプションを選択すると、データタスクは [デルタ抽出間隔] に従って変更をチェックします。

情報メモ間隔は各「ラウンド」の後に開始されます。ラウンドは、データタスクがソーステーブルから変更を読み取り、それをターゲットに送信 (単一のトランザクションとして) するのにかかる時間として定義できます。ラウンドの長さはテーブルの数や変更に応じて異なります。したがって、間隔を 10 分に指定し、ラウンドに 4 分かかる場合、変更をチェックする実際の時間は 14 分になります。
- デルタ抽出間隔: システムからデルタが抽出される頻度。既定は 60 秒ごとになっています。
スケジュールどおり: このオプションを選択すると、データタスクはデルタを 1 回抽出して停止します。その後はスケジュールどおりに実行が継続されます。

情報メモこのオプションは、CDC サイクル間の間隔が 24 時間以上の場合にのみ関連します。

スケジュールに関する情報:
- レプリケーションプロジェクトの「データレイクにデータをランディングする」タスクについては、「レイクランディングタスクの CDC のスケジュール設定」を参照してください

その他のチューニング

ステートメントのキャッシュサイズ (ステートメントの数): 後で実行するためにサーバーに保存する準備済みステートメントの最大数 (ターゲットに変更を適用する場合)。既定値は 50 です。最大値は 200 です。
プライマリキー列を更新する際の DELETE と INSERT: このオプションを使用するには、ソースデータベースで完全なサプリメンタルロギングをオンにする必要があります。

情報メモこの設定は、SaaS アプリケーションプレビューコネクタを使用する場合は使用できません。[接続を作成] ダイアログおよびオンラインヘルプの両方で、Preview コネクタはボタンで表示されます。

スキーマの進化

スキーマ内の次のタイプの DDL 変更を処理する方法を選択します。スキーマの進化の設定を変更した場合は、再度タスクを準備する必要があります。次の表には、サポートされている DDL 変更に対して使用できるアクションが示されています。

タスクが SaaS アプリケーション Preview コネクタで構成されている場合、列のデータ型を変更 DDL 変更のみがサポートされます。コネクタがプレビュー中かどうかを確認するには、コネクタのヘルプを参照してください。

DDL の変更	ターゲットに適用	無視	テーブルを一時停止	タスクを停止
列を追加	あり	あり	あり	あり
列名を変更	なし	なし	あり	あり
テーブルの名前を変更	なし	なし	あり	あり
列のデータ型を変更	なし	あり	あり	あり
テーブルを作成 [選択ルール] を使用してパターンに一致するデータセットを追加した場合、パターンを満たす新しいテーブルが検出され、追加されます。	あり	あり	なし	なし

文字置換

ターゲットデータベース内のソース文字の置換または削除、および/または選択した文字セットでサポートされていないソース文字の置換または削除ができます。

文字はすべて Unicode コードポイントとして指定する必要があります。
文字置換は、コントロールテーブルでも実行されます。

無効な値は、テーブルのセルの右上に赤い三角形で示されます。三角形の上にマウスカーソルを置くと、エラーメッセージが表示されます。

タスクに定義されたテーブルレベルまたはグローバル変換は、文字の置換が完了した後に実行されます。
[ソース文字の置換または削除] テーブルで定義された置換アクションは、 [選択した文字セットでサポートされていないソース文字の置換または削除] テーブルで定義された置換アクションの前に実行されます。
文字置換は LOB データ型をサポートしません。

ソース文字の置換または削除

[ソース文字の置換または削除] テーブルを使用して、特定のソース文字の置換を定義します。これは、文字の Unicode 表現がソースプラットフォームとターゲットプラットフォームで異なる場合などに便利です。たとえば、Linux では、Shift_JIS 文字セットのマイナス文字は U+2212 と表されますが、Windows では U+FF0D と表されます。

置換アクション
内容	実行すること
置換アクションを定義する。	テーブルの上にある [文字を追加] ボタンをクリックします。 [ソース文字] および [置換文字] の項目にそれぞれソース文字とターゲット文字を指定します。たとえば、文字「a」を文字「e」に置き換えるには、 0061 と 0065 をそれぞれ指定します。情報メモ指定したソース文字を削除するには、 [置換文字] 列に「0」と入力します。追加の文字を置換または削除するには、手順 1 ～ 2 を繰り返します。
指定されたソースまたはターゲットの文字を編集する	行の最後にあるをクリックして、 [編集] を選択します。
テーブルからエントリを削除する	行の最後にあるをクリックして、 [削除] を選択します。

選択した文字セットでサポートされていないソース文字の置換または削除

[文字セットでサポートされていないソース文字] テーブルを使用して、選択した文字セットでサポートされていないすべての文字に対して 1 つの置換文字を定義します。

サポートされていない文字の置換アクション
内容	実行すること
置換アクションを定義または編集する。	テーブルの [文字セット] ドロップダウンリストから文字セットを選択します。選択した文字セットでサポートされていない文字は、ターゲット上で以下の手順 2 で指定する文字に置き換えられます。 [置換文字] 列で、列内の任意の場所をクリックし、置換文字を指定します。たとえば、サポートされていない文字をすべて「a」に置き換えるには、「0061」と入力します。情報メモサポートされていない文字をすべて削除するには、「0」と入力します。
置換アクションを無効にする。	[文字セット] ドロップダウンリストから空のエントリを選択します。

データセットセグメントの並列ロード

この設定は SaaS アプリケーションソースでは使用できず、ソースデータベースとターゲットデータベースの特定のサブセットでのみ使用できます。

フルロード中は、データセットをセグメントに分割して並列でロードすることで、大規模なデータセットのロードを高速化できます。テーブルは、データ範囲、すべてのパーティション、すべてのサブパーティション、または特定のパーティションごとに分割できます。

詳細については、「並列のレプリケートデータセットセグメント」を参照してください。

詳細オプション

これらのオプションは特定のバージョンまたは環境にのみ関連するため、UI では公開されていません。したがって、Qlik サポートまたは製品ドキュメントにより明示的に指示されない限り、これらのオプションを設定しないでください。

オプションを設定するには、オプションを [機能名の追加] 項目にコピーし、 [追加] をクリックします。次に、受け取った指示に従って値を設定するか、オプションを有効にします。

レイクランディングタスクの CDC のスケジュール設定

次のユースケースでは、ターゲットデータを最新の状態に保つためにスケジュール間隔を定義する必要があります。

Data Movement gateway を使用せずにデータソースにアクセスする
SaaS アプリケーション Preview コネクタを使用します。コネクタがプレビュー中かどうかを確認するには、コネクタのヘルプを参照してください。
SAP ODataソースから変更をキャプチャする際に、スケジュール済みオプションを使用する場合。

スケジュールにより、ソースデータセットの変更に応じてターゲットデータセットを更新する頻度が決定されます。更新頻度はスケジュールによって決定されますが、更新方法はデータセットの種類によって決まります。ソースデータセットが CDC (変更データキャプチャ) をサポートしている場合は、ソースデータへの変更のみがレプリケーションされ、対応するターゲットテーブルに適用されます。ソースデータセットが CDC をサポートしていない場合 (ビューなど)、すべてのソースデータを対応するターゲットテーブルに再ロードすることによって変更が適用されます。一部のソースデータセットが CDC をサポートし、一部がサポートしない場合は、2 つの個別のサブタスクが作成されます (変更データキャプチャ (CDC) 更新方法としてが選択されていると想定)。 1 つは CDC をサポートしないデータセットを再ロードするためのもので、もう 1 つは CDC をサポートするデータセットへの変更をキャプチャするためのものです。この場合、データの一貫性を確保するために、両方のタスクに対して同じスケジュール間隔を維持しないことを強くお勧めします (将来、更新頻度を変更する場合)。

スケジュールを変更するには:

データプロジェクトを開き、次のいずれかを実行します。
- タスクビューで、データタスクの [] をクリックし、 [スケジュール] を選択します。
- パイプラインビューで、データタスクの [] をクリックし、 [スケジュール] を選択します。
- レプリケーションタスクを開き、 [スケジュール] ツールバーボタンをクリックします。
必要に応じてスケジュール設定を変更し、 [OK] をクリックします。

次のスケジュール実行の開始予定時にデータタスクが実行中の場合、タスクが完了するまで次のスケジュール実行はスキップされます。

Data Movement gateway に基づいて実行されなかったタスクを実行する

ネットワークの問題により、Data Movement gateway への接続が失われる場合があります。次回のスケジュールされた実行の前に Data Movement gateway への接続が復元されない場合、データタスクはスケジュールどおりに実行できません。このような場合、接続が復元された直後に実行するかどうかを選択できます。

すべての Data Movement gateway のデフォルト設定は、管理アクティビティセンターで定義されています。以下の説明に従って、個々のタスクに対してこれらの設定を上書きできます。

これを行うには

プロジェクトを開き、次のいずれかを実行します。
- タスクビューで、データタスクの [] をクリックし、 [スケジュール] を選択します。
- パイプラインビューで、データタスクの [] をクリックし、 [スケジュール] を選択します。
- データタスクを開き、 [スケジュール] ツールバーボタンをクリックします。
[スケジュール - <タスク>] ダイアログが開きます。
[このタスクにカスタム設定を使用] をオンにします。
ダイアログの下部で、次のいずれかの [未実行のスケジュール済みタスクを実行] オプションを選択します。
- 可能な限り早く、その後はスケジュールどおりに: 次のスケジュールされたインスタンスの前にタスクを実行することが重要である場合
- スケジュールどおり: 次のスケジュールされたインスタンスでタスクを実行
設定を保存します。

参照先:実行されなかったスケジュールのタスクの実行。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。

こちらにフィードバックをお寄せください

クラウド ストレージ ターゲットの設定

一般