tSchemaComplianceCheckの標準プロパティ
これらのプロパティは、標準ジョブのフレームワークで実行されているtSchemaComplianceCheckを設定するために使われます。
標準のtSchemaComplianceCheckコンポーネントは、データクオリティファミリーに属しています。
このフレームワーク内のコンポーネントは、すべてのTalend製品で使用できます。
基本設定
[Base Schema] (基本スキーマ)および[Edit schema] (スキーマを編集) |
スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。 現状で処理されるデータのストラクチャーと性質について説明します。 [Built-in] (組み込み): そのコンポーネントに対してのみスキーマを作成し、ローカルに保管します。 [Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保管されています。さまざまなプロジェクトやジョブデザインで再利用できます。 |
[Check all columns from schema] (すべてのカラムをスキーマに対してチェック) |
このオプションを選択すると、基本スキーマに対してすべてのカラムのチェックが実行されます。 |
[Custom defined] (カスタム定義) |
このオプションを選択すると、特定のカラムに対して特定のチェックが実行されます。このオプションを選択すると、[Checked Columns] (確認対象カラム)テーブルが表示されます。 |
[Checked Columns] (確認対象カラム) |
このテーブルでは、どのカラムについてどのようなチェックを実行するかを定義します。このテーブルは[Custom defined] (カスタム定義)オプションを選択すると表示されます。 |
|
[Column] (カラム): カラム名を表示します。 |
|
[Type] (タイプ): 各カラムに含めるデータのタイプを選択します。この検証はすべてのカラムに必須です。 |
[Date pattern] (日付パターン): 各カラムに対して期待される日付フォーマットをDateのデータ型で定義します。 |
|
[Nullable] (Null可能): 個々のカラムでこのチェックボックスをオンにすると、そのカラムはNULL可能として定義されます。つまり、このカラムの空の行を基本スキーマ定義に関係なく出力フローに移動できるようにします。すべてのカラムをNULL可能として定義するには、テーブルヘッダーのチェックボックスをオンにします。 |
|
|
[Max length] (最大長): 個々のカラムでこのチェックボックスをオンにすると、カラムのデータ長を基本スキーマの長さ定義と照合できます。この検証をすべてのカラムに対して実行するには、テーブルヘッダーのチェックボックスをオンにします。 |
コンプライアンスチェックに他のスキーマを使用 |
準拠していないデータを拒否するために、期待どおりのデータとなるように参照スキーマを定義します。 データ型、NULL値、または長さに制限がある場合があります。 |
[Trim the excess content of column when length checking chosen and the length is greater than defined length] (長さチェックが選択され、定義された長さを超える場合はカラムの余分なコンテンツを切り捨て) |
tSchemaComplianceCheckの3つのモードのいずれかで、このチェックボックスをオンにすると、指定した長さを超えるデータは拒否されずに切り捨てられます。 情報メモ注:
このオプションは、String型のデータにのみ適用可能です。 |
詳細設定
[Use Fastest Date Check] (最速日付チェックを使用) |
日付パターンが定義されていない場合に Talend DateシステムルーチンのTalendDate.isDate()メソッドを使用して高速日付形式チェックを実行するには、このチェックボックスをオンにします。ルーチンの詳細は、ルーチンとはをご覧ください。 |
[Use Strict Data Check] (厳格日付チェックを使用) |
このチェックボックスをオンにして、厳密なデータ形式チェックを実行します。 選択すると、[Use Fastest Date Check] (最速日付チェックを使用)チェックボックスは非表示になります。 |
[Ignore TimeZone when Check Date] (日付チェック時にタイムゾーンを無視) |
日付チェック時にタイムゾーン設定を無視するには、このチェックボックスをオンにします。 [Check all columns from schema] (すべてのカラムをスキーマに対してチェック)モードが選択されている場合は利用できません。 |
[Treat all empty string as NULL] (空の文字列をすべてNULLと見なす) |
このチェックボックスをオンにすると、すべてのカラムの空のフィールドが空の文字列ではなくNULL値として扱われます。 デフォルトでは、このチェックボックスはオンです。このチェックボックスをオフにすると、[Choose Column(s)] (カラムの選択)テーブルが表示され、個々のカラムを選択できるようになります。 |
[Check string by byte length] (バイト長で文字列をチェック) |
このチェックボックスをオンにすると、[Charset] (文字セット)テキストボックスで設定された文字セットに従ってバイト長の文字列カラムをチェックします。 デフォルトではこのチェックボックスは選択されておらず、文字長のみがチェックされています。 |
[tStatCatcher Statistics] (tStatCatcher統計) |
このチェックボックスを選択すると、コンポーネントレベルでログデータを収集できます。 |
グローバル変数
グローバル変数 |
ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、[Die on error] (エラー発生時に強制終了)がオフになっている場合のみ機能します。 Flow変数はのコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。 フィールドまたは式に変数を入力する場合は、Ctrl + スペースを押して変数リストにアクセスし、使用する変数を選択します。 変数の詳細は、コンテキストと変数を使用をご覧ください。 |
使用方法
使用ルール |
このコンポーネントは、フロー内の中間ステップであり、準拠していないデータをメインフローから除外できます。このコンポーネントは、入力フローを必要とするため、開始コンポーネントにはできません。また、検証済みフローを収集するための1つ以上の出力コンポーネントに加え、拒否リンクを使用して拒否されたデータ用の2番目の出力コンポーネントも必要になります。詳細は、リジェクトをご覧ください。 |