tFileInputDelimitedの標準プロパティ
これらのプロパティは、標準ジョブのフレームワークで実行されているtFileInputDelimitedを設定するために使われます。
標準のtFileInputDelimitedコンポーネントは、ファイルファミリーに属しています。
このフレームワーク内のコンポーネントは、すべてのTalend製品で使用できます。
基本設定
[Property type] (プロパティタイプ) |
[Built-in] (組み込み)と[Repository] (リポジトリー)のいずれかです。 |
|
[Built-In] (組み込み): 一元的に保存されるプロパティデータはありません。 |
|
[Repository] (リポジトリー): プロパティが保存されているリポジトリーファイルを選択します。 |
[Use existing dynamic] (既存のダイナミックを使用) |
tSetDynamicSchemaコンポーネントで既存のダイナミックスキーマセットを使用する場合は、このチェックボックスを選択します。 |
[File Name/Stream] (ファイル名/ストリーム) |
[File Name] (ファイル名): 処理されるファイルの名前とパス [Stream] (ストリーミング): 処理されるデータフロー。対応する代表変数によりtFileInputDelimitedでデータを取得するには、データをフローに追加する必要があります。 この変数は、既にTalend Studioで事前に定義されているか、このコンポーネントと共に使用されているコンテキストやコンポーネントによって提供されている可能性があります。それ以外の場合は、手動で変数を定義し、ジョブのデザインに応じて(たとえばtJavaまたはtJavaFlexを使って)使用できます。 手入力の手間を省くため、変数が適切に定義されることを確認する必要があるものの、予測変換リスト([Ctrl] + [Space])から目的の変数を選択して、現在のフィールドに入力できます。 情報メモ警告: エラーを避けるために、このフィールドには(相対パスの代わりに)絶対パスを使用します。
|
[Row separator] (行区切り) |
行の終端を識別するために使用される区切り。 |
[Field separator] (フィールド区切り) |
転送されたデータのフィールドを区切る場合は、文字、文字列、正規表現のいずれかを入力します。 情報メモ注: [CSV options] (CSVオプション)が選択されていると、フィールド区切りは1文字のみとなります。この場合、このフィールドに複数の文字を入力しても、フィールド区切りとして機能するのは最初の文字だけです。
|
[CSV options] (CSVオプション) |
このチェックボックスを選択すると、次のCSVパラメーターを指定できます:
標準エスケープ文字("\")を使用することをお勧めします。これを使用しない場合は、[Escape char] (エスケープ文字)と[Text enclosure] (テキストエンクロージャー)に同じ文字を設定する必要があります。たとえば、エスケープ文字が"\"に設定されている場合、テキストエンクロージャーはその他の任意の1文字に設定できます。他方、エスケープ文字が"\"以外の文字に設定されている場合、テキストエンクロージャーはその他の任意の複数の文字に設定できます。ただし、エスケープ文字はテキストエンクロージャーと同じ文字に変更されます。たとえば、エスケープ文字が"#"に設定され、テキストエンクロージャーが"@"に設定されている場合、エスケープ文字は"#"ではなく"@"に変更されます。 |
[Header] (ヘッダー) |
ファイルの先頭でスキップする行の数を入力します。 ダイナミックスキーマを使用する場合、ヘッダーフィールド値が設定されているかどうかに関係なく、入力データの最初の行が常にヘッダー行として扱われることにご注意ください。ダイナミックスキーマの詳細は、ダイナミックスキーマをご覧ください。 |
[Footer] (フッター) |
ファイルの最後にスキップする行数。 |
[Limit] (制限事項) |
処理される行の最大数。[Limit] (制限) = 0の場合、行の読み取りや処理は行われません。 |
[Schema] (スキーマ)と[Edit Schema] (スキーマを編集) |
スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。 スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。現在のスキーマがリポジトリータイプの場合は、3つのオプションを利用できます。
null不可能なプリミティブフィールドの入力値がnullの場合、そのフィールドを含むデータ行は拒否されることにご注意ください。 このコンポーネントは、ダイナミックスキーマ機能の利点を備えているので、ソースファイルから不明なカラムを取得したり、各カラムを個別にマッピングしなくてもソースからカラムを一括してコピーしたりできます。ダイナミックスキーマの詳細は、ダイナミックスキーマをご覧ください。 ダイナミックスキーマ機能は、テーブルの不明なカラムを取得するしくみになっており、その他の目的には使用しないことをお勧めします。テーブルの作成には推奨しません。 ダイナミックスキーマ機能を使用する場合、ダイナミックカラムには入力ファイルの実際のカラム名は含まれません。出力フローに実際のカラム名を含める場合は、入力ファイルにヘッダー行があり、ヘッダー値が正しく設定されていることをご確認ください。 |
|
[Built-in] (組み込み): そのコンポーネントに対してのみスキーマを作成し、ローカルに保管します。 |
|
[Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保管されています。さまざまなプロジェクトやジョブデザインで再利用できます。 |
[Skip empty rows] (空の行をスキップ) |
このチェックボックスを選択すると、空白行はスキップされます。 |
[Uncompress as zip file] (Zipファイルを展開) |
このチェックボックスを選択すると、入力ファイルの圧縮が解除されます。 |
Die on error (エラー発生時に強制終了) |
このチェックボックスを選択すると、エラー発生時にジョブの実行が停止されます。 エラーの発生した行をスキップし、エラーが発生していない行の処理を完了するには、このチェックボックスをオフにします。エラーをスキップしたら、[Row] (行)> [Reject] (リジェクト)リンクを使用してエラーの発生した行を収集できます。 FileNotFoundExceptionを取得するには、このチェックボックスも選択する必要があります。 |
詳細設定
高度な区切り(数字用) |
数値に使用する区切りを変更する場合は、このチェックボックスを選択します。デフォルトでは、桁区切りはコンマ(,)で、小数点区切りはピリオド(.)です。 |
[Extract lines at random] (行をランダムに抽出) |
このチェックボックスを選択すると、ランダムに抽出する行数を設定できます。 |
[Encoding] (エンコーディング) |
リストからエンコーディングを選択するか、[CUSTOM] (カスタム)を選択して、手動で定義します。このフィールドはデータベースデータ処理の必須フィールドです。サポートされるエンコーディングは、使用しているJVMに応じて異なります。詳細は、https://docs.oracle.comをご覧ください。 |
[Trim all column] (すべてのカラムのトリム) |
このチェックボックスを選択すると、先行ホワイトスペースおよび後続ホワイトスペースがすべてのカラムから削除されます。このチェックボックスをオフにすると、[Check column to trim] (トリミングするカラムをチェック)テーブルが表示され、トリミングする特定のカラムを選択できます。 |
[Check each row structure against schema] (スキーマに対して各行ストラクチャーをチェック) |
このチェックボックスを選択すると、各行のカラム総数がスキーマと一致するかどうかチェックされます。一致しない場合、コンソール上にエラーメッセージが表示されます。 |
[Check date] (日付の確認) |
このチェックボックスを選択すると、日付形式が入力スキーマに対して厳密にチェックされます。 |
[Check columns to trim] (トリミングするカラムをチェック) |
このテーブルは使用されているスキーマで自動入力されます。トリミングするカラムに対応するチェックボックスをオンにします。 |
[Split row before field] (フィールドの前の行を分割) |
このチェックボックスを選択すると、フィールドの分割前に行を分割できます。 |
[Permit hexadecimal (0xNNN) or octal (0NNNN) for numeric types] (数値型に16進数または8進数を許可) |
16進数文字列または8進数文字列を数値データ型(long、integer、short、またはbyte)に解析する場合は、このチェックボックスを選択します。 表示されるテーブルで対象となるカラムの横にあるチェックボックスをオンにし、各カラムの入力文字列をスキーマで定義されている型に変換します。 [Permit hexadecimal or octal] (16進数または8進数を許可)チェックボックスをオンにすると、すべてのカラムが選択されます。 このテーブルは、[Permit hexadecimal (0xNNN) or octal (0NNNN) for numeric types - it will act the opposite for Byte] (数値型の16進数(0xNNN)または8進数(0NNNN) - Byteには逆の動作をします)のチェックボックスがオンになっている場合にのみ表示されます。 |
[tStatCatcher Statistics] (tStatCatcher統計) |
このチェックボックスを選択すると、ジョブレベルおよび各コンポーネントレベルで処理メタデータが収集されます。 |
グローバル変数
グローバル変数 |
NB_LINE: 処理された行の数。これはAfter変数で、整数を返します。 ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。 Flow変数はのコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。 フィールドまたは式に変数を入力する場合は、Ctrl + スペースを押して変数リストにアクセスし、使用する変数を選択します。 変数の詳細は、コンテキストと変数を使用をご覧ください。 |
使用方法
使用ルール |
このコンポーネントを使用してファイルを読み取り、定義されたセパレーターを使用してこのファイルに含まれるフィールドを区切ります。[Row] (行) > [Main] (メイン)リンクを使用するか、定義されたタイプに対応しないデータでデータをフィルタリングする[Row] (行) > [Reject] (リジェクト)リンクを使用してデータフローを作成できます。詳細は、手順をご覧ください。 |
制限事項 |
ライセンスの互換性の問題のため、このコンポーネントの使用に必要な1つ以上のJARが提供されていません。この特定のコンポーネントに不足しているJARをインストールするには、Component (コンポーネント)タブビューの[Install] (インストール)ボタンをクリックします。Talend StudioのIntegrationパースペクティブにある[Modules] (モジュール)タブでも、不足しているすべてのJARを簡単に見つけて追加できます。詳細は、外部モジュールをインストールをご覧ください。 |