tFileInputPositionalの標準プロパティ
これらのプロパティは、標準ジョブのフレームワークで実行されているtFileInputPositionalを設定するために使われます。
標準のtFileInputPositionalコンポーネントは、ファイルファミリーに属しています。
このフレームワーク内のコンポーネントは、すべてのTalend製品で利用できます。
基本設定
[Property type] (プロパティタイプ) |
[Built-in] (組み込み)と[Repository] (リポジトリー)のいずれかです。 |
|
[Built-In] (組み込み): 一元的に保存されるプロパティデータはありません。 |
|
[Repository] (リポジトリー): プロパティが保存されているリポジトリーファイルを選択します。 |
[Use existing dynamic] (既存のダイナミックを使用) |
既存のダイナミックスキーマを再利用して不明なカラムのデータを処理するには、このチェックボックスをオンにします。 このチェックボックスをオンにすると、 [Component list] (コンポーネントリスト)が表示され、ダイナミックスキーマの設定に使うコンポーネントを選択できます。 |
ファイル名/ストリーム |
[File Name] (ファイル名): 処理されるファイルの名前とパス 情報メモ警告: エラーを避けるために、このフィールドには(相対パスの代わりに)絶対パスを使用します。
[Stream] (ストリーミング): 処理されるデータフロー。tFileInputPositionalが対応する代表変数を介してこれらのデータを取得するには、データをフローに追加する必要があります。 この変数はStudioで事前に定義されているか、このコンポーネントで使用されているコンテキストまたはコンポーネントによって提供されている可能性があります。たとえば、tFileFetchのINPUT_STREAM変数です。提供されていない場合、tJavaまたはtJavaFlexを使用して、手入力で変数を定義し、ジョブデザインに基づいて使用できます。 手入力の手間を省くため、変数が適切に定義されることを確認する必要があるものの、予測変換リスト([Ctrl] + [Space])から目的の変数を選択して、現在のフィールドに入力できます。 使用可能な変数に関連するトピックは、Talend Studioユーザーガイドをご覧ください。 入力ストリームに関連するシナリオは、ストリーミングモードでのリモートファイルからのデータの読み取りをご覧ください。 |
[Row separator] (行区切り) |
行の終端を識別するために使用される区切り。 |
[Use byte length as the cardinality] (基数としてバイト長を使用) |
このコンポーネントに2バイト文字のサポートを有効にするには、このチェックボックスをオンにします。この機能にはJDK 1.6が必要です。 |
[Customize] (カスタマイズ) |
位置ファイルのデータ形式をカスタマイズし、テーブルカラムを定義するには、このチェックボックスをオンにします。 [Column] (カラム): カスタマイズするカラムを選択します。 [Size] (サイズ): カラムのサイズを入力します。 [Padding char] (埋め込み文字): 二重引用符の間に、フィールドから削除する必要のある埋め込み文字を入力します。デフォルトの埋め込み文字はスペースです。 [Alignment] (整列): 適切な整列パラメーターを選択します。 |
[Pattern] (パターン) |
長さの値はコンマで区切られ、引用符で囲まれた文字列として解釈されます。このフィールドに入力された値が、定義されたスキーマと一貫していることをご確認ください。 |
[Pattern Units] (パターンユニット) |
[Pattern] (パターン)フィールドで指定された長さの値の単位。
|
[Skip empty rows] (空の行をスキップ) |
このチェックボックスを選択すると、空白行はスキップされます。 |
[Uncompress as zip file] (Zipファイルを展開) |
このチェックボックスを選択すると、入力ファイルの圧縮が解除されます。 |
[Die on error] (エラー発生時に強制終了) |
このチェックボックスを選択すると、エラー発生時にジョブの実行が停止されます。 エラーの発生した行をスキップし、エラーが発生していない行の処理を完了するには、このチェックボックスをオフにします。エラーをスキップしたら、[Row] (行)> [Reject] (リジェクト)リンクを使用してエラーの発生した行を収集できます。 |
[Header] (ヘッダー) |
ファイルの先頭でスキップする行の数を入力します。 |
[Footer] (フッター) |
ファイルの最後にスキップする行数。 |
[Limit] (制限事項) |
処理される行の最大数。[Limit] (制限) = 0の場合、行の読み取りや処理は行われません。 |
[Schema] (スキーマ)と[Edit schema] (スキーマを編集) |
スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。 スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。現在のスキーマがリポジトリータイプの場合は、3つのオプションを利用できます。
このコンポーネントは、ダイナミックスキーマ機能の利点を備えているので、ソースファイルから不明なカラムを取得したり、各カラムを個別にマッピングしなくてもソースからカラムを一括してコピーしたりできます。ダイナミックスキーマの詳細は、Talend Studioユーザーガイドをご覧ください。 このダイナミックスキーマ機能は、テーブルの不明なカラムを取得する目的で設計されており、この目的に限り使用をお勧めします。テーブルの作成で使用することは勧められていません。 このコンポーネントは、ダイナミックスキーマ機能を活用するためにtSetDynamicSchemaと連携する必要があります。 |
|
[Built-in] (組み込み): このコンポーネントに対してのみ作成されたスキーマがローカルに保管されます。関連項目:Talend Studioユーザーガイドをご覧ください。 |
|
[Repository] (リポジトリー): スキーマは既に存在し、リポジトリーに保管されているため、さまざまなプロジェクトやジョブフローチャートで再利用できます。関連項目:Talend Studioユーザーガイドをご覧ください。 |
詳細設定
[Needed to process rows longer than 100 000 characters] (100 000文字を超える行を処理する必要がある) |
入力ファイルで処理される行が100 000文字を超える場合は、このチェックボックスをオンにします。 |
[Advanced separator (for numbers)] (詳細区切り文字: 数値) |
数値に使用する区切りを変更する場合は、このチェックボックスを選択します。デフォルトでは、桁区切りはコンマ(,)で、小数点区切りはピリオド(.)です。 [Thousands separator] (3桁区切り): 数字3桁の区切り文字を定義します。 [Decimal separator] (小数点区切り): 小数点の区切り文字を定義します。 |
[Trim all column] (すべてのカラムのトリム) |
このチェックボックスをオンにすると、先行ホワイトスペースおよび後続ホワイトスペースが定義済みのカラムから削除されます。 |
[Validate date] (データの検証) |
このチェックボックスを選択すると、日付形式が入力スキーマに対して厳密にチェックされます。 |
[Encoding] (エンコーディング) |
リストからエンコーディングを選択するか、[CUSTOM] (カスタム)を選択して、手動で定義します。このフィールドはデータベースデータ処理の必須フィールドです。サポートされるエンコーディングは、使用しているJVMに応じて異なります。詳細は、https://docs.oracle.com (英語のみ)をご覧ください。 |
[tStatCatcher Statistics] (tStatCatcher統計) |
このチェックボックスを選択すると、ジョブレベルやコンポーネントレベルでジョブ処理メタデータが収集されます。 |
グローバル変数
グローバル変数 |
NB_LINE: 処理された行の数。これはAfter変数で、整数を返します。 ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、[Die on error] (エラー発生時に強制終了)がオフになっている場合のみ機能します。 Flow変数はのコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。 フィールドまたは式に変数を入れるには、Ctrl + スペースを押して変数リストにアクセスし、リストから使用する変数を選択します。 変数の詳細は、Talend Studioユーザーガイドをご覧ください。 |
使用方法
使用ルール |
このコンポーネントを使ってファイルを読み取り、位置区切り値を使ってフィールドを区切ります。Row > Rejectリンクを使用して拒否フローを作成し、定義されたタイプに対応しないデータをフィルタリングすることもできます。これら2つのリンクの使用方法の例については、手順をご覧ください。 |