tFileOutputDelimitedの標準プロパティ
これらのプロパティは、標準ジョブのフレームワークで実行されているtFileOutputDelimitedを設定するために使われます。
標準のtFileOutputDelimitedコンポーネントは、ファイルファミリーに属しています。
このフレームワーク内のコンポーネントは、すべてのTalend製品で利用できます。
基本設定
[Property type] (プロパティタイプ) |
[Built-in] (組み込み)と[Repository] (リポジトリー)のいずれかです。 |
|
[Built-In] (組み込み): 一元的に保存されるプロパティデータはありません。 |
|
[Repository] (リポジトリー): プロパティが保存されているリポジトリーファイルを選択します。 |
[Use Output Stream] (出力ストリームを使用) |
このチェックボックスを選択すると、目的のデータフローが処理されます。これを選択すると、[Output Stream] (出力ストリーム)フィールドが表示され、目的のデータフローを入力できます。 対応する代表変数により、コンポーネントでデータを取得できるようにするには、処理するデータフローを追加する必要があります。 この変数はStudioで事前に定義されているか、このコンポーネントと共に使用されているコンテキストまたはコンポーネントによって提供されている可能性があります。 それ以外の場合は、手動で変数を定義し、ジョブの設計に従って使用できます(たとえば、tJavaまたはtJavaFlexを使用)。 手入力の手間を省くため、変数が適切に定義されることを確認する必要があるものの、予測変換リスト([Ctrl] + [Space])から目的の変数を選択して、現在のフィールドに入力できます。 ストリームの使用方法の詳細は、ストリーミングモードでのリモートファイルからのデータの読み取りをご覧ください。 |
[File name] (ファイル名) |
出力ファイルや使用する変数の名前またはパス。 [Use Output Stream] (出力ストリームを使用)チェックボックスをオンにすると、このフィールドは使用できなくなります。 ジョブで変数を定義して使用する方法は、『 Talend Studio ユーザーガイド』をご覧ください。 情報メモ警告: エラーを避けるために、このフィールドには(相対パスの代わりに)絶対パスを使用します。
|
[Row Separator] (行区切り) |
行の終端を識別するために使用される区切り。 |
[Field Separator] (フィールド区切り) |
転送されたデータのフィールドを区切る場合は、文字か文字列を入力します。 情報メモ注: [Advanced settings] (詳細設定)ビューで[CSV options] (CSVオプション)が選択されていると、フィールド区切りは1文字のみとなります。この場合、このフィールドに複数の文字を入力しても、フィールド区切りとして機能するのは最初の文字だけです。
|
[Append] (追加) |
このチェックボックスを選択すると、ファイルの最後に新しい行が追加されます。 |
ヘッダーを含める |
このカラムヘッダーをファイルに含めるには、このチェックボックスを選択します。 |
[Compress as zip file] (ZIPファイルとして圧縮) |
出力ファイルをzip形式で圧縮するには、このチェックボックスを選択します。 |
[Schema] (スキーマ)と[Edit schema] (スキーマを編集) |
スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。 スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。現在のスキーマがリポジトリータイプの場合は、3つのオプションを利用できます。
このコンポーネントは、ダイナミックスキーマ機能の利点を備えているので、ソースファイルから不明なカラムを取得したり、各カラムを個別にマッピングしなくてもソースからカラムを一括してコピーしたりできます。ダイナミックスキーマの詳細は、Talend Studioユーザーガイドをご覧ください。 このダイナミックスキーマ機能は、テーブルの不明なカラムを取得する目的で設計されており、この目的に限り使用をお勧めします。テーブルの作成で使用することは勧められていません。 |
|
[Built-in] (組み込み): そのコンポーネントに対してのみスキーマを作成し、ローカルに保管します。 |
|
[Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保管されています。さまざまなプロジェクトやジョブデザインで再利用できます。 |
[Sync columns] (カラムを同期) |
クリックすると、出力ファイルのスキーマと入力ファイルのスキーマが同期されます。同期機能は、[Row] (行)接続が出力コンポーネントにリンクされている場合にのみ表示されます。 |
詳細設定
[Advanced separator (for numbers)] (詳細区切り文字: 数値) |
数値に使用する区切りを変更する場合は、このチェックボックスを選択します。デフォルトでは、桁区切りはコンマ(,)で、小数点区切りはピリオド(.)です。 [Thousands separator] (3桁区切り): 数字3桁の区切り文字を定義します。 [Decimal separator] (小数点区切り): 小数点の区切り文字を定義します。 |
[CSV options] (CSVオプション) |
このチェックボックスを選択すると、次のCSVパラメーターを指定できます:
標準エスケープ文字("\")を使用することをお勧めします。これを使用しない場合は、[Escape char] (エスケープ文字)と[Text enclosure] (テキストエンクロージャー)に同じ文字を設定する必要があります。たとえば、エスケープ文字が"\"に設定されている場合、テキストエンクロージャーはその他の任意の1文字に設定できます。他方、エスケープ文字が"\"以外の文字に設定されている場合、テキストエンクロージャーはその他の任意の複数の文字に設定できます。ただし、エスケープ文字はテキストエンクロージャーと同じ文字に変更されます。たとえば、エスケープ文字が"#"に設定され、テキストエンクロージャーが"@"に設定されている場合、エスケープ文字は"#"ではなく"@"に変更されます。 |
[Create directory if not exists] (ディレクトリーがない場合はディレクトリーを作成) |
このチェックボックスはデフォルトで選択されています。区切り付き出力ファイルが存在しない場合は、保管するディレクトリーを作成します。 |
[Split output in several files] (出力を複数のファイルに分割) |
非常に大きな出力ファイルの場合は、このチェックボックスをオンにして、区切り付き出力ファイルを複数のファイルに分割します。 [Rows in each output file] (各出力ファイルの行):各出力ファイルの行数を設定するために使われます。 |
フラッシュバッファーサイズのカスタマイズ |
このチェックボックスを選択すると、バッファーを空にする前に書き込む行数が定義されます。 [Row Number] (行数):書き込む行数を設定するために使われます。 |
[Output in row mode] (行モード出力) |
このチェックボックスを選択すると、フラッシュのアトミック性が確保され、データ各行の一貫性が保たれるため不完全なデータ行がファイルに書き込まれることはありません。 このチェックボックスは通常、マルチスレッドでコンポーネントを使用する場合に使用します。 |
[Encoding] (エンコーディング) |
リストからエンコーディングを選択するか、[CUSTOM] (カスタム)を選択して、手動で定義します。このフィールドはデータベースデータ処理の必須フィールドです。サポートされるエンコーディングは、使用しているJVMに応じて異なります。詳細は、https://docs.oracle.com (英語のみ)をご覧ください。 |
[Don't generate empty file] (空のファイルを生成しない) |
空のファイルを生成しない場合は、このチェックボックスを選択します。 |
[Throw an error if the file already exist] (ファイルが既存の場合はエラーにする) |
[Basic settings] (基本設定)ビューの[File Name] (ファイル名)フィールドに指定された出力ファイルが既に存在する場合は、このチェックボックスをオンにして例外を返します。 既存のファイルを上書きするには、このチェックボックスをオフにします。 |
[tStatCatcher Statistics] (tStatCatcher統計) |
このチェックボックスを選択すると、ジョブレベルやコンポーネントレベルでジョブ処理メタデータが収集されます。 |
グローバル変数
グローバル変数 |
NB_LINE: 入力コンポーネントによって読み取られた行の数、または出力コンポーネントに転送された行の数。これはAfter変数で、整数を返します。 FILE_NAME: 処理されているファイルの名前。これはFlow変数で、文字列を返します。 ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、[Die on error] (エラー発生時に強制終了)がオフになっている場合のみ機能します。 Flow変数はのコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。 フィールドまたは式に変数を入れるには、Ctrl + スペースを押して変数リストにアクセスし、リストから使用する変数を選択します。 変数の詳細は、Talend Studioユーザーガイドをご覧ください。 |
使用方法
使用ルール |
このコンポーネントを使用して、区切り付きファイルを作成し、フィールド区切り値を使用してフィールドを区切ります。 |
制限事項 |
ライセンスの互換性の問題のため、このコンポーネントの使用に必要な1つ以上のJARが提供されていません。この特定のコンポーネントに不足しているJARをインストールするには、Component (コンポーネント)タブビューの[Install] (インストール)ボタンをクリックします。Studioの Integration パースペクティブの[Modules] (モジュール)タブでも、不足しているすべてのJARを簡単に見つけて追加できます。詳細は、外部モジュールのインストールをご覧ください。外部モジュールをインストールする方法は、Talend Help Center (https://help.talend.com (英語のみ))をご覧ください。 |