tFileOutputPositionalの標準プロパティ
これらのプロパティは、標準ジョブのフレームワークで実行されているtFileOutputPositionalを設定するために使われます。
標準のtFileOutputPositionalコンポーネントは、ファイルファミリーに属しています。
このフレームワーク内のコンポーネントは、すべてのTalend製品で利用できます。
基本設定
[Property type] (プロパティタイプ) |
[Built-in] (組み込み)と[Repository] (リポジトリー)のいずれかです。 |
|
[Built-In] (組み込み): 一元的に保存されるプロパティデータはありません。 |
|
[Repository] (リポジトリー): プロパティが保存されているリポジトリーファイルを選択します。 |
[Use existing dynamic] (既存のダイナミックを使用) |
既存のダイナミックスキーマを再利用して不明なカラムのデータを処理するには、このチェックボックスをオンにします。 このチェックボックスをオンにすると、 [Component list] (コンポーネントリスト)が表示され、ダイナミックスキーマの設定に使うコンポーネントを選択できます。 |
[Use Output Stream] (出力ストリームを使用) |
このチェックボックスを選択すると、目的のデータフローが処理されます。これを選択すると、[Output Stream] (出力ストリーム)フィールドが表示され、目的のデータフローを入力できます。 対応する代表変数により、コンポーネントでデータを取得できるようにするには、処理するデータフローを追加する必要があります。 この変数はStudioで事前に定義されているか、このコンポーネントと共に使用されているコンテキストまたはコンポーネントによって提供されている可能性があります。 それ以外の場合は、手動で変数を定義し、ジョブの設計に従って使用できます(たとえば、tJavaまたはtJavaFlexを使用)。 手入力の手間を省くため、変数が適切に定義されることを確認する必要があるものの、予測変換リスト([Ctrl] + [Space])から目的の変数を選択して、現在のフィールドに入力できます。 ストリームの使用方法の詳細は、ストリーミングモードでのリモートファイルからのデータの読み取りをご覧ください。 |
[File name] (ファイル名) |
処理されるファイルの名前またはパス、または使う変数。 [Use Output Stream] (出力ストリームを使用)チェックボックスをオンにすると、このフィールドは使用できなくなります。 ジョブで変数を定義して使用する方法は、Talend Studioユーザーガイドをご覧ください。 情報メモ警告: エラーを避けるために、このフィールドには(相対パスの代わりに)絶対パスを使用します。
|
[Schema] (スキーマ) と [Edit Schema] (スキーマを編集) |
スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。 スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。現在のスキーマがリポジトリータイプの場合は、3つのオプションを利用できます。
このコンポーネントは、ダイナミックスキーマ機能の利点を備えているので、ソースファイルから不明なカラムを取得したり、各カラムを個別にマッピングしなくてもソースからカラムを一括してコピーしたりできます。ダイナミックスキーマの詳細は、Talend Studioユーザーガイドをご覧ください。 このダイナミックスキーマ機能は、テーブルの不明なカラムを取得する目的で設計されており、この目的に限り使用をお勧めします。テーブルの作成で使用することは勧められていません。 |
|
[Built-in] (組み込み): そのコンポーネントに対してのみスキーマを作成し、ローカルに保管します。 |
|
[Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保管されています。さまざまなプロジェクトやジョブデザインで再利用できます。 |
[Row separator] (行区切り) |
行の終端を識別するために使用される区切り。 |
[Append] (追加) |
このチェックボックスをオンにすると、ファイルの最後に新しい行が追加されます。 |
[Include header] (ヘッダーを含める) |
このチェックボックスをオンにすると、カラムヘッダーがファイルに追加されます。 |
[Compress as zip file] (ZIPファイルとして圧縮) |
出力ファイルをzip形式で圧縮するには、このチェックボックスをオンにします。 |
形式 |
固定長ファイルのデータ形式をカスタマイズし、フォーマットテーブルのカラムに入力します。 [Column] (カラム): カスタマイズするカラムを選択します。 [Size] (サイズ): カラムのサイズを入力します。 [Padding char] (パディング文字): 引用符の間を埋めるパディング文字を入力します。デフォルトの埋め込み文字はスペースです。 [Alignment] (整列): 適切な整列パラメーターを選択します。 [Keep] (保持): カラムまたはフィールドのデータが長すぎる場合は、保持する部分を選択します。 |
詳細設定
[Advanced separator (for numbers)] (詳細区切り文字: 数値) |
数値に使用する区切りを変更する場合は、このチェックボックスを選択します。デフォルトでは、桁区切りはコンマ(,)で、小数点区切りはピリオド(.)です。 [Thousands separator] (3桁区切り): 数字3桁の区切り文字を定義します。 [Decimal separator] (小数点区切り): 小数点の区切り文字を定義します。 |
[Use byte length as the cardinality] (基数としてバイト長を使用) |
このコンポーネントに2バイト文字のサポートを追加するには、このチェックボックスをオンにします。この機能にはJDK 1.6が必要です。 |
[Create directory if not exists] (ディレクトリーがない場合はディレクトリーを作成) |
このチェックボックスはデフォルトで選択されています。存在しない場合は、出力テーブルを保持するディレクトリーが作成されます。 |
[Custom the flush buffer size] (フラッシュバッファーサイズのカスタマイズ) |
このチェックボックスを選択すると、バッファーを空にする前に書き込む行数が定義されます。 [Row Number] (行数):書き込む行数を設定するために使われます。 |
[Output in row mode] (行モード出力) |
行モードで書き込みます。 |
[Encoding] (エンコーディング) |
リストからエンコーディングを選択するか、[CUSTOM] (カスタム)を選択して、手動で定義します。このフィールドはデータベースデータ処理の必須フィールドです。サポートされるエンコーディングは、使用しているJVMに応じて異なります。詳細は、https://docs.oracle.com (英語のみ)をご覧ください。 |
[Don't generate empty file] (空のファイルを生成しない) |
空のファイルを生成しない場合は、このチェックボックスを選択します。 |
[tStatCatcher Statistics] (tStatCatcher統計) |
このチェックボックスを選択すると、ジョブレベルやコンポーネントレベルでジョブ処理メタデータが収集されます。 |
グローバル変数
グローバル変数 |
NB_LINE: 入力コンポーネントによって読み取られた行の数、または出力コンポーネントに転送された行の数。これはAfter変数で、整数を返します。 ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、[Die on error] (エラー発生時に強制終了)がオフになっている場合のみ機能します。 Flow変数はのコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。 フィールドまたは式に変数を入れるには、Ctrl + スペースを押して変数リストにアクセスし、リストから使用する変数を選択します。 変数の詳細は、Talend Studioユーザーガイドをご覧ください。 |
使用方法
使用ルール |
このコンポーネントを使ってファイルを読み取り、指定された区切りを使ってフィールドを区切ります。 |
[Dynamic settings] (ダイナミック設定) |
[+]ボタンをクリックしてテーブルに行を追加し、[Code] (コード)フィールドにコンテキスト変数を入力して、ジョブ内で計画した複数の接続からHDFS接続をダイナミックに選択します。この機能は、異なるHDFSシステムまたは異なるディストリビューション内のファイルにアクセスする必要がある場合、特に、 Talend Studio を介さずにジョブをデプロイおよび実行する必要がある時など、ジョブの設定を変更できない環境で作業している場合に役立ちます。 [Dynamic settings] (ダイナミック設定)テーブルは、[Basic settings] (基本設定)ビューで[Use an existing connection] (既存の接続を使用)チェックボックスがオンになっている場合のみ利用できます。ダイナミックパラメーターを定義すると、[Basic settings] (基本設定)ビューの[Component List] (コンポーネントリスト)ボックスは利用できなくなります。 ダイナミックパラメーターの定義法を示すユースケースについては、コンテキストベースのダイナミック接続によってデータベースからデータを読み取りと、ダイナミックにロードされた接続パラメーターを使って異なるMySQLデータベースからデータを読み取りをご覧ください。[Dynamic settings] (ダイナミック設定)とコンテキスト変数については、Talend Studioユーザーガイドをご覧ください。 |