tLogRow MapReduceプロパティ(非推奨)
これらのプロパティは、MapReduceジョブのフレームワークで実行されているtLogRowを設定するために使われます。
MapReduce tLogRowコンポーネントは、ログおよびエラーファミリーに属しています。
このフレームワーク内のコンポーネントは、ビッグデータ対応のTalend 製品すべて、およびTalend Data Fabricで使用できます。
MapReduceのフレームワークは、Talend 7.3以降非推奨となります。Apache SparkのTalendジョブを使って、インテグレーションタスクを実行します。基本設定
[Schema] (スキーマ)と[Edit schema] (スキーマを編集) |
スキーマとは行の説明のことです。処理して次のコンポーネントに渡すフィールド(カラム)数を定義します。Sparkジョブを作成する場合、フィールドの命名時は予約語のlineを避けます。 スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。現在のスキーマがリポジトリータイプの場合は、3つのオプションを利用できます。
このコンポーネントは、ダイナミックスキーマ機能の利点を備えているので、ソースファイルから不明なカラムを取得したり、各カラムを個別にマッピングしなくてもソースからカラムを一括してコピーしたりできます。ダイナミックスキーマの詳細は、Talend Studioユーザーガイドをご覧ください。 このダイナミックスキーマ機能は、テーブルの不明なカラムを取得する目的で設計されており、この目的に限り使用をお勧めします。テーブルの作成で使用することは勧められていません。 |
[Built-in] (組み込み): そのコンポーネントに対してのみスキーマを作成し、ローカルに保管します。 |
|
[Repository] (リポジトリー): スキーマは作成済みで、リポジトリーに保管されています。さまざまなプロジェクトやジョブデザインで再利用できます。 |
|
[Sync columns] (カラムを同期) | クリックすると、出力ファイルのスキーマと入力ファイルのスキーマが同期されます。同期機能は、コンポーネントが[Row] (行)接続を使用して先行のコンポーネントとリンクされている場合にのみ使用できます。 |
[Basic] (基本) | 出力フローを基本モードで表示します。 |
[Table] (テーブル) | 出力フローをテーブルのセルで表示します。 |
[Vertical] (垂直) |
出力フローの各行をキー値リストとして表示します。 このモードを選択すると、各出力行に対して、コンポーネントの一意の名前とラベルのいずれか、またはその両方を表示するかを選択できます。 |
[Separator] (区切り) (基本モードの場合のみ) |
ログ表示のデータを区切るセパレーターを入力します。 |
[Print header] (ヘッダーを印刷) (基本モードの場合のみ) |
このチェックボックスを選択すると、入力フローのヘッダーが出力ディスプレイに表示されます。 |
[Print component unique name in front of each output row] (各出力行の前にコンポーネントの固有名を印刷) (基本モードの場合のみ) |
このチェックボックスを選択すると、複数のtLogRowコンポーネントが使用される場合、出力を区別するために各出力行の前にコンポーネントの固有名が表示されます。 |
[Print schema column name in front of each value] (各値の前にスキーマのカラム名を表示) (基本モードの場合のみ) |
このチェックボックスを選択すると、出力スキーマからカラムラベルが取得されます。 |
[Use fixed length for values] (値に固定長を使用) (基本モードの場合のみ) |
このチェックボックスを選択すると、値の表示の固定幅が設定されます。 |
詳細設定
[Use local timezone for date] (日付にローカルタイムゾーンを使用) | ジョブが実行されるコンピューターのローカルな日付を使用する場合は、このチェックボックスを選択します。このチェックボックスをオフのままにしておくと、日付タイプのデータ形式にUTCが自動的に使用されます。 |
グローバル変数
グローバル変数 |
ERROR_MESSAGE: エラーが発生した時にコンポーネントによって生成されるエラーメッセージ。これはAfter変数で、文字列を返します。この変数はコンポーネントにこのチェックボックスが存在し、[Die on error] (エラー発生時に強制終了)がオフになっている場合のみ機能します。 Flow変数はのコンポーネントの実行中に機能し、After変数はコンポーネントの実行後に機能します。 フィールドまたは式に変数を入れるには、Ctrl + スペースを押して変数リストにアクセスし、リストから使用する変数を選択します。 変数の詳細は、Talend Studioユーザーガイドをご覧ください。 |
使用方法
使用ルール |
このコンポーネントは、データフローの中間ステップとして、またはジョブフローチャートの終了オブジェクトとして使用できます。 Talend Map/Reduceジョブでは、このコンポーネントは、中間または終了ステップとして使用されます。Hadoopで直接実行できるネイティブMap/Reduceコードを生成します。 [Run] (実行)ビューの[Hadoop Configuration] (Hadoop設定)タブを使用して、ジョブ全体で特定のHadoopディストリビューションに対する接続を定義する必要があります。 この接続は、ジョブごとに有効になります。 Talend Map/Reduceジョブの詳細は、Talend Big Data入門ガイドでTalend Map/Reduceジョブを作成、変換、設定する方法のセクションをご覧ください 。 本書では、特に明記されていない限り、標準ジョブ、つまり従来の Talend データ統合ジョブ、およびMap/Reduce以外のジョブのシナリオで説明しています。 |