ソート済み行の再グルーピング
このJavaシナリオでは、4つのエレメントからなるジョブについて説明します。これは、区切り付きファイル行を行ごとに読み取り、ソートタイプと順序別で入力データをソートし、すべての入力ソート済み行を非正規化し、[Run] (実行)ログコンソールに出力を表示することを目的としています。
Talendでサポートされているテクノロジーの詳細は、Talendコンポーネントをご覧ください。
-
[Palette] (パレット)から、tFileInputDelimited、tSortRow、tDenormalizeSortedRow および tLogRowのコンポーネントをデザインワークスペースにドロップします。
-
[Row Main] (行メイン) リンクを使って、4つのコンポーネントを接続します。
-
デザインワークスペースでtFileInputDelimitedを選択します。
-
[Component] (コンポーネント)タブをクリックして、tFileInputDelimitedの基本設定を定義します。
-
[Property type] (プロパティタイプ)を[Built-in] (組み込み)に設定します。
-
処理されたファイルへのパスを[File Name] (ファイル名)フィールドに入力します。この例で使用されているname_listファイルには、idと名前の2つのカラムがあります。
-
必要に応じて、行とフィールドの区切り、ヘッダーとフッター、および処理される行数を定義します。
-
[Built-in] (組み込み)に[Schema] (スキーマ)を設定し、[Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックして、次のコンポーネントに渡すデータを定義します。このサンプルのスキーマは、idと[Named] (名前)の2つのカラムで構成されています。
-
デザインワークスペースで、tSortRowを選択します。
-
[Component] (コンポーネント)タブをクリックして、tSortRowの基本設定を定義します。
-
[Schema type] (スキーマのタイプ)を[Built-in] (組み込み)に設定し、[Sync columns] (カラムを同期)をクリックしてtFileInputDelimitedコンポーネントからスキーマを取得します。
-
[Criteria] (条件)パネルで、プラスボタンを使用して行を追加し、処理するスキーマカラムのソートパラメーターを設定するために使われます。このサンプルでは、idカラムを昇順にソートします。
-
デザインワークスペースで、tDenormalizeSortedRowを選択します。
-
[Component] (コンポーネント)タブをクリックして、tDenormalizeSortedRowの基本設定を定義します。
-
[Schema type] (スキーマのタイプ)を[Built-in] (組み込み)に設定し、[Sync columns] (カラムを同期)をクリックしてtSortRowコンポーネントからスキーマを取得します。
-
[Input rows count] (入力行数)フィールドに、処理する入力行数を入力するか、Ctrl + スペースを押してコンテキスト変数リストにアクセスし、変数を選択します: tFileInputDelimited_1_NB_LINE。
-
[非正規化する] (To denormalize)パネルで、プラスボタンを使用して行を追加し、処理するスキーマカラムのソートパラメーターを設定するために使われます。このサンプルでは、[Named] (名前)カラムを非正規化します。
-
デザインワークスペースで、tLogRowを選択して、[Component] (コンポーネント)タブをクリックし、基本設定を定義します。tLogRowの詳細は、tLogRowをご覧ください。
-
ジョブを保存し、F6を押して実行します。
コンソールに表示される結果は、[name] (名前)カラムがどのように非正規化されたかを示しています。