別のデータセットのデータの動的な使用
ルックアップ機能は現在のプレパレーションからのデータを参照データセット内のデータとマッチングするので、ユーザーはこの参照データをプレパレーションに追加できます。
情報メモヒント: Talendでは、最大1,000,000行、10カラムのデータセットでルックアップ機能を使用することをお勧めしています。
この例では、顧客が住んでいるアメリカの州に関する情報を含むプレパレーションを用いて作業するという想定ですが、州を2文字のコードだけで識別する設定になっています。これと並行して2番目のデータセットがあり、そこでは2文字の米州コードが州のフルネームとマッチングされています。ユーザーはルックアップ機能を使用してこの情報を取得し、プレパレーションに追加します。
手順
タスクの結果
前述のサンプルで説明されなかったルックアップ機能のもう1つの動作は、参照データセットからの値に重複や空があった場合の処理です。
次の例をご覧ください。州コードの1つがプレパレーションにありません。また、参照データセットに[NY]州コードの重複エントリーがあります。この例でNYは2つの値を取る可能性があります。New YorkとNueva Yorkです。ただし、どちらのエントリーも同じである可能性も十分にあります。

上記の結果は、以下の動作を適用して得られたものです。
- 参照データセット内に同じ値が複数存在する場合、初回の出現のみがマッチングされます。この例では[Nueva York]です。
- プレパレーション内の空のセルは、空のセルとマッチングされます。