Avro形式の従業員データのフィルタリング
このシナリオは、ビッグデータ関連Talend製品にのみ適用されます。
Talendでサポートされているテクノロジーの詳細は、Talendコンポーネントを参照してください。
このシナリオでは、 Talend Map/Reduceジョブを作成し、Map/Reduceコンポーネントを使用して、Avro形式のデータの読み取り、変換、書き込みを行う方法を説明します。このジョブでは、Map/Reduceコードを生成し、Hadoop内で直接実行します。また、ワークスペース内の[Map] (マップ)バーには、このジョブではマッパーのみが使用されることが示され、ランタイムにはマップの計算の進捗状況が表示されます。
Talend Map/Reduceコンポーネントは、サブスクリプションのBig Dataユーザーのみが使用できます。また、このシナリオはMap/Reduceコンポーネントでのみ複製できます。
このシナリオで使用するサンプルデータは、理論的には以下のように読み取られるレコードの会社従業員情報ですが、実際にはAvro形式のファイルとしてのみ表示されます。
1;Lyndon;Fillmore;21-05-2008
2;Ronald;McKinley;15-08-2008
3;Ulysses;Roosevelt;05-10-2008
4;Harry;Harrison;23-11-2007
5;Lyndon;Garfield;19-07-2007
6;James;Quincy;15-07-2008
7;Chester;Jackson;26-02-2008
8;Dwight;McKinley;16-07-2008
9;Jimmy;Johnson;23-12-2007
10;Herbert;Fillmore;03-04-2008
このシナリオに沿って作業をする前に、使用するHadoopディストリビューションへの適切なアクセス権限と許可があることをご確認ください。その後、次の手順に従ってください。