Sélectionner les enregistrements des salaires supérieurs à la moyenne à l'aide d'un Job Map/Reduce
Ce scénario s'applique uniquement aux solutions Talend avec Big Data.
Pour plus de technologies supportées par Talend, consultez Composants Talend.
Ce scénario présente un Job à six composants, créé pour calculer le salaire moyen d'un jeu de données d'exemple et sélectionner les salaires supérieurs à la moyenne.
Les données d'exemple à utiliser sont déjà stockées dans le système HDFS à utiliser et se présentent comme suit :
1 Lyndon 1200
2 Ronald 3500
3 Ulysses 5000
4 Harry 2000
5 Garfield 1800
6 James 3300
7 Chester 4200
8 Dwight 2200
9 Jimmy 2800
10 Herbert 3500
Le séparateur utilisé pour séparer les champs est /t et les trois colonnes des données d'exemple sont id, name et salary.
Vous pouvez utiliser le composant tHDFSOutput pour écrire les données d'exemple dans le système HDFS à utiliser. Pour plus d'informations, consultez tHDFSOutput.