Pour créer ce Job, vous devez effectuer les quatre étapes suivantes :
Création du Job, configuration du schéma d'entrée et lecture du fichier d'entrée selon le schéma défini.
Définition de la commande activant la fonctionnalité de flux de sortie.
Mapping des données via le composant tMap.
Écriture en sortie du flux de données sélectionné.
Le Job terminé doit ressembler à celui de l'image suivante. Pour consulter les instructions détaillées relatives à la création du Job, lisez les sections suivantes.
Étape 1 : Lire les données d'entrée d'un fichier local
Utilisez le composant tFileInputDelimited pour lire le fichier customers.csv contenant les données d'entrée. Ce composant se trouve dans la famille File/Input de la Palette.
Procédure
Cliquez sur le tFileInputDelimited puis déposez-le dans l'espace de modélisation graphique. Double-cliquez sur ce composant afin d'ouvrir sa vue Basic settings et définir ses propriétés de base.
Cliquez sur le bouton [...] à côté du champ File name/Stream et parcourez votre système jusqu'à votre fichier d'entrée. Vous pouvez également saisir manuellement le chemin d'accès à ce fichier.
Cliquez sur Edit schema pour ouvrir une boîte de dialogue dans laquelle configurer la structure du fichier d'entrée.
Cliquez six fois sur le bouton [+] pour ajouter six colonnes, puis, définissez le Type et le nom des colonnes comme dans la capture d'écran :
Cliquez sur OK pour fermer cette boîte de dialogue.
Étape 2 : Configurer la commande pour activer la fonctionnalité Output Stream
Utilisez le tJava pour définir la commande de création d'un fichier de sortie et un répertoire contenant le fichier de sortie.
Procédure
Cliquez sur le tJava puis déposez-le dans l'espace de modélisation graphique. Double-cliquez sur ce composant afin d'ouvrir sa vue Basic settings et définir ses propriétés simples.
Dans le champ Code, saisissez la commande suivante :
new java.io.File("C:/myFolder").mkdirs();
globalMap.put("out_file",new java.io.FileOutputStream("C:/myFolder/customerselection.txt",false));
Note InformationsConseil :
La commande saisie ci-dessus crée un nouveau répertoire C:/myFolder dans lequel sauvegarder le fichier de sortie customerselection.txt. Vous pouvez personnaliser la commande selon vos besoins.
Reliez le tJava au tFileInputDelimited à l'aide d'un lien Trigger > On Subjob Ok.
Cela déclenche le sous-Job commençant par le tFileInputDelimited lorsque le tJava est correctement exécuté.
Étape 3 : Mapper les données à l'aide du composant tMap
Procédure
Cliquez sur le tMap puis déposez-le dans l'espace de modélisation graphique. Double-cliquez sur ce composant afin d'ouvrir sa vue Basic settings et définir ses propriétés simples.
Cliquez sur le bouton [...] à côté du Map Editor pour ouvrir une boîte de dialogue dans laquelle configurer le mapping.
Cliquez six fois sur le bouton [+] de gauche pour ajouter six colonnes au schéma des données entrantes. Ces colonnes doivent être identiques aux suivantes :
Cliquez sur le bouton [+] à droite pour ajouter un flux de données de sortie.
Sélectionnez New output et cliquez sur OK pour sauvegarder le schéma de sortie.
Le schéma de sortie est vide.
Cliquez sur le bouton [+] sous la table out1 pour ajouter trois colonnes aux données de sortie.
Déposez les colonnes id, CustomerName et CustomerAge de la gauche à la droite, dans leurs lignes respectives.
Cliquez sur OK pour sauvegarder les paramètres.
Étape 4 : Écrire en sortie le flux de données sélectionné
Procédure
Cliquez sur le tFileOutputDelimited puis déposez-le dans l'espace de modélisation graphique. Double-cliquez sur ce composant afin d'ouvrir sa vue Basic settings et définir ses propriétés simples.
Cochez la case Use Output Stream pour activer le champ Output Stream et renseignez le champ Output Stream avec la commande suivante :
(java.io.OutputStream)globalMap.get("out_file")
Note InformationsRemarque :
Vous pouvez personnaliser la commande dans le champ Output Stream en appuyant sur les touches Ctrl+Espace pour utiliser l'autocomplétion et sélectionner des commandes built-in. Vous pouvez également saisir manuellement votre commande. Dans ce scénario, la commande utilisée dans le champ Output Stream appelle la classe java.io.OutputStream pour écrire le flux de données filtré dans un fichier local, spécifié dans la zone Code du tJava.
Reliez le tFileInputDelimited au tMap à l'aide d'un lien Row > Main, puis reliez le tMap au tFileOutputDelimited à l'aide du lien Row > out1 défini dans le Map Editor du tMap.
Cliquez sur le bouton Sync columns afin de récupérer le schéma défini dans le composant précédent.
Cliquez sur le tLogRow puis déposez-le dans l'espace de modélisation graphique. Double-cliquez sur ce composant afin d'ouvrir sa vue Basic settings et définir ses propriétés simples.
Sélectionnez l'option Table dans la zone Mode.
Reliez le tFileOutputDelimited au tLogRow à l'aide d'un lien Row > Main.
Cliquez sur Sync columns pour récupérer le schéma du composant précédent.
Ce Job est maintenant prêt à être exécuté.
Appuyez sur les touches Ctrl+S pour sauvegarder votre Job et appuyez sur F6 pour l'exécuter.
Le contenu de données sélectionnées s'affiche dans la console.
Les données sélectionnées sont également écrites dans le fichier local customerselection.txt.
Cette page vous a-t-elle aidé ?
Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.