Trouver des fichiers dupliqués entre deux dossiers
Le scénario suivant décrit un Job qui fait une boucle sur deux dossiers, transforme les résultats de l'itération en flux de données afin d'obtenir une liste de noms de fichiers puis affiche les doublons dans la console Run.
Déposer et relier les composants
Procedure
- Déposez les composants suivants de la Palette dans l'espace de modélisation graphique : deux tFileList, deux tIterateToFlow, deux tFileOutputDelimited, un tFileInputDelimited, un tUniqRow et un tLogRow.
- Reliez le premier tFileList au premier tIterateToFlow à l'aide d'un lien Row > Iterate et reliez le premier tIterateToFlow au premier tFileOutputDelimited à l'aide d'un lien Row > Main afin de former le premier sous-Job.
- Reliez le second tFileList au second tIterateToFlow à l'aide d'un lien Row > Iterate et reliez le second tIterateToFlow au second tFileOutputDelimited à l'aide d'un lien Row > Main afin de former le deuxième sous-Job.
- Reliez le tFileInputDelimited au tUniqRow à l'aide d'un lien Row > Main et reliez le tUniqRow au tLogRow à l'aide d'un lien Row > Duplicates afin de former le troisième sous-Job.
- Reliez les trois sous-Jobs à l'aide de liens Trigger > On Subjob Ok afin qu'ils soient déclenchés l'un après l'autre. Nommez ensuite les composants afin de mieux identifier leur rôle dans le Job.