2つのフォルダー間で重複するファイルを見つける
このシナリオでは、2つのフォルダー内のファイルで反復しているジョブについて説明します。反復の結果をデータフローに変換し、ファイル名のリストを取得し、リストからすべての重複をピックアップし、[Run] (実行)コンソール上に表示します。これはたとえば、2つのフォルダーをマージする前のプレパレーションステップとして行うものです。
コンポーネントをドロップしてリンク
Procedure
- [Palette] (パレット)から、2つのtFileListコンポーネント、2つのtIterateToFlowコンポーネント、2つのtFileOutputDelimitedコンポーネント、1つのtFileInputDelimitedコンポーネント、1つのtUniqRowコンポーネント、および1つのtLogRowコンポーネントをデザインワークスペースにドロップします。
- [Row] (行) > [Iterate] (反復処理)接続を使って最初のtFileListコンポーネントを最初のtIterateToFlowコンポーネントにリンクし、[Row] (行) > [Main] (メイン)接続を使って最初のtIterateToFlowコンポーネントを最初のtFileOutputDelimitedコンポーネントに接続して、最初のサブジョブを作成します。
- [Row] (行) > [Iterate] (反復処理)接続を使って2番目のtFileListコンポーネントを2番目のtIterateToFlowコンポーネントにリンクし、[Row] (行) > [Main] (メイン)接続を使って2番目のtIterateToFlowコンポーネントを2番目のtFileOutputDelimitedコンポーネントに接続して、2番目のサブジョブを作成します。
- [Row] (行) > [Main] (メイン)接続を使ってtFileInputDelimitedコンポーネントをtUniqRowコンポーネントにリンクし、[Row] (行) > [Duplicates] (重複)接続を使ってtUniqRowコンポーネントをtLogRowコンポーネントに接続して、3番目のサブジョブを作成します。
- 連続して次々にトリガーされるように、[Trigger] (トリガー) > On Subjob Ok接続を使って3つのサブジョブをリンクし、ジョブ内でのロールを識別しやすくするために、コンポーネントにラベルを付けます。