ジョブを設定
手順
- [Palette] (パレット)からtFileInputDelimited、tMatchPredict、およびtFileOutputDelimitedのコンポーネントをデザインワークスペースにドロップします。
- [Main] (メイン)リンクを使用してtFileInputDelimitedをtMatchPredictに接続します。
- [Suspect duplicates]リンクを使用してtMatchPredictをtFileOutputDelimitedに接続します。
- ソースデータの疑わしいペアと疑わしいサンプルを計算に従って、[Run] (実行)>[Spark configuration] (Spark設定) ビューで、Sparkクラスターと有効化されたチェックポイントへの接続が定義されていることを確認します。