メイン コンテンツをスキップする

重複値を分析

Talend StudioProfilingパースペクティブで一致分析を使用して、データベースまたは区切り付きファイルのカラムを比較し、VSRまたはT-Swooshアルゴリズムを使って類似レコードのグループを作成できます。

この分析を使うと、シンプルな方法でマッチングルールを作成してカラムのセットでテストでき、結果をエディターに直接表示できます。データでマッチングルールのテストが終わったら、エディターからエクスポートしてTalend Studioリポジトリーに保存し、tMatchGrouptRecordMatchingtGenKey、Hadoopなどの一致コンポーネントにインポートすれば、後で使用できるようになります。

また、Profilingパースペクティブを使い、マッチングルールエディターでマッチングルールを定義してTalend Studioリポジトリーに保存することもできます。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。