メイン コンテンツをスキップする 補完的コンテンツへスキップ

一致分析を作成

一致分析では、ブロッキングキーやマッチングキー、およびサバイバーシップルールを使ってデータベース内または区切り付きファイル内のカラムのセットを比較し、類似するレコードのグループを作成できます。

始める前に

Metadataノードの下で、データベースかファイル接続が少なくとも1つ定義されていること。

このタスクについて

この分析によって、マッチングルールを作成してデータでテストし、重複値の数を評価できるようになります。マッチングルールは同じテーブル内のカラムに対してのみテストできます。

手順

  1. Talend Studioのツリービューの[Metadata] (メタデータ)フォルダーの下で定義されている接続がない場合は、エディター内からデータソースへの接続を作成する。
    詳細は、一致分析を設定をご覧ください。
  2. 一致プロセスを使用して、類似するレコードを検索したいテーブルまたはカラムのグループを定義する。
  3. ブロッキングキーを定義して、比較が必要なペアの数を減らす。
    詳細は、マッチングルールを定義をご覧ください。
  4. グルーピングする類似のレコードに基づいて、マッチングキーと一致メソッドを定義する。詳細は、マッチングルールを定義をご覧ください。
  5. 一致分析エディターからマッチングルールをエクスポートして、Talend Studioリポジトリーで一元管理する。
  6. 一致分析に基づいてレポートを生成し、遠隔データベースで保存する。これらのレポートを使って現在の統計と過去の統計を比較することで、データの進化を判断できます。詳細は、レポートをご覧ください。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。