メイン コンテンツをスキップする
補完的コンテンツへスキップ
Qlik.com
Community
Learning
日本語 (変更)
Deutsch
English
Français
日本語
中文(中国)
閉じる
ドキュメント
Qlik Talend ドキュメンテーション
リリース ノート
インストールとアップグレード
データ統合
管理と実行
データ品質とガバナンス
アプリケーションと API 統合
追加のリソース
API ドキュメンテーション ポータル
セキュリティ ポータル
Talend アーカイブ
Qlik ヘルプ
Getting Started
Getting started with Talend cloud
Talend Cloud
Talend Cloud API Designer
Talend Cloud Data Inventory
Talend Cloud Data Preparation
Talend Cloud Data Stewardship
Talend Cloud Pipeline Designer
Talend Cloud API Services Platform
Getting started with Talend on premises
Talend Data Fabric
Talend Data Preparation
Talend Data Stewardship
Qlik ヘルプに移動
日本語 (変更)
Deutsch
English
Français
日本語
中文(中国)
検索
ヘルプを検索
メニュー
閉じる
ヘルプを検索
こちらにフィードバックをお寄せください
Talendツールを使ってデータマッチング
Survivorshipコンポーネント
シナリオ
重複グループからの最良データの選択によるサバイバーの作成
入力データのグルーピングプロセスの設定
重複レコードのグルーピング
このページ上
手順
手順
tMatchGroup
を右クリックしてコンテキストメニューを開き、
[Configuration Wizard] (設定ウィザード)
を選択します。
ウィザードでは、グループのプレビューを表示したり、同種のマッチング結果を正しく取得するためにコンポーネント設定を調整したりできます。
[Key Definition] (キー定義)
テーブルの下のプラスボタンをクリックして、1行追加します。
この行の
[Input Key Attribute] (入力キー属性)
カラムで、
[acctName]
を選択します。このカラムは、入力データの重複を照合するための参照データとして使用されます。
[Matching Function] (マッチングファンクション)
カラムで、
[Jaro-Winkler]
マッチングアルゴリズムを選択します。
[Match threshold] (マッチングしきい値)
フィールドで、2つのレコードフィールドがマッチングすることを示す数値を入力します。この例では、
0.6
と入力します。
[Chart] (チャート)
をクリックして、このマッチングルールを実行し、ウィザードで結果を表示します。
入力レコードが1つのグループに含まれていない場合は、
0.6
をもっと小さい値に置き換え、
[Chart] (グラフ)
をもう一度クリックして、4件のレコードがすべて同じグループになるまで結果を確認します。
このシナリオのジョブでは、
tRuleSurvivorship
により4件の類似レコードが含まれる1つの重複グループを使用し、1件のサバイバーを作成できるようにしています。この簡単なサンプルは、
tRuleSurvivorship
が他のコンポーネントと連携して最適データを作成する方法について明確にイメージするのに役立ちます。ただし、実際のケースでは、複雑な重複が発生している状況ではるかに多くのデータを処理する必要があり、データをもっと多くのグループに分ける必要があるでしょう。
[OK]
をクリックしてこの
[Configuration wizard] (設定ウィザード)
を閉じると、
tMatchGroup
コンポーネントの
[Basic settings] (基本設定)
ビューに、設定したパラメーターが自動的に入力されます。
[Configuration wizard] (設定ウィザード)
の詳細は、
設定ウィザード
をご覧ください。
このページは役に立ちましたか?
このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。
こちらにフィードバックをお寄せください
前のトピック
入力レコードのセットアップ
次のトピック
サバイバー検証フローの定義