メイン コンテンツをスキップする
補完的コンテンツへスキップ
Qlik.com
Community
Learning
日本語 (変更)
Deutsch
English
Français
日本語
中文(中国)
閉じる
ドキュメント
Qlik Talend ドキュメンテーション
リリース ノート
インストールとアップグレード
データ統合
管理と実行
データ品質とガバナンス
アプリケーションと API 統合
追加のリソース
API ドキュメンテーション ポータル
セキュリティ ポータル
Talend アーカイブ
Qlik ヘルプ
Getting Started
Getting started with Talend cloud
Talend Cloud
Talend Cloud API Designer
Talend Cloud Data Inventory
Talend Cloud Data Preparation
Talend Cloud Data Stewardship
Talend Cloud Pipeline Designer
Talend Cloud API Services Platform
Getting started with Talend on premises
Talend Data Fabric
Talend Data Preparation
Talend Data Stewardship
Qlik ヘルプに移動
日本語 (変更)
Deutsch
English
Français
日本語
中文(中国)
検索
ヘルプを検索
メニュー
閉じる
ヘルプを検索
こちらにフィードバックをお寄せください
Talendツールを使ってデータマッチング
Fuzzy matching
シナリオ
異なるマッチング方法を使用して4つのカラムを比較し、発生した重複を収集
コンポーネントの設定
このページ上
手順
手順
tFileInputDelimited
をダブルクリックして
[Basic settings] (基本設定)
ビューを開き、プロパティを定義します。
[File name] (ファイル名)
の横にある
[...]
ボタンをクリックし、入力データを保持するファイルを参照します。
必要に応じて、
ヘッダー
、
フッター
、および
制限
を設定するために使われます。
このシナリオでは、
[Header] (ヘッダー)
を1に設定します。フッターと処理された行数の制限は設定されていません。
[Edit schema] (スキーマを編集)
をクリックして、ソース区切りファイルのデータストラクチャーを記述できるダイアログボックスを開きます。
このシナリオでは、ソーススキーマは、
ID
、
Status
、
FirstName
、
Email
、
City
、
Initial
、および
ZipCode
の各カラムで構成されます。
tFuzzyUniqRow
をダブルクリックして
[Basic settings] (基本設定)
ビューを表示し、プロパティを定義します。
[Key Attribute] (キー属性)
カラムで、定義されているマッチングメソッド、
名前
、
Eメール
、
都市
、
郵便番号
を使用してチェックするカラムの横にあるチェックボックスをこのサンプルで選択します。
[Matching type ] (マッチングタイプ)
カラムで、選択した各カラムで使用するマッチング方法を設定するために使われます。
この例では、
Leveshtein
は
名前
、
Eメール
、
郵便番号
カラムのマッチング方法として使用され、
[Double Metaphone] (二重メタフォン)
は
都市
カラムのマッチング方法として使用されます。
次に、
Levenshtein
メソッドの最小距離と最大距離を設定するために使われます。この方法では、距離は、エントリーが参照と完全にマッチングするために実行する必要がある文字変更(挿入、削除、置換)の数です。この例では、最小距離は0、最大距離は2になります。これにより、
FirstName
カラム、
Email
カラム、
ZipCode
カラムの完全にマッチングするエントリー、または最大2文字の変更があるエントリーがすべて出力されます。このマッチング方法は、入力データの音声の不一致に基づいているため、
[Double Metaphone] (二重メタフォン)
に設定する最小距離も最大距離もありません。
最初の
tFileOutputExcel
をダブルクリックして
[Basic settings] (基本設定)
ビューを表示し、プロパティを定義します。
宛先のファイル名とシート名を設定し、
[Include Header] (ヘッダーを含める)
チェックボックスをオンにします。
2番目の
tFileOutputExcel
についても同じ操作を行います。
このページは役に立ちましたか?
このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。
こちらにフィードバックをお寄せください
前のトピック
ジョブを設定
次のトピック
ジョブを実行