メイン コンテンツをスキップする
補完的コンテンツへスキップ
Qlik.com
Community
Learning
Qlik リソース
日本語 (変更)
Deutsch
English
Français
日本語
中文(中国)
閉じる
ドキュメント
クラウド
Client-Managed
追加のドキュメント
クラウド
Qlik Cloud
ホーム
紹介
Qlik Cloud の新機能
Qlik Talend Cloud について
分析
データ統合
管理
自動化
開発
他のクラウド ソリューション
Talend Cloud
Talend API Portal
Stitch
Upsolver
Client-Managed
クライアント管理 — 分析
管理者向け
Qlik Sense
開発者向け
Qlik Sense
Qlik NPrinting
Connectors
Qlik GeoAnalytics
Qlik Alerting
ユーザーと管理者向けの
QlikView
開発者向け
QlikView
Governance Dashboard
クライアント管理 — データ統合
Qlik Replicate
Qlik Compose
Qlik Enterprise Manager
Qlik Gold Client
Qlik Catalog
NodeGraph (legacy)
Talend Studio
Talend ESB
Talend Administration Center
Talend Data Catalog
Talend Data Preparation
Talend Data Stewardship
追加のドキュメント
追加のドキュメント
Qlik ドキュメンテーション アーカイブ
Talend ドキュメンテーション アーカイブ
Qlik Talend 製品のヘルプを検索
オンボーディング
分析を開始
分析ユーザーのオンボーディング
Qlik Sense で分析を開始
Qlik Cloud Analytics Standard の管理
Qlik Cloud Analytics Premium および Enterprise の管理
Qlik Sense
Business
の管理
Qlik Sense
Enterprise SaaS
の管理
Qlik Cloud Government を管理
Windows 上の
Qlik Sense
Enterprise
の管理
ビデオ
移行センター
評価ガイド
Qlik リソース
Qlik ヘルプに移動
日本語 (変更)
Deutsch
English
Français
日本語
中文(中国)
検索
SearchUnify の検索をロード中
製品に関するサポートが必要な場合は、Qlik Support にお問い合わせください。
Qlik Customer Portal
メニュー
閉じる
SearchUnify の検索をロード中
製品に関するサポートが必要な場合は、Qlik Support にお問い合わせください。
Qlik Customer Portal
こちらにフィードバックをお寄せください
Talendツールを使ってデータマッチング
Fuzzy matching
シナリオ
異なるマッチング方法を使用して4つのカラムを比較し、発生した重複を収集
コンポーネントの設定
このページ上
手順
手順
tFileInputDelimited
をダブルクリックして
[Basic settings] (基本設定)
ビューを開き、プロパティを定義します。
[File name] (ファイル名)
の横にある
[...]
ボタンをクリックし、入力データを保持するファイルを参照します。
必要に応じて、
ヘッダー
、
フッター
、および
制限
を設定するために使われます。
このシナリオでは、
[Header] (ヘッダー)
を1に設定します。フッターと処理された行数の制限は設定されていません。
[Edit schema] (スキーマを編集)
をクリックして、ソース区切りファイルのデータストラクチャーを記述できるダイアログボックスを開きます。
このシナリオでは、ソーススキーマは、
ID
、
Status
、
FirstName
、
Email
、
City
、
Initial
、および
ZipCode
の各カラムで構成されます。
tFuzzyUniqRow
をダブルクリックして
[Basic settings] (基本設定)
ビューを表示し、プロパティを定義します。
[Key Attribute] (キー属性)
カラムで、定義されているマッチングメソッド、
名前
、
Eメール
、
都市
、
郵便番号
を使用してチェックするカラムの横にあるチェックボックスをこのサンプルで選択します。
[Matching type ] (マッチングタイプ)
カラムで、選択した各カラムで使用するマッチング方法を設定するために使われます。
この例では、
Leveshtein
は
名前
、
Eメール
、
郵便番号
カラムのマッチング方法として使用され、
[Double Metaphone] (二重メタフォン)
は
都市
カラムのマッチング方法として使用されます。
次に、
Levenshtein
メソッドの最小距離と最大距離を設定するために使われます。この方法では、距離は、エントリーが参照と完全にマッチングするために実行する必要がある文字変更(挿入、削除、置換)の数です。この例では、最小距離は0、最大距離は2になります。これにより、
FirstName
カラム、
Email
カラム、
ZipCode
カラムの完全にマッチングするエントリー、または最大2文字の変更があるエントリーがすべて出力されます。このマッチング方法は、入力データの音声の不一致に基づいているため、
[Double Metaphone] (二重メタフォン)
に設定する最小距離も最大距離もありません。
最初の
tFileOutputExcel
をダブルクリックして
[Basic settings] (基本設定)
ビューを表示し、プロパティを定義します。
宛先のファイル名とシート名を設定し、
[Include Header] (ヘッダーを含める)
チェックボックスをオンにします。
2番目の
tFileOutputExcel
についても同じ操作を行います。
このページは役に立ちましたか?
このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。
こちらにフィードバックをお寄せください
前のトピック
ジョブを設定
次のトピック
ジョブを実行