データを標準化
マッチングタスクを実行する前にデータを標準化させることは、マッチング精度を向上させるために不可欠なステップです。
Talendは、データを標準化するうえでさまざまな方法を提供しています。
- データはインデックスに対して標準化できます。シノニムは標準化されるか、「マスター」ワードに変換されます。
利用できるデータシノニムディクショナリーの詳細は、データシノニムディクショナリーをご覧ください。
- 住所検証コンポーネントを使用すれば、Experian QAS、Loqate、MelissaDataといった各検証ツールに対して住所データを標準化させることができます。これらのツールによって返される住所には一貫性があり、住所表現のバリエーションは排除されます。住所が標準化されればマッチングが容易になります。
tQASBatchAddressRow、tLoqateAddressRow、tMelissaDataAddressという各コンポーネントの詳細は、Address standardizationをご覧ください。
- tStandardizePhoneNumberコンポーネントを使用すれば、発信国の書式規則に基づいて電話番号を標準化できます。
電話番号の標準化の詳細は、Phone number standardizationをご覧ください。
- よりジェネリックなその他のコンポーネント(tReplace、tReplaceList、tVerifyEmail、tExtractRegexFields、tMapなど)を使ってデータを変換すれば、より標準的なレコードを取得できます。