既存のセマンティックタイプをアップデート
Talend Dictionary Serviceで既存のセマンティックタイプを編集し、Talend Data Preparationでのデータ検証方法に影響を与えることができます。
Talend Data Preparationの事前定義済みセマンティックタイプは標準値に基づいていますが、独自のデータに合わせてセマンティックタイプを調整する必要があります。事前定義済みカテゴリーに入ると思われる一部のデータは、無効と見なされる可能性があります。
ここで、メールアドレス、生年月日、居住国を示す顧客リストが含まれているデータセットの例に注目してみましょう。Americaのエントリーがすべて無効と見なされていることがわかります。これは有効な国名ではありませんが、自分の会社で使用されているので有効な値としたいと考えています。
ここで問題となるのは、Americaは、Talend Data Preparationのcountryセマンティックタイプで期待されている値の1つではないという点です。この場合に有効なエントリーは、United StatesとUnited States of Americaのいずれかです。
今後この問題を回避できるよう、Talend Dictionary Serviceのcountryセマンティックタイプをアップデートし、有効なエントリーのリストにAmericaを追加します。この変更は、Talend Data Preparationで自動的に使用可能になります。
手順
タスクの結果
countryセマンティックタイプは、新しい値をサポートするように手動でアップデートされています。
今後、countryセマンティックタイプに一致するデータを処理する場合は、Americaも有効な値と見なされます。