データクラスを割り当て
データ分類は、カタログにインポートされたデータソースに含まれているエレメントの性質と目的を検出、理解、分類するのに役立ちます。
データクラスを割り当てることで、同じデータクラスを持つオブジェクトを分類して操作できるようになります。
Talend Data Catalogでは、データクラスの種類がいくつか提供されています。
データベース内のカラムやファイル内のフィールドなどのオブジェクトには、データクラスを使って手動でタグ付けできます。Talend Data Catalogはデータクラスの割り当てを提案することもできます。- データ検出クラスは、事前定義済みの列挙、パターン、正規表現に基づいてデータの性質を自動的に検出します。データ検出分類では、データサンプリングとデータプロファイリングの機能を使います。
- メタデータ検出クラスはメタデータ属性でクラスを検出します。データ検出分類では特定できないデータ(一意なデータパターンを持たない生年月日など)を検出するのに役立ちます。メタデータ検出分類では、MQL機能が活用されています。
- 複合クラスは、複数のメタデータ検出クラスおよびデータ検出クラスに基づいています。
始める前に
- [Data Classification Editing] (データ分類の編集)機能を持つオブジェクトロールが割り当てられていること。
- オプションとして、メタデータのインポート中にデータのサンプリングとプロファイリングが有効になっており、設定済みであること。