データクオリティルールとは
データクオリティルールとは、データセット内にある異常の検出に役立つビジネス要件のセットのことです。
データが準拠する必要のある値を定義します。一部のデータにのみデータクオリティルールを適用するように条件を追加できます。
データクオリティルールはテンプレートとして動作します。
- データクオリティルールをスタンドアロンオブジェクトとして作成します。ルールを定義する時に、変数と特定の値を使用できます。
データクオリティルールは汎用なので、変数とデータモデルの属性を関連付けることで各データセットにルールを適応させることができます。
特定値の場合は、ルールを適用した全データセットで同じ値を使用できます。
- データクオリティルールを適用し、フィールドに応じて変更します。
データクオリティルールの変数とフィールドを関連付けます。あるフィールドにルールを適用すれば、他のフィールドのデータを検証できます。
- データクオリティルールは値を分類して、データを検証します。
- 値は有効です。ルールステートメントをすべて満たしています。
- 値は適用できません。条件を満たしておらず、代替の検証式が定義されていません。
- 値は無効です。条件式は満たしていますが、検証式は満たしていないか、これらの値でルールを実行できません。たとえば、ルールが文字列と数値を比較する必要がある場合に発生します。
データクオリティルールは、データセットのクオリティとTalend Trust Scoreに影響します。
1つのデータセットのクオリティに対する影響については、以下をご覧ください。
データコンソールタブでの全体的なクオリティに対する影響については、以下をご覧ください。