Gérer les classes de données
La classification de données vous permet de détecter, de comprendre et de classifier la nature et l'objectif des éléments contenus dans les sources de données importées dans votre catalogue.
Vous pouvez classifier des objets importés avec des termes du glossaire afin de définir ces éléments techniques en des termes métiers compréhensibles de tous·tes. La classification de données peut également vous permettre de trouver des relations cachées entre ces objets.
Talend Data Catalog vous permet d'automatiser les processus d'identification et de classification de données à l'aide de la capacité de profiling de données et des classes de données. Cela vous permet de protéger automatiquement les données sensibles.
Vous pouvez voir et gérer les classes de données existantes et en créer de nouvelles depuis
.Types des classes de données
- Les classes de données détectées détectent automatiquement la nature des données en se basant sur une énumération, des motifs et des expressions régulières prédéfinies. La classification de données détectées utilise la capacité de profiling et d'échantillonnage de données.
- Les classes de métadonnées détectées détectent les classes par attributs de métadonnées. Elles vous assistent dans la détection de données ne pouvant être identifiées avec la classification de données détectées, comme la date de naissance qui n'a pas de modèles de données uniques. La classification de métadonnées détectées fonctionne grâce à la capacité MQL.
- Les classes composées sont basées sur plusieurs classes de métadonnées détectées et de données détectées.
Vous pouvez utiliser ces classes de données pour profiler et rapprocher les critères de masquage des données sensibles. Les classes de données et métadonnées détectées partagent la même infrastructure pour PII et le masquage de données.
Classifications de données et de métadonnées détectées
La classification de données détectées détecte automatiquement les modèles de données fréquents. Elle est moins centrée sur l'apport de définitions.
La classification de métadonnées détectées apporte des définitions générales et faisant autorité. Elle est plus flexible mais moins précise que la classification de données détectées.
Classifications de données pour les objets importés
- une définition ou une classification de données détectées,
- plusieurs classifications de métadonnées détectées (relations avec les termes métier),
- plusieurs classifications de données proposées, approuvées et attribuées (relations avec des classes de données).
Il est recommandé d'être aussi précis·e que possible avec les classifications de données et d'avoir une classification approuvée ou attribuée pour un objet importé.
Lignage du flux sémantique
Talend Data Catalog utilise les classifications de données et de métadonnées pour implémenter des lookups de la définition déduite et des éléments liés pour le lignage du flux sémantique.