Profiling de données et qualité de données
Qu'est-ce que le Talend Data Quality ?
- Les perspectives Profiling et Data Explorer dans lesquelles vous pouvez analyser des données, parcourir et interroger les résultats des analyses.
- La perspective Integration dans laquelle vous pouvez accéder à un ensemble de composants et routines dédiés à la qualité de données. Cela vous permet d'embarquer des fonctionnalités de nettoyage de données dans vos processus de transformation/intégration de données.
- Dans la perspective Integration, vous avez accès à des centaines de composants couvrant tous les besoins en intégration de données, ainsi que de nombreux composants de qualité de données utilisés pour nettoyer les données.
Pour plus d'informations concernant ces composants spécifiques à la qualité de données, consultez Composants de qualité de données (Data Quality).
Cette fonctionnalité n'est pas intégrée par défaut dans votre Studio Talend. Vous devez l'installer à l'aide du gestionnaire des fonctionnalités. Pour plus d'informations, consultez Installer les fonctionnalités à l'aide du Gestionnaire des fonctionnalités.
Fonctions de base
Référentiel des métadonnées
À l'aide de la solution de qualité de données Talend, vous pouvez vous connecter à des sources de données pour analyser leur structure (catalogues, schémas et tables) et stocker la description de leurs métadonnées dans son référentiel de métadonnées. Vous pouvez utiliser ces métadonnées pour définir des métriques et des indicateurs.
Pour plus d'informations, consultez Créer des connexions aux différentes sources de données.
Une fonction intéressante est la base de données de rapports, dans laquelle vous pouvez garder un historique des rapports créés et partager les résultats avec les membres de votre équipe. Pour plus d'informations, consultez Gestion de la base de données de rapports.
Modèles et indicateurs
- Les expressions régulières, qui sont des modèles réguliers prédéfinis.
- Les modèles SQL qui sont les modèles que vous ajoutez à l'aide de clauses LIKE.
Pour plus d'informations concernant les modèles, consultez Modèles.
- les indicateurs système, la liste d'indicateurs prédéfinis,
- les indicateurs personnalisés, la liste des indicateurs définis par l'utilisateur·trice.
Pour plus d'informations concernant les indicateurs, consultez Indicateurs.