tDQRules/tDataQualityRules
Ce composant valide des données à l'aide de règles de qualité de données en connectant le Studio Talend à Qlik Talend Data Integration ou à une application Talend.
- Qlik Talend Data Integration.
- Talend Cloud Data Inventory.
- Talend Cloud Data Stewardship.
- la version hybride 8.0 R2022-07 ou supérieure de Talend Data Stewardship.
Pour les Jobs Apache Spark, vous pouvez utiliser le tDataQualityRules uniquement avec les applications Talend.
Pour plus d'informations sur chaque application, consultez la documentation associée :
- Pour Qlik Talend Data Integration, consultez Utilisation de règles de validation dans la documentation Qlik Cloud.
- Pour Talend Cloud Data Stewardship, consultez Qu'est-ce qu'une règle de qualité de données ? dans le Guide d'utilisation de Talend Cloud Data Stewardship.
- Pour la version hybride de Talend Data Stewardship en version 8.0 R2022-07 ou supérieure, consultez Qu'est-ce qu'une règle de qualité de données ? dans le Guide d'utilisation de Talend Data Stewardship. Pour plus d'informations concernant la version hybride, consultez Qu'est-ce que l'hybride pour Talend Cloud ?.
- Pour Talend Cloud Data Inventory, consultez Qu'est-ce qu'une règle de qualité de données ? dans le Guide d'utilisation de Talend Cloud Data Inventory. Vous pouvez vous connecter à cette application dans le Studio Talend en version 8.0 R2023-06 ou supérieure.
Une règle de qualité de données est un ensemble de prérequis métier définissant les valeurs auxquelles vos données doivent être conformes.
Pour récupérer les règles de qualité de données dans un fichier JAR, le tDQRules connecte le Studio Talend à l'une des applications listées ci-dessus. Le Studio Talend utilise la bibliothèque récupérée pour que vous puissiez appliquer les règles de qualité de données à vos données. Pour plus d'informations concernant le fonctionnement du composant avec les applications Talend, consultez Description des processus local, hybride et Cloud.
Le tableau suivant présente les catégories et sous-catégories dans lesquelles le composant retourne les données :
| Catégories de sortie | tDataQualityRules | tDQRules |
|---|---|---|
| Valid Ces données suivent le flux Main. |
|
Les données sont conformes à la condition et à l'expression de validation ou les données sont conformes uniquement à l'expression de validation alternative. |
| Invalide Ces données suivent le flux Reject. |
|
. |
| Non applicable Ces données suivent le flux Not_Applicable. |
Non applicable à ce composant | Les données ne remplissent pas la condition. La règle ne peut être appliquée aux données. |
Ce composant n'est pas intégré par défaut à votre Studio Talend. Vous devez l'installer à l'aide du gestionnaire des fonctionnalités. Pour plus d'informations, consultez Installer les fonctionnalités à l'aide du Gestionnaire des fonctionnalités.
Vous avez besoin de Qlik Talend Cloud Enterprise Edition pour utiliser le composant tDQRules/tDataQualityRules.
- En mode local, Apache Spark 3.0 et supérieures.
- Le service Cloudera Data Engineering avec Apache Spark 3.1 ou 3.2.
Les propriétés Standards.
Ces propriétés sont utilisées pour configurer le tDQRules et le tDataQualityRules s'exécutant dans le framework de Jobs Standard.
Le composant tDQRules Standard et le composant tDataQualityRules Standard appartiennent à la famille Qualité de données.
Si vous utilisez le composant tDataQualityRules, consultez Basic settings (Paramètres simples) du tDataQualityRules . Ce composant a été combiné au tDQRules en version 8.0 R2025-06 du Studio Talend mais les propriétés du tDataQualityRules sont les mêmes. Elles ne dépendent pas de la version que vous utilisez.
Basic settings (Paramètres simples) du tDQRules
| Propriétés | Description |
|---|---|
| Cloud | Sélectionnez l'application de laquelle vous souhaitez récupérer les règles :
Cliquez sur Apply pour activer davantage de paramètres. Si vous avez sélectionné le composant Talend Cloud Data Inventory ou Stewardship, vous utilisez le composant tDataQualityRules. Consultez Basic settings (Paramètres simples) du tDataQualityRules . |
|
Property Type |
Sélectionnez la manière dont le chemin d'accès au fichier et le schéma seront configurés.
|
| Schema et Edit schema |
Un schéma est une description de lignes, il définit le nombre de champs (colonnes) qui sont traités et passés au composant suivant. Cliquez sur Sync columns pour récupérer le schéma du composant précédent dans le Job. Sélectionnez le type de schéma dans la liste Schema :
Créez le schéma en cliquant sur le bouton Edit Schema. Si le schéma est en mode Repository, trois options sont disponibles : View schema : sélectionnez cette option afin de voir uniquement le schéma. Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales. Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Les types supportés sont : Boolean, Date, Double, Dynamic, Float, Integer, Long, Short et String. |
| URL |
Note InformationsImportant : Vous avez besoin de l'autorisation Rules - View pour récupérer les règles.
Saisissez l'URL de l'application. Par exemple, https://qcs.us.qlikcloud.com/. |
| API key | Saisissez votre clé API. Pour en générer une, consultez Génération de clés API. |
| Rule library timestamp | Après avoir saisi l'URL et le jeton, cliquez sur Fetch rules (Récupérer les règles). Si l'URL et le jeton sont corrects, les règles sont récupérées dans le Studio Talend : yyyy-MM-dd hh:mm:ss (library_number). Lorsque vous cliquez sur Fetch rules (Récupérer les règles), un fichier JAR contenant la définition de la règle est créé dans :
Lorsque vous mettez les règles à jour dans l'application, cliquez sur Fetch rules (Récupérer les règles) pour récupérer leur dernière version. |
| Rule name |
Sélectionnez la règle dans la liste et cliquez sur Refresh table. |
| Rule content |
Associez les variables de la règle aux données d'entrée. La règle est récupérée depuis la bibliothèque :
Lorsqu'aucune règle ou colonne d'entrée n'est disponible, vérifiez que :
|
Basic settings (Paramètres simples) du tDataQualityRules
| Propriétés | Description |
|---|---|
| Cloud |
Cette option est disponible à partir de la version 8.0 R2025-06 du Studio Talend. Sélectionnez l'application de laquelle vous souhaitez récupérer les règles :
Cliquez sur Apply pour activer davantage de paramètres. Si vous avez sélectionné Qlik Talend Cloud Data Integration, vous utilisez le tDQRules. Consultez Basic settings (Paramètres simples) du tDQRules . |
| Schema et Edit schema |
Un schéma est une description de lignes, il définit le nombre de champs (colonnes) qui sont traités et passés au composant suivant. Cliquez sur Sync columns pour récupérer le schéma du composant précédent dans le Job. Sélectionnez le type de schéma dans la liste Schema :
Créez le schéma en cliquant sur le bouton Edit Schema. Si le schéma est en mode Repository, trois options sont disponibles : View schema : sélectionnez cette option afin de voir uniquement le schéma. Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales. Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Les types supportés sont : Boolean, Date, Double, Dynamic, Float, Integer, Long, Short et String. |
| Application | Sélectionnez l'application de laquelle vous souhaitez récupérer les règles de qualité de données. |
| URL |
Note InformationsImportant : Vous avez besoin de l'autorisation Rules - View pour récupérer les règles.
Saisissez l'URL de l'application sélectionnée. Par exemple, https://qcs.us.qlikcloud.com/ pour Qlik Talend Data Integration. Pour les applications Talend, les URL suivantes sont supportées :
|
| Token | Saisissez votre jeton. Pour en générer un, consultez Générer un jeton d'accès personnel. |
| DQ rule library timestamp | Après avoir saisi l'URL et le jeton, cliquez sur Refresh. Si l'URL et le jeton sont corrects, les règles sont récupérées dans le Studio Talend : yyyy-MM-dd hh:mm:ss (library_number). Lorsque vous cliquez sur Fetch rules (Récupérer les règles), un fichier JAR contenant la définition de la règle est créé dans :
Lorsque vous mettez à jour les règles dans une application Cloud ou hybride, cliquez sur Refresh (Actualiser) pour récupérer la dernière version. |
| Configure DQ rules | Associez les variables de la règle aux données d'entrée. Les règles sont récupérées depuis la bibliothèque :
Si aucune règle ou colonne d'entrée n'est disponible, vérifiez que :
Vous pouvez associer les types de données du Studio Talend à certains types de données des applications. Consultez Associer des types de données. Pour appliquer plus de règles, cliquez sur |
Associer des types de données
| Variable de règle provenant de l'application* | Colonne d'entrée (depuis Studio Talend) |
|---|---|
| Nombre | Double, Float, Integer, Long, Short et String |
| Booléen | Booléen |
| Text | Chaîne de caractères |
| Date | Date |
| N'importe quel type de données supporté dans l'application | Dynamic |
|
* Vous pouvez saisir l'URL de :
|
|
Paramètres avancés
| Propriétés | Description |
|---|---|
| tStatCatcher Statistics |
Cochez cette case pour collecter les métadonnées de traitement du Job, aussi bien au niveau du Job qu'au niveau de chaque composant. |