Accéder au contenu principal Passer au contenu complémentaire

tDQRules/tDataQualityRules

Ce composant valide des données à l'aide de règles de qualité de données en connectant le Studio Talend à Qlik Talend Data Integration ou à une application Talend.

Note InformationsAvertissement : À partir du Studio Talend 8.0 R2025-06, le composant tDataQualityRules est remplacé par le tDQRules. Ce composant vous permet d'utiliser les règles depuis :
  • Qlik Talend Data Integration.
  • Talend Cloud Data Inventory.
  • Talend Cloud Data Stewardship.
  • la version hybride 8.0 R2022-07 ou supérieure de Talend Data Stewardship.

Pour les Jobs Apache Spark, vous pouvez utiliser le tDataQualityRules uniquement avec les applications Talend.

Pour plus d'informations sur chaque application, consultez la documentation associée :

Une règle de qualité de données est un ensemble de prérequis métier définissant les valeurs auxquelles vos données doivent être conformes.

Pour récupérer les règles de qualité de données dans un fichier JAR, le tDQRules connecte le Studio Talend à l'une des applications listées ci-dessus. Le Studio Talend utilise la bibliothèque récupérée pour que vous puissiez appliquer les règles de qualité de données à vos données. Pour plus d'informations concernant le fonctionnement du composant avec les applications Talend, consultez Description des processus local, hybride et Cloud.

Le tableau suivant présente les catégories et sous-catégories dans lesquelles le composant retourne les données :

Catégories de sortie tDataQualityRules tDQRules
Valid

Ces données suivent le flux Main.

  • Valide : Les données sont conformes à la condition et à l'expression de validation ou les données sont conformes uniquement à l'expression de validation alternative.
  • Non applicable (NA) : les données ne remplissent pas la condition. La règle ne peut être appliquée aux données.
Les données sont conformes à la condition et à l'expression de validation ou les données sont conformes uniquement à l'expression de validation alternative.
Invalide

Ces données suivent le flux Reject.

  • Invalide : Les données sont conformes à la condition mais pas à l'expression de validation.
  • Non exécutable (NE) : La règle ne peut être exécutée sur les données. Par exemple, lorsque les types de données ne correspondent pas.
  • Invalide : Les données sont conformes à la condition mais pas à l'expression de validation.
  • Non exécutable (NE) : La règle ne peut être exécutée sur les données. Par exemple, lorsque les types de données ne correspondent pas.
  • Lorsqu'il n'y a aucun résultat, cela signifie qu'il n'y a aucun résultat à retourner

.

Non applicable

Ces données suivent le flux Not_Applicable.

Non applicable à ce composant Les données ne remplissent pas la condition. La règle ne peut être appliquée aux données.

Ce composant n'est pas intégré par défaut à votre Studio Talend. Vous devez l'installer à l'aide du gestionnaire des fonctionnalités. Pour plus d'informations, consultez Installer les fonctionnalités à l'aide du Gestionnaire des fonctionnalités.

Vous avez besoin de Qlik Talend Cloud Enterprise Edition pour utiliser le composant tDQRules/tDataQualityRules.

Le composant tDataQualityRules Apache Spark supporte :
  • En mode local, Apache Spark 3.0 et supérieures.
  • Le service Cloudera Data Engineering avec Apache Spark 3.1 ou 3.2.

Les propriétés Standards.

Ces propriétés sont utilisées pour configurer le tDQRules et le tDataQualityRules s'exécutant dans le framework de Jobs Standard.

Le composant tDQRules Standard et le composant tDataQualityRules Standard appartiennent à la famille Qualité de données.

Note InformationsImportant :

Si vous utilisez le composant tDataQualityRules, consultez Basic settings (Paramètres simples) du tDataQualityRules . Ce composant a été combiné au tDQRules en version 8.0 R2025-06 du Studio Talend mais les propriétés du tDataQualityRules sont les mêmes. Elles ne dépendent pas de la version que vous utilisez.

Basic settings (Paramètres simples) du tDQRules

Propriétés Description
Cloud Sélectionnez l'application de laquelle vous souhaitez récupérer les règles :
  • Qlik Talend Cloud Data Integration
  • Talend Cloud Data Inventory ou Stewardship

Cliquez sur Apply pour activer davantage de paramètres.

Si vous avez sélectionné le composant Talend Cloud Data Inventory ou Stewardship, vous utilisez le composant tDataQualityRules. Consultez Basic settings (Paramètres simples) du tDataQualityRules .

Property Type

Sélectionnez la manière dont le chemin d'accès au fichier et le schéma seront configurés.

  • Built-In : le chemin d'accès au fichier et le schéma seront configurés localement pour ce composant.

  • Repository : Les détails du fichier stocké centralement dans le Repository > Metadata seront réutilisés par ce composant.

    Vous devez cliquer sur le bouton [...] et, dans la boîte de dialogue Repository Content qui s'ouvre, sélectionnez le fichier à réutiliser. Toutes les propriétés relatives seront automatiquement renseignées.

Schema et Edit schema

Un schéma est une description de lignes, il définit le nombre de champs (colonnes) qui sont traités et passés au composant suivant.

Cliquez sur Sync columns pour récupérer le schéma du composant précédent dans le Job.

Sélectionnez le type de schéma dans la liste Schema :
  • Built-in : le schéma est créé et conservé localement pour ce composant seulement.

  • Repository : le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé dans des Jobs et projets.

Créez le schéma en cliquant sur le bouton Edit Schema. Si le schéma est en mode Repository, trois options sont disponibles :

View schema : sélectionnez cette option afin de voir uniquement le schéma.

Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs.

Les types supportés sont : Boolean, Date, Double, Dynamic, Float, Integer, Long, Short et String.

URL
Note InformationsImportant : Vous avez besoin de l'autorisation Rules - View pour récupérer les règles.

Saisissez l'URL de l'application. Par exemple, https://qcs.us.qlikcloud.com/.

API key Saisissez votre clé API. Pour en générer une, consultez Génération de clés API.
Rule library timestamp Après avoir saisi l'URL et le jeton, cliquez sur Fetch rules (Récupérer les règles).

Si l'URL et le jeton sont corrects, les règles sont récupérées dans le Studio Talend : yyyy-MM-dd hh:mm:ss (library_number).

Lorsque vous cliquez sur Fetch rules (Récupérer les règles), un fichier JAR contenant la définition de la règle est créé dans :
studio-path\configuration\.m2\repository\org\talend\libraries\rule-number

Lorsque vous mettez les règles à jour dans l'application, cliquez sur Fetch rules (Récupérer les règles) pour récupérer leur dernière version.

Rule name

Sélectionnez la règle dans la liste et cliquez sur Refresh table.

Rule content

Associez les variables de la règle aux données d'entrée.

La règle est récupérée depuis la bibliothèque :
  • Rule variable : Variable provenant de l'application Cloud.
  • Input column : Colonne d'entrée provenant du Studio Talend.
  • Fact column : Colonne d'entrée provenant du Studio Talend lorsque la colonne est dynamique.
Lorsqu'aucune règle ou colonne d'entrée n'est disponible, vérifiez que :
  • Les règles de qualité de données ont été récupérées dans Rule library timestamp (Horodatage des bibliothèques de règles).
  • Le schéma d'entrée est correct.

Basic settings (Paramètres simples) du tDataQualityRules

Propriétés Description
Cloud

Cette option est disponible à partir de la version 8.0 R2025-06 du Studio Talend.

Sélectionnez l'application de laquelle vous souhaitez récupérer les règles :
  • Qlik Talend Cloud Data Integration
  • Talend Cloud Data Inventory ou Stewardship

Cliquez sur Apply pour activer davantage de paramètres.

Si vous avez sélectionné Qlik Talend Cloud Data Integration, vous utilisez le tDQRules. Consultez Basic settings (Paramètres simples) du tDQRules .

Schema et Edit schema

Un schéma est une description de lignes, il définit le nombre de champs (colonnes) qui sont traités et passés au composant suivant.

Cliquez sur Sync columns pour récupérer le schéma du composant précédent dans le Job.

Sélectionnez le type de schéma dans la liste Schema :
  • Built-in : le schéma est créé et conservé localement pour ce composant seulement.

  • Repository : le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé dans des Jobs et projets.

Créez le schéma en cliquant sur le bouton Edit Schema. Si le schéma est en mode Repository, trois options sont disponibles :

View schema : sélectionnez cette option afin de voir uniquement le schéma.

Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs.

Les types supportés sont : Boolean, Date, Double, Dynamic, Float, Integer, Long, Short et String.

Application Sélectionnez l'application de laquelle vous souhaitez récupérer les règles de qualité de données.
URL
Note InformationsImportant : Vous avez besoin de l'autorisation Rules - View pour récupérer les règles.

Saisissez l'URL de l'application sélectionnée. Par exemple, https://qcs.us.qlikcloud.com/ pour Qlik Talend Data Integration.

Pour les applications Talend, les URL suivantes sont supportées :
  • Talend Cloud Data Stewardship, ou la version hybride de Talend Data Stewardship 8.0 R2022-07 ou une version supérieure :
    https://tds.<env>.cloud.talend.com/rulerepository/api/v1
    https://tds.<env>.cloud.talend.com/rulerepository/api/v1/
    https://tds.<env>.cloud.talend.com/rulerepository
    https://tds.<env>.cloud.talend.com/rulerepository/
    https://tds.<env>.cloud.talend.com (Only for Talend Cloud Data Stewardship)
    https://tds.<env>.cloud.talend.com/ (Only for Talend Cloud Data Stewardship)

    Lorsque vous utilisez la version hybride, vous pouvez utiliser une URL avec l'adresse IP ou le nom d'hôte :

    https://ip:19999/rulerepository/api/v1
    https://ip:19999/rulerepository/api/v1/
    https://ip:19999/rulerepository
    https://ip:19999/rulerepository/
    https://hostname:19999/rulerepository/api/v1
    https://hostname:19999/rulerepository/api/v1/         
    https://hostname:19999/rulerepository
    https://hostname:19999/rulerepository/
  • Talend Cloud Data Inventory, à partir de la version 8.0 R2023-06 du Studio Talend :
    https://tdc.<env>.cloud.talend.com/rulerepository/api/v1
    https://tdc.<env>.cloud.talend.com/rulerepository/api/v1/
    https://tdc.<env>.cloud.talend.com/rulerepository
    https://tdc.<env>.cloud.talend.com/rulerepository/
    https://tdc.<env>.cloud.talend.com
    https://tdc.<env>.cloud.talend.com/ 
Token Saisissez votre jeton. Pour en générer un, consultez Générer un jeton d'accès personnel.
DQ rule library timestamp Après avoir saisi l'URL et le jeton, cliquez sur Refresh.

Si l'URL et le jeton sont corrects, les règles sont récupérées dans le Studio Talend : yyyy-MM-dd hh:mm:ss (library_number).

Lorsque vous cliquez sur Fetch rules (Récupérer les règles), un fichier JAR contenant la définition de la règle est créé dans :
studio-path\configuration\.m2\repository\org\talend\libraries\rule-number

Lorsque vous mettez à jour les règles dans une application Cloud ou hybride, cliquez sur Refresh (Actualiser) pour récupérer la dernière version.

Configure DQ rules Associez les variables de la règle aux données d'entrée.
Les règles sont récupérées depuis la bibliothèque :
  • DQ Rule : sélectionnez la règle.
  • Rule variable : les variables de la règle sont automatiquement récupérées.
  • Input column : sélectionnez la colonne contenant les valeurs devant remplacer la variable.
  • Dynamic column selection:  lorsque vous avez sélectionné une colonne dynamique comme colonne d'entrée (Input column), saisissez le nom de la colonne entre guillemets doubles.
    Note InformationsRestriction : Vous pouvez associer une variable de règle à une colonne uniquement. Saisissez une colonne uniquement dans Dynamic column selection.
Si aucune règle ou colonne d'entrée n'est disponible, vérifiez que :
  • Les règles de qualité de données ont été récupérées dans DQ rule library timestamp (Horodatage des bibliothèques de règles DQ).
  • Le schéma d'entrée est correct.

Vous pouvez associer les types de données du Studio Talend à certains types de données des applications. Consultez Associer des types de données.

Pour appliquer plus de règles, cliquez sur l'icône Add (Ajouter).

Associer des types de données

Le tableau suivant décrit les types de données que vous pouvez associer.
Variable de règle provenant de l'application* Colonne d'entrée (depuis Studio Talend)
Nombre Double, Float, Integer, Long, Short et String
Booléen Booléen
Text Chaîne de caractères
Date Date
N'importe quel type de données supporté dans l'application Dynamic
* Vous pouvez saisir l'URL de :
  • Talend Cloud Data Stewardship,
  • la version hybride 8.0 R2022-07 ou supérieure de Talend Data Stewardship,
  • Talend Cloud Data Inventory, à partir de la version 8.0 R2023-06 du Studio Talend.
Pour Qlik Talend Data Integration, consultez les types supportés dans l'application dans Utilisation de règles de validation.

Paramètres avancés

Propriétés Description
tStatCatcher Statistics

Cochez cette case pour collecter les métadonnées de traitement du Job, aussi bien au niveau du Job qu'au niveau de chaque composant.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.