Propriétés du tDataQualityRules pour Apache Spark Batch
Ces propriétés sont utilisées pour configurer le tDataQualityRules s'exécutant dans le framework de Jobs Spark Batch.
Le composant tDataQualityRules Spark Batch appartient à la famille Qualité de données.
Paramètres simples
Output Schema et Edit schema |
Un schéma est une description de lignes, il définit le nombre de champs (colonnes) qui sont traités et passés au composant suivant. Cliquez sur Sync columns pour récupérer le schéma du composant précédent dans le Job. Sélectionnez le type de schéma dans la liste Schema :
Créez le schéma en cliquant sur le bouton Edit Schema. Si le schéma est en mode Repository, trois options sont disponibles : View schema : sélectionnez cette option afin de voir uniquement le schéma. Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales. Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Les types supportés sont : Boolean, Date, Double, Float, Integer, Long, Short et String. |
Application | Sélectionnez l'application de laquelle vous souhaitez récupérer les règles de qualité de données. Cette option est disponible à partir de la version 8.0 R2024-01 du Studio Talend. |
URL |
Note InformationsImportant :
Vous avez besoin de l'autorisation Rules - View (Règles - Visualisation) pour récupérer les règles. Pour plus d'informations, consultez les Rôles utilisateur·trices prédéfinis relatifs à l'application que vous utilisez.
Saisissez l'URL de l'application sélectionnée dans la liste déroulante Application. Lorsque l'URL ne correspond pas à l'application sélectionnée, le Job peut échouer. Les URL suivantes sont supportées :
|
Token | Saisissez votre jeton d'accès personnel. Pour en générer un, consultez https://help.talend.com/r/fr-FR/Cloud/management-console-user-guide/cloud-access-token. |
DQ rule library timestamp | Après avoir saisi l'URL et le jeton, cliquez sur Refresh. Si l'URL et le jeton sont corrects, les règles de qualité de données sont récupérées dans le Studio Talend : yyyy-MM-dd hh:mm:ss (library_number). Lorsque vous mettez à jour les règles de qualité de données dans une application Cloud ou hybride, cliquez sur Refresh (Actualiser) pour récupérer la dernière version. |
Configure DQ rules | Associez les variables de la règle aux données d'entrée. Les règles sont récupérées depuis la bibliothèque :
Si aucune règle ou colonne d'entrée n'est disponible, vérifiez que :
Vous pouvez associer les types de données du Studio Talend à certains types de données de Talend Cloud Data Stewardship ou de Talend Data Stewardship hybride. Consultez Associer des types de données. Pour appliquer plus de règles, cliquez sur . |
Associer des types de données
Variable de règle provenant de l'application* | Colonne d'entrée (depuis Studio Talend) |
---|---|
Nombre | Double, Float, Integer, Long, Short et String |
Booléen | Booléen |
Text | Chaîne de caractères |
Date | Date |
* Vous pouvez saisir l'URL de :
|
Paramètres avancés
tStatCatcher Statistics |
Cochez cette case pour collecter les métadonnées de traitement du Job, aussi bien au niveau du Job qu'au niveau de chaque composant. |