Propriétés du tRuleSurvivorship Standard
Ces propriétés sont utilisées pour configurer le tRuleSurvivorship s'exécutant dans le framework de Jobs Standard.
Le composant tRuleSurvivorship Standard appartient à la famille Qualité de données.
Le composant de ce framework est disponible dans Talend Data Management Platform, Talend Big Data Platform, Talend Real-Time Big Data Platform, Talend Data Services Platform et Talend Data Fabric.
Basic settings
Schema et Edit schema |
Un schéma est une description de lignes. Il définit le nombre de champs (colonnes) à traiter et à passer au composant suivant. Lorsque vous créez un Job Spark, évitez le mot réservé line lors du nommage des champs. Ce composant fournit deux colonnes en lecture seule :
Lorsqu'un enregistrement consolidé est créé, la colonne CONFLICT n'affiche pas les conflits résolus par les règles de résolution des conflits. |
|
Built-in : le schéma est créé et conservé localement pour ce composant seulement. |
|
Repository : le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé dans des Jobs et projets. |
Group identifier |
Sélectionnez la colonne dont le contenu indique les identifiants de groupe requis du schéma d'entrée. |
Group size |
Sélectionnez la colonne dont le contenu indique la taille requise du groupe dans le schéma d'entrée. |
Rule package name |
Saisissez le nom de l'ensemble de règles que vous créez via ce composant. |
Generate rules and survivorship flow |
Une fois que toutes les règles ont été configurées dans un ensemble de règles ou que vous avez modifié certaines règles via ce composant, cliquez sur l'icône pour générer l'ensemble de règles sous le nœud Survivorship Rules du dossier Rules Management sous Metadata dans le Repository de la perspective Integration de votre Studio Talend. Note InformationsRemarque :
Cette étape est nécessaire pour valider les modifications et les prendre en compte lors de l'exécution. Si un ensemble de règles du même nom existe déjà dans le Repository, ces modifications, une fois validées, vont l'écraser, sinon celui du Repository aura priorité lors de l'exécution. Note InformationsAvertissement : Dans un ensemble de règles, deux règles ne peuvent pas porter le même nom.
|
Rule table |
Renseignez cette table pour créer un flux complet de consolidation. Chaque règle donnée est définie comme une étape d'exécution. Ainsi, dans l'ordre décroissant dans la table, ces règles représentent une séquence et un flux prend forme. Les colonnes de cette table sont : Order : dans la liste, sélectionnez l'ordre d'exécution des règles que vous créez afin de définir un flux de consolidation. Les types d'ordre peuvent être :
Rule Name : saisissez le nom de chaque règle que vous créez. Cette colonne est disponible uniquement pour les règles Sequential puisqu'elle définit les étapes du flux de consolidation. N'utilisez pas de caractère spécial dans le nom des règles, sinon le Job risque de ne pas s'exécuter correctement. Les noms de règle sont sensibles à la casse. Reference column : sélectionnez la colonne sur laquelle vous souhaitez appliquer une règle donnée. Ce sont les colonnes définies dans le schéma de ce composant. Cette colonne n'est pas disponible pour les règles Multi-target car elles définissent uniquement les colonnes Target column. Function : sélectionnez le type d'opération de validation à effectuer sur une colonne Reference column donnée. Les types disponibles comprennent :
Value : saisissez l'expression qui vous intéresse, correspondant à la fonction Match regex ou Expression sélectionnée dans la colonne Function. Target column : lorsqu'une étape est exécutée, elle valide la valeur d'un champ d'un enregistrement d'une colonne Reference column donnée et sélectionne la valeur correspondante de meilleure qualité pour renseigner la colonne Target column donnée. Sélectionnez la colonne Target column parmi les colonnes du schéma du composant. Ignore blanks : cochez les cases correspondant au nom des colonnes dont vous souhaitez ignorer les valeurs vides. |
Define conflict rule |
Cochez cette case pour créer des règles de résolution des conflits dans la table Conflict rule table. |
Conflict rule table |
Renseignez cette table pour créer des règles de résolution des conflits. Les colonnes de cette table sont : Rule Name : saisissez le nom de chaque règle que vous créez. N'utilisez pas de caractère spécial dans le nom des règles, sinon le Job risque de ne pas s'exécuter correctement. Conflicting column : lorsqu'une étape est exécutée, elle valide la valeur d'un champ d'un enregistrement d'une colonne Reference column donnée et sélectionne la valeur correspondante de meilleure qualité pour renseigner la colonne Conflicting column donnée. Sélectionnez cette colonne Conflicting column parmi les colonnes du schéma du composant. Function : sélectionnez le type d'opération de validation à effectuer sur une colonne Conflicting column donnée. Les types disponibles comprennent ceux de la table Rule table et les types suivants :
Value : saisissez l'expression qui vous intéresse, correspondant à la fonction Match regex ou Expression sélectionnée dans la colonne Function. Reference column : sélectionnez la colonne sur laquelle vous souhaitez appliquer une règle de résolution de conflits donnée. Ce sont les colonnes définies dans le schéma de ce composant. Ignore blanks : cochez les cases correspondant au nom des colonnes dont vous souhaitez ignorer les valeurs vides. Disable : cochez cette case pour désactiver la règle correspondante. |
Paramètres avancés
Input data generated with t-Swoosh algorithm |
Cochez cette case si les données d'entrée sont générées à l'aide de l'algorithme T-Swoosh par le composant tMatchGroup. Sinon, décochez la case. |
Ignore the new master record from tMatchGroup |
Cette case est affichée lorsque l'option Input data generated with T-Swoosh algorithm est sélectionnée. Le nouvel enregistrement maître est le résultat du composant tMatchGroup et de l'algorithme T-Swoosh. Il n'est pas le résultat des données d'entrée d'origine. Si vous avez besoin de cet enregistrement maître, décochez la case. Lorsqu'il n'y a qu'un seul enregistrement dans un groupe, il est l'enregistrement maître et ne sera pas ignoré. Même lorsque la case est cochée. |
tStatCatcher Statistics |
Cochez cette case pour collecter les métadonnées de traitement du Job, aussi bien au niveau du Job qu'au niveau de chaque composant. |
Variables globales
Variables globales |
ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, lorsque le composant contient cette case. Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant. Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. À partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser. Pour plus d'informations concernant les variables, consultez Utiliser les contextes et les variables. |
Utilisation
Règle d'utilisation |
Ce composant est généralement utilisé comme composant intermédiaire et nécessite un composant d'entrée et un composant de sortie. Comme il requiert des données groupées à traiter, ce composant fonctionne avec des composants comme le tMatchGroup comprenant donc des colonnes GID (identifiant du groupe) et GRP_SIZE (taille du groupe). Il requiert également que les données d'entrée soient triées par l'identifiant du groupe et que la première ligne du groupe contienne la taille du groupe. Lorsque vous exportez un Job à l'aide d'un tRuleSurvivorship, vous devez cocher la case Export Dependencies afin d'exporter ensemble les règles de consolidation générées. Pour plus d'informations concernant l'export d'un Job, consultez Export d'éléments. |