Propriétés du tDataStewardshipTaskInput standard
Ces propriétés sont utilisées pour configurer le composant tDataStewardshipTaskInput lorsqu'il s'exécute dans un framework de Jobs Standard.
Le composant tDataStewardshipTaskOutput standard appartient à la famille Talend Data Stewardship.
Le composant de ce framework est disponible dans tous les produits Talend nécessitant une souscription.
Basic settings
Property Type |
Peut être Built-in ou Repository. |
|
Built-in : le schéma est créé et conservé localement pour ce composant seulement. |
|
Repository : le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé dans des Jobs et projets. |
Schema et Edit schema |
Un schéma est une description de lignes. Il définit le nombre de champs (colonnes) à traiter et à passer au composant suivant. Lorsque vous créez un Job Spark, évitez le mot réservé line lors du nommage des champs. Créez le schéma en cliquant sur le bouton Edit Schema. Si le schéma est en mode Repository, trois options sont disponibles :
Les colonnes ci-dessous sont automatiquement ajoutées à ce composant et sont en lecture seule. Elles donnent les métadonnées de la tâche.
|
URL |
Saisissez l'adresse pour accéder au serveur de Talend Data Stewardship avec le suffixe /data-stewardship/, par exemple http://<server_address>:19999/data-stewardship/. Si vous utilisez Talend Cloud Data Stewardship, utilisez l'URL du centre de données correspondant pour accéder à l'application, avec le suffixe /data-stewardship/, par exemple https://tds.us.cloud.talend.com/data-stewardship, pour le centre de données AWS US. Pour la liste des URL des centres de données disponibles, consultez URL et régions de Talend Cloud. |
Username et Password |
Saisissez les informations d'authentification pour vous connecter à Talend Data Stewardship. Pour saisir le mot de passe, cliquez sur le bouton [...] à côté du champ Password, puis, dans la boîte de dialogue qui s'ouvre, saisissez le mot de passe entre guillemets doubles et cliquez sur OK afin de sauvegarder les paramètres. Si vous utilisez Talend Cloud Data Stewardship et que :
|
Campagne |
Cliquez sur Find a campaign pour ouvrir la liste des campagnes disponibles dans Talend Data Stewardship et sélectionnez le nom de la campagne contenant les tâches. Il s'agit d'un champ informatif en lecture seule. |
Type |
Liste en lecture seule affichant le type de campagne parmi les types prédéfinis, une fois la campagne sélectionnée dans les paramètres simples. |
Override enforcement of data model |
Cochez cette case si vous souhaitez traiter les données sur le serveur de Talend Data Stewardship, même si le type de schéma est invalide. Aucune validation d'entrée du schéma n'est effectuée. |
État |
Sélectionnez dans la liste l'état du workflow dans lequel vous souhaitez récupérer vos tâches. Cette liste affiche le nom de tous les états définis dans le workflow de la campagne. Elle montre les états initial et final et tout état de validation ajouté lors de la création de la campagne dans Talend Data Stewardship. Utilisez l'option Any State pour récupérer toutes les tâches, quel que soit leur état. Utilisez l'option Custom pour spécifier différents états des tâches à récupérer, séparés par une virgule, par exemple "New,to Validate1,Resolved". Vous devez renseigner le libellé exact de l'état défini dans le workflow. |
Assignee |
Sélectionnez le participant de la campagne dont vous souhaitez récupérer les tâches. No Assignee récupère les tâches qui ne sont assignées à aucun·e data steward et Any Assignee récupère les tâches sans prendre en compte la personne assignée. L'option Custom vous permet d'attribuer des tâches dynamiquement aux data stewards faisant partie de la campagne en définissant des variables de contexte dans le champ qui s'affiche. La valeur attendue est l'identifiant du·de la steward. Vous pouvez utiliser cette option pour attribuer les tâches à des stewards spécifiques en vous basant sur un attribut spécifié des données d'entrée. Par exemple, vous pouvez attribuer les clients français à Jacques Bocuse, un data steward français et les clients des États-Unis à Cale Carolina, un data steward états-unien, ou les attribuer selon leur niveau de support client, Platinum pour le manager de l'équipe support et Gold pour les experts. |
Priority, Choice et Tags |
Priority (facultatif) : sélectionnez l'une des priorités des tâches. Sinon, sélectionnez Custom et configurez une expression personnalisée dans le champ qui s'affiche. Si aucun niveau n'est sélectionné, Any Priority récupère toutes les tâches, quelle que soit leur priorité. Choice (facultatif, disponible uniquement lorsqu'une campagne ARBITRATION est sélectionnée) : sélectionnez l'une des options configurées sur les tâches de la campagne. No Choice récupère les tâches pour lesquelles aucun choix n'a été sélectionné par les data stewards et Any Choice récupère toutes les tâches, quel que soit le choix sélectionné. Tags (facultatif) : saisissez les mots-clés à associer aux tâches à récupérer. Vous pouvez utiliser les mots-clés pour filtrer les tâches. |
Query (Requête) |
Saisissez l'instruction de requête que vous souhaitez utiliser pour filtrer les tâches à traiter. La condition se compose d'un nom de champ, d'un opérateur et d'une valeur. Lorsque vous référencez des données d'enregistrements, le nom du champ doit comporter le préfixe record.. Vous devez utiliser des guillemets simples autour des chaînes de caractères et faire précéder ces guillemets par une barre oblique inversée (\) dans la chaîne de caractères. Par exemple : pour filtrer les tâches par personne assignée et valeur du prénom, lorsque vous avez un champ FirstName dans l'enregistrement, utilisez assignee='user1@talend.com' dans le champ Assignee et 'De\'wayne' dans le champ Query. Pour plus d'informations, consultez Langage de requête utilisé avec les composants Data Stewardship et l'API REST. |
Retrieve golden record only |
Cochez cette case pour lire uniquement les enregistrements maître résultant du processus de fusion. Cette option est sélectionnée par défaut et est disponible uniquement avec les campagnes de type MERGING. |
Advanced settings
Campaign ID |
Il affiche le nom technique de la campagne une fois la campagne sélectionnée. Cependant, vous pouvez modifier la valeur du champ afin de la remplacer par un paramètre de contexte par exemple, et passer les variables de contexte à un Job au moment de l'exécution. Ce nom technique est toujours utilisé pour identifier une campagne lorsque le Job communique avec Talend Data Stewardship quelle que soit la valeur du champ Campaign. |
HTTP client configuration |
Connect Timeout : configurez le temps en millisecondes (ms) durant lequel attendre avant l'échec de la tentative de connexion et l'arrêt du Job. Request Timeout : configurez le temps en millisecondes (ms) durant lequel attendre avant l'échec de la tentative de requête et l'arrêt du Job. La valeur 0 est interprétée comme temps d'attente infini. |
Use ID based pagination |
Cette option améliore les performances lors de la récupération de tâches en se basant sur l'ID de la dernière tâche d'un lot pour récupérer la tâche suivante. |
Batch Size |
Configurez le nombre de lignes que vous souhaitez dans chaque lot traité. Ne modifiez pas la valeur par défaut, à moins de rencontrer un problème de performance. Augmenter la taille des lots peut améliorer les performances mais paramétrer une valeur trop haute peut causer des échecs dans les Jobs. |
Consume tasks when they are read |
Cette case est cochée par défaut pour marquer les tâches comme consommées sur le serveur de Talend Data Stewardship une fois récupérées par le composant. Ces tâches ne seront pas récupérées une seconde fois lorsque vous exécutez à nouveau le Job avec les mêmes critères de filtre. Assurez-vous de décocher cette case uniquement pour les cas d'utilisation spécifiques, sinon vous risquez fortement de traiter deux fois les mêmes tâches.
Note InformationsRemarque : Cette option ne s'applique que pour résoudre des tâches.
|
Max request attempts |
Configurez le nombre de tentatives de requêtes avant de retourner une exception pour expiration et d'arrêter le Job. |
Statistiques du tStatCatcher |
Cochez cette case pour collecter les métadonnées de traitement du Job, aussi bien au niveau du Job qu'au niveau de chaque composant. |
Variables globales
NB_LINE |
Nombre de messages traités. Cette variable est une variable After et retourne un entier. |
NB_REJECT |
Nombre de lignes rejetées. Cette variable est une variable After et retourne un entier. |
NB_SUCCESS |
Nombre de lignes correctement traitées. Cette variable est une variable After et retourne un entier. |
ERROR_MESSAGE |
Message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, lorsque le composant contient cette case. |
Utilisation
Règle d'utilisation |
Ce composant est généralement utilisé comme composant de début dans un Job ou un sous-Job et nécessite un lien de sortie. |