Accéder au contenu principal Passer au contenu complémentaire

Propriétés du tDataStewardshipTaskOutput standard

Ces propriétés sont utilisées pour configurer le composant tDataStewardshipTaskOutput lorsqu'il s'exécute dans un framework de Jobs standard.

Le composant tDataStewardshipTaskOutput Standard appartient à la famille Talend Data Stewardship.

Le composant de ce framework est disponible dans tous les produits Talend nécessitant une souscription.

Basic settings

Property Type

Peut être Built-in ou Repository.

 

Built-in : le schéma est créé et conservé localement pour ce composant seulement.

 

Repository : le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé dans des Jobs et projets.

Schema et Edit schema

Un schéma est une description de lignes. Il définit le nombre de champs (colonnes) à traiter et à passer au composant suivant. Lorsque vous créez un Job Spark, évitez le mot réservé line lors du nommage des champs.

Créez le schéma en cliquant sur le bouton Edit Schema. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir uniquement le schéma.

  • Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs.

    Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre Repository Content.

Une fois que vous avez sélectionné une campagne dans la liste Find a campaign, le tDataStewardshipTaskOutput prend en compte le schéma de la campagne et crée des colonnes de schéma identiques dans sa vue Basic settings. Le composant ajoute également les colonnes TDS_DUE_DATE et TDS_EXTERNAL_ID au schéma :
  • TDS_DUE_DATE : contient la date à laquelle la tâche est due, au format : YYYY-MM-DD HH:mm:ss. Cette date est automatiquement calculée selon le délai de la tâche défini lors de la création de la campagne dans Talend Data Stewardship. Si vous ne définissez pas de date de délai pour les tâches lors de la création de la campagne, cette colonne reste vide.

  • TDS_EXTERNAL_ID : permet de définir un identifiant de votre choix sur des tâches, afin de les récupérer facilement à partir de tout autre système tel que Talend MDM Web UI.

    Si vous ne définissez pas un identifiant pour les tâches lors de la création du Job, cette colonne reste vide.

Si vous souhaitez écrire les tâches dans une campagne MERGING ou GROUPING, les colonnes ci-dessous sont automatiquement ajoutées au schéma.

  • TDS_GID : contient l'identifiant du groupe.

    Cet identifiant est utilisé par le tDataStewardshipTaskOutput pour grouper les enregistrements dans les tâches. Tous les enregistrements source devant être groupés dans une seule tâche doivent avoir la même colonne TDS_GID.

  • TDS_MASTER (uniquement pour une campagne MERGING) : indique si l’enregistrement est un enregistrement maître ou source.

    Deux cas à prendre en compte :
    • Si aucun enregistrement source n'est défini en tant que maître pour une tâche donnée, Talend Data Stewardship détermine initialement les attributs des enregistrements correspondants pour créer l'enregistrement maître, selon les règles de consolidation définies lors de la création de la campagne.

      Pour plus d'informations concernant les règles de consolidation, consultez la section sur la configuration de modèles de données dans les campagnes Merging du guide Exemples d'utilisation de Talend Data Stewardship.

    • Si plus d'un enregistrement source est défini en tant que maître pour une tâche donnée, Talend Data Stewardship définit le premier enregistrement source défini en tant que maître comme enregistrement maître. Ainsi, la bonne pratique est d'avoir un enregistrement maître par tâche, ou de ne pas en avoir.
  • TDS_SOURCE : contient le nom de la source de l'enregistrement, s'il y en a une.

  • TDS_RATING (disponible uniquement lorsque le type de campagne MERGING est sélectionné) : fournit le score de confiance par enregistrement source configuré lors de la création de la tâche. Ce score écrase le score défini lors de la création de la campagne, si vous en avez défini un. Cette valeur est un entier, représentant un pourcentage entre 0 et 100.

  • TDS_SCORE : fournit la distance calculée entre l'entrée et les enregistrements maître selon l'algorithme de rapprochement.

  • TDS_CREATION : contient la date de création de la tâche.
  • TDS_LAST_UPDATE : contient la date de dernière mise à jour de la tâche.

URL

Saisissez l'adresse pour accéder au serveur de Talend Data Stewardship avec le suffixe /data-stewardship/, par exemple http://<server_address>:19999/data-stewardship/.

Si vous utilisez Talend Cloud Data Stewardship, utilisez l'URL du centre de données correspondant pour accéder à l'application, avec le suffixe /data-stewardship/, par exemple https://tds.us.cloud.talend.com/data-stewardship, pour le centre de données AWS US.

Pour la liste des URL des centres de données disponibles, consultez URL et régions de Talend Cloud.

Username et Password

Saisissez les informations d'authentification pour vous connecter à Talend Data Stewardship.

Pour saisir le mot de passe, cliquez sur le bouton [...] à côté du champ Password, puis, dans la boîte de dialogue qui s'ouvre, saisissez le mot de passe entre guillemets doubles et cliquez sur OK afin de sauvegarder les paramètres.

Si vous utilisez Talend Cloud Data Stewardship et que :
  • Si le SSO est activé, saisissez un jeton d'accès dans le champ.
  • Le SSO n'est pas activé, saisissez dans le champ :
    • un jeton d'accès, ou
    • votre mot de passe (déprécié).

Campagne

Cliquez sur Find a campaign pour ouvrir la liste des campagnes disponibles dans Talend Data Stewardship et sélectionnez le nom de la campagne contenant les tâches. Il s'agit d'un champ informatif en lecture seule.

Type

Liste en lecture seule affichant le type de campagne parmi les types prédéfinis, une fois la campagne sélectionnée dans les paramètres simples.

Override enforcement of data model

Cochez cette case si vous souhaitez traiter les données sur le serveur de Talend Data Stewardship, même si le type de schéma est invalide. Aucune validation d'entrée du schéma n'est effectuée.

Cette case est cochée par défaut uniquement pour les campagnes de type Merging (Fusion) et Resolution (Résolution).

État

Sélectionnez dans la liste l'état du workflow avec lequel vous souhaitez créer vos tâches.

Cette liste affiche le nom de tous les états définis dans le workflow de la campagne. Elle montre les états initial et final et tout état de validation ajouté lors de la création de la campagne dans Talend Data Stewardship.

Utilisez l'option Custom si vous souhaitez contextualiser les valeurs afin de définir les différents états, selon les différentes valeurs. Par exemple, vous pouvez attribuer la valeur "New" au champ State, si vous souhaitez que tous les champs entrants soient vérifiés et attribuer la valeur "To validate" au même champ si vous avez confiance en les valeurs entrantes et que vous souhaitez simplement les valider.

Assignee

Sélectionnez le participant de la campagne dont vous souhaitez créer les tâches. Sinon, sélectionnez No Assignee pour créer les tâches sans prendre en compte les personnes assignées.

L'option Custom vous permet d'attribuer des tâche dynamiquement aux data stewards faisant partie de la campagne en définissant des variables de contexte dans le champ qui s'affiche. La valeur attendue est l'identifiant du·de la data steward.

Vous pouvez utiliser cette option pour attribuer les tâches à des stewards spécifiques en vous basant sur un attribut spécifié des données d'entrée. Par exemple, vous pouvez attribuer les clients français à Jacques Bocuse, un data steward français et les clients des États-Unis à Cale Carolina, un data steward états-unien, ou les attribuer selon leur niveau de support client, Platinum pour le manager de l'équipe support et Gold pour les experts.

Priority, Choice et Tags

Priority (facultatif) : sélectionnez l'une des priorités des tâches. Sinon, sélectionnez Custom et configurez une expression personnalisée dans le champ qui s'affiche.

Si aucun niveau n'est sélectionné, Medium est utilisé par défaut.

Choice (facultatif, disponible uniquement lorsqu'une campagne ARBITRATION est sélectionnée) : sélectionnez l'une des options configurées pour les enregistrements lors de la définition de la campagne dans l'application Web. La valeur par défaut est No Choice, cela permet aux data stewards de travailler dans l'application Web. Cependant, configurer un choix d'arbitrage dans le Job est un moyen d'aider le·a steward en présélectionnant le choix le plus pertinent directement lors de la création des tâches.

Tags (facultatif) : sélectionnez l'un des mots-clés assignés aux tâches de la campagne.

Vous pouvez utiliser les mots-clés pour filtrer les tâches à charger dans la campagne.

Commentaires

(facultatif) : sélectionnez une ou plusieurs colonne(s) de schéma et saisissez le commentaire que vous souhaitez ajouter aux tâches à créer.

Cette table liste par défaut toutes les colonnes du schéma.

Le participant de la campagne pourra voir le commentaire à tout moment s'il place son curseur sur la colonne de l'enregistrement source dans Talend Data Stewardship. Cette information peut lui permettre de prendre une décision plus éclairée lors de la résolution de la tâche.

Advanced settings

ID de la campagne

Il affiche le nom technique de la campagne une fois la campagne sélectionnée. Cependant, vous pouvez modifier la valeur du champ afin de la remplacer par un paramètre de contexte par exemple, et passer les variables de contexte à un Job au moment de l'exécution. Ce nom technique est toujours utilisé pour identifier une campagne lorsque le Job communique avec Talend Data Stewardship quelle que soit la valeur du champ Campaign.

Max tasks per commit

Configurez le nombre de tâches à avoir dans chaque commit.

Il n'y a pas de limite pour la taille des lots dans Talend Data Stewardship (version sur site).

Cependant, vous devez vous assurer de ne pas dépasser 200 tâches par commit dans Talend Cloud Data Stewardship. Configurer de hautes valeurs peut causer des échecs des Jobs.

HTTP client configuration

Connect Timeout : configurez le temps en millisecondes (ms) durant lequel attendre avant l'échec de la tentative de connexion et l'arrêt du Job.

Request Timeout : configurez le temps en millisecondes (ms) durant lequel attendre avant l'échec de la tentative de requête et l'arrêt du Job.

La valeur 0 est interprétée comme temps d'attente infini.

Statistiques du tStatCatcher

Cochez cette case pour collecter les métadonnées de traitement du Job, aussi bien au niveau du Job qu'au niveau de chaque composant.

Variables globales

NB_LINE

Nombre de messages traités. Cette variable est une variable After et retourne un entier.

NB_REJECT

Nombre de lignes rejetées. Cette variable est une variable After et retourne un entier.

NB_SUCCESS

Nombre de lignes correctement traitées. Cette variable est une variable After et retourne un entier.

ERROR_MESSAGE

Message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, lorsque le composant contient cette case.

Utilisation

Règle d'utilisation

Ce composant est généralement utilisé comme composant de fin dans un Job ou un sous-Job et nécessite un lien d'entrée.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.