Création d'un sprint de résolution avec un Job Talend Studio
Vous pouvez créer un sprint de résolution avec un Job Talend Studio comme source de données.
Voici le flux de travail permettant de créer et d'alimenter un sprint :
-
Création du sprint
Vous créez le sprint dans Data stewardship dans Qlik Talend Data Integration.
-
Alimentation du sprint
Vous créez un Job dans Studio Talend pour alimenter le sprint. Vous pouvez créer une tâche de sorte à exécuter le Job périodiquement afin de soumettre de nouveaux enregistrements pour validation.
Conditions préalables requises
Avant de créer le sprint, vous devez remplir les conditions suivantes :
-
Vos clients Qlik Cloud et Talend Cloud doivent être connectés. Pour plus d'informations, consultez Connexion de Qlik Cloud à Talend Cloud.
-
Vous devez disposer d'un espace à utiliser lors de la création du sprint.
Les propriétaires/créateurs de sprint doivent disposer des autorisations suivantes dans l'espace : Peut gérer, Accès en écriture, Accès en lecture, Peut afficher les données
Les Data stewards doivent disposer des autorisations suivantes dans l'espace : Accès en écriture, Accès en lecture, Peut afficher les données
-
Vous devez disposer d'une connexion au data warehouse Snowflake que vous souhaitez utiliser pour stocker les données de sprint. N'utilisez pas de passerelle de données pour la connexion.
Tous les utilisateurs de sprint doivent disposer des autorisations suivantes dans l'espace de la connexion : Accès en écriture, Accès en lecture, Peut afficher les données
Vous pouvez créer une connexion dans Connexions dans le centre d'activités Qlik Talend Data Integration.
Pour plus d'informations sur les connexions Snowflake, consultez Snowflake.
Pour créer un sprint de résolution, cliquez sur Créer un sprint dans Data stewardship dans le centre d'activités Qlik Talend Data Integration.
Paramètres de sprint généraux
-
Nom
Ajoutez un nom pour le sprint.
-
Espace
Sélectionnez l'espace dans lequel créer le sprint.
-
Description
Ajoutez une description au sprint.
-
Alimentation du sprint
Sélectionnez Job Studio Talend.
Cliquez sur Suivant lorsque vous êtes prêt à définir le schéma de données.
Définition du schéma de données
Vous devez maintenant définir le schéma de données.
Ajoutez des colonnes au schéma de données en cliquant sur Ajouter une colonne. Cliquez sur Suivant lorsque vous êtes prêt à définir le stockage de données.
Indiquez le Nom, la Description et le Type de chaque colonne.
Vous pouvez utiliser Verrouiller la colonne et Exclure la colonne pour déterminer les colonnes qui peuvent être consultées et modifiées. Cela s'avère utile pour créer une vue de validation contenant uniquement les colonnes requises à valider disponibles.
-
Verrouiller la colonne
Si vous sélectionnez cette option, la colonne sera visible pour les Data stewards, mais elle ne pourra pas être modifiée. Utilisez cette option pour les colonnes qui n'ont pas besoin d'être validées, mais qui sont utiles comme référence pour les Data stewards.
-
Exclure la colonne
Si vous sélectionnez cette option, la colonne ne sera pas visible pour les Data stewards. Utilisez cette option pour les colonnes qui ne sont pas utiles comme référence pour les Data stewards.
Application de règles de validation
Vous pouvez appliquer des règles de validation à une colonne pour faciliter l'identification des données non valides. Les données non valides seront mises en surbrillance dans la colonne.
-
Cliquez sur + pour appliquer une règle de validation.
Vous pouvez soit sélectionner une règle de validation existante, soit en créer une nouvelle.
Pour plus d'informations sur la création de règles de validation, consultez Création d'une règle de validation.
Connexion au stockage de données
Vous devez vous connecter à l'entrepôt de données cloud que vous souhaitez utiliser pour stocker les données du sprint. Snowflake est actuellement le seul entrepôt de données supporté.
-
Sélectionnez la connexion à l'entrepôt de données.
-
Sélectionnez la base de données à utiliser.
-
Sélectionnez si vous souhaitez utiliser un schéma de base de données existant ou un nouveau schéma de base de données.
Si vous sélectionnez Nouveau schéma de base de données, définissez le nom du nouveau schéma.
-
Définissez le nom de la table à utiliser pour les données de sprint résolues dans Nom de table pour les enregistrements résolus.
Cliquez sur Suivant lorsque vous êtes prêt à définir les rôles et d'autres paramètres pour le flux de travail de sprint.
Définition des rôles et des paramètres du flux de travail de sprint
La dernière étape consiste à définir les rôles et d'autres paramètres.
-
Ajouter des propriétaires
Ajoutez tous les utilisateurs qui devraient être propriétaires du sprint.
-
Ajouter des stewards
Ajoutez tous les Data stewards pour ce sprint.
-
Workflow d'enregistrement
Vous pouvez choisir si vous souhaitez ajouter une deuxième étape de validation par les propriétaires du sprint.
Note InformationsSi un utilisateur qui est à la fois propriétaire du sprint et Data steward valide un enregistrement, la deuxième étape de validation est ignorée. -
Attribution d'enregistrements
Sélectionnez si vous souhaitez attribuer automatiquement les enregistrements ou si vous souhaitez attribuer manuellement les enregistrements aux Data stewards.
-
Auto
Les enregistrements sont attribués automatiquement aux Data stewards avec une répartition égale. Les enregistrements ne seront pas attribués aux propriétaires de sprint qui ne sont pas également des Data stewards.
-
Manuel
Les enregistrements ne seront initialement pas attribués à un Data steward. Les propriétaires de sprint et les Data stewards peuvent attribuer des enregistrements à partir de la section Non attribués.
-
-
Priority
Vous pouvez définir la priorité du sprint.
Cliquez sur Enregistrer lorsque vous êtes prêt à créer le sprint.
Le sprint est maintenant créé. L'étape suivante consiste à alimenter le sprint à l'aide d'un Job Talend Studio.
Alimentation du sprint
Vous créez un Job dans Studio Talend via le composant tdsOutput pour alimenter le sprint. Vous pouvez créer une tâche de sorte à exécuter le Job périodiquement afin de soumettre de nouveaux enregistrements pour validation.
Pour plus d'informations, consultez Paramètres tDSOutput.