Accéder au contenu principal Passer au contenu complémentaire

Exécuter une préparation

Lorsque vous avez terminé de nettoyer votre jeu de données, vous souhaitez envoyer les résultats de votre préparation vers un nouveau jeu de données ou un jeu de données existant.

Vous pouvez vérifier le statut de l'exécution ou cliquer sur le lien vers votre jeu de données de destination dans la page Run history (Historique des exécutions). Pour plus d'informations, consultez la Page d'historique des exécutions.

Cette fonctionnalité possède les limitations suivantes :

  • Vous ne pouvez exécuter que la version courante d'une préparation. Il est actuellement impossible d'exécuter une version spécifique d'une préparation.
  • Lorsque vous exécutez une préparation sur un jeu de données de base de données, insérer plus de 100 000 nouvelles lignes peut créer des problèmes de performance.

Sélectionner une destination

Avant d'exécuter une préparation, vous devez configurer son exécution. La première étape nécessite la sélection ou l'ajout d'un jeu de données de destination.

Before you begin

Cette fonctionnalité est disponible uniquement avec Moteur distant Gen2 en version R2024-06 ou supérieure, ou avec Moteur Cloud pour le design. Assurez-vous de redémarrer d'abord votre moteur pour activer les dernières mises à jour.

Une limitation rend impossible l'exécution d'une préparation sur des jeux de données basés sur les types de connexion suivants :

  • Amazon DynamoDB (Base de données)
  • Apache Kudu (Base de données)
  • Azure Synapse (base de données)
  • REST (Services Web)
  • FTP (Systèmes de fichiers)
  • Azure Event Hubs (Messaging)
  • RabbitMQ (Messaging)

Procedure

  1. Cliquez sur le bouton Run en haut à droite de l'écran pour ouvrir le panneau des paramètres.
  2. Sélectionnez un type de destination parmi les options suivantes :
    • Existing dataset (Jeu de données existant) : Sélectionnez dans la liste le jeu de données vers lequel vous souhaitez exporter le résultat de la préparation.
    • New dataset (Nouveau jeu de données) : Nommez le nouveau jeu de données et spécifiez la connexion sur laquelle il sera basé.
    • Source dataset (Jeu de données source). Le jeu de données utilisé comme source de la préparation sera mis à jour avec les données préparées.

      Voici la liste des connexions que vous pouvez utiliser lorsque vous sélectionnez Source dataset (Jeu de données source) comme destination :

      • Amazon Aurora (Bases de données)
      • Azure Cosmos DB (Bases de données)
      • Delta Lake (Bases de données)
      • Google BigQuery (Bases de données)
      • MariaDB (Bases de données)
      • Microsoft Dynamics 365 (Applications métier)
      • MongoDB (Bases de données)
      • MySQL (Bases de données)
      • NetSuite (Applications métier)
      • Oracle (Bases de données)
      • PostgreSQL (Bases de données)
      • Salesforce (Applications métier)
      • SingleStore (Bases de données)
      • Snowflake (Bases de données)
    • Direct download (Téléchargement direct) : les données préparées sont exportées dans un fichier local.
    Nouveaux types de destination sélectionnés.
  3. Cliquez sur Next.
  4. Configurez les paramètres supplémentaires si nécessaire.
    Les paramètres affichés dépendent du type de jeu de données sélectionné. Pour plus d'informations concernant les connecteurs, consultez Guide des connecteurs des applications Talend Cloud.
  5. Cliquez sur Next (Suivant) pour continuer la configuration de l'exécution.

Mapper la préparation et les colonnes de destination

L'étape de mapping vous permet de mapper les colonnes avant d'écrire dans une destination définie.

Les relations sont représentées par des lignes entre la préparation sélectionnée et les colonnes de destination sélectionnées.

Note InformationsImportant: L'étape Data Mapping (Mapping de données) n'est pas disponible pour les jeux de données basés sur HTTP et sur des fichiers.

Pour commencer le mapping, vous pouvez :

  • Glissez-déposez une colonne de préparation sur une colonne de destination.
  • Sélectionnez une colonne de préparation directement depuis la liste déroulante de sélection ou saisissez le nom de la colonne dans la zone de sélection.
Mapping visuel entre les colonnes de préparation et les colonnes de destination.

Les règles suivantes s'appliquent lors du mapping de colonnes :

  • (Bêta) Le mapping automatique s'effectue lors du démarrage de la deuxième étape de la configuration de l'exécution.
  • Les colonnes de préparation non mappées sont ignorées et ne s'affichent pas dans les colonnes de destination.

    Exemple : Votre jeu de données de préparation contient ces colonnes : first_name, last_name, email et phone. Votre jeu de données de destination contient ces colonnes : firstname, lastname, address et phone.

    Si vous mappez first_name à firstname, last_name à lastname et phone à phone, votre schéma de sortie contiendra ces colonnes : firstname, lastname, address et phone. La colonne email non mappée sera ignorée. La colonne de destination address sera vide.

  • Une colonne de destination obligatoire non mappée provoquera certainement une erreur. Il sera toujours possible d'exécuter la préparation, mais cela pourra entraîner une perte de données ou davantage d'erreurs. Il est donc recommandé de corriger d'abord le mapping.
  • Si le jeu de données de destination est un jeu de données JDBC : les valeurs des colonnes de préparation mappées seront ajoutées aux colonnes de destination correspondantes, selon l'opération définie sur votre base de données (insertion, mise à jour, upsert ou suppression), au cours de la première étape de la configuration de l'exécution.

    Exemple : Si vous avez sélectionné l'action Insert et que votre colonne de préparation firstname contient les valeurs Alice et John et si elle est mappée à la colonne de destination first_name contenant les valeurs Will et Alima, la colonne de préparation contiendra toutes ces valeurs après le mapping : Alice, John, Will et Alima, ce qui correspond à une insertion.

  • Il n'y a aucune modification de schéma lorsque vous mappez des colonnes, ce qui signifie que le nom de la colonne de destination mappée sera conservé, écrasant le nom de la colonne de préparation mappée à celle-ci.

    Exemple : Si vous mappez la colonne de préparation firstname à la colonne de destination first_name, la colonne de destination mappée sera nommée first_name.

Configurer l'environnement d'exécution

La dernière étape de configuration de l'exécution est la configuration de l'environnement.

Procedure

  1. Facultatif : Activez l'option Keep row order (Conserver l'ordre des lignes) pour conserver l'ordre des lignes du jeu de données source dans le jeu de données de destination. Cela peut augmenter le temps d'exécution de la préparation. Si la préparation contient des fonctions sensibles à l'ordre, cette option est activée par défaut et sa valeur ne peut être modifiée. Menu Run (Exécuter) ouvert.
  2. Sélectionnez un profil d'exécution pour exécuter la préparation configurée.

    Les profils d'exécution sont créés par les utilisateur·trices ayant des rôles spécifiques dans Talend Management Console.

    Un profil d'exécution contient l'ensemble des configurations pour exécuter des pipelines sur un Moteur distant Gen2 ou sur un Moteur Cloud pour le design, en fonction de votre type de licence. Vous pouvez définir la bonne allocation de ressources, ainsi que les paramètres avancés utilisés lors de l’exécution, dans les profils d’exécution. Selon votre licence et vote moteur, différents types de profils d'exécution sont disponibles.

    Par défaut, le profil d'exécution sélectionné sera celui basé sur le premier moteur disponible dans la liste.

    Pour plus d'informations concernant les profils d'exécution, consultez Gérer des profils d’exécution.

  3. Cliquez sur Run.

Results

L'exécution de la préparation commence. Selon la taille du jeu de données et le nombre d'étapes, l'exécution peut prendre quelques secondes ou minutes. Vous pouvez trouver des informations concernant le statut d'exécution sur la page Run history (Historique des exécutions).

Pour plus d'informations concernant l'historique des exécutions dans la page Run history, consultez la page Run history (Historique des exécutions).

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.