Accéder au contenu principal Passer au contenu complémentaire

Procédure

Procédure

  1. À partir de la Palette, déposez les composants suivants dans l'espace de modélisation graphique : un tFileInputXML, un tFileOutputXML et un tLogRow.
    Cliquez-droit sur le composant tFileInputXML, sélectionnez Row > Main dans le menu contextuel, et cliquez sur le composant tFileOutputXML pour créer le lien.
    Cliquez-droit sur le composant tFileInputXML, sélectionnez Row > Reject dans le menu contextuel, et cliquez sur le composant tLogRow pour créer le lien de rejet.
  2. Double-cliquez sur le composant tFileInputXML pour afficher l'onglet Basic settings et paramétrer ses propriétés.
  3. Dans la liste Property Type, sélectionnez Repository et cliquez sur le bouton [...] près du champ pour afficher la boîte de dialogue Repository Content dans laquelle vous pouvez sélectionner les métadonnées relatives au fichier d'entrée s'il est déjà stocké dans le nœud File xml dans le dossier Metadata de la vue Repository. Les champs suivants seront renseignés automatiquement. Sinon, sélectionnez le mode Built-in et renseignez ces champs manuellement.
    Pour plus d'informations concernant le stockage des métadonnées de schémas dans la vue Repository, consultez Gestion des métadonnées dans le Studio Talend.
  4. Dans le champ Schema Type, sélectionnez Repository et cliquez sur le bouton[...] pour ouvrir la boîte de dialogue d'où vous pouvez sélectionner le schéma décrivant la structure de votre fichier d'entrée si vous l'avez stocké dans la vue Repository. Sinon, sélectionnez Buit-in et cliquez sur le bouton [...] à côté du champ Edit schema pour ouvrir la boîte de dialogue d'où vous pouvez définir le schéma manuellement.
    Dans cet exemple, le schéma comprend cinq colonnes : id, CustomerName, CustomerAddress, idState et id2.
  5. Cliquez sur le bouton [...] près du champ Filename et parcourez votre système jusqu'au fichier XML à traiter.
  6. Dans le champ Loop XPath query, saisissez, entre guillemets inversés, le chemin du nœud XML sur lequel effectuer une boucle afin de récupérer les données.
    Dans la table Mapping, la colonne Column est automatiquement renseignée avec les colonnes définies dans le schéma.
    Dans la colonne XPath query, saisissez entre guillemets inversés le nœud du fichier XML contenant les données que vous voulez extraire dans la colonne correspondante.
  7. Dans le champ Limit, saisissez le nombre de lignes à traiter. Dans ce scénario, l'objectif est de traiter les 10 premières lignes.
  8. Double-cliquez sur le composant tFileOutputXML pour afficher l'onglet Basic settings et paramétrer ses propriétés.
  9. Cliquez sur le bouton [...] près du champ File Name. Parcourez votre système jusqu'au fichier XML de sortie dans lequel vous souhaitez collecter des données, ici customer_data.xml.
    Dans le champ Row tag, saisissez entre guillemets inversés le nom que vous souhaitez donner à la balise contenant les données.
    Cliquez sur Edit schema pour afficher la boîte de dialogue et assurez-vous que le schéma correspond à celui du composant précédant. Si nécessaire, cliquez sur Sync columns pour récupérer le schéma du composant précédent.
  10. Double-cliquez sur le tLogRow afin d'afficher sa vue Basic settings et définir ses propriétés de base.
    Cliquez sur Edit schema pour ouvrir la boîte de dialogue et assurez-vous que le schéma correspond à celui du composant précédant. Sinon, cliquez sur Sync columns pour récupérer le schéma du composant précédent.
    Dans la zone Mode, sélectionnez l'option Vertical.
  11. Enregistrez votre Job et appuyez sur F6 pour l'exécuter.

Résultats

Le fichier de sortie customer_data.xml contenant les données correctes est créé dans le chemin défini et les données XML erronées sont affichées dans la console de la vue Run.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.