Accéder au contenu principal Passer au contenu complémentaire

Support dynamique des distributions Hadoop dans le Studio Talend (déprécié)

Availability-noteDéprécié·e
Note InformationsDéprécié·e : Les distributions intégrées et les distributions dynamiques sont dépréciées à partir de la version 8.0 de Talend. Spark Universal est la distribution standard pour exécuter des Jobs Big Data dans des plateformes Big Data. Pour plus d'informations, consultez Exécuter un Job avec Spark Universal.

Pour migrer depuis une distribution intégrée ou dynamique (par exemple Cloudera, Hortonworks, Amazon EMR, Azure Synapse, Databricks ou Microsoft HDInsight), Talend vous recommande d'activer la distribution Spark Universal pour vos distributions et Jobs Big Data.

Ajouter dynamiquement la plateforme Big Data la plus récente (Distributions dynamiques) (déprécié)

Availability-noteDeprecated

Dans le Studio Talend, si la plateforme Big Data que vous utilisez n'est pas supportée, suivez la procédure ci-dessous pour ajouter cette distribution et la rendre disponible dans le Studio Talend.

Dans la version courante du Studio Talend, vous pouvez utiliser cette procédure pour ajouter les distributions Cloudera et Hortonworks uniquement. Cette procédure utilise Cloudera pour montrer comment ajouter une distribution dynamique au Studio Talend.

Avec cette fonctionnalité de support dynamique, vous aurez l'agilité et la flexibilité vous permettant d'utiliser une version Cloudera ou Hortonworks qui n'était pas disponible lors de la sortie de votre Studio Talend en ajoutant cette version vous-même en quelques clics.

Les distributions dynamiques ainsi ajoutées sont généralement des versions mineures d'une mise à jour majeure certifiée Talend de votre distribution. Talend dépend des déclarations de compatibilité des vendeurs pour assurer la compatibilité du Studio Talend avec ces versions mineures et fournit donc un support officiel pour les cas d'utilisation pouvant être produits dans ces versions mineures ainsi que dans les versions certifiées Talend. Pour plus d'informations concernant les versions de distribution certifiées par Talend et la politique générale de support Talend des versions certifiées et compatibles, consultez Versions des distributions de plateformes supportées pour les Jobs Talend avec Big Data.
  • Sur la liste des versions de distribution, certaines versions ont un libellé Builtin. Ces versions ont été ajoutées par Talend via le mécanisme de distribution dynamique et livrées avec le Studio Talend lors de sa sortie. Elles sont certifiées par Talend et sont donc officiellement supportées et prêtes à l'emploi.
Note InformationsNote: Pour les distributions Cloudera, Talend vous recommande d'utiliser les distributions built-in CDP 7.x plutôt que les distributions CDP dynamiques. Avec la distribution dynamique CDP, Talend supporte les versions jusqu'à la 7.1.8. Les versions CDP 7.1.9 Private Cloud Base et 7.2 Public Cloud ne sont pas supportées. Si vous souhaitez utiliser CDP 7.1.9 Private Cloud Base, CDP 7.2 Public Cloud ou une version supérieure, Talend vous recommande d'utiliser la fonctionnalité Spark Universal. Pour plus d'informations, consultez Exécuter un Job avec Spark Universal.

Procedure

  1. Dans la perspective Integration, cliquez sur File > Edit Project properties pour ouvrir la boîte de dialogue Project Settings.
  2. Cliquez sur General > Dynamic distribution settings pour ouvrir cette vue.
  3. Dans la liste déroulante Distribution, sélectionnez Cloudera.
    La boîte de dialogue des paramètres du projet dans le Studio Talend est ouverte et la vue Dynamic Distribution Settings (Paramètres de la distribution dynamique) est sélectionnée.
  4. Configurez votre référentiel Nexus local pour stocker les fichiers jar de distribution dynamique à télécharger.
    Même si elle n'est pas obligatoire, cette étape permet aux autres utilisateurs et utilisatrices ou aux autres instances du Studio Talend de télécharger ces fichiers JAR plus rapidement.
    1. Configurez un proxy sur votre référentiel Nexus local et liez ce proxy au proxy Talend dédié : https://talend-update.talend.com/nexus/content/groups/dynamicdistribution/.
      Les identifiants à utiliser pour vous connecter à ce proxy Talend sont les suivants :
      • nom d'utilisateur ou d'utilisatrice : Studio-dl-client
      • Mot de passe : studio-dl-client

      Lorsque vous créez votre proxy local, vous devez définir les identifiants spécifiques à ce proxy local. Pour un exemple de création d'un proxy Nexus, consultez Proxy settings (uniquement en anglais) dans la documentation Nexus (en anglais).

    2. Cliquez sur General > Artifact Proxy Setting pour ouvrir cette vue et cochez la case Override default setup pour activer le champ Repository.
    3. Dans le champ Repository, saisissez l'URL de votre proxy local et les identifiants définis pour ce proxy.
    4. Cliquez sur Check connection pour vérifier le statut de la connexion.
  5. Retournez dans la vue Dynamic distribution settings et cliquez sur le bouton Dynamic distribution setup pour ouvrir l'assistant de configuration de distribution dynamique.
  6. Sélectionnez le bouton radio Create new dynamic configuration, puis cliquez sur Refresh pour afficher, dans la liste déroulante Version, les versions de Cloudera disponibles dans le référentiel connecté Cloudera.
  7. Sélectionnez la version de Cloudera pour laquelle vous souhaitez générer la configuration à utiliser dans le Studio Talend.
  8. Cliquez sur Finish.

    Le Studio Talend commence à recevoir les fichiers de configuration pour cette distribution depuis le référentiel Cloudera. Cette récupération de fichiers peut prendre un moment.

    Cela fait, l'assistant [Dynamic distribution setup] se ferme automatiquement et vous renvoie à la vue Dynamic distribution settings. La nouvelle distribution dynamique générée pour la version précédemment sélectionnée s'affiche dans la liste Version.

  9. Vous pouvez répéter cette opération pour ajouter d'autres versions, si nécessaire. Sinon, cliquez sur Apply and Close afin de fermer la boîte de dialogue Project settings.

Results

Vous pouvez utiliser cette nouvelle version de la même manière que les distributions fournies avec le Studio Talend. Vous pouvez :
  • configurer la connexion à cette distribution dynamique dans le Repository et réutiliser cette connexion dans des Jobs Talend ;

  • utiliser directement cette distribution dynamique dans vos Jobs. Si vous construisez votre Job pour générer des fichiers exécutables dans une archive .zip et que vous devez exécuter ces fichiers exécutables sous Windows, n'utilisez pas le script .bat, utilisez le script .ps1.

Même s'il est habituellement possible d'exporter un Job avec ses dépendances, comme une connexion définie dans le Repository, la connexion à une distribution dynamique ne peut être exportée de la même manière. Si vous devez exporter ce type de connexion, consultez Exporter ou importer la configuration d'une distribution de plateforme Big Data dynamique.

Modifier la configuration d'une distribution dynamique (déprécié)

Availability-noteDeprecated

Une fois qu'une distribution dynamique de plateforme Big Data a été ajoutée au Studio Talend, vous pouvez facilement modifier sa configuration.

Cela s'avère particulièrement utile lorsque vous devez utiliser une distribution personnalisée pour laquelle certains fichiers Jar personnalisés sont requis, ou lorsque vous devez déboguer une configuration dynamique.

Comme nous l'avons laissé entendre, la procédure présentée ci-dessous s'applique uniquement à une distribution de plateforme Big Data ajoutée comme décrit dans Ajouter dynamiquement la plateforme Big Data la plus récente (Distributions dynamiques).

Before you begin

Vous devez avoir des connaissances suffisantes relatives à votre distribution pour comprendre les modifications que vous apportez à votre configuration.

Procedure

  1. Dans la perspective Integration, cliquez sur File > Edit project properties pour ouvrir la boîte de dialogue Project settings.
  2. Développez le nœud General et cliquez sur Dynamic distribution settings pour ouvrir cette vue.
  3. Cliquez sur le bouton Dynamic distribution setup pour ouvrir l'assistant de configuration de la distribution dynamique.
  4. Sélectionnez le bouton radio Edit an existing dynamic configuration et, dans la liste déroulante Version, sélectionnez la configuration à modifier.
  5. Cliquez sur Next pour ouvrir la liste des groupes de modules de configuration de la distribution sélectionnée.
  6. Dans le champ Distribution name, saisissez un nouveau nom pour la distribution que vos personnalisez, afin de la distinguer de celle générée par le Studio Talend.
  7. Sélectionnez le module à modifier et cliquez sur le bouton [...] pour ouvrir l'assistant Module Groups Wizard.
    Boîte de dialogue Module group wizard page (Page de l'assistant du groupe de modules).
  8. Dans l'assistant Module Groups Wizard, utilisez les boutons Add et Delete afin d'ajouter ou de supprimer, respectivement, les fichiers Jar, pour modifier la configuration de votre distribution.
  9. Cela fait, cliquez sur Finish afin de valider vos modifications et fermer l'assistant Module Groups Wizard.
  10. Cliquez à nouveau sur Finish pour fermer l'assistant Dynamic distribution setup.

    Cette distribution personnalisée s'affiche dans la liste déroulante Version, dans la vue Dynamic distribution settings de la boîte de dialogue Project settings.

  11. Cliquez sur Apply puis sur OK pour valider la nouvelle configuration et fermer la boîte de dialogue Project settings.

Results

Votre distribution personnalisée est disponible dans le Studio Talend.

Exporter ou importer la configuration d'une distribution de plateforme Big Data dynamique (déprécié)

Availability-noteDeprecated

Même si la configuration d'une distribution de plateforme Big Data dynamique ne peut être exportée ou importée avec les Jobs l'utilisant, elle peut être exportée ou importée via la vue Dynamic distribution setup dans la boîte de dialogue Project settings.

Comme nous l'avons laissé entendre, la procédure présentée ci-dessous est applicable uniquement sur une distribution de plateforme Big Data ajoutée comme décrit dans la procédure Ajouter dynamiquement la dernière plateforme Big Data.

Procedure

  1. Dans la perspective Integration, cliquez sur File > Edit project properties pour ouvrir la boîte de dialogue Project settings.
  2. Développez le nœud General et cliquez sur Dynamic distribution settings pour ouvrir cette vue.
  3. Cliquez sur le bouton Dynamic distribution setup pour ouvrir l'assistant de configuration de la distribution dynamique.
    Option Description

    Edit an existing dynamic configuration

    Utilisez ce bouton radio pour exporter une distribution dynamique.

    Une fois le bouton radio sélectionné, la liste Version devient active.

    Sélectionnez dans la liste la distribution à exporter, puis cliquez sur Next pour ouvrir la vue des détails de la distribution. Dans cette vue, cliquez sur le bouton Export configuration pour exporter la configuration en tant que fichier JSON.

    Import dynamic configuration

    Utilisez ce bouton radio pour importer une distribution dynamique.

    Une fois le bouton radio sélectionné, cliquez sur le bouton [...] activé.

    Parcourez votre système jusqu’au fichier JSON contenant les informations de configuration de la distribution dynamique à importer.

    Ce fichier JSON à utiliser est généralement exporté depuis un autre Studio Talend. Si vous souhaitez utiliser un fichier JSON manuellement créé, assurez-vous que le schéma JSON que vous utilisez est le même que celui du fichier JSON exporté.

  4. Cliquez de nouveau sur Finish pour fermer l'assistant Dynamic distribution setup.
  5. Si vous importez une distribution dynamique, la distribution importée s'affiche dans la liste Version dans la vue Dynamic distribution settings de la boîte de dialogue Project settings. Cliquez sur Apply puis sur OK pour valider la nouvelle configuration et fermer la boîte de dialogue Project settings.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.