Accéder au contenu principal Passer au contenu complémentaire

Utiliser le connecteur JDBC pour se connecter à Amazon Athena

Cet exemple explique comment utiliser le pilote JDBC Java pour se connecter au service Amazon Athena et tirer parti du service sur le Studio Talend.

Configurer une connexion JDBC pour se connecter à Amazon Athena

Before you begin

  • Amazon Athena n'est actuellement disponible que dans certaines régions AWS. Vérifiez la disponibilité du service dans le tableau des régions d'AWS.
  • La bibliothèque additionnelle requise AthenaJDBC42-2.X.X.jar est prête. Si non, téléchargez le pilote Athena JDBC ici.
  • Comme les résultats de la requête d'Amazon Athena doivent être sauvegardés sur Amazon S3, créez un dossier de sortie S3. Pour plus d'informations sur Amazon Athena, Amazon S3 et JDBC, consultez :

Procedure

  1. Dans la vue Repository du Studio Talend, développez le nœud Metadata, cliquez-droit sur DB Connections et sélectionnez Create connection.
    Capture d'écran de la vue Repository (Référentiel).
    L'assistant Database Connection s'ouvre.
  2. Saisissez le nom de la connexion et sa finalité puis cliquez sur Next.
  3. Sélectionnez JDBC dans la liste DB type.
  4. Dans le champ JDBC URL, saisissez les détails de l'URL JDBC, incluant vos identifiants AWS.
    jdbc:awsathena://AwsRegion=<AWS Region>;User=<AWS Access Key>;Password=<AWS Secret Key>;S3OutputLocation=<S3 folder>
  5. Installez la bibliothèque supplémentaire requise.
    1. Dans la table Drivers, cliquez sur le bouton [+] pour ajouter une ligne et cliquez sur le bouton [...] pour ouvrir la boîte de dialogue Module.
    2. Sélectionnez l'option Install a new module, cliquez sur le bouton [...] pour parcourir les fichiers .jar téléchargé.
      Capture d'écran de la boîte de dialogue Module.
    3. Cliquez sur OK pour fermer cette boîte de dialogue.
  6. De retour sur l'assistant Database connection, cliquez sur le bouton Select class name et sélectionnez la classe du pilote principale qui autorise la communication avec Amazon Athena.
  7. Dans les champs User Id et Password, renseignez votre identifiant et mot de passe d'authentification à la base de données.
    Capture d'écran de l'assistant Database connection (Connexion à la base de données).
  8. Cliquez sur Test connection puis sur Finish pour fermer l'assistant.
  9. Dans la vue Repository, cliquez-droit sur la connexion JDBC tout juste créée et sélectionnez Retrieve Schema pour récupérer la table du schéma du service Amazon Athena connecté.
    Capture d'écran de la vue Repository (Référentiel).

Configurer un Job pour se connecter à Amazon Athena

Procedure

  1. Créez un Job Talend standard et déposez deux composants dans son espace de modélisation graphique : un composant tDBInput et un tLogRow, puis nommez-les selon vos besoins.
  2. Double-cliquez sur le composant tDBInput, sélectionnez JDBC à partir de la liste Database puis cliquez sur Apply.
  3. Reliez le composant tDBInput au composant tLogRow à l'aide d'un lien de type Row > Main.
    Capture d'écran du Job dans l'espace de modélisation graphique.
  4. Dans l'arborescence du Repository, développez la connexion JDBC créée, sélectionnez le schéma de la table qui vous intéresse puis déposez-le sur le composant tDBInput.
    Les informations de connexion, le nom de la table et le schéma sont configurés automatiquement.
  5. Cliquez sur Guess Query pour générer la clause de requête puis la modifier selon vos besoins.
  6. Dans la vue Basic settings du composant tLogRow, cliquez sur Sync columns pour vous assurer que son schéma est identique aux composants en entrée, puis sélectionnez l'option Table (each is key/value list) pour une meilleure lisibilité de l'affichage dans la console.
  7. Appuyez sur F6 pour exécuter le Job.

Results

La console Run affiche les données lues à partir du service Amazon Athena.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.