Accéder au contenu principal Passer au contenu complémentaire

Traiter un fichier PDF avec Claude et en extraire les informations clés

Le Job suivant a pour objectif d'accéder à une API Claude, à l'aide d'un modèle Claude pour récupérer et traiter un PDF existant concernant des statistiques relatives aux mobiles et extraire les informations clés du fichier dans la console.

Avant de commencer

Ce scénario utilise les fonctionnalités des modèles Claude. Pour plus d'informations, consultez la documentation Claude correspondante.

Relier les composants

Procédure

  1. Glissez-déposez les composants suivants de la Palette dans l'espace de modélisation graphique : tClaudeAIClient et tLogRow.
  2. Reliez les deux composants à l'aide d'un lien Row > FLOW.
    Vue d'ensemble du Job dans le Studio.

Configurer les composants

Procédure

  1. Double-cliquez sur le composant tClaudeAIClient pour afficher sa vue Component.
  2. Dans la vue Basic settings, saisissez votre clé API Claude et sélectionnez le modèle Claude à utiliser.
    Dans ce scénario, utilisez le modèle claude-3-7-sonnet-20250219. Pour plus d'informations concernant les modèles Claude supportant les fichiers PDF, consultez la documentation Claude correspondante.
    Vous pouvez laisser vide le champ Prompt, car il sera renseigné dans la vue Advanced settings comme code JSON.
    Vue Basic settings de la configuration du tClaudeAIClient.
  3. Dans la vue Advanced settings, saisissez la version d'API de votre choix et configurez la requête JSON référençant votre PDF et fournissant le prompt.
    Pour ce faire, sélectionnez Use raw JSON et saisissez le code JSON suivant dans le champ Request body :
    {
      "model": "{.config.model}",
      "max_tokens": 1024,
      "messages": [{
            "role": "user",
            "content": [{
                "type": "document",
                "source": {
                    "type": "url",
                    "url": "<url_to_pdf>"
                }
            },
            {
                "type": "text",
                "text": "What are the key findings in this document?"
            }]
        }]
    }

    Remplacez <url_to_pdf> par l'URL réelle de stockage du PDF.

    Vue Advanced settings de la configuration du tClaudeAIClient.
    Dans ce scénario, un fichier PDF de rapport sur des statistiques relatives aux mobiles, notamment concernant les utilisateur·trices, les appareils, les systèmes d'exploitation et les habitudes est utilisé.
    Texte d'introduction du fichier PDF à récupérer et résumer.
  4. Double-cliquez sur le composant tLogRow pour afficher sa vue Component.
    Cliquez sur Sync columns afin de récupérer le schéma du composant précédent, si nécessaire.
    Dans la zone Mode, sélectionnez Basic, puis Print content with log4j pour afficher les résultats du Job dans la console.

Exécuter le Job

Procédure

  1. Appuyez sur les touches Ctrl + S pour sauvegarder votre Job.
  2. Appuyez sur F6 pour l’exécuter.

Résultats

La console de la vue Run affiche le résultat du prompt JSON récupérant les données du PDF et extrayant les informations clés.
Console d'exécution affichant les informations clés extraites du PDF fourni.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.