Traiter un fichier PDF avec Claude et en extraire les informations clés
Le Job suivant a pour objectif d'accéder à une API Claude, à l'aide d'un modèle Claude pour récupérer et traiter un PDF existant concernant des statistiques relatives aux mobiles et extraire les informations clés du fichier dans la console.
Avant de commencer
Ce scénario utilise les fonctionnalités des modèles Claude. Pour plus d'informations, consultez la documentation Claude correspondante.
Relier les composants
Procédure
Glissez-déposez les composants suivants de la Palette dans l'espace de modélisation graphique : tClaudeAIClient et tLogRow.
Reliez les deux composants à l'aide d'un lien Row > FLOW.
Configurer les composants
Procédure
Double-cliquez sur le composant tClaudeAIClient pour afficher sa vue Component.
Dans la vue Basic settings, saisissez votre clé API Claude et sélectionnez le modèle Claude à utiliser.
Dans ce scénario, utilisez le modèle claude-3-7-sonnet-20250219. Pour plus d'informations concernant les modèles Claude supportant les fichiers PDF, consultez la documentation Claude correspondante.
Vous pouvez laisser vide le champ Prompt, car il sera renseigné dans la vue Advanced settings comme code JSON.
Dans la vue Advanced settings, saisissez la version d'API de votre choix et configurez la requête JSON référençant votre PDF et fournissant le prompt.
Pour ce faire, sélectionnez Use raw JSON et saisissez le code JSON suivant dans le champ Request body :
{
"model": "{.config.model}",
"max_tokens": 1024,
"messages": [{
"role": "user",
"content": [{
"type": "document",
"source": {
"type": "url",
"url": "<url_to_pdf>"
}
},
{
"type": "text",
"text": "What are the key findings in this document?"
}]
}]
}
Remplacez <url_to_pdf> par l'URL réelle de stockage du PDF.
Dans ce scénario, un fichier PDF de rapport sur des statistiques relatives aux mobiles, notamment concernant les utilisateur·trices, les appareils, les systèmes d'exploitation et les habitudes est utilisé.
Double-cliquez sur le composant tLogRow pour afficher sa vue Component.
Cliquez sur Sync columns afin de récupérer le schéma du composant précédent, si nécessaire.
Dans la zone Mode, sélectionnez Basic, puis Print content with log4j pour afficher les résultats du Job dans la console.
Exécuter le Job
Procédure
Appuyez sur les touches Ctrl + S pour sauvegarder votre Job.
Appuyez sur F6 pour l’exécuter.
Résultats
La console de la vue Run affiche le résultat du prompt JSON récupérant les données du PDF et extrayant les informations clés.
Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.