Indexer des évaluations de téléphones avec une base de données et des intégrations vectorielles
Ce Job lit des fichiers texte d'évaluations de téléphones depuis un dossier, scinde le contenu en morceaux plus petits pour une meilleure analyse, génère des intégrations vectorielles à l'aide d'Azure OpenAI et les stocke dans une base de données Pinecone vectorielle, pour implémenter la recherche sémantique.
Avant de commencer
Avant d'exécuter ce Job, assurez-vous d'avoir les éléments suivants :
- Un compte Azure OpenAI actif avec accès au modèle text-embedding-3-small.
- Votre clé API et votre endpoint (point de terminaison) Azure OpenAI sont configuré·es.
- Un compte Pinecone avec un index créé pour stocker les intégrations.
- Votre clé API et votre endpoint d'hôte Pinecone sont configuré·es.
- Vous avez téléchargé le fichier archive tembeddingai-tpineconeclient_phone-review-files.zip et extrait les fichiers LG.txt et Iphones.txt.
- Vous avez créé le répertoire <folder_path>/phone-reviews/ avec les fichiers de texte d'évaluation des téléphones.
Relier les composants
Procédure
Configurer les composants
Pourquoi et quand exécuter cette tâche
Procédure
Exécuter le Job
Procédure
- Appuyez sur les touches Ctrl+S pour enregistrer le Job.
- Appuyez sur F6 pour exécuter le Job.
Résultats
Le Job lit les fichiers d'évaluation, scinde le texte en morceaux, génère des intégrations à l'aide d'Azure OpenAI, vérifie le transfert des métadonnées via le tMap et effectue un upsert sur les données vectorisées dans Pinecone pour la recherche sémantique.
Les intégrations d'évaluations de téléphones stockées dans Pinecone activent les requêtes de recherches sémantiques, permettant aux utilisateur·trices de trouver les évaluations pertinentes en se basant sur le contexte plutôt que sur des correspondances exactes de mots-clés. La scission du texte en morceaux assure des résultats de recherche plus précis et de meilleures fonctionnalités d'analyse.