Accéder au contenu principal Passer au contenu complémentaire

Propriétés du tMongoDBInput Standard

Ces propriétés sont utilisées pour configurer le tMongoDBInput s'exécutant dans le framework de Jobs Standard.

Le composant tMongoDBInput Standard appartient aux familles Big Data et Bases de données NoSQL.

Le composant de ce framework est disponible dans tous les produits Talend avec Big Data et dans Talend Data Fabric.

Basic settings

Use existing connection

Cochez cette case et sélectionnez le composant de connexion adéquat dans la liste Component list pour réutiliser les paramètres d'une connexion que vous avez déjà définie.

DB Version Sélectionnez dans la liste déroulante la version de la base de données à utiliser.

Ce champ est disponible lorsque la case Use existing connection n'est pas cochée.

Use connection string

Sélectionnez cette option pour établir une connexion utilisant une URI MongoDB Atlas. Saisissez l'URI dans le champ à droite. Consultez Connection String URI Format (en anglais) pour plus d'informations.

Cette option est disponible lorsque vous sélectionnez MongoDB 4.4.X and later dans la liste déroulante DB Version.

Note InformationsRemarque : Cette option est disponible uniquement si vous avez installé la mise à jour mensuelle R2021-12 du Studio Talend ou une mise à jour plus récente fournie par Talend. Pour plus d'informations, contactez votre administrateur ou administratrice.
Use replica set address Cochez cette case pour afficher la table Replica address.

Dans la table Replica address, vous pouvez configurer différents serveurs de la base de données MongoDB pour le failover.

Ce champ est disponible lorsque la case Use existing connection n'est pas cochée.

Server et Port Saisissez l'adresse IP et le numéro du port d'écoute du serveur de la base de données.

Ces champs sont disponibles lorsque les cases Use existing connection et Use replica set address ne sont pas cochées.

Base de données Saisissez le nom de la base de données.
Use SSL connection (Configure the SSL authentication in tSetKeystore or in Studio preferences)

Cochez cette case pour activer la connexion chiffrée SSL ou TLS.

Utilisez le composant tSetKeystore dans le même Job afin de spécifier les informations de chiffrement.

Notez que la connexion SSL est disponible uniquement à partir de la version 2.4 de MongoDB.

Set read preference

Cochez cette case et, dans la liste Read preference qui s'affiche, sélectionnez le membre auquel vous souhaitez adresser les opérations de lecture.

Si vous laissez décochée cette case, le Job utilise les préférences de lecture par défaut. Autrement dit, il utilise le membre primaire d'un Replica set.

Pour plus d'informations, consultez la documentation de MongoDB relative à la réplication et à ses préférences de lecture (Read preferences).

Authentification requise Cochez cette case pour activer l'authentification à la base de données.

Parmi les mécanismes listés dans la liste déroulante Authentication mechanism, le mécanisme NEGOTIATE est recommandé si vous n'utilisez pas Kerberos, car il sélectionne automatiquement le mécanisme d'authentification le plus adapté à la version de MongoDB que vous utilisez.

Comme le mécanisme d'authentification SCRAM-SHA-256 est supporté uniquement par MongoDB 4.x et supérieures, l'option SCRAM-SHA-256 SASL est disponible uniquement lorsque MongoDB 4.4.X and later est sélectionné dans la liste déroulante DB Version.

Note InformationsRemarque : L'option X509 est disponible uniquement lorsque vous avez installé la mise à jour mensuelle R2021-12 du Studio Talend ou une plus récente fournie par Talend. Pour plus d'informations, contactez votre administrateur ou administratrice.

Pour plus d'informations concernant les autres mécanismes de la liste, consultez MongoDB Authentication (en anglais) dans la documentation MongoDB.

Set Authentication database

Si le nom d'utilisateur ou d'utilisatrice à utiliser pour se connecter à MongoDB a été créé dans une base de données d'authentification MongoDB spécifique, cochez cette case pour saisir le nom de la base de données en question dans le champ Authentication database qui s'affiche.

Pour plus d'informations concernant la base de données d'authentification MongoDB, consultez User Authentication database (en anglais).

Username et Password Saisissez les informations d'authentification de l'utilisateur ou de l'utilisatrice de la base de données.

Pour saisir le mot de passe, cliquez sur le bouton [...] à côté du champ Password, puis, dans la boîte de dialogue qui s'ouvre, saisissez le mot de passe entre guillemets doubles et cliquez sur OK afin de sauvegarder les paramètres.

Ce champ est disponible lorsque la case Required authentication est cochée.

Si le système de sécurité sélectionné dans la liste Authentication mechanism est Kerberos, saisissez les informations dans les champs suivants User principal, Realm et KDC server et non dans les champs Username et Password.

Collection Saisissez le nom de la collection dans la base de données MongoDB.
Schema et Edit Schema

Un schéma est une description de lignes. Il définit le nombre de champs (colonnes) à traiter et à passer au composant suivant. Lorsque vous créez un Job Spark, évitez le mot réservé line lors du nommage des champs.

Créez le schéma en cliquant sur le bouton Edit Schema. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir uniquement le schéma.

  • Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs.

    Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre Repository Content.

Si une colonne dans une base de données est un document JSON et que vous devez lire le document entier, saisissez un astérisque (*) dans la colonne DB column, sans guillemets.

Query Spécifiez la condition de la requête. Ce champ est disponible uniquement lorsque vous avez sélectionné Find query dans la liste Query type.

Par exemple, saisissez "{id:4}" afin de récupérer l'enregistrement dont l'id est 4, dans la collection spécifiée dans le champ Collection.

Note InformationsRemarque :

À la différence des instructions de requête requises dans le logiciel client MongoDB, la requête fait ici référence au contenu dans find(). Ainsi la requête est {id:4} alors qu'elle devrait être db.blog.find({id:4}) dans le client MongoDB.

Specify fields to return Cochez cette case pour définir un ensemble de champs dans les documents à retourner depuis la base de données
Return only these fields Saisissez le nom des champs à retourner à partir des données dans cette table.

Ce champ est disponible uniquement lorsque vous cochez la case Specify fields to return dans la vue Basic settings.

Aggregation stages Créez un pipeline d'agrégation en ajoutant les étapes à travers lesquelles vous souhaitez que les documents passent, pour obtenir des résultats agrégés à partir de ces documents. Cette table est disponible uniquement lorsque vous avez sélectionné Aggregation pipeline query dans la liste Query type.

Une seule étape est autorisée par ligne, dans la table Aggregation stages. Toutes les étapes sont exécutées une par une, dans l'ordre dans lequel vous les avez placées dans la table. Pour plus d'informations concernant le pipeline d'agrégation MongoDB, consultez Aggregation pipeline (en anglais).

Exemple 1 :
  • Si vous souhaitez agréger les documents relatifs à vos client·es, à l'aide des étapes $match et $group, vous devez ajouter deux lignes à la table Aggregation stages et définir deux étapes, comme suit :
    "{$match : {status : 'A'}}"
    "{$group : {_id : '$cust_id', total : {$sum : '$amount'}}}"

    Dans cette agrégation, les documents clients ayant un statut A sont sélectionnés. Parmi les clients sélectionnés, ceux utilisant le même ID client sont groupés et la somme des valeurs des champs amount du même client est effectuée.

    Pour une liste complète des étapes que vous pouvez utiliser et les opérateurs associés, consultez Aggregation pipeline operators (en anglais).

Exemple 2 :
  • Ce composant supporte les fonctionnalités de recherche vectorielle Atlas. Vous pouvez utiliser cette option pour effectuer des requêtes sur les données à l'aide de l'étape d'agrégation $vectorSearch et d'un index de recherche préalablement créé à l'aide d'un composant tMongoDBRow :
    "{$vectorSearch : {index : '<index_name>', path : '<field_to_search>', 
    queryVector:"[<array_of_numbers>], numCandidates: <number_of_candidates>, limit: <number_of_results>}}}" 
    Pour plus d'informations concernant les paramètres de requête $vectorSearch, consultez la documentation MongoDB correspondante (en anglais).
Mapping

Chaque colonne du schéma défini pour ce composant représente un champ des documents à lire. Dans cette table, vous devez spécifier les nœuds parents de ces champs, s'il y en a.

Par exemple, dans le document se présentant comme suit :
{
               _id: ObjectId("5099803df3f4948bd2f98391"),
               person: { first: "Joe", last: "Walker" }
            }
Les champs first et last ont un nœud parent person mais le champ _id ne contient aucun nœud parent. Cela fait, la table Mapping doit ressembler à ceci :
Column     Parent node path
_id
first       "person"
last        "person"
Sort by Spécifiez la colonne et choisissez l'ordre pour l'opération de tri.

Ce champ est disponible uniquement lorsque vous avez sélectionné Find query dans la liste Query type.

Limit Saisissez le nombre maximal de documents à récupérer.

Ce champ est disponible uniquement lorsque vous avez sélectionné Find query dans la liste Query type.

Skip Spécifiez le nombre de lignes récupérées à ignorer. Les lignes sont ignorées à partir de la première ligne.
Note InformationsRemarque : Cette option est disponible uniquement si vous avez installé la mise à jour mensuelle R2022-01 du Studio Talend ou une mise à jour plus récente fournie par Talend. Pour plus d'informations, contactez votre administrateur ou administratrice.
Batch size Spécifiez le nombre maximal de lignes pouvant être récupérées dans chaque lot. Pour éviter de possibles erreurs, ne configurez pas cette option à 1.
Note InformationsRemarque : Cette option est disponible uniquement si vous avez installé la mise à jour mensuelle R2022-01 du Studio Talend ou une mise à jour plus récente fournie par Talend. Pour plus d'informations, contactez votre administrateur ou administratrice.

Paramètres avancés

tStatCatcher Statistics Cochez cette case afin de collecter les données de log au niveau des composants.
No query timeout

Cochez cette case pour empêcher les serveurs MongoDB de fermer les curseurs inactifs après 10 minutes d'inactivité de ces curseurs. Dans cette situation, un curseur inactif reste ouvert jusqu'à ce que les résultats de ce curseur soient épuisés ou que vous fermiez manuellement le curseur à l'aide de la méthode cursor.close().

Un curseur, dans MongoDB, est un pointeur vers l'ensemble de résultats de la requête. Par défaut, c'est-à-dire lorsque la case est décochée, un serveur MongoDB ferme automatiquement les curseurs inactifs après une période d'inactivité donnée, pour éviter les utilisations excessives de mémoire. Pour plus d'informations concernant les curseurs MongoDB, consultez https://docs.mongodb.org/manual/core/cursors/ (en anglais).

Convert BSON document to string Cochez cette case pour convertir toutes les valeurs de BSON à String. Les valeurs de type array sont des listes d'objets basiques.

Cette option est uniquement disponible pour MongoDB versions 3.5.x, 4.4.x et supérieures.

Variables globales

Variables globales

NB_LINE : nombre de lignes lues par un composant d'entrée ou passées à un composant de sortie. Cette variable est une variable After et retourne un entier.

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, lorsque le composant contient cette case.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. À partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez Utiliser les contextes et les variables.

Utilisation

Règle d'utilisation Le composant tMongoDBInput est un composant de début. Il vous permet de récupérer des enregistrements d'une collection dans la base de données MongoDB et de les transférer au composant suivant, pour affichage ou stockage.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.