Propriétés du tCosmosDBInput Standard
Ces propriétés sont utilisées pour configurer le tCosmosDBInput s'exécutant dans le framework de Jobs Standard.
Le composant tCosmosDBInput Standard appartient aux familles Cloud et Bases de données.
Le composant de ce framework est disponible dans tous les produits Talend avec Big Data et dans Talend Data Fabric.
Basic settings
Use existing connection |
Cochez cette case et sélectionnez le composant de connexion adéquat dans la liste Component list pour réutiliser les paramètres d'une connexion que vous avez déjà définie. |
API de |
Sélectionnez l'API de la base de données à utiliser. Les paramètres à définir sont affichés dans la vue Component. Dans la dernière version de ce composant, seule l'API de MongoDB est supportée. C'est pour cette raison que la base de données MongoDB est souvent mentionnée dans la documentation des composants CosmosDB. |
Use replica set address or multiple query routers |
Cochez cette case pour afficher la table Server addresses. Dans la table Server addresses, définissez les bases de données MongoDB shardées ou les ensembles de répliques MongoDB auxquel(le)s vous souhaitez vous connecter. |
Server et Port |
Saisissez l'adresse IP et le numéro du port d'écoute du serveur de la base de données. Disponible lorsque la case Use replica set address or multiple query routers n'est pas cochée. |
Database |
Saisissez le nom de la base de données MongoDB à laquelle vous connecter. |
Set read preference |
Cochez cette case et, dans la liste Read preference qui s'affiche, sélectionnez le membre auquel vous souhaitez adresser les opérations de lecture. Si vous laissez décochée cette case, le Job utilise les préférences de lecture par défaut. Autrement dit, il utilise le membre primaire d'un Replica set. Pour plus d'informations, consultez la documentation de MongoDB relative à la réplication et à ses préférences de lecture (Read preferences). |
Mécanisme d'authentification |
Parmi les mécanismes listés dans la liste déroulante Authentication mechanism, le mécanisme NEGOTIATE est recommandé si vous n'utilisez pas Kerberos, car il sélectionne automatiquement le mécanisme d'authentification le plus adapté à la version de MongoDB que vous utilisez. Pour plus d'informations concernant les autres mécanismes de la liste, consultez MongoDB Authentication (uniquement en anglais) (en anglais) dans la documentation MongoDB. |
Set Authentication database |
Si le nom d'utilisateur ou d'utilisatrice à utiliser pour se connecter à MongoDB a été créé dans une base de données d'authentification MongoDB spécifique, cochez cette case pour saisir le nom de la base de données en question dans le champ Authentication database qui s'affiche. Pour plus d'informations concernant la base de données d'authentification MongoDB, consultez User Authentication database (uniquement en anglais) (en anglais). |
Username et Password |
Données d'authentification de l’utilisateur ou l'utilisatrice de la base de données. Pour saisir le mot de passe, cliquez sur le bouton [...] à côté du champ Password, puis, dans la boîte de dialogue qui s'ouvre, saisissez le mot de passe entre guillemets doubles et cliquez sur OK afin de sauvegarder les paramètres. Disponible lorsque la case Use authentication est cochée. Si le système de sécurité sélectionné dans la liste Authentication mechanism est Kerberos, saisissez les informations dans les champs suivants User principal, Realm et KDC server et non dans les champs Username et Password. |
Collection |
Nom de la collection dans la base de données. |
Schema et Edit Schema |
Un schéma est une description de lignes. Il définit le nombre de champs (colonnes) à traiter et à passer au composant suivant. Lorsque vous créez un Job Spark, évitez le mot réservé line lors du nommage des champs. Créez le schéma en cliquant sur le bouton Edit Schema. Si le schéma est en mode Repository, trois options sont disponibles :
Si une colonne dans une base de données est un document JSON et que vous devez lire le document entier, saisissez un astérisque (*) dans la colonne DB column, sans guillemets. |
Query |
Spécifiez la condition de la requête. Ce champ est disponible uniquement lorsque vous avez sélectionné Find query dans la liste Query type. Par exemple, saisissez "{id:4}" afin de récupérer l'enregistrement dont l'id est 4, dans la collection spécifiée dans le champ Collection. À la différence des instructions de requête requises dans le logiciel client MongoDB, la requête fait ici référence au contenu dans find(). Ainsi la requête est {id:4} alors qu'elle devrait être db.blog.find({id:4}) dans le client MongoDB. |
Specify fields to return |
Cochez cette case pour définir un ensemble de champs dans les documents à retourner depuis la base de données |
Return only these fields |
Saisissez le nom des champs à retourner à partir des données dans cette table. Ce champ est disponible uniquement lorsque vous cochez la case Specify fields to return dans la vue Basic settings. |
Mapping |
Chaque colonne du schéma défini pour ce composant représente un champ des documents à lire. Dans cette table, vous devez spécifier les nœuds parents de ces champs, s'il y en a. Par exemple, dans le document se présentant comme suit :
{ _id: ObjectId("5099803df3f4948bd2f98391"), person: { first: "Joe", last: "Walker" } }Les champs first et last ont un nœud parent person mais le champ _id ne contient aucun nœud parent. Cela fait, la table Mapping doit ressembler à ceci : Column Parent node path _id first "person" last "person" |
Sort by |
Spécifiez la colonne et choisissez l'ordre pour l'opération de tri. Ce champ est disponible uniquement lorsque vous avez sélectionné Find query dans la liste Query type. |
Limit |
Saisissez le nombre maximal de documents à récupérer. Ce champ est disponible uniquement lorsque vous avez sélectionné Find query dans la liste Query type. |
Advanced settings
tStatCatcher Statistics |
Cochez cette case afin de collecter les données de log au niveau des composants. |
No query timeout |
Cochez cette case pour empêcher les serveurs MongoDB de fermer les curseurs inactifs après 10 minutes d'inactivité de ces curseurs. Dans cette situation, un curseur inactif reste ouvert jusqu'à ce que les résultats de ce curseur soient épuisés ou que vous fermiez manuellement le curseur à l'aide de la méthode cursor.close(). Un curseur, dans MongoDB, est un pointeur vers l'ensemble de résultats de la requête. Par défaut, c'est-à-dire lorsque la case est décochée, un serveur MongoDB ferme automatiquement les curseurs inactifs après une période d'inactivité donnée, pour éviter les utilisations excessives de mémoire. Pour plus d'informations concernant les curseurs MongoDB, consultez https://docs.mongodb.org/manual/core/cursors/ (uniquement en anglais) (en anglais). |
Utilisation
Règle d'utilisation |
Le composant tCosmosDBInput est un composant de début et vous permet de récupérer des enregistrements d'une collection, dans la base de données Cosmos et de les transférer au composant suivant, pour affichage ou stockage. |