Propriétés du tMongoDBBulkLoad Standard
Ces propriétés sont utilisées pour configurer le tMongoDBBulkLoad s'exécutant dans le framework de Jobs Standard.
Le composant tMongoDBBulkLoad Standard appartient aux familles Big Data et Bases de données NoSQL.
Le composant de ce framework est disponible dans tous les produits Talend avec Big Data et dans Talend Data Fabric.
Basic settings
Schema et Edit schema |
Un schéma est une description de lignes. Il définit le nombre de champs (colonnes) à traiter et à passer au composant suivant. Lorsque vous créez un Job Spark, évitez le mot réservé line lors du nommage des champs. Créez le schéma en cliquant sur le bouton Edit Schema. Si le schéma est en mode Repository, trois options sont disponibles :
|
MongoDB directory | Saisissez dans ce champ le répertoire d'installation de MongoDB. |
Use local DB path | Cochez cette case afin de fournir les informations de la base de données locale que vous souhaitez utiliser. Les versions 3.0 et supérieures de MongoDB ne supportent pas cette fonctionnalité.
|
Use replica set address | Cochez la case pour afficher la table Replica address.
|
Use connection string |
Sélectionnez cette option pour établir une connexion utilisant une URI MongoDB Atlas. Saisissez l'URI dans le champ à droite. Consultez Connection String URI Format (en anglais) pour plus d'informations. Note InformationsRemarque : Cette option est disponible uniquement si vous avez installé la mise à jour mensuelle R2021-12 du Studio Talend ou une mise à jour plus récente fournie par Talend. Pour plus d'informations, contactez votre administrateur ou administratrice.
|
Serveur | Nom de l'hôte ou adresse IP du serveur de base de données. Notez que la valeur par défaut, localhost, est utilisée si le serveur n'est pas spécifié. Ce champ est disponible uniquement lorsque la case Use replica set address n'est pas cochée. |
Port | Port d'écoute du serveur de la base de données. Notez que la valeur par défaut, 27017, est utilisée si le port n'est pas spécifié. Ce champ est disponible uniquement lorsque la case Use replica set address n'est pas cochée. |
Database | Saisissez le nom de la base de données dans laquelle importer les données. |
Collection | Saisissez le nom de la collection dans laquelle importer les données. |
Use SSL connection |
Cochez cette case pour activer la connexion chiffrée SSL ou TLS. Utilisez le composant tSetKeystore dans le même Job afin de spécifier les informations de chiffrement. Notez que la connexion SSL est disponible uniquement à partir de la version 2.4 de MongoDB. |
Drop collection if exist | Cochez cette case afin de supprimer la collection si elle existe déjà. |
Authentification requise | Cochez cette case pour activer l'authentification à la base de données. Parmi les mécanismes listés dans la liste déroulante Authentication mechanism, le mécanisme NEGOTIATE est recommandé si vous n'utilisez pas Kerberos, car il sélectionne automatiquement le mécanisme d'authentification le plus adapté à la version de MongoDB que vous utilisez. Comme le mécanisme d'authentification SCRAM-SHA-256 est supporté uniquement par MongoDB 4.x et supérieures, l'option SCRAM-SHA-256 SASL est disponible uniquement lorsque MongoDB 4.4.X and later est sélectionné dans la liste déroulante DB Version. Note InformationsRemarque : L'option X509 est disponible uniquement lorsque vous avez installé la mise à jour mensuelle R2021-12 du Studio Talend ou une plus récente fournie par Talend. Pour plus d'informations, contactez votre administrateur ou administratrice.
Pour plus d'informations concernant les autres mécanismes de la liste, consultez MongoDB Authentication (en anglais) dans la documentation MongoDB. |
Set Authentication database |
Si le nom d'utilisateur ou d'utilisatrice à utiliser pour se connecter à MongoDB a été créé dans une base de données d'authentification MongoDB spécifique, cochez cette case pour saisir le nom de la base de données en question dans le champ Authentication database qui s'affiche. Pour plus d'informations concernant la base de données d'authentification MongoDB, consultez User Authentication database (en anglais). |
Username et Password | Données d'authentification de l’utilisateur ou l'utilisatrice de la base de données. Pour saisir le mot de passe, cliquez sur le bouton [...] à côté du champ Password, puis, dans la boîte de dialogue qui s'ouvre, saisissez le mot de passe entre guillemets doubles et cliquez sur OK afin de sauvegarder les paramètres. Ces champs sont disponibles lorsque la case Required authentication est cochée. Si le système de sécurité sélectionné dans la liste Authentication mechanism est Kerberos, saisissez les informations dans les champs suivants User principal, Realm et KDC server et non dans les champs Username et Password. |
Certificate | Saisissez le chemin d'accès au fichier du certificat. Vous pouvez également renseigner ce champ en cliquant sur le bouton [...] à droite de ce champ, en navigant jusqu'au dossier où se trouve le fichier de certificat et en sélectionnant le fichier de certificat. Ce champ est disponible lorsque l'option X509 est sélectionnée dans la liste déroulante Authentication mechanism. |
Use certificate authority | Sélectionnez cette option pour utiliser un certificat provenant d'une autorité de certification. Vous devez saisir le chemin d'accès au fichier de certificat provenant d'une autorité de certification dans le champ à droite. Vous pouvez également renseigner ce champ en cliquant sur le bouton [...] à droite de ce champ, en navigant jusqu'au dossier où se trouve le fichier de certificat et en sélectionnant le fichier de certificat. Ce champ est disponible lorsque l'option X509 est sélectionnée dans la liste déroulante Authentication mechanism. |
Data file | Saisissez le chemin d'accès complet au fichier duquel importer les données, ou cliquez sur le bouton [...] afin de parcourir votre système jusqu'au fichier de données. Assurez-vous que le fichier de données est bien dans un format standard. Par exemple, les champs des fichiers CSV doivent être séparés par une virgule. |
File type | Sélectionnez le type de fichier dans la liste. Les formats CSV, TSV et JSON sont supportés. |
The JSON file starts with an array | Cochez cette case pour permettre au tMongoDBBulkload de lire les fichiers JSON commençant par un tableau. Cette case est disponible lorsque vous avez sélectionné JSON dans la liste File type. |
Action on data | Sélectionnez l'action à effectuer sur les données.
|
Upsert fields | Personnalisez les champs sur lesquels effectuer un upsert. Cette table est disponible lorsque vous sélectionnez Upsert dans la liste Action on data. |
First line is header | Cochez cette case pour utiliser la première ligne d'un fichier CSV ou TSV en tant qu'en-tête. Cette case est disponible uniquement lorsque vous sélectionnez CSV ou TSV dans la liste File type. |
Ignore blanks | Cochez cette case pour ignorer les champs vides dans les fichiers CSV ou TSV. Cette case est disponible uniquement lorsque vous sélectionnez CSV ou TSV dans la liste File type. |
Print log | Cochez cette case pour afficher les logs. |
Advanced settings
Additional arguments | Renseignez cette table afin d'utiliser des arguments supplémentaires selon vos besoins. Par exemple, vous pouvez utiliser l'argument "--jsonArray" pour accepter l'import de données de différents documents MongoDB dans un seul tableau JSON. Pour plus d'informations concernant les arguments supplémentaires, consultez la documentation MongoDB (en anglais). |
Disable retryable writes | Cochez cette case pour désactiver les tentatives automatiques de réécriture. Pour plus d'informations concernant cette option, consultez la documentation MongoDB (en anglais). Cette option est supportée uniquement avec mongoimport en version 100.9.5 ou supérieure. |
tStatCatcher Statistics | Cochez cette case afin de collecter les données du log au niveau du composant. |
Global Variables
Variables globales |
NB_LINE : nombre de lignes lues par un composant d'entrée ou passées à un composant de sortie. Cette variable est une variable After et retourne un entier. ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, lorsque le composant contient cette case. Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant. Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. À partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser. Pour plus d'informations concernant les variables, consultez Utiliser les contextes et les variables. |
Utilisation
Règle d'utilisation | Ce composant peut être utilisé avec un tMongoDBInput afin de vérifier si les données sont bien importées. |
Limitation | L'outil client MongoDB doit être installé sur la machine où les Jobs contenant ce composant sont exécutés. |