Propriétés du tMapROjaiInput Standard
Ces propriétés sont utilisées pour configurer le tMapROjaiInput s'exécutant dans le framework de Job Standard.
Le composant tMapROjaiInput Standard appartient à la famille Bases de données NoSQL.
Le composant de ce framework est disponible dans tous les produits Talend avec Big Data et dans Talend Data Fabric.
Basic settings
Distribution et Version |
Sélectionnez la version du cluster MapR. Pour être utilisé, le cluster doit héberger une base de données MapR-DB. |
Schema et Edit schema |
Un schéma est une description de lignes. Il définit le nombre de champs (colonnes) à traiter et à passer au composant suivant. Lorsque vous créez un Job Spark, évitez le mot réservé line lors du nommage des champs.
Créez le schéma en cliquant sur le bouton Edit Schema. Si vous effectuez des modifications, le schéma passe automatiquement en type built-in.
Ce composant supporte le type Document. Si un champ concerne les documents entiers, sélectionnez Document dans la colonne Type pour ce champ dans l'éditeur de schéma. Cliquez sur Sync columns pour récupérer le schéma du composant précédent dans le Job. |
Use kerberos authentication |
Si vous accédez à une base de données MapR-DB de type OJAI s'exécutant avec une sécurité Kerberos, cochez cette case, saisissez le nom et le mot de passe du Principal, dans les champs qui s'affichent. À chaque démarrage du Job, le composant envoie ses informations d'authentification à Kerberos pour un nouveau ticket kinit. |
Use a keytab to authenticate |
Cochez la case Use a keytab to authenticate pour vous connecter à un système utilisant Kerberos à l'aide d'un fichier keytab. Un fichier Keytab contient les paires des Principaux et clés cryptées Kerberos. Vous devez saisir le principal à utiliser dans le champ Principal et le chemin d'accès au fichier keytab dans le champ Keytab. Ce fichier keytab doit être stocké sur la machine où s'exécute votre Job, par exemple, sur un Talend JobServer. l'utilisateur ou l'utilisatrice exécutant un Job utilisant un fichier Keytab n'est pas nécessairement celui désigné par un Principal mais doit avoir le droit de lire le fichier Keytab utilisé. Par exemple, le nom d'utilisateur ou d'utilisatrice que vous utilisez pour exécuter le Job est user1 et le principal à utiliser est guest. Dans cette situation, assurez-vous que user1 a les droits de lecture pour le fichier Keytab à utiliser. |
Restrict partial sorts with Secondary Indexes |
Cochez cette case pour forcer la requête à trier explicitement les données. Ainsi, vous évitez dans votre requête les tris partiels pouvant survenir à cause d'index secondaires asynchrones. Pour plus d'informations relatives aux problèmes de tri partiel dans MapR OJAI, consultez Asynchronous Secondary Index Updates dans la documentation MapR (en anglais). Ne cochez pas cette case si vous n'attendez pas de latence dans les index asynchrones ou si vous savez que l'impact de la latence est minime. En laissant cette case décochée, votre requête bénéficie des avantages de tri fournis pas les index secondaires des tables JSON MapR-DB. |
Table name |
Saisissez le nom de table à traiter. |
Query |
Spécifiez la clause WHERE de la requête à effectuer par le tMapROjaiInput. Par exemple, saisissez "{id:{$eq: 4}}" ou "{id:4}}"pour récupérer l'enregistrement dans lequel id est 4. Puisqu'OJAI utilise le format de requêtes MongoDB pour les requêtes, consultez Query Operators dans la documentation MongoDB, pour en savoir plus sur les opérateurs disponibles. |
Mapping |
Chaque colonne du schéma défini pour ce composant représente un champ des documents à lire. Dans cette table, vous devez spécifier les nœuds parents de ces champs, s'il y en a. Par exemple, dans le document se présentant comme suit :
{ _id: ObjectId("5099803df3f4948bd2f98391"), person: { first: "Joe", last: "Walker" } }Les champs first et last ont un nœud parent person mais le champ _id ne contient aucun nœud parent. Cela fait, la table Mapping doit ressembler à ceci : Column Parent node path _id first "person" last "person" |
Advanced settings
tStatCatcher Statistics |
Cochez cette case pour collecter les métadonnées de traitement du Job, aussi bien au niveau du Job qu'au niveau de chaque composant. |
Variables globales
Variables globales |
ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, lorsque le composant contient cette case. NB_LINE : nombre de lignes lues par un composant d'entrée ou passées à un composant de sortie. Cette variable est une variable After et retourne un entier. Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant. Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. À partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser. Pour plus d'informations concernant les variables, consultez Utiliser les contextes et les variables. |
Utilisation
Règle d'utilisation |
Le tMapROjaiInput exécute des requêtes pour lire des données d'une base de données MapR-DB. Ce composant est un composant de début dans un Job et nécessite un lien de sortie pour envoyer les données au composant suivant. |