Propriétés du tHBaseConnection Standard
Ces propriétés sont utilisées pour configurer le tHBaseConnection s'exécutant dans le framework de Jobs Standard.
Le composant tHBaseConnection Standard appartient aux familles Big Data et Bases de données NoSQL.
Le composant de ce framework est disponible dans tous les produits Talend avec Big Data et dans Talend Data Fabric.
Basic settings
Property type |
Peut être Built-in ou Repository. - Built-in : propriétés utilisées ponctuellement sans stockage dans le référentiel. - Repository : sélectionnez le fichier dans lequel sont stockées les propriétés du composant. Les champs suivants sont automatiquement renseignés à l'aide des données récupérées. |
Distribution |
Sélectionnez dans la liste le cluster que vous utilisez. Les options de la liste varient selon le composant que vous utilisez. Parmi ces options, les suivantes nécessitent une configuration spécifique :
|
HBase version |
Sélectionnez la version de la distribution Hadoop que vous utilisez. Les options disponibles dépendent du composant que vous utilisez. |
Hadoop version of the distribution |
Cette liste s'affiche uniquement lorsque vous avez sélectionné Custom dans la liste des distributions à connecter à un cluster n'étant pas officiellement supporté par le Studio. Dans cette situation, sélectionnez la version de Hadoop de ce cluster personnalisé, Hadoop 1 ou Hadoop 2. |
Zookeeper quorum |
Saisissez le nom ou l'URL du service Zookeeper utilisé pour coordonner les transactions entre votre Studio et votre base de données. Notez que, lorsque vous configurez Zookeeper, vous pouvez avoir besoin de configurer explicitement la propriété zookeeper.znode.parent pour définir le chemin vers le nœud znode racine contenant tous les znodes créés et utilisés par votre base de données. Cochez la case la case Set Zookeeper znode parent afin de définir cette propriété. |
Zookeeper client port |
Saisissez le numéro du port d'écoute client du service Zookeeper que vous utilisez. |
Inspect the classpath for configurations |
Cochez cette case pour permettre au composant de vérifier les fichiers de configuration dans le répertoire configuré pour la variable $HADOOP_CONF_DIR et de lire directement les paramètres de ces fichiers dans le répertoire. Cette fonctionnalité vous permet de modifier facilement la configuration Hadoop afin que le composant puisse passer d'un environnement à un autre, comme par exemple pour passer d'un environnement test à un environnement production. Dans ce cas, les champs ou les options utilisée pour configurer la connexion Hadoop et/ou la sécurité Kerberos sont masqués. Si vous souhaitez utiliser certains paramètres comme les paramètres Kerberos mais que ces paramètres ne sont pas inclus dans les fichiers de configuration Hadoop, vous devez créer un fichier appelé talend-site.xml et mettre ce fichier dans le répertoire défini dans $HADOOP_CONF_DIR. Le fichier talend-site.xml doit se présenter comme suit :
<!-- Put site-specific property overrides in this file. --> <configuration> <property> <name>talend.kerberos.authentication </name> <value>kinit </value> <description> Set the Kerberos authentication method to use. Valid values are: kinit or keytab. </description> </property> <property> <name>talend.kerberos.keytab.principal </name> <value>user@BIGDATA.COM </value> <description> Set the keytab's principal name. </description> </property> <property> <name>talend.kerberos.keytab.path </name> <value>/kdc/user.keytab </value> <description> Set the keytab's path. </description> </property> <property> <name>talend.encryption </name> <value>none </value> <description> Set the encryption method to use. Valid values are: none or ssl. </description> </property> <property> <name>talend.ssl.trustStore.path </name> <value>ssl </value> <description> Set SSL trust store path. </description> </property> <property> <name>talend.ssl.trustStore.password </name> <value>ssl </value> <description> Set SSL trust store password. </description> </property> </configuration> Les paramètres lus depuis ces fichiers de configuration écrasent ceux utilisés par défaut dans le Studio. Lorsqu'un paramètre n'existe pas dans ces fichiers de configuration, le paramètre par défaut est utilisé. |
Use kerberos authentication |
Si la base de données choisie utilise la sécurité Kerberos, cochez cette case puis saisissez le nom des principaux dans les champs affichés. Vous pouvez trouver cette information dans le fichier hbase-site.xml du cluster à utiliser.
Si vous souhaitez utiliser un fichier Kerberos keytab pour vous identifier, cochez la case Use a keytab to authenticate. Un fichier Keytab contient les paires des Principaux et clés cryptées Kerberos. Vous devez saisir le principal à utiliser dans le champ Principal et le chemin d'accès au fichier keytab dans le champ Keytab. Ce fichier keytab doit être stocké sur la machine où s'exécute votre Job, par exemple, sur un serveur de Jobs Talend. l'utilisateur ou l'utilisatrice exécutant un Job utilisant un fichier Keytab n'est pas nécessairement celui désigné par un Principal mais doit avoir le droit de lire le fichier Keytab utilisé. Par exemple, le nom d'utilisateur ou d'utilisatrice que vous utilisez pour exécuter le Job est user1 et le principal à utiliser est guest. Dans cette situation, assurez-vous que user1 a les droits de lecture pour le fichier Keytab à utiliser. |
Advanced settings
Propriétés |
Si vous devez utiliser la configuration personnalisée pour votre HBase, renseignez dans cette table la ou les propriété(s) à personnaliser. Lors de l'exécution, la ou les propriété(s) personnalisée(s) vont écraser celles définies précédemment pour HBase. Par exemple, vous devez définir la valeur de la propriété dfs.replication à 1 pour la configuration de HBase. Vous devez ajouter une ligne à cette table, à l'aide du bouton [+] et saisir le nom et la valeur de cette propriété dans la ligne. |
tStatCatcher Statistics |
Cochez cette case afin de collecter les données du log au niveau du composant. |
Global Variables
Variables globales |
ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, lorsque le composant contient cette case. Une variable Flow fonctionne durant l'exécution d'un composant. Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. À partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser. Pour plus d'informations concernant les variables, consultez le Guide d'utilisation du Studio Talend. |
Utilisation
Règle d'utilisation |
Ce composant est généralement utilisé avec d'autres composants HBase, notamment avec le tHBaseClose. |
Prérequis |
Avant de commencer, vérifiez que tous les prérequis de l'IP de Loopback (rebouclage) attendus par votre base de données sont respectés. La distribution Hadoop doit être correctement installée afin de garantir les interactions avec le Studio Talend . La liste suivante présente des informations d'exemple relatives à MapR.
Pour plus d'informations concernant l'installation d'une distribution Hadoop, consultez le manuel correspondant à la distribution Hadoop que vous utilisez. |