Propriétés du tMapRStreamsInput Standard
Ces propriétés sont utilisées pour configurer le tMapRStreamsInput s'exécutant dans le framework de Jobs Standard.
Le composant tMapRStreamsInput Standard appartient à la famille Internet.
Le composant de ce framework est disponible dans tous les produits Talend avec Big Data et dans Talend Data Fabric.
Basic settings
Schema et Edit schema |
Un schéma est une description de lignes. Il définit le nombre de champs (colonnes) à traiter et à passer au composant suivant. Lorsque vous créez un Job Spark, évitez le mot réservé line lors du nommage des champs. Notez que le schéma de ce composant est en lecture seule. Il stocke les messages envoyés du producteur de messages. |
Output type |
Sélectionnez le type de données à envoyer au composant suivant. Généralement, il est recommandé d'utiliser le type String, car le tMapRStreamsInput peut automatiquement traduire les messages MapR Streams de type byte[] en chaînes de caractères, afin de les traiter par le Job. Cependant, si le format des messages MapR Streams est inconnu du tMapRStreamsInput, comme Protobuf, vous pouvez sélectionner byte[] et utiliser un composant Custom code, comme le tJavaRow, afin de désérialiser les messages en chaînes de caractères, afin que les autres composants du Job puissent traiter ces messages. |
Use an existing connection |
Cochez cette case et, dans la liste qui s'affiche, sélectionnez le composant de connexion permettant de réutiliser les informations de connexion précédemment définies. |
Distribution et Version |
Sélectionnez la distribution MapR à utiliser. Seules les versions 5.2 et supérieures de MapR sont supportées par les composants MapRDB. Si la distribution que vous devez utiliser pour votre base de données MapRDB n'est pas officiellement supportée par ce composant MapRBD, c'est-à-dire, si la distribution de MapR ne s'affiche pas dans la liste déroulante Version de ce composant ou si cette distribution n'est pas MapR, sélectionnez Custom.
|
Topic name |
Saisissez le nom du topic duquel le tMapRStreamsInput reçoit le flux des messages. Vous devez saisir le nom du flux auquel ce topic appartient. La syntaxe est la suivante : chemin_du_flux:nom_du_topic |
Consumer group ID |
Saisissez le nom du groupe de consommateurs auquel vous souhaitez que le consommateur courant (le composant tMapRStreamsInput) appartienne. Ce groupe de consommateurs sera créé lors de l'exécution s'il n'existe pas. |
Reset offsets on consumer group |
Cochez cette case pour supprimer les offsets sauvegardés pour le groupe de consommateurs à utiliser, afin que ce groupe de consommateurs soit géré comme un nouveau groupe n'ayant consommé aucun message. |
New consumer group starts from |
Sélectionnez le point de départ duquel les messages d'un topic sont consommés. Dans MapR Streams, le numéro d'ID séquentiel d'un message se nomme offset. Lorsqu'un nouveau groupe de consommateurs démarre, dans cette liste, vous pouvez sélectionner beginning pour commencer la consommation depuis le message le plus ancien du topic entier ou sélectionner latest pour attendre un nouveau message. Notez que le groupe de consommateurs prend en compte uniquement les messages dont l'offset a été commité comme point de départ. Chaque groupe de consommateurs possède son propre compteur pour se rappeler la position d'un message consommé. Pour cette raison, une fois qu'un groupe de consommateurs a commencé à consommer des messages d'un topic donné, un groupe de consommateurs reconnaît le message le plus récent en voyant simplement la position où son groupe a arrêté la consommation, plutôt que le topic complet. Partant de ce principe, les comportements suivants peuvent être attendus :
|
Auto-commit offsets |
Cochez cette case pour que le tMapRStreamsInput sauvegarde automatiquement l'état de sa consommation, à la fin de chaque intervalle de temps donné. Vous devez définir cet intervalle dans le champ Interval affiché. Notez que les offsets sont commités uniquement à la fin de chaque intervalle. Si votre Job s'arrête au milieu d'un intervalle, l'était de consommation du message dans cet intervalle n'est pas commité. |
Stop after a maximum total duration (ms) |
Cochez cette case et, dans le champ qui s'affiche, saisissez la durée (en millisecondes) à la fin de laquelle le tMapRStreamsInput arrête son exécution. |
Stop after receiving a maximum number of messages |
Cochez cette case et, dans le champ qui s'affiche, saisissez le nombre maximal de messages que le tMapRStreamsInput doit recevoir avant qu'il arrête automatiquement de s'exécuter. |
Stop after maximum time waiting between messages (ms) |
Cochez cette case et, dans le champ qui s'affiche, saisissez le temps d'attente (en millisecondes) durant lequel le tMapRStreamsInput attend un nouveau message. Si le tMapRStreamsInput ne reçoit pas de nouveau message et que l'intervalle de temps est épuisé, son exécution s'arrête. |
Advanced settings
Consumer properties |
Ajoutez les propriétés de consommation Kafka nécessaires pour personnaliser cette table. |
Timeout precision(ms) |
Saisissez, en millisecondes, la durée à la suite de laquelle vous souhaitez retourner une exception de suspension si aucun message n'est disponible à la consommation. La valeur -1 indique qu'aucun délai avant suspension n'est configuré. |
Load the offset with the message |
Cochez cette case pour écrire en sortie les offsets des messages consommés au composant suivant. Lorsque vous cochez cette case, une colonne offset en lecture seule est ajoutée au schéma. |
Custom encoding |
Il est possible de rencontrer des problèmes d'encodage lorsque vous traitez les données stockées. Dans ce cas, cochez cette case pour afficher la liste Encoding. Sélectionnez l'encodage à partir de la liste ou sélectionnez Custom et définissez-le manuellement. |
tStatCatcher Statistics |
Cochez cette case pour collecter les métadonnées de traitement au niveau du Job ainsi qu'au niveau de chaque composant. |
Variables globales
Variables globales |
ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, lorsque le composant contient cette case. Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant. Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. À partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser. Pour plus d'informations concernant les variables, consultez Utiliser les contextes et les variables. |
Utilisation
Règle d'utilisation |
Ce composant est utilisé en tant que composant de début et nécessite un lien de sortie. Lorsque le topic MapR Streams à utiliser n'existe pas, vous pouvez d'abord créer ce topic à l'aide du composant tMapRStreamsCreateTopic ou de votre interface en ligne de commande MapR. |
Prérequis |
La distribution Hadoop doit être correctement installée afin de garantir les interactions avec le Studio Talend . La liste suivante présente des informations d'exemple relatives à MapR.
Pour plus d'informations concernant l'installation d'une distribution Hadoop, consultez le manuel correspondant à la distribution Hadoop que vous utilisez. |