Accéder au contenu principal Passer au contenu complémentaire

Propriétés du tCassandraInput Standard

Ces propriétés sont utilisées pour configurer le tCassandraInput s'exécutant dans le framework de Jobs Standard.

Le composant tCassandraInput Standard appartient aux familles Big Data et Bases de données NoSQL.

Le composant de ce framework est disponible dans tous les produits Talend avec Big Data et dans Talend Data Fabric.

Basic settings

Property type

Peut être Built-In ou Repository.

Built-In : aucune propriété n'est stockée de manière centrale.

Repository : Sélectionnez le fichier dans lequel sont stockées les propriétés du composant.

Use existing connection

Cochez cette case et sélectionnez le composant de connexion adéquat dans la liste Component list pour réutiliser les paramètres d'une connexion que vous avez déjà définie.

DB Version

Sélectionnez la version de Cassandra que vous utilisez.

API type

Cette liste déroulante s'affiche uniquement lorsque vous avez sélectionné la version 2.0 de Cassandra dans la liste DB version. Dans cette liste API type, vous pouvez sélectionner Datastax pour utiliser CQL 3 (Cassandra Query Language) avec Cassandra ou sélectionnez Hector pour utiliser CQL 2.

Notez que l'API Hector est dépréciée, ainsi que le support de Cassandra V2.0.

Avec l'évolution des commandes CQL, les paramètres à configurer dans la vue Basic settings varient.

Host

Saisissez le nom de l'hôte ou l'adresse IP du serveur Cassandra.

Port

Saisissez le numéro du port d'écoute du serveur Cassandra.

Authentification requise

Cochez cette case afin de fournir les informations d'authentification pour Cassandra.

Cette case apparaît uniquement si vous ne cochez pas la case Use existing connection.

Username

Saisissez dans ce champ le nom d'utilisateur ou d'utilisatrice pour l'authentification à Cassandra.

Password

Saisissez dans ce champ le mot de passe pour l'authentification à Cassandra.

Pour saisir le mot de passe, cliquez sur le bouton [...] à côté du champ Password, puis, dans la boîte de dialogue qui s'ouvre, saisissez le mot de passe entre guillemets doubles et cliquez sur OK afin de sauvegarder les paramètres.

Espace de clés

Saisissez le nom du Keyspace duquel lire les données.

Column family

Saisissez le nom de famille de la colonne de laquelle lire les données.

Schema et Edit Schema

Un schéma est une description de lignes. Il définit le nombre de champs (colonnes) à traiter et à passer au composant suivant. Lorsque vous créez un Job Spark, évitez le mot réservé line lors du nommage des champs.

Créez le schéma en cliquant sur le bouton Edit Schema. Si le schéma est en mode Repository, trois options sont disponibles :

  • View schema : sélectionnez cette option afin de voir uniquement le schéma.

  • Change to built-in property : sélectionnez cette option pour passer le schéma en mode Built-In et effectuer des modifications locales.

  • Update repository connection : sélectionnez cette option afin de modifier le schéma stocké dans le référentiel et décider de propager ou non les modifications à tous les Jobs. Si vous souhaitez propager les modifications uniquement au Job courant, cliquez sur No et sélectionnez à nouveau la métadonnée du schéma dans la fenêtre Repository Content.

Query

Saisissez les instructions de requête à utiliser pour lire les données dans la base de données Cassandra.

Par défaut, la requête n'est pas sensible à la casse. Cela signifie, que, lors de l'exécution, le nom des colonnes saisis dans la requête sont toujours pris en minuscules. Si vous voulez rendre la requête sensible à la casse, mettez les noms de colonnes entre guillemets doubles.

Le bouton [...] à côté de ce champ vous permet de générer le code d'exemple affichant quelles sont les variables prédéfinies pour les données à lire et comment ces variables peuvent être utilisées.

Cette fonctionnalité est disponible uniquement à partir de la version 2.0 (dépréciée) de l'API Datastax de Cassandra.

Column family type

Standard : la famille de colonnes est de type Standard.

Super : la famille de colonnes est de type Super.

Include key in output columns

Cochez cette case pour inclure la clé de la famille de colonnes dans les colonnes de sortie.

  • Key column : sélectionnez la colonne de clé dans la liste.

Row key type

Sélectionnez dans la liste le type de données Talend appropriées pour la clé de ligne.

Row key Cassandra type

Sélectionnez dans la liste le type Cassandra pour la clé de ligne.

Note InformationsAvertissement :

La valeur de l'option Default varie en fonction du type de clé de ligne sélectionné. Par exemple, si vous sélectionnez String dans la liste Row key type, la valeur de l'option Default est UTF8.

Pour plus d'informations concernant la table de mapping entre le type Cassandra et le type de données Talend, consultez Tableaux des correspondances entre le type Cassandra et le type de données Talend.

Include super key output columns

Cochez cette case pour inclure la super clé de la famille de colonnes dans les colonnes de sortie.

  • Super key column : sélectionnez la colonne de super clés dans la liste.

Cette case apparaît uniquement si vous sélectionnez Super dans la liste Column family type.

Super column type

Sélectionnez dans la liste le type de la super colonne.

Super column Cassandra type

Sélectionnez le type Cassandra correspondant à la super colonne, dans la liste.

Pour plus d'informations concernant la table de mapping entre le type Cassandra et le type de données Talend, consultez Tableaux des correspondances entre le type Cassandra et le type de données Talend.

Specify row keys

Cochez cette case afin de spécifier les clés des lignes de la famille de colonnes.

Row Keys

Saisissez les clés de lignes spécifiques dans la famille de colonnes, au format correct selon le type de clé de ligne.

Ce champ apparaît uniquement si la case Specify row keys est cochée.

Key start

Saisissez la clé de la ligne de début du type de données correct.

Key end

Saisissez la clé de la ligne de fin du type de données correct.

Key limit

Saisissez le nombre de lignes à lire entre la ligne de début et la ligne de fin.

Specify columns

Cochez cette case afin de spécifier directement le nom des colonnes de la famille de colonnes.

Columns

Spécifiez directement le nom des colonnes de la famille de colonnes, au format correct selon le type de colonne.

Ce champ apparaît uniquement si la case Specify columns est cochée.

Columns range start

Saisissez le nom de la colonne de début du type de données correct.

Columns range end

Saisissez le nom de la colonne de fin du type de données correct.

Columns range limit

Saisissiez le nombre de colonnes à lire entre la colonne de début et la colonne de fin.

Advanced settings

tStatCatcher Statistics

Cochez cette case pour collecter les métadonnées de traitement du Job au niveau du Job ainsi qu'au niveau de chaque composant.

Variables globales

Variables globales

NB_LINE : nombre de lignes lues par un composant d'entrée ou passées à un composant de sortie. Cette variable est une variable After et retourne un entier.

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, lorsque le composant contient cette case.

Une variable Flow fonctionne durant l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. À partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez le Guide d'utilisation du Studio Talend.

Utilisation

Règle d'utilisation

Ce composant nécessite un lien de sortie.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.