Propriétés du tRedshiftOutputBulk Standard
Ces propriétés sont utilisées pour configurer le tRedshiftOutputBulk s'exécutant dans le framework de Jobs Standard.
Le composant tRedshiftOutputBulk Standard appartient aux familles Cloud et Bases de données.
Le composant de ce framework est disponible dans tous les produits Talend.
Basic settings
Base de données |
Sélectionnez le type de base de données dans la liste et cliquez sur Apply (Appliquer). |
Data file path at local |
Spécifiez le chemin d'accès local au fichier à générer. Notez que ce fichier est généré sur la machine où est installé le Studio Talend ou sur laquelle le Job utilisant ce composant est déployé. |
Schema et Edit schema |
Un schéma est une description de lignes. Il définit le nombre de champs (colonnes) à traiter et à passer au composant suivant. Lorsque vous créez un Job Spark, évitez le mot réservé line lors du nommage des champs. Built-in : le schéma est créé et conservé localement pour ce composant seulement. Repository : le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé dans des Jobs et projets. Créez le schéma en cliquant sur le bouton Edit Schema. Si le schéma est en mode Repository, trois options sont disponibles :
|
Compress the data file |
Cochez cette case et sélectionnez dans la liste un type de compression pour le fichier de données. Cette case est indisponible lorsque la case Append the local file est cochée. |
Encrypt |
Cochez cette case pour générer et charger le fichier de données dans Amazon S3 en utilisant le chiffrement côté client. Dans le champ Encryption key affiché, saisissez la clé de chiffrement utilisée pour chiffrer le fichier. Cette case est décochée par défaut et le fichier de données est chargé dans Amazon S3 en utilisant le chiffrement côté serveur. Note InformationsRemarque : Cette option est disponible lorsque la case Use an existing S3 connection n'est pas cochée.
Pour plus d'informations concernant le chiffrement côté serveur et côté client, consultez Protection des données à l'aide d'un chiffrement. |
Use an existing S3 connection |
Cochez cette case et sélectionnez le composant de connexion adéquat dans la liste Component list pour réutiliser les paramètres d'une connexion que vous avez déjà définie. |
Credential provider |
Spécifiez la manière d'obtenir les identifiants de sécurité AWS : Static Credentials ou Inherit credentials from AWS role.
|
Access Key |
Spécifiez l'ID de la clé d'accès identifiant de manière unique un compte AWS. Pour savoir comment obtenir votre clé d'accès et votre clé secrète d'accès, consultez Getting Your AWS Access Keys (en anglais). Note InformationsRemarque : Cette option est disponible lorsque Use an existing S3 connection ou Inherit credentials from AWS role ne sont pas sélectionnés dans la liste déroulante Credentials provider.
|
Secret Key |
Spécifiez la clé secrète d'accès, constituant les informations de sécurité, ainsi que la clé d'accès. Pour saisir la clé secrète, cliquez sur le bouton [...] à côté du champ Secret key, puis, dans la boîte de dialogue qui s'ouvre, saisissez le mot de passe entre guillemets doubles puis cliquez sur OK afin de sauvegarder les paramètres. Note InformationsRemarque : Cette option est disponible lorsque Use an existing S3 connection ou Inherit credentials from AWS role ne sont pas sélectionnés dans la liste déroulante Credentials provider.
|
Assume Role (Endosser un rôle) |
Si vous avez temporairement besoin d'autorisations d'accès relatives à un rôle AWS IAM qui n'est pas octroyé à votre compte d'utilisateur ou d'utilisatrice, cochez cette case afin d'assumer ce rôle. Puis, spécifiez les valeurs des paramètres suivants pour créer une session du rôle. Assurez-vous que l'accès à ce rôle a été octroyé à votre compte d'utilisateur ou d'utilisatrice par la politique de sécurité associée à ce rôle. En cas de doute, adressez-vous au propriétaire de ce rôle ou à votre administrateur AWS. Note InformationsRemarque : Cette option est disponible lorsque la case Use an existing S3 connection n'est pas cochée.
|
Region |
Spécifiez la zone géographique AWS en sélectionnant le nom d'une zone géographique dans la liste ou en saisissant le nom de la zone entre guillemets doubles ("us-east-1" par exemple) dans la liste. Pour plus d'informations concernant les zones géographiques AWS, consultez Régions et points de terminaison AWS . Note InformationsRemarque : Cette option est disponible lorsque la case Use an existing S3 connection n'est pas cochée.
|
Bucket |
Saisissez le nom du bucket Amazon S3, le dossier de plus haut niveau, dans lequel charger le fichier. Le bucket et la base de données Redshift à utiliser doivent se situer dans la même région sur Amazon. Cela permet d'éviter les erreurs S3ServiceException d'Amazon. Pour plus d'informations concernant ces erreurs, consultez S3ServiceException Errors (en anglais). |
Key |
Saisissez la clé d'objet assignée au fichier chargé dans Amazon S3. |
Advanced settings
Field Separator |
Saisissez le caractère utilisé pour séparer les champs. |
Text enclosure |
Sélectionnez le caractère avec lequel entourer les champs. |
Delete local file after putting it to S3 |
Cochez cette case pour supprimer le fichier local après son chargement dans Amazon S3. Par défaut, cette case est cochée. |
Create directory if not exists |
Cochez cette case pour créer le répertoire spécifié dans le champ Data file path at local, s'il n'existe pas. Par défaut, cette case est cochée. |
Encoding |
Sélectionnez un type d'encodage pour les données dans le fichier à générer. |
Config client |
Cochez cette case afin de configurer les paramètres clients pour Amazon S3. Cliquez sur le bouton [+] sous la table pour ajouter autant de lignes que nécessaire, chaque ligne pour un paramètre de configuration client, et configurez la valeur des attributs suivants pour chaque paramètre :
Pour plus d'informations concernant les paramètres clients S3, consultez Configuration du Client. |
STS Endpoint |
Cochez cette case afin de spécifier l'endpoint du service AWS Security Token Service duquel les informations d'authentification sont récupérées. Par exemple, saisissez sts.amazonaws.com. Cette case est disponible uniquement lorsque la case Assume Role est cochée. |
Signing region |
Sélectionnez la région AWS du service STS. Si la région n'est pas dans la liste, vous pouvez saisir son nom entre guillemets doubles. La valeur par défaut est us-east-1. Cette liste déroulante case est disponible uniquement lorsque la case Assume Role est cochée. |
External Id |
Si l'administrateur du compte auquel le rôle appartient vous a fourni un ID externe, saisissez sa valeur ici. L'ID externe (External Id) est un identifiant unique permettant à un nombre d'utilisateurs et d'utilisatrices connecté·e·s limité d'avoir ce rôle. Ce champ est disponible uniquement lorsque la case Assume Role est cochée. |
Serial number |
Lorsque vous avez un rôle attribué, la politique de confiance de ce rôle peut nécessiter une authentification multifacteur. Dans ce cas, vous devez indiquer le numéro d'identification du matériel ou de l'appareil d'authentification multifacteur virtuel associé à l'utilisateur ou l'utilisatrice ayant ce rôle. Ce champ est disponible uniquement lorsque la case Assume Role est cochée. |
Token code |
Lorsque vous avez un rôle attribué, la politique de confiance de ce rôle peut nécessiter une authentification multifacteur. Dans ce cas, vous devez indiquer un code de jeton. Ce code de jeton est un mot de passe à utilisation unique produit par l'appareil d'authentification multifacteur. Ce champ est disponible uniquement lorsque la case Assume Role est cochée. |
Tags |
Liste les balises de session sous forme de paires clé-valeur. Vous pouvez utiliser ces balises de session dans des politiques afin de permettre d'autoriser ou l'accès aux requêtes. Transitive : cochez cette case pour indiquer qu'une balise persiste vers le rôle suivant dans une chaîne de rôles. Pour plus d'informations concernant les balises, consultez Chaînage des rôles avec des balises de session. Ce champ est disponible uniquement lorsque la case Assume Role est cochée. |
IAM Policy ARNs |
Saisissez les noms ARN (Amazon Resource Names) des stratégies gérées par IAM que vous souhaitez utiliser comme stratégies de sessions gérées. Utiliser les stratégies de sessions gérées afin de limiter les autorisations de la session. Les politiques doivent exister dans le même compte que le rôle. Les autorisations de la session sont au croisement de la stratégie des rôles basée sur l'identité et des stratégies de sessions. Pour plus d'informations concernant les stratégies de sessions, consultez la documentation Stratégies de session. Ce champ est disponible uniquement lorsque la case Assume Role est cochée. |
Policy (Politique d'application) |
Saisissez une politique IAM au format JSON, à utiliser comme politique de session. Utilisez les politiques de session afin de limiter les autorisations de la session. Les autorisations de la session sont au croisement de la stratégie des rôles basée sur l'identité et des stratégies de sessions. Pour plus d'informations concernant les stratégies de sessions, consultez la documentation Stratégies de session. Ce champ est disponible uniquement lorsque la case Assume Role est cochée. |
tStatCatcher Statistics |
Cochez cette case pour collecter les métadonnées de traitement du Job au niveau du Job ainsi qu'au niveau de chaque composant. |
Variables globales
Variables globales |
NB_LINE : nombre de lignes traitées. Cette variable est une variable After et retourne un entier. ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, lorsque le composant contient cette case. Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant. Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. À partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser. Pour plus d'informations concernant les variables, consultez Utiliser les contextes et les variables. |
Utilisation
Règle d'utilisation |
Ce composant est généralement utilisé avec le composant tRedshiftBulkExec pour alimenter Amazon Redshift avec un fichier délimité/CSV. Utilisés ensemble, ils permettent de maximiser les performances lorsqu'ils alimentent Amazon Redshift. |