Propriétés du tAzureSynapseBulkExec Standard
Ces propriétés sont utilisées pour configurer le tAzureSynapseBulkExec s'exécutant dans le framework de Jobs Standard.
Le composant tAzureSynapseBulkExec Standard appartient à deux familles : Cloud et Bases de données.
Le composant de ce framework est disponible dans tous les produits Talend.
Basic settings
Property Type |
Sélectionnez la manière de configurer les informations de connexion.
|
Use an existing connection |
Cochez cette case et sélectionnez le composant de connexion adéquat dans la liste Component list pour réutiliser les paramètres d'une connexion que vous avez déjà définie. Notez que lorsqu'un Job contient un Job parent et un Job enfant, si vous devez partager une connexion existante entre ces deux niveaux, par exemple pour partager la connexion créée par le Job parent au Job enfant, vous devez :
Pour un exemple de partage d'une connexion à une base de données à travers différents niveaux de Jobs, consultez le Guide d'utilisation du Studio Talend . |
JDBC Provider |
Sélectionnez le fournisseur du pilote JDBC à utiliser. |
Host |
Saisissez l'adresse IP ou le nom d'hôte du serveur de la base de données ou de l'instance Azure Synapse Analytics à utiliser. Si le service SQL Server Browser est en cours d'exécution sur la machine où se situe le serveur, vous pouvez vous connecter à une instance nommée via un port TCP dynamique et fournir le nom d'hôte et le nom d'instance dans ce champ, au format {host_name}\{instance_name}. Dans ce cas, laissez le champ Port vide. Consultez Service SQL Server Browser (uniquement en anglais) pour plus d'informations. |
Port |
Saisissez le numéro du port d'écoute du serveur de la base de données ou de l'instance Azure Synapse Analytics à utiliser. Si le service SQL Server Browser est en cours d'exécution sur la machine où se situe le serveur, vous pouvez vous connecter à une instance nommée via un port TCP dynamique en fournissant le nom d'hôte et le nom d'instance dans le champ Host et en laissant ce champ vide. Consultez Service SQL Server Browser (uniquement en anglais) pour plus d'informations. |
Schéma |
Saisissez le nom du schéma Azure Synapse Analytics. |
Base de données |
Spécifiez le nom du service Azure Synapse Analytics à utiliser. |
Username et Password |
Saisissez les informations d'authentification. Pour saisir le mot de passe, cliquez sur le bouton [...] près du champ Password, saisissez le mot de passe entre guillemets doubles dans la boîte de dialogue et cliquez sur OK. Vous pouvez utiliser Type 2 integrated authentication sous Windows en ajoutant integratedSecurity=true dans Additional JDBC Parameters et en laissant ces deux champs vides. Consultez la section Connexion avec une authentification intégrée sous Windows dans la page Création de l’URL de connexion (uniquement en anglais), pour plus d'informations. |
Additional JDBC Parameters |
Définissez des propriétés de connexion supplémentaires pour la connexion à la base de données que vous créez. Les propriétés sont séparées par un point-virgule et chaque propriété est une paire clé-valeur. Par exemple, encrypt=true;trustServerCertificate=false; hostNameInCertificate=*.database.windows.net;loginTimeout=30; pour une connexion à la base de données Azure SQL. |
Table |
Spécifiez le nom de la table de SQL Data Warehouse dans laquelle charger les données. |
Action on table |
Sélectionnez une opération à effectuer sur la table définie, vous pouvez effectuer l'une des opérations suivantes :
|
Schema et Edit schema |
Un schéma est une description de lignes. Il définit le nombre de champs (colonnes) à traiter et à passer au composant suivant. Lorsque vous créez un Job Spark, évitez le mot réservé line lors du nommage des champs.
Créez le schéma en cliquant sur le bouton Edit Schema.
Note InformationsRemarque : Si vous effectuez des modifications, le schéma passe automatiquement en type built-in.
|
Load method |
Configurez la méthode de chargement des données. Deux options sont fournies : Copy et PolyBase. Consultez Stratégies de chargement des données pour le pool SQL Synapse (uniquement en anglais) pour plus d'informations. Note InformationsRemarque : Cette option est disponible uniquement si vous avez installé la mise à jour mensuelle R2020-05 du Studio ou une mise à jour plus récente fournie par Talend. Pour plus d'informations, contactez votre administrateur.
|
Azure Storage |
Sélectionnez le type de stockage Azure duquel charger les données. Vous pouvez sélectionner Blob Storage, Data Lake Storage Gen1 ou Data Lake Storage Gen2. Notez que l'option Data Lake Storage Gen1 n'est pas disponible si l'option Copy est sélectionnée dans la liste déroulante Load method. Note InformationsRemarque : L'option Data Lake Storage Gen2 est disponible uniquement si vous avez installé la mise à jour mensuelle R2020-05 du Studio ou une mise à jour plus récente fournie par Talend. Pour plus d'informations, contactez votre administrateur.
|
Authentication method |
Sélectionnez l'une des méthodes d'authentification suivantes dans la liste déroulante.
Cette option est disponible lorsque l'option Copy (Copier) est sélectionnée dans la liste déroulante Load method (Méthode de chargement). Note InformationsRemarque : Cette option est disponible uniquement si vous avez installé la mise à jour mensuelle R2020-05 du Studio ou une mise à jour plus récente fournie par Talend. Pour plus d'informations, contactez votre administrateur.
|
Account Name |
Saisissez le nom de votre compte pour accéder à Azure Blob Storage ou Azure Data Lake Storage. |
Access key |
Saisissez la clé associée au compte de stockage auquel vous devez accéder. Deux clés sont disponibles pour chaque compte. Par défaut, n'importe laquelle peut être utilisée pour accéder au compte. Sélectionnez dans la liste déroulante le composant dont les informations de connexion seront utilisées pour configurer la connexion à Azure Storage. Cette propriété est disponible uniquement lorsque l'option Blob Storage est sélectionnée dans la liste déroulante Azure Storage. |
SAS Token |
Saisissez la valeur du jeton SAS. Pour plus d'informations, consultez Accorder un accès limité aux ressources du Stockage Azure à l’aide des signatures d’accès partagé (SAP) (uniquement en anglais). Cette option n'est disponible que pour l'option Shared access signatures (Signatures d'accès partagées) de la liste déroulante Authentication method (Méthode d'authentification). Note InformationsRemarque : Cette option est disponible uniquement si vous avez installé la mise à jour mensuelle R2020-05 du Studio ou une mise à jour plus récente fournie par Talend. Pour plus d'informations, contactez votre administrateur.
|
Endpoint suffix |
Saisissez l'endpoint du service Azure Storage. La combinaison du nom de compte et de l'endpoint de service Azure Storage forme l'endpoint du compte de stockage. La valeur par défaut varie selon le paramètre Azure Storage, "dfs.core.windows.net" pour Data Lake Storage Gen2 et "blob.core.windows.net" pour Blob Storage. Ce champ n'est disponible que pour l'option Copy (Copier) de la liste déroulante Load method (Méthode de chargement). Note InformationsRemarque : Cette option est disponible uniquement si vous avez installé la mise à jour mensuelle R2020-05 du Studio ou une mise à jour plus récente fournie par Talend. Pour plus d'informations, contactez votre administrateur.
|
Container |
Saisissez le nom du conteneur d'objets blob. Cette propriété est disponible uniquement lorsque l'option Blob Storage est sélectionnée dans la liste déroulante Azure Storage. |
External paths |
Saisissez les chemins externes desquels charger les données. Vous pouvez ajouter plusieurs chemins externes en cliquant sur le bouton +, en bas. Notez que les chemins externes sont des chemins relatifs, avec le conteneur comme racine. Ce champ est disponible uniquement lorsque l'option Copy est sélectionnée dans la liste déroulante Load method, dans la vue Basic settings. Note InformationsRemarque : Cette option est disponible uniquement si vous avez installé la mise à jour mensuelle R2020-05 du Studio ou une mise à jour plus récente fournie par Talend. Pour plus d'informations, contactez votre administrateur.
|
Client Id |
Saisissez l'ID de votre application (également appelée ID du client). Ce champ est disponible lorsque l'option Data Lake Storage Gen1 est sélectionnée dans la liste déroulante Azure Storage. |
OAuth 2.0 token endpoint |
Dans le champ Token endpoint, copiez-collez l'endpoint du jeton OAuth 2.0 que vous pouvez obtenir à partir de la liste Endpoints dans la page App registrations de votre portail Azure. Ce champ est disponible lorsque l'option Data Lake Storage Gen1 est sélectionnée dans la liste déroulante Azure Storage. |
Azure Storage Location |
Spécifiez l'emplacement où est créé votre compte Azure Blob Storage ou Azure Data Lake Storage. |
Advanced settings
Secure transfer required |
Sélectionnez cette option pour utiliser le transfert sécurisé pour la connexion à Azure Storage. Cette option est disponible lorsque l'option Data Lake Storage Gen2 est sélectionnée dans la liste déroulante Azure Storage et que l'option PolyBase est sélectionnée dans la liste déroulante Load method dans la vue Basic settings. Note InformationsRemarque : Cette option est disponible uniquement si vous avez installé la mise à jour mensuelle R2020-05 du Studio ou une mise à jour plus récente fournie par Talend. Pour plus d'informations, contactez votre administrateur.
|
Authenticate using Azure Active Directory |
Cochez cette option pour utiliser l'authentification Azure Active Directory lors de l'établissement de la connexion. Consultez Utiliser Authentification Microsoft Entra (uniquement en anglais) pour des informations associées. Note InformationsRemarque : Cette option est disponible uniquement si vous avez installé la mise à jour mensuelle R2020-05 du Studio ou une mise à jour plus récente fournie par Talend. Pour plus d'informations, contactez votre administrateur.
|
Format du fichier |
Sélectionnez le format de fichier définissant les données externes stockées dans votre Azure Blob Storage ou Azure Data Lake Storage, Delimited Text, Hive RCFile, Hive ORC ou Parquet. Cette option est disponible lorsque l'option PolyBase est sélectionnée dans la liste déroulante Load method dans la vue Basic settings. Pour plus d'informations concernant les formats de fichiers, consultez CREATE EXTERNAL FILE FORMAT (en anglais) (uniquement en anglais). |
File type |
Sélectionnez le type de fichier définissant les données externes stockées dans votre Azure Blob Storage ou Azure Data Lake Storage, CSV, ORC ou Parquet. Ce champ est disponible uniquement lorsque l'option Copy est sélectionnée dans la liste déroulante Load method, dans la vue Basic settings. Pour plus d'informations concernant les formats de fichiers, consultez CREATE EXTERNAL FILE FORMAT (en anglais) (uniquement en anglais). Note InformationsRemarque : Cette option est disponible uniquement si vous avez installé la mise à jour mensuelle R2020-05 du Studio ou une mise à jour plus récente fournie par Talend. Pour plus d'informations, contactez votre administrateur.
|
Specify map to source table fields |
Sélectionnez cette option pour mapper les champs du fichier source aux colonnes du schéma spécifique en saisissant des colonnes de schéma et des index de champs dans la table qui s'affiche. Notez que les index de champs du fichier source doivent être donnés en ordre croissant dans la table. Si cette option n'est pas sélectionnée, les champs du fichier source seront mappés aux colonnes de schéma dans l'ordre par défaut. Ce champ est disponible uniquement lorsque l'option Copy est sélectionnée dans la liste déroulante Load method, dans la vue Basic settings. Note InformationsRemarque : Cette option est disponible uniquement si vous avez installé la mise à jour mensuelle R2020-05 du Studio ou une mise à jour plus récente fournie par Talend. Pour plus d'informations, contactez votre administrateur.
|
First row |
Configurez le nombre de lignes à traiter comme en-têtes dans le fichier source. La valeur par défaut est 1. Ce champ est disponible uniquement lorsque l'option Copy est sélectionnée dans la liste déroulante Load method, dans la vue Basic settings et que l'option CSV est sélectionnée dans la liste déroulante File type. Note InformationsRemarque : Cette option est disponible uniquement si vous avez installé la mise à jour mensuelle R2020-05 du Studio ou une mise à jour plus récente fournie par Talend. Pour plus d'informations, contactez votre administrateur.
|
Field quote |
Spécifiez le caractère utilisé comme caractère de citation (séparateur de chaînes de caractères) dans le fichier source. Ce champ est disponible uniquement lorsque l'option Copy est sélectionnée dans la liste déroulante Load method, dans la vue Basic settings et que l'option CSV est sélectionnée dans la liste déroulante File type. Note InformationsRemarque : Cette option est disponible uniquement si vous avez installé la mise à jour mensuelle R2020-05 du Studio ou une mise à jour plus récente fournie par Talend. Pour plus d'informations, contactez votre administrateur.
|
Field Terminator |
Spécifiez le caractère de fin de champ, indiquant la fin de chaque champ dans le fichier source. Ce champ est disponible uniquement lorsque l'option Copy est sélectionnée dans la liste déroulante Load method, dans la vue Basic settings et que l'option CSV est sélectionnée dans la liste déroulante File type. Note InformationsRemarque : Cette option est disponible uniquement si vous avez installé la mise à jour mensuelle R2020-05 du Studio ou une mise à jour plus récente fournie par Talend. Pour plus d'informations, contactez votre administrateur.
|
Row terminator |
Spécifiez le caractère de fin de ligne, indiquant la fin de chaque ligne dans le fichier source. Ce champ est disponible uniquement lorsque l'option Copy est sélectionnée dans la liste déroulante Load method, dans la vue Basic settings et que l'option CSV est sélectionnée dans la liste déroulante File type. Note InformationsRemarque : Cette option est disponible uniquement si vous avez installé la mise à jour mensuelle R2020-05 du Studio ou une mise à jour plus récente fournie par Talend. Pour plus d'informations, contactez votre administrateur.
|
Date format |
Spécifiez le format de date. La valeur par défaut est Session date format. Ce champ est disponible uniquement lorsque l'option Copy est sélectionnée dans la liste déroulante Load method, dans la vue Basic settings et que l'option CSV est sélectionnée dans la liste déroulante File type. Note InformationsRemarque : Cette option est disponible uniquement si vous avez installé la mise à jour mensuelle R2020-05 du Studio ou une mise à jour plus récente fournie par Talend. Pour plus d'informations, contactez votre administrateur.
|
Encoding |
Sélectionnez l'encodage dans la liste, UTF8 ou UTF16. Ce champ est disponible uniquement lorsque l'option Copy est sélectionnée dans la liste déroulante Load method, dans la vue Basic settings et que l'option CSV est sélectionnée dans la liste déroulante File type. Note InformationsRemarque : Cette option est disponible uniquement si vous avez installé la mise à jour mensuelle R2020-05 du Studio ou une mise à jour plus récente fournie par Talend. Pour plus d'informations, contactez votre administrateur.
|
Identity insert |
Sélectionnez cette option pour insérer les valeurs d'identité du fichier source dans la colonne d'identité. Pour plus d'informations, consultez COPY (Transact-SQL) (préversion) (uniquement en anglais). Ce champ est disponible uniquement lorsque l'option Copy est sélectionnée dans la liste déroulante Load method, dans la vue Basic settings. Note InformationsRemarque : Cette option est disponible uniquement si vous avez installé la mise à jour mensuelle R2020-05 du Studio ou une mise à jour plus récente fournie par Talend. Pour plus d'informations, contactez votre administrateur.
|
Max errors |
Saisissez le nombre maximal d'erreurs autorisées avant que le processus ne s'arrête. Ce champ est disponible uniquement lorsque l'option Copy est sélectionnée dans la liste déroulante Load method, dans la vue Basic settings. |
Field separator |
Spécifiez le(s) caractère(s) indiquant la fin de chaque champ, dans le fichier délimité. Cette propriété est disponible lorsque l'option PolyBase est sélectionnée dans la liste déroulante Load method (Méthode de chargement), dans la vue Basic settings (Paramètres de base) et que Delimited Text (Fichier délimité) est sélectionnée dans la liste déroulante File Format (Format de fichier). |
Enclosed by |
Cochez cette case et, dans le champ proche, spécifiez le caractère entourant la chaîne de caractères dans le fichier délimité. Cette propriété est disponible lorsque l'option PolyBase est sélectionnée dans la liste déroulante Load method (Méthode de chargement), dans la vue Basic settings (Paramètres de base) et que Delimited Text (Fichier délimité) est sélectionnée dans la liste déroulante File Format (Format de fichier). |
Date format |
Cochez cette case et, dans le champ proche, spécifiez le format personnalisé pour toutes les données d'heure et de date dans le fichier délimité. Pour plus d'informations concernant le format de date, consultez CREATE EXTERNAL FILE FORMAT (uniquement en anglais). Cette propriété est disponible lorsque l'option PolyBase est sélectionnée dans la liste déroulante Load method (Méthode de chargement), dans la vue Basic settings (Paramètres de base) et que Delimited Text (Fichier délimité) est sélectionnée dans la liste déroulante File Format (Format de fichier). |
Use type default |
Cochez cette case pour stocker chaque valeur manquante à l'aide de la valeur par défaut du type de données de la colonne correspondante. Décochez cette case pour stocker chaque valeur manquante dans le fichier délimité en tant que NULL. Cette propriété est disponible lorsque l'option PolyBase est sélectionnée dans la liste déroulante Load method (Méthode de chargement), dans la vue Basic settings (Paramètres de base) et que Delimited Text (Fichier délimité) est sélectionnée dans la liste déroulante File Format (Format de fichier). |
Serde Method |
Sélectionnez une méthode Hive de sérialisation et désérialisation. Cette propriété est disponible lorsque l'option Hive RCFile est sélectionnée dans la liste déroulante File format. |
Compressed by |
Cochez cette case si les données externes sont compressées. Dans la liste déroulante qui s'affiche, sélectionnez la méthode de compression. |
Data import reject options |
Cochez cette case pour spécifier les options de rejet suivantes.
Cette option n'est disponible que pour l'option PolyBase de la liste déroulante Load method (Méthode de chargement). Pour plus d'informations concernant les options de rejet, consultez CREATE EXTERNAL TABLE (uniquement en anglais). |
Distribution Option |
Sélectionnez le modèle de partitionnement (sharding) utilisé pour distribuer les données dans la table, Round Robin, Hash ou Replicate. Pour plus d'informations concernant les modèles de partitionnement supportés par Azure Synapse Analytics, consultez Architecture de pool SQL dédié (anciennement SQL DW) dans Azure Synapse Analytics (uniquement en anglais). Cette propriété est disponible lorsqu'une option relative à la création de table est sélectionnée dans la liste déroulante Action on table. |
Distribution Column Name |
Nom de la colonne de distribution pour une table e distribution par hachage. Cette propriété est disponible uniquement lorsque l'option Hash est sélectionnée dans la liste déroulante Distribution Option. |
Table Option |
Sélectionnez le type d'index de la table, Clustered Columnstore Index, Heap ou Clustered Index. Pour plus d'informations, consultez Indexation de tables dans SQL Data Warehouse (uniquement en anglais). Cette propriété est disponible lorsqu'une option relative à la création de table est sélectionnée dans la liste déroulante Action on table. |
Index column(s) |
Spécifiez le nom d'une ou plusieurs colonne(s) clé(s) dans l'index. Si plusieurs colonnes sont spécifiées, séparez-les par une virgule. Cette propriété est disponible uniquement lorsque l'option Clustered Index est sélectionnée dans la liste déroulante Table Option. |
Partition |
Cochez cette case pour spécifier les options de partitionnement suivantes :
Pour plus d'informations concernant les partitions de tables, consultez Partitionnement de tables dans SQL Data Warehouse (uniquement en anglais). Cette propriété est disponible lorsqu'une option relative à la création de table est sélectionnée dans la liste déroulante Action on table. |
tStatCatcher Statistics |
Cochez cette case pour collecter les métadonnées de traitement du Job, aussi bien au niveau du Job qu'au niveau de chaque composant. |
Variables globales
ERROR_MESSAGE |
Message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. |
NB_LINE_INSERTED |
Nombre de lignes insérées. Cette variable est une variable After et retourne un entier. |
Utilisation
Règle d'utilisation |
Ce composant peut être utilisé en standalone dans un Job ou un sous-Job. |
Limitation |
Certaines fonctionnalités supportées par d'autres bases de données ne sont pas supportées par Azure Synapse Analytics. Pour plus d'informations, consultez Fonctionnalités de table non prises en charge (uniquement en anglais). |