Propriétés du tAzureSynapseBulkExec Standard
Ces propriétés sont utilisées pour configurer le tAzureSynapseBulkExec s'exécutant dans le framework de Jobs Standard.
Le composant tAzureSynapseBulkExec Standard appartient à deux familles : Cloud et Bases de données.
Le composant de ce framework est disponible dans tous les produits Talend.
Basic settings
Type de propriété |
Sélectionnez la manière de configurer les informations de connexion.
|
Use an existing connection |
Cochez cette case et sélectionnez le composant de connexion adéquat dans la liste Component list pour réutiliser les paramètres d'une connexion que vous avez déjà définie. Notez que lorsqu'un Job contient un Job parent et un Job enfant, si vous devez partager une connexion existante entre ces deux niveaux, par exemple pour partager la connexion créée par le Job parent au Job enfant, vous devez :
Pour un exemple de partage d'une connexion à une base de données à travers différents niveaux de Jobs, consultez Partager une connexion à une base de données. |
JDBC Provider |
Sélectionnez le fournisseur du pilote JDBC à utiliser. |
Host | Saisissez l'adresse IP ou le nom d'hôte du serveur de la base de données ou de l'instance Azure Synapse Analytics à utiliser. Si le service SQL Server Browser est en cours d'exécution sur la machine où se situe le serveur, vous pouvez vous connecter à une instance nommée via un port TCP dynamique et fournir le nom d'hôte et le nom d'instance dans ce champ, au format {host_name}\{instance_name}. Dans ce cas, laissez le champ Port vide. Consultez Service SQL Server Browser pour plus d'informations. |
Port | Saisissez le numéro du port d'écoute du serveur de la base de données ou de l'instance Azure Synapse Analytics à utiliser. Si le service SQL Server Browser est en cours d'exécution sur la machine où se situe le serveur, vous pouvez vous connecter à une instance nommée via un port TCP dynamique en fournissant le nom d'hôte et le nom d'instance dans le champ Host et en laissant ce champ vide. Consultez Service SQL Server Browser pour plus d'informations. |
Schéma | Saisissez le nom du schéma Azure Synapse Analytics. |
Base de données | Spécifiez le nom du service Azure Synapse Analytics à utiliser. |
Username et Password | Saisissez les informations d'authentification. Pour saisir le mot de passe, cliquez sur le bouton [...] près du champ Password, saisissez le mot de passe entre guillemets doubles dans la boîte de dialogue et cliquez sur OK. Vous pouvez utiliser Type 2 integrated authentication sous Windows en ajoutant integratedSecurity=true dans Additional JDBC Parameters et en laissant ces deux champs vides. Consultez la section Connexion avec une authentification intégrée sous Windows dans la page Création de l’URL de connexion, pour plus d'informations. |
Additional JDBC Parameters |
Définissez des propriétés de connexion supplémentaires pour la connexion à la base de données que vous créez. Les propriétés sont séparées par un point-virgule et chaque propriété est une paire clé-valeur. Par exemple, encrypt=true;trustServerCertificate=false; hostNameInCertificate=*.database.windows.net;loginTimeout=30; pour une connexion à la base de données Azure SQL. |
Table | Spécifiez le nom de la table de SQL Data Warehouse dans laquelle charger les données. |
Action on table |
Sélectionnez une opération à effectuer sur la table définie, vous pouvez effectuer l'une des opérations suivantes :
|
Schema et Edit schema |
Un schéma est une description de lignes. Il définit le nombre de champs (colonnes) à traiter et à passer au composant suivant. Lorsque vous créez un Job Spark, évitez le mot réservé line lors du nommage des champs.
Créez le schéma en cliquant sur le bouton Edit Schema. Si vous effectuez des modifications, le schéma passe automatiquement en type built-in.
|
Load method |
Configurez la méthode de chargement des données. Deux options sont fournies : Copy et PolyBase. Consultez Stratégies de chargement des données pour le pool SQL Synapse pour plus d'informations. |
Azure Storage | Sélectionnez le type de stockage Azure duquel charger les données. L'option Data Lake Storage Gen1 n'est pas disponible si l'option Copy est sélectionnée dans la liste déroulante Load method. Si vous sélectionnez PloyBase dans la liste Load method, Data Lake Storage Gen2 dans la liste Azure Storage, dans la vue Basic settings et Secure transfer required dans la vue Advanced settings, l'option Authentication with managed identity s'affichera dans la vue Basic settings. Consultez Documentation sur les identités managées pour des ressources Azure pour plus d'informations. |
Authentication method |
Sélectionnez l'une des méthodes d'authentification suivantes dans la liste déroulante.
Cette option est disponible uniquement lorsque l'option Copy (Copier) est sélectionnée dans la liste déroulante Load method (Méthode de chargement). |
Account Name | Saisissez le nom de votre compte pour accéder à Azure Blob Storage ou Azure Data Lake Storage. |
Access key |
Saisissez la clé associée au compte de stockage auquel vous devez accéder. Deux clés sont disponibles pour chaque compte. Par défaut, n'importe laquelle peut être utilisée pour accéder au compte. Sélectionnez dans la liste déroulante le composant dont les informations de connexion seront utilisées pour configurer la connexion à Azure Storage. Cette option est disponible uniquement lorsque l'option Blob Storage est sélectionnée dans la liste déroulante Azure Storage. |
SAS Token |
Saisissez la valeur du jeton SAS. Pour plus d'informations, consultez Accorder un accès limité aux ressources du Stockage Azure à l’aide des signatures d’accès partagé (SAP). Cette option est disponible uniquement lorsque l'option Shared access signatures (Signatures d'accès partagées) est sélectionnée dans la liste déroulante Authentication method (Méthode d'authentification). |
Endpoint suffix |
Saisissez l'endpoint du service Azure Storage. La combinaison du nom de compte et de l'endpoint de service Azure Storage forme l'endpoint du compte de stockage. La valeur par défaut varie selon le paramètre Azure Storage, "dfs.core.windows.net" pour Data Lake Storage Gen2 et "blob.core.windows.net" pour Blob Storage. Cette option est disponible uniquement lorsque l'option Copy (Copier) est sélectionnée dans la liste déroulante Load method (Méthode de chargement). |
Container | Saisissez le nom du conteneur d'objets blob. Cette option est disponible uniquement lorsque l'option Blob Storage est sélectionnée dans la liste déroulante Azure Storage. |
External paths |
Saisissez les chemins externes desquels charger les données. Vous pouvez ajouter plusieurs chemins externes en cliquant sur le bouton +, en bas. Notez que les chemins externes sont des chemins relatifs, avec le conteneur comme racine. Cette option est disponible uniquement lorsque l'option Copy (Copier) est sélectionnée dans la liste déroulante Load method (Méthode de chargement) de la vue Basic settings (Paramètres simples) . |
Client Id | Saisissez l'ID de votre application (également appelée ID du client). Cette option est disponible uniquement lorsque l'option Data Lake Storage Gen1 est sélectionnée dans la liste déroulante Azure Storage. |
OAuth 2.0 token endpoint |
Dans le champ Token endpoint, copiez-collez l'endpoint du jeton OAuth 2.0 que vous pouvez obtenir à partir de la liste Endpoints dans la page App registrations de votre portail Azure. Cette option est disponible uniquement lorsque l'option Data Lake Storage Gen1 est sélectionnée dans la liste déroulante Azure Storage. |
Azure Storage Location | Spécifiez l'emplacement où est créé votre compte Azure Blob Storage ou Azure Data Lake Storage. |
Advanced settings
Secure transfer required | Sélectionnez cette option pour utiliser le transfert sécurisé pour la connexion à Azure Storage. Cette option est disponible uniquement lorsque l'option Data Lake Storage Gen2 est sélectionnée dans la liste déroulante Azure Storage et que l'option PloyBase est sélectionnée dans la liste déroulante Load method dans la vue Basic settings. |
Authenticate using Azure Active Directory |
Cochez cette option pour utiliser l'authentification Azure Active Directory lors de l'établissement de la connexion. Consultez Utiliser Authentification Microsoft Entra pour des informations associées. |
Format du fichier | Sélectionnez le type de format définissant les données externes stockées dans votre Azure Blob Storage ou Azure Data Lake Storage. Cette option est disponible uniquement lorsque l'option PloyBase est sélectionnée dans la liste déroulante Load method (Méthode de chargement) de la vue Basic settings. Pour plus d'informations concernant les formats de fichiers, consultez CREATE EXTERNAL FILE FORMAT (en anglais). |
File type | Sélectionnez le type de fichier définissant les données externes stockées dans votre Azure Blob Storage ou Azure Data Lake Storage. Si vous sélectionnez Blob Storage dans la liste déroulante Azure Storage de la vue Basic settings, seul le type de fichier CSV est supporté. Cette option est disponible uniquement lorsque l'option Copy (Copier) est sélectionnée dans la liste déroulante Load method (Méthode de chargement) de la vue Basic settings (Paramètres simples) . Pour plus d'informations concernant les formats de fichiers, consultez CREATE EXTERNAL FILE FORMAT (en anglais). |
Specify map to source table fields | Sélectionnez cette option pour mapper les champs du fichier source aux colonnes du schéma spécifique en saisissant des colonnes de schéma et des index de champs dans la table qui s'affiche. Notez que les index de champs du fichier source doivent être donnés en ordre croissant dans la table. Si cette option n'est pas sélectionnée, les champs du fichier source seront mappés aux colonnes de schéma dans l'ordre par défaut. Cette option est disponible uniquement lorsque l'option Copy (Copier) est sélectionnée dans la liste déroulante Load method (Méthode de chargement) de la vue Basic settings (Paramètres simples) . |
First row |
Configurez le nombre de lignes à traiter comme en-têtes dans le fichier source. La valeur par défaut est 1. Cette option est disponible uniquement lorsque l'option Copy est sélectionnée dans la liste déroulante Load method, dans la vue Basic settings et que l'option CSV est sélectionnée dans la liste déroulante File type. |
Field quote | Spécifiez le caractère utilisé comme caractère de citation (séparateur de chaînes de caractères) dans le fichier source. Cette option est disponible uniquement lorsque l'option Copy est sélectionnée dans la liste déroulante Load method, dans la vue Basic settings et que l'option CSV est sélectionnée dans la liste déroulante File type. |
Field Terminator | Spécifiez le caractère de fin de champ, indiquant la fin de chaque champ dans le fichier source. Cette option est disponible uniquement lorsque l'option Copy est sélectionnée dans la liste déroulante Load method, dans la vue Basic settings et que l'option CSV est sélectionnée dans la liste déroulante File type. |
Row terminator | Spécifiez le caractère de fin de ligne, indiquant la fin de chaque ligne dans le fichier source. Cette option est disponible uniquement lorsque l'option Copy est sélectionnée dans la liste déroulante Load method, dans la vue Basic settings et que l'option CSV est sélectionnée dans la liste déroulante File type. |
Date format | Spécifiez le format de date. La valeur par défaut est Session date format. Cette option est disponible uniquement lorsque l'option Copy est sélectionnée dans la liste déroulante Load method, dans la vue Basic settings et que l'option CSV est sélectionnée dans la liste déroulante File type. |
Encoding | Sélectionnez l'encodage dans la liste, UTF8 ou UTF16. Cette option est disponible uniquement lorsque l'option Copy est sélectionnée dans la liste déroulante Load method, dans la vue Basic settings et que l'option CSV est sélectionnée dans la liste déroulante File type. |
Identity insert |
Sélectionnez cette option pour insérer les valeurs d'identité du fichier source dans la colonne d'identité. Pour plus d'informations, consultez COPY (Transact-SQL) (préversion). Cette option est disponible uniquement lorsque l'option Copy (Copier) est sélectionnée dans la liste déroulante Load method (Méthode de chargement) de la vue Basic settings (Paramètres simples) . |
Max errors | Saisissez le nombre maximal d'erreurs autorisées avant que le processus ne s'arrête. Cette option est disponible uniquement lorsque l'option Copy (Copier) est sélectionnée dans la liste déroulante Load method (Méthode de chargement) de la vue Basic settings (Paramètres simples) . |
Field separator | Spécifiez le·s caractère·s indiquant la fin de chaque champ, dans le fichier délimité. Cette option est disponible uniquement lorsque l'option PloyBase est sélectionnée dans la liste déroulante Load method de la vue Basic settings et que l'option Delimited Text est sélectionnée dans la liste déroulante File format. |
Enclosed by | Cochez cette case et, dans le champ proche, spécifiez le caractère entourant la chaîne de caractères dans le fichier délimité. Cette option est disponible uniquement lorsque l'option PloyBase est sélectionnée dans la liste déroulante Load method de la vue Basic settings et que l'option Delimited Text est sélectionnée dans la liste déroulante File format. |
Date format | Cochez cette case et, dans le champ proche, spécifiez le format personnalisé pour toutes les données d'heure et de date dans le fichier délimité. Pour plus d'informations concernant le format de date, consultez CREATE EXTERNAL FILE FORMAT. Cette option est disponible uniquement lorsque l'option PloyBase est sélectionnée dans la liste déroulante Load method de la vue Basic settings et que l'option Delimited Text est sélectionnée dans la liste déroulante File format. |
Use type default | Cochez cette case pour stocker chaque valeur manquante à l'aide de la valeur par défaut du type de données de la colonne correspondante. Décochez cette case pour stocker chaque valeur manquante dans le fichier délimité en tant que NULL. Cette option est disponible uniquement lorsque l'option PloyBase est sélectionnée dans la liste déroulante Load method de la vue Basic settings et que l'option Delimited Text est sélectionnée dans la liste déroulante File format. |
Serde Method | Sélectionnez une méthode Hive de sérialisation et désérialisation. Cette option est disponible uniquement lorsque l'option Hive RCFile est sélectionnée dans la liste déroulante File format. |
Compressed by | Cochez cette case si les données externes sont compressées. Dans la liste déroulante qui s'affiche, sélectionnez la méthode de compression. |
Data import reject options | Cochez cette case pour spécifier les options de rejet suivantes.
Cette option n'est disponible que pour l'option PolyBase de la liste déroulante Load method (Méthode de chargement). Pour plus d'informations concernant les options de rejet, consultez CREATE EXTERNAL TABLE. |
Distribution Option | Sélectionnez le modèle de sharding utilisé pour distribuer les données dans la table. Pour plus d'informations concernant les modèles de partitionnement supportés par Azure Synapse Analytics, consultez Architecture de pool SQL dédié (anciennement SQL DW) dans Azure Synapse Analytics. Cette option est disponible uniquement lorsqu'une option relative à la création de table est sélectionnée dans la liste déroulante Action on table. |
Distribution Column Name | Nom de la colonne de distribution pour une table e distribution par hachage. Cette option est disponible uniquement lorsque l'option Hash est sélectionnée dans la liste déroulante Distribution Option. |
Table Option | Sélectionnez le type d'index de la table. Pour plus d'informations, consultez Indexation de tables dans SQL Data Warehouse. Cette option est disponible uniquement lorsqu'une option relative à la création de table est sélectionnée dans la liste déroulante Action on table. |
Index column(s) | Spécifiez le nom d'une ou plusieurs colonne(s) clé(s) dans l'index. Si plusieurs colonnes sont spécifiées, séparez-les par une virgule. Cette option est disponible uniquement lorsque l'option Clustered Index est sélectionnée dans la liste déroulante Table Option. |
Partition | Cochez cette case pour spécifier les options de partitionnement suivantes :
Pour plus d'informations concernant les partitions de tables, consultez Partitionnement de tables dans SQL Data Warehouse. Cette option est disponible uniquement lorsqu'une option relative à la création de table est sélectionnée dans la liste déroulante Action on table. |
tStatCatcher Statistics |
Cochez cette case pour collecter les métadonnées de traitement du Job, aussi bien au niveau du Job qu'au niveau de chaque composant. |
Variables globales
ERROR_MESSAGE |
Message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. |
NB_LINE_INSERTED |
Nombre de lignes insérées. Cette variable est une variable After et retourne un entier. |
Utilisation
Règle d'utilisation |
Ce composant peut être utilisé en standalone dans un Job ou un sous-Job. |
Limitation |
Certaines fonctionnalités supportées par d'autres bases de données ne sont pas supportées par Azure Synapse Analytics. Pour plus d'informations, consultez Fonctionnalités de table non supportées. |