Accéder au contenu principal Passer au contenu complémentaire

tBatchAddressRowCloud

Ce composant utilise le traitement batch afin de parser les données d'adresses et obtenir rapidement des adresses formatées, précises et sans devoir installer de logiciel.

Les données d'adresses sont corrigées par rapport aux dernières données de référence en ligne provenant de plusieurs fournisseurs, notamment Loqate et MelissaData. Le tBatchAddressRowCloud propose des alternatives pour les données d'adresses manquantes, telles que le pays ou le code postal, et les adresses sont enrichies avec d'autres éléments comme la latitude et la longitude. Les avantages de ce composant par rapport au tAddressRowCloud est le gain de performance lors du traitement de grands volumes de données.

Le composant tBatchAddressRowCloud divise des adresses provenant de flux d'entrées en différents fichiers (batchs), vérifie et formate les adresses dans chaque fichier à l'aide de services batch en ligne.

Ce composant n'est pas intégré par défaut à votre Studio Talend. Vous devez l'installer à l'aide du gestionnaire des fonctionnalités. Pour plus d'informations, consultez Installer les fonctionnalités à l'aide du Gestionnaire des fonctionnalités.

Propriétés du tBatchAddressRowCloud Standard

Ces propriétés sont utilisées pour configurer le tBatchAddressRowCloud s'exécutant dans le framework de Jobs Standard.

Le composant tBatchAddressRowCloud Standard appartient à la famille Qualité de données.

Ce composant est disponible dans Talend Data Management Platform, Talend Big Data Platform, Talend Real-Time Big Data Platform, Talend Data Services Platform et Talend Data Fabric.

Basic settings

Propriétés Description

Schema

  • Un schéma est une description de lignes. Il définit le nombre de champs (colonnes) à traiter et à passer au composant suivant. Lorsque vous créez un Job Spark, évitez le mot réservé line lors du nommage des champs.

  • Built-in : le schéma est créé et conservé localement pour ce composant seulement.

  • Repository : le schéma existe déjà et est stocké dans le Repository. Ainsi, il peut être réutilisé dans des Jobs et projets.

Edit Schema

Cliquez sur le bouton [...] et définissez les schémas d'entrée et de sortie des données d'adresses.

Le schéma de sortie du composant tBatchAddressRowCloud propose plusieurs colonnes d'adresses en lecture seule dont la colonne VerificationLevel qui fournit un statut de la vérification de l'adresse traitée. Les niveaux de vérification de cette colonne sont définis par Talend. Pour plus d'informations, consultez Niveaux de vérification d'adresses dans le tAddressRowCloud.

Certaines colonnes de sortie peuvent aussi rester vides lors de l'exécution du Job selon le fournisseur d'adresses sélectionné dans les Basic settings du composant.

Address Provider

Sélectionnez dans la liste le fournisseur des données de référence par rapport auquel vous souhaitez valider et formater les adresses d'entrée.

La liste des fournisseurs d'adresses est constituée de Loqate et MelissaData.

Default Country

Sélectionnez le nom de pays pour lequel le code ISO 3166-1 alpha-3 code doit être utilisé lorsque vous parsez les données et qu'aucun pays identifiable n'est trouvé dans un enregistrement d'entrée.

License/API key

Saisissez la clé de licence ou d'API fournie par le fournisseur d'adresses sélectionné dans la liste.

Pour saisir une clé de licence, cliquez sur le bouton […] à côté du champ.

Vous devez visiter le site du fournisseur, vous enregistrer et obtenir la clé de licence/d'API.

Batch Job name

Saisissez, entre guillemets, un nom pour les fichiers batch générés et stockés sur le serveur de Loqate. Ces fichiers contiennent le résultat du traitement batch.

Cette option n'apparaît que si Loqate est le fournisseur d'adresses sélectionné.

Number of rows in each batch file

Saisissez le nombre d'enregistrements d'adresses à grouper dans chaque fichier batch.

Cette option n'apparaît que si Loqate est le fournisseur d'adresses sélectionné.

Note InformationsRemarque : Si MelissaData est le fournisseur d'adresses sélectionné, 100 lignes sont envoyées dans chaque fichier batch.

Loqate website login

Saisissez votre identifiant, fourni par Loqate.

Cette option n'apparaît que si Loqate est le fournisseur d'adresses sélectionné.

Loqate website password

Saisissez le mot de passe fourni par Loqate.

Cette option n'apparaît que si Loqate est le fournisseur d'adresses sélectionné.

Processing Mode

Cette option s'applique uniquement au fournisseur Loqate.

Dans la liste, sélectionnez le mode de validation d'adresses que vous souhaitez utiliser :

Verify and Geocode (par défaut) : avec ce mode, le composant standardise, corrige les adresses et les enrichit avec des informations de latitude et longitude.
Note InformationsRemarque : Combiner la vérification d'adresses et le géocodage vous coûtera des crédits supplémentaires. Pour plus d'informations, consultez les tarifs Loqate (en anglais).

- Verify only : avec ce mode, le composant standardise et corrige les adresses sans les enrichir avec les informations de latitude et longitude.

Cette option n'apparaît que si Loqate est le fournisseur d'adresses sélectionné.

Input Mapping

Address field : ajoutez des lignes à la table et sélectionnez dans la liste des adresses prédéfinies les champs qui contiendront les adresses d'entrée.

Le tBatchAddressRowCloud fournit une longue liste de champs d'adresses, car certains pays ont des structures d'adresses plus complexes que d'autres. Pour plus d'informations concernant les champs d'entrée, consultez Champs d'adresses dans le tLoqateAddressRow.

Input Column : ajoutez des lignes à la table et sélectionnez dans la liste les colonnes contenant les adresses d'entrée. Le schéma d'entrée peut contenir une ou plusieurs colonne(s) et même contenir des colonnes ne représentant pas de données d'adresses.

Use Additional Output

Cochez cette case et utilisez la table Output Mapping pour ajouter des colonnes d'adresses au schéma de sortie :

Address field : ajoutez des lignes à la table et sélectionnez, dans la liste d'adresses prédéfinies, les champs des informations supplémentaires que vous souhaitez écrire en sortie.

Ces champs d'adresses prédéfinies varient selon le fournisseur sélectionné dans la liste Address Provider. Pour plus d'informations concernant les champs d'adresses supplémentaires, consultez le site Web de votre fournisseur.

Output Column : sélectionnez dans la liste les colonnes qui contiendront les informations des adresses supplémentaires de sortie. Vous devez d'abord ajouter ces colonnes supplémentaires au schéma de sortie du tBatchAddressRowCloud via le bouton Edit Schema.

Le tBatchAddressRowCloud mappe les valeurs des champs d'adresses vers les colonnes le sortie dans la colonne Output Column.

Si vous choisissez d'avoir une colonne de sortie dans la table Output Address ayant le même nom qu'une colonne d'entrée, la valeur de la colonne d'entrée est écrasée par la valeur donnée par le composant.

Advanced settings

Propriétés Description

Use mockup mode (no credit consumption)

Avant de pouvoir utiliser cette option, vous devez exécuter votre Job au moins une fois afin de créer des fichiers batch sur le serveur de Loqate.

Cette option sert uniquement au test ou au développement. Vous ne serez pas facturés pour le traitement batch si vous choisissez d'exécuter le Job avec cette option.

Cochez cette case afin de simuler l'exécution et les réponses du serveur de Loqate en utilisant en sortie un fichier batch ayant été précédemment traité et sauvegardé sur le serveur.

Batch ID : configurez l'identifiant du fichier batch à utiliser comme entrée dans votre Job.

Vous pouvez obtenir l'identifiant du fichier si vous vous connectez à Loqate et accédez au serveur Loqate.

tStat Catcher Statistics

Cochez cette case afin de collecter les données au niveau du composant.

Variables globales

Variables Description

Variables globales

ERROR_MESSAGE : message d'erreur généré par le composant lorsqu'une erreur survient. Cette variable est une variable After et retourne une chaîne de caractères. Cette variable fonctionne uniquement si la case Die on error est décochée, lorsque le composant contient cette case.

Une variable Flow fonctionne durant l'exécution d'un composant. Une variable After fonctionne après l'exécution d'un composant.

Pour renseigner un champ ou une expression à l'aide d'une variable, appuyez sur les touches Ctrl+Espace pour accéder à la liste des variables. À partir de cette liste, vous pouvez choisir la variable que vous souhaitez utiliser.

Pour plus d'informations concernant les variables, consultez Utiliser les contextes et les variables.

Utilisation

Conseils d'utilisation Description

Règle d'utilisation

Ce composant est un composant intermédiaire. Il nécessite un flux d'entrée et un flux de sortie.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.