Accéder au contenu principal Passer au contenu complémentaire

Modification d'adresses par rapport à un fichier Melissa Data

Ce Job utilise le composant tFixedFlowInput pour générer les données d'adresses à analyser, le tMelissaDataAddress pour analyser le schéma d'entrée ainsi que valider, corriger et standardiser les adresses des États-Unis générées par le tFixedFlowInput et un tLogRow afin d'écrire en sortie les adresses correctement formatées, dans la console.

Note InformationsImportant : Le composant tMelissaDataAddress fonctionne avec les données provenant d'un installeur Melissa Data dont la date est au maximum 2023-05. Si vous avez installé une version 2023-06 ou supérieure, le Job échoue.

Ce scénario s'applique uniquement à Talend Data Management Platform, Talend Big Data Platform, Talend Real-Time Big Data Platform, Talend MDM Platform, Talend Data Services Platform, Talend MDM Platform et Talend Data Fabric.

Avant de commencer

Vous devez :
  1. Récupérer les données de latitude et longitude et les codes de résultat de GeoCode :
    • Achetez une licence GeoCode ou GeoPoint.
    • Installez Melissa Data avec les fichiers de données GeoPoint et GeoCode.
  2. Ajouter le chemin vers le dossier contenant la bibliothèque mdAddr à vos variables d'environnement système.
    • Lorsque l'option No Melissa GeoCoder License Was Purchased est sélectionnée, les bibliothèques requises sont :
      • mdAddr.dll
      • mdAddrJavaWrapper.dll
      • mdRightFielder.dll. Cette bibliothèque est requise lorsque la seule colonne d'entrée est Address.
      • mdRightFielderJavaWrapper.dll. Cette bibliothèque est requise lorsque la seule colonne d'entrée est Address.
    • Lorsque l'option No Melissa GeoCoder License Was Purchased ou The Melissa GeoCoder License Was Purchased est sélectionnée, les bibliothèques requises sont :
      • mdGeo.dll
      • mdGeoJavaWrapper.dll
      • mdAddr.dll
      • mdAddrJavaWrapper.dll
      • mdRightFielder.dll. Cette bibliothèque est requise lorsque la seule colonne d'entrée est Address.
      • mdRightFielderJavaWrapper.dll. Cette bibliothèque est requise lorsque la seule colonne d'entrée est Address.
      Sous Windows, les variables doivent être ajoutées dans la fenêtre Variables d'environnement.
      Fenêtre Modifier les variables d'environnement.
    Si la variable d'environnement système n'est pas correctement définie, l'erreur suivante peut survenir :
    java.lang.Error: java.lang.UnsatisfiedLinkError
  3. Sous Linux, redémarrez votre ordinateur après avoir défini vos variables d'environnement système afin que les modifications soient prises en compte.

Configurer votre Job

Procédure

  1. Déposez les composants suivants de la Palette dans l'espace de modélisation graphique : un tFixedFlowInput, un tMelissaDataAddress et un tLogRow.
  2. Reliez les trois composants à l'aide de liens Row > Main.
    Job utilisant les composants tFixedFlowInput, tMelissaDataAddress et tLogRow.

Configurer le composant d'entrée

Procédure

  1. Double-cliquez sur le composant tFixedFlowInput pour ouvrir sa vue Basic settings dans l'onglet Component.
    Configuration du composant tFixedFlowInput.
  2. Créez le schéma en cliquant sur le bouton Edit Schema.
  3. Cliquez sur le bouton [+] pour ajouter les colonnes qui contiendront les données d'adresse à votre schéma d'entrée.
    Dans cet exemple, ajoutez les colonnes suivantes :
    • input_company
    • input_address1
    • input_address2
    • input_city
    • input_state
    • input_postal
    Schéma du composant tFixedFlowInput.
  4. Cliquez sur OK.
  5. Dans le champ Number of rows, paramétrez le nombre de lignes à 1.
  6. Dans la zone Mode, sélectionnez l'option Use Inline Content (delimited file) et configurez le séparateur de lignes (Row Separator) et le séparateur de champs (Field Separator).
  7. Dans la table Content, saisissez les données d'adresses que vous souhaitez analyser.
    Par exemple :
    Talend Inc.|5150 El Camino Real|Suite C-31|Los Altos||94022|
    Talend Inc.|6 Executive Circle|Suite 200|Irvine|California|92614|
    Talend Inc.|220 White Plains Road|Suite 390|Tarrytown|New York|10591|
    Talend Inc.|8 New England Executive Park|Suite 170|Burlington|Massachusetts|01803|

Configurer le composant tMelissaDataAddress

Procédure

  1. Double-cliquez sur le tMelissaDataAddress pour afficher sa vue Basic settings et définir ses propriétés.
    Configuration du composant tMelissaDataAddress.
  2. Cliquez sur le bouton Sync columns pour récupérer le schéma du composant précédent.
  3. Cliquez sur le bouton Edit schema pour voir les schémas d'entrée et de sortie et les modifier, si nécessaire.
    Schéma du composant tMelissaDataAddress.
    Des colonnes en lecture seule sont ajoutées au schéma de sortie :
    • COMPANY_STANDARDIZED retourne le nom standard de l'entreprise.
    • ADDRESLINE1_STANDARDIZED retourne la première ligne de la rue de l'adresse.
    • ADDRESLINE2_STANDARDIZED retourne la seconde ligne de la rue de l'adresse.
    • CITY_STANDARDIZED retourne le nom standard de la ville.
    • STATE_STANDARDIZED retourne les deux lettres du code État.
    • POSTAL_STANDARDIZED retourne le code postal.
    • COUNTRY_STANDARDIZED retourne les deux lettres du code Pays.
    • RESULT_CODES retourne les codes de vérification.
  4. Cliquez sur OK pour fermer la boîte de dialogue.
  5. Dans la table Input Address :
    1. utilisez le bouton [+] pour ajouter des lignes à la table.
    2. Cliquez dans la colonne Address Field et sélectionnez dans la liste prédéfinie les champs contenant les données des adresses d'entrée.
      Le composant mappera les valeurs de ces champs vers les colonnes d'entrée définies dans cette table.
    3. Cliquez dans la colonne Input Column et sélectionnez dans la liste les colonnes du schéma d'entrée contenant les données des adresses d'entrée à parser.
  6. Dans la table Output Address, vous pouvez définir les champs d'adresse supplémentaires :
    1. utilisez le bouton [+] pour ajouter des lignes à la table.
      Ces lignes vont contenir les informations supplémentaires à récupérer de Melissa Data, comme la clé d'adresse, le nom du pays ou les données de longitude et de latitude.
    2. Cliquez dans la colonne Address Field et sélectionnez dans la liste prédéfinie les champ contenant les données d'adresses de sortie.

      Le composant va mapper les valeurs de ces champs vers les colonnes de sortie définies dans la table.

    3. Cliquez dans la colonne Output Column et sélectionnez dans la liste les colonnes du schéma de sortie qui contiendront les informations supplémentaires.

      Si vous cliquez sur Sync Columns après avoir ajouté des colonnes au schéma de sortie, ces colonnes ajoutées sont supprimées.

  7. Dans le champ Specify your MelissaData license, configurez votre clé de licence fournie par Melissa Data lors de la commande de Data Quality Suite ou de l'API Address Object.

    Si la clé de licence saisie n'est pas correcte, vous pouvez utiliser GeoCoder en mode démo.

  8. Dans le champ Specify your MelissaData DataFile folder, configurez le chemin d'accès au dossier de données de Melissa Data fourni par Melissa Data.
  9. Dans la vue Advanced settings du composant, sélectionnez la licence achetée.

    Si vous n'avez pas acheté de licence GeoPoint ou GeoCode, sélectionnez No Melissa GeoCoder License Was Purchased pour exécuter le Job. Notez que vous ne pourrez récupérer ni les données de latitude et longitude, ni les codes de résultat de GeoCode.

Exécuter le Job

Procédure

Enregistrez votre Job et appuyez sur F6 pour l'exécuter.

Résultats

Le composant tMelissaDataAddress lit les lignes d'adresses en entrée, les corrige et les formate, puis affiche le résultat en lignes d'adresses "standardisées" de sortie.

Résultats dans la console.
En plus de vérifier et de standardiser une adresse, le tMelissaDataAddress met également en correspondance le nom des rues par rapport à un code postal, fait correspondre des données géographiques à un code postal et à des informations de villes, puis analyse les rues et retourne tous les résultats via différentes colonnes de sortie. Cet exemple montre uniquement certaines des colonnes de sorties écrites par le composant tMelissaDataAddress :
  • GetAddressKey retourne la clé d'adresse.
  • GetCountyName retourne le nom des comtés.
  • GetTimeZone retourne le fuseau horaire.
  • GetLongitude retourne les données de longitude.
  • GetLatitude retourne les données de latitude.
  • GeoCodeResult retourne les codes de résultat de GeoCode.
  • Ces colonnes de sortie standards retournent le nom standard de l'entreprise, deux lignes de la rue de l'adresse, le nom standard des villes, les codes États, les codes postaux et les codes pays.
  • La colonne de sortie RESULTS_CODE retourne les codes de vérification pour chaque ligne d'adresse traitée. Ces codes sont écrits dans des listes délimitées par des virgules. Chaque code se compose de deux lettres suivies de deux chiffres. Ces codes indiquent différents statuts et erreurs. Par exemple, le code AC02 signifie que le nom de l’État est correct, selon la combinaison du nom de la ville et du code postal. Le code AS01 signifie que le nom de la rue est valide et livrable.

Pour une liste exhaustive des codes de résultat, pour plus d'informations concernant les colonnes de sortie, consultez le site Web http://www.melissadata.com/ (en anglais).

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.