メイン コンテンツをスキップする 補完的コンテンツへスキップ

Melissa Dataデータファイルに基づいて住所を編集

このジョブでは、tFixedFlowInputコンポーネントを使って、分析する住所データを生成し、tMelissaDataAddressコンポーネントを使って入力スキーマを分析し、tFixedFlowInputコンポーネントで生成された米国の住所を検証、訂正、標準化し、tLogRowコンポーネントを使って、フォーマットされた正しい住所をコンソールに出力します。

情報メモ重要: tMelissaDataAddressは、2023-05以前のMelissa Dataインストーラーからのデータで動作します。2023-06以降からのデータをインストールした場合、ジョブは失敗します。

このシナリオはTalend Data Management PlatformTalend Big Data PlatformTalend Real-Time Big Data PlatformTalend MDM PlatformTalend Data Services PlatformTalend MDM PlatformおよびTalend Data Fabricにのみ適用されます。

始める前に

必要な操作は次のとおりです:
  1. 緯度と経度のデータおよびGeoCodeの結果コードを取得します:
    • GeoCodeライセンスまたはGeoPointライセンスを購入します。
    • GeoPointおよびGeoCodeデータファイルを含むMelissa Dataをインストールします。
  2. mdAddrライブラリーを含むフォルダーへのパスをシステム環境変数に追加します。
    • [No Melissa GeoCoder License Was Purchased] (Melissa GeoCoderのライセンスが購入されませんでした)が選択されている場合、必要なライブラリーは次のとおりです:
      • mdAddr.dll
      • mdAddrJavaWrapper.dll
      • mdRightFielder.dll 入力カラムがAddressのみである場合、このライブラリーが必要となります。
      • mdRightFielderJavaWrapper.dll 入力カラムがAddressのみである場合、このライブラリーが必要となります。
    • [No Melissa GeoCoder License Was Purchased] (Melissa GeoCoderのライセンスが購入されませんでした)[The Melissa GeoCoder License Was Purchased] (Melissa GeoCoderのライセンスが購入されました)が選択されている場合、必要なライブラリーは次のとおりです:
      • mdGeo.dll
      • mdGeoJavaWrapper.dll
      • mdAddr.dll
      • mdAddrJavaWrapper.dll
      • mdRightFielder.dll 入力カラムがAddressのみである場合、このライブラリーが必要となります。
      • mdRightFielderJavaWrapper.dll 入力カラムがAddressのみである場合、このライブラリーが必要となります。
      Windows版では、[Environment variables] (環境変数)ウィンドウでこの変数を追加する必要があります。
      [Edit environment variables] (環境変数を編集)ウィンドウ。
    システム環境変数が正しく設定されていない場合、次のエラーが予想されます:
    java.lang.Error: java.lang.UnsatisfiedLinkError
  3. Linuxでは、システム環境変数を設定した後、変更を反映するためにコンピューターを再起動します。

ジョブを設定

手順

  1. 次のコンポーネントを[Palette] (パレット)からデザインワークスペースにドロップします: tFixedFlowInputtMelissaDataAddresstLogRow
  2. [Row] (行) > [Main] (メイン)接続を使って3つのコンポーネントを接続します。
    tFixedFlowInputコンポーネント、tMelissaDataAddressコンポーネント、tLogRowコンポーネントを使ったジョブ。

入力コンポーネントを設定

手順

  1. tFixedFlowInputコンポーネントをダブルクリックして、[Component] (コンポーネント)タブで[Basic settings] (基本設定)ビューを開きます。
    tFixedFlowInputコンポーネントの設定。
  2. スキーマを変更するには[Edit schema] (スキーマを編集)をクリックします。
  3. [+]ボタンをクリックし、住所データを保持するカラムを入力スキーマに追加します。
    この例では、以下を追加します。
    • input_company
    • input_address1
    • input_address2
    • input_city
    • input_state
    • input_postal
    tFixedFlowInputコンポーネントのスキーマ。
  4. OKをクリックします。
  5. [Number of rows] (行数)フィールドで、行数を1に設定します。
  6. [Mode] (モード)エリアで、[Use Inline Content (delimited file)] (インラインコンテンツ(区切り付きファイルを使う))オプションを選択して、対応するフィールドで行とフィールドの区切りを設定するために使われます。
  7. [Content] (コンテンツ)テーブルに分析される住所データを入力します。
    例:
    Talend Inc.|5150 El Camino Real|Suite C-31|Los Altos||94022|
    Talend Inc.|6 Executive Circle|Suite 200|Irvine|California|92614|
    Talend Inc.|220 White Plains Road|Suite 390|Tarrytown|New York|10591|
    Talend Inc.|8 New England Executive Park|Suite 170|Burlington|Massachusetts|01803|

tMelissaDataAddressコンポーネントを設定する

手順

  1. tMelissaDataAddressをダブルクリックして[Basic settings] (基本設定)ビューを表示し、コンポーネントプロパティを定義します。
    tMelissaDataAddressコンポーネントの設定。
  2. [Sync columns] (カラムを同期)をクリックすると、先行コンポーネントからスキーマが取得されます。
  3. [Edit schema] (スキーマを編集)ボタンをクリックして入力および出力スキーマを表示し、必要に応じて出力スキーマを編集します。
    tMelissaDataAddressコンポーネントのスキーマ。
    読み取り専用カラムが出力スキーマに追加されます。
    • COMPANY_STANDARDIZEDは標準的な会社名を返します。
    • ADDRESLINE1_STANDARDIZEDは番地の最初の行を返します。
    • ADDRESLINE2_STANDARDIZEDは番地の2行目を返します。
    • CITY_STANDARDIZEDは標準的な都市名を返します。
    • STATE_STANDARDIZEDは州名の2文字の略語を返します。
    • POSTAL_STANDARDIZEDは郵便番号を返します。
    • COUNTRY_STANDARDIZEDは国名の2文字の省略形を返します。
    • RESULT_CODESは確認コードを返します。
  4. [OK]をクリックしてダイアログボックスを閉じます。
  5. [Input Address] (入力住所)テーブルで:
    1. [+]ボタンを使って、行をテーブルに追加します。
    2. [Address Field] (住所フィールド)カラムをクリックし、入力住所データを保持するフィールドを事前定義済みリストから選択します。
      これらのフィールドの値が、このテーブルで設定した入力カラムにマッピングされます。
    3. [Input Column] (入力カラム)カラムをクリックし、解析する入力住所データを保持する入力スキーマのリストからカラムを選択します。
  6. [Output Address] (出力住所)テーブルで、追加の住所フィールドを定義できます。
    1. [+]ボタンを使って、行をテーブルに追加します。
      これらの行には、住所キー、国名、経度と緯度のデータなど、Melissaデータから取得する追加情報が含まれます。
    2. [Address Field] (住所フィールド)カラムをクリックし、出力住所データを保持するフィールドを事前定義済みリストから選択します。

      これらのフィールドの値が、このテーブルで設定した出力カラムにマッピングされます。

    3. [Output Column] (出力カラム)カラムをクリックし、追加情報を保持する出力スキーマのリストからカラムを選択します。

      カラムを出力スキーマに追加した後で[Sync columns] (カラムを同期)をクリックすると、カラムは削除されます。

  7. [Specify your MelissaData license] (MelissaDataライセンスの指定)フィールドに、Data Quality SuiteまたはAddress Object APIをオーダーした時にMelissa Dataから提供されたライセンスキーを設定するために使われます。

    入力したライセンスキーが正しくない場合は、デモモードでGeoCoderを使う方法があります。

  8. [Specify your MelissaData DataFile folder] (MelissaData DataFileフォルダーの指定)フィールドに、Melissa Dataから提供されたMelissa Dataデータフォルダーへのパスを設定するために使われます。
  9. コンポーネントの[Advanced settings] (詳細設定) ビューで、購入したライセンスを選択します。

    GeoPointまたはGeoCodeライセンスを購入していない場合は、[No Melissa GeoCoder License Was Purchased] (Melissa GeoCoderのライセンスが購入されませんでした)を選択してジョブを実行します。緯度/経度のデータとGeoCode結果コードは取得できません。

ジョブを保存して実行

手順

ジョブを保存し、[F6]を押して実行します。

タスクの結果

tMelissaDataAddressは、入力住所行を読み取り、住所を修正およびフォーマットして、一種の「標準化された」住所出力行に結果を提供します。

コンソールからの結果。
住所の確認と標準化に加えて、tMelissaDataAddressはまた、ストリート名を郵便番号と照合し、地理データを郵便番号と都市情報に照合し、最終的に番地を解析し、さまざまな出力カラムを介してこれらすべての結果を返します。この例は、tMelissaDataAddressコンポーネントによって書き込まれた出力カラムの一部のみを示しています。
  • GetAddressKeyは、住所キーを返します。
  • GetCountyNameは、郡名を返します。
  • GetTimeZoneは、タイムゾーンを返します。
  • GetLongitudeは、経度データを返します。
  • GetLatitudeは、緯度データを返します。
  • GeoCodeResultは、結果コードを返します。
  • 出力標準カラムは、標準の会社名、最大2つの番地行、標準の都市名、州名の2文字の略称、郵便番号、および国名の2文字の略称を返します。
  • RESULTS_CODE出力カラムは、処理されたアドレス行ごとの検証コードを返します。これらのコードは、コンマ区切りリストに書き込まれます。各コードは2文字の後に数字が付いています。これらのコードは、さまざまなステータスとエラーを示します。たとえば、AC02コードは州名が都市名と郵便番号の組み合わせを基に修正されていること、AS01コードは番地が有効で配達可能であることを意味します。

結果コードの完全なリスト、およびすべての出力カラムの詳細は、http://www.melissadata.com/をご覧ください。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。