電話番号情報を抽出
Extract phone number informationファンクションを使って、電話番号に関する新しいタイプの情報を複数の新しいカラムに抽出できます。
このファンクションでは、電話タイプ、国、地域、地理的地域、通信事業者名、タイムゾーンに関する情報を抽出できます。ただし、ファンクションの動作は電話番号データを含んでいるカラムのセマンティックタイプによります。
- セマンティックタイプが、US Phone、UK Phone、DE Phone、またはFR Phoneのいずれかに対応する場合は、出力が必要なフィールドを選択し、ファンクションを適用するだけの処理になります。
- カラムに異なる国からの番号が含まれており、フォーマットがそれぞれ異なり、一致するセマンティックタイプがよりジェネリックなPhone numberである場合は、Extract phone number informationファンクションを使用する前にフォーマット作業が必要になります。この手順が必要なのは、標準化されていない番号は複数の国に対応するストラクチャーになっている場合が多く、国を一意識別することが不可能であるためです。
ここでは、世界中の顧客の基本的な顧客情報(名前、国、電話番号など)が含まれているデータセットの例を見てみましょう。このプレパレーションの目的は、連絡先情報として携帯電話番号を入力した顧客のみを残すように電話番号を処理することです。[Extract phone number information] (電話番号情報を抽出)には電話タイプに関するこの情報を表示できませんでしたが、番号がさまざまなフォーマットになっているため、このままではまだファンクションを適用できません。最初に、countryカラムの情報を使用して[phone]カラムにフォーマットオペレーションを行い、番号に国際電話のプレフィックスを追加します。Talend Data Preparationはこの段階で、形式が揃い、それぞれの国情報が含まれた電話番号の情報を抽出できます。
手順
タスクの結果
フォーマットを指定する簡単な手順を終えると、電話番号から抽出されたさまざまな情報を含むカラムが作成済みとなっています。情報はGoogle電話ライブラリーから抽出されたものです。これで、それぞれの番号が固定回線または携帯電話のどちらであるかを容易に特定でき、プレパレーションを続行できます。
空または無効だった行は、ファンクションの適用後に空のセルを生成します。