Extraire des informations concernant les numéros de téléphone
Vous pouvez utiliser la fonction Extract phone number information (Extraire des informations sur le numéro de téléphone) pour extraire de nouveaux types d’informations concernant les numéros de téléphone dans plusieurs nouvelles colonnes.
Cette fonction peut extraire des informations sur le type de téléphone, le pays, la région, la localisation, le nom de l’opérateur et le fuseau horaire. Cependant, le comportement de la fonction dépend du type sémantique de la colonne qui contient les données :
- Si le type sémantique correspond à US Phone, UK Phone, DE Phone ou FR Phone, vous pouvez simplement sélectionner les champs de sortie souhaités et appliquer la fonction.
- Si la colonne contient des numéros de différents pays, avec des formats différents et si le type sémantique de rapprochement est le type générique Phone number, vous devrez effectuer un formatage avant d’utiliser la fonction Extract phone number information. Cette étape est nécessaire car les nombres qui ne sont pas standardisés ont souvent une structure qui s’applique à plusieurs pays. Il est donc impossible de déterminer le pays auquel ils correspondent.
Prenez l’exemple d’un jeu de données contenant des informations simples sur des clients, par exemple le nom, pays de résidence et numéro de téléphone de clients du monde entier. Le but de cette préparation est de travailler sur les numéros de téléphone afin de ne garder que les clients ayant fourni un numéro de téléphone mobile comme information de contact. La fonction Extract phone number information pourrait afficher cette information sur le type de téléphone, mais elle ne peut pas être appliquée tant que les numéros ont des formats différents. Vous allez d’abord effectuer une opération de formatage sur la colonne phone, à l’aide des informations de la colonne country, pour ajouter une préfixe international à vos numéros. Talend Data Preparation peut ensuite extraire les informations de vos numéros de téléphone. Ceux-ci ont un format harmonisé et contiennent une information sur leur pays respectif.
Procédure
Résultats
Après une brève étape de formatage, les colonnes contenant les diverses informations extraites des numéros de téléphone sont créées. Ces informations sont extraites par la Google phone library. Vous pouvez maintenant différencier facilement les numéros de téléphone provenant de lignes fixes ou mobiles et continuer votre préparation.
Les lignes qui étaient vides ou invalides génèrent des cellules vides après l’application de la fonction.