Formater automatiquement des données en se basant sur des exemples
La fonctionnalité de remplissage par magie offre une solution pratique de formatage de types de données n'ayant pas de fonction dédiée, ou permet de réaliser facilement une suite de transformations à l'aide de la même fonction.
Via un algorithme d'apprentissage automatique, cette fonctionnalité vous permet de définir un modèle se basant sur plusieurs exemples puis, via un algorithme d'apprentissage automatique, d'appliquer la transformation sur une colonne entière.
Pour le moment, le remplissage par magie supporte les types de transformations suivants :
- substring
- ajout de constantes (nombres, chiffres, caractères spéciaux),
- sensibilité à la casse,
- transformation sémantique pour les pays, les codes postaux et les États des États-Unis, les adresses e-mail, les URL et les dates.
Pour que la fonction puisse fonctionner, vous devez saisir au moins deux exemples de la transformation à appliquer. Vous pouvez ajouter jusqu'à trois autres exemples. Plus vous saisissez d'exemples, plus le modèle sera identifié précisement par la fonction.
Si le programme de transformation généré par la fonction ne s'applique pas à certaines données de la colonne source, elles restent inchangées dans la colonne cible.
Les types de données tels que dates ou phone numbers ont une fonction dédiée pouvant être utilisée pour modifier facilement leur format. Cependant, les types comme full names, social security numbers ou state codes, par exemple, n'ont pas cette fonction. Les scénarios suivants illustrent comment utiliser la fonctionnalité de remplissage par magie afin de formater vos données dans ces cas.
Formater les noms avec le remplissage par magie
Vous pouvez utilisez la fonctionnalité de remplissage par magie pour formater des noms, selon un modèle défini par des exemples.
Prenez l'exemple d'un jeu de données avec une colonne contenant les noms complets de vos clients.
Vous souhaitez formater ces noms et conserver uniquement la première lettre du prénom, suivie d'un point puis du nom de famille en majuscules. Par exemple, George Abitbol deviendrait G. ABITBOL. La manière la plus simple d'accomplir ce formatage est d'utiliser le remplissage par magie afin de configurer des exemples du fonctionnement de la transformation et de l'appliquer au reste de la colonne.
Procedure
Results
Formater des numéros de Sécurité Sociale à l'aide du remplissage par magie
Vous pouvez utilisez la fonctionnalité de remplissage par magie pour formater des numéros de Sécurité Sociale, selon un modèle défini par des exemples.
Dans cette exemple, votre jeu de données contient des informations sur vos clients comme des noms, des adresses e-mail, et surtout, des numéros de Sécurité Sociale. Cependant, ces numéros de Sécurité Sociale ont été saisis au mauvais format, sans tirets. Par exemple, un numéro comme 334-20-6259, a été saisi 334206259 dans ce jeu de données. En raison du mauvais format, la plupart des données sont qualifiées par l'application de numéros de routage, et sont considérées comme invalides.
Pour résoudre cette erreur, la fonctionnalité de remplissage par magie va permettre d'appliquer le format de numéros de Sécurité Sociale correct à vos données, en suivant un modèle basé sur quelques exemples que vous avez entré.
Procedure
Results
Tirer parti des analyses sémantiques pour transformer des codes États en États à l'aide du remplissage par magie
En se basant sur l'exemple que vous allez saisir, le remplissage par magie peut également reconnaître et formater les données correspondant à certains types sémantiques : pays, adresses e-mail, URL, dates, codes postaux et États des États-Unis.
Par exemple, un jeu de données comportant des données clients, telles que leur nom, adresse e-mail, ou encore l'État dans lequel ils vivent. Ce scénario présente comment utiliser le remplissage par magie pour convertir les codes États à deux lettres en leur nom de pays complet correspondant, pour avoir les données dans un format plus lisible.
Procedure
Results
Tirer parti des fonctionnalités sémantiques afin de convertir des dates en jours de la semaine à l'aide du remplissage par magie
En se basant sur l'exemple que vous allez saisir, le remplissage par magie peut également reconnaître et formater les données correspondant à certains types sémantiques : pays, adresses e-mail, URL, codes postaux et États des États-Unis, dates.
Prenez l'exemple d'une petite entreprise de commerce de détail ayant plusieurs magasins dans une ville. Le jeu de données suivant indique comment le nombre total de ventes est enregistré avec la date correspondante chaque jour. Le format utilisé pour saisir des dates est dd/MM/yyyy, mais vous pouvez également afficher le jour de la semaine correspondant, afin de faire des analyses statistiques et déterminer les jours les plus rentables. Ce scénario vous présente comment utiliser la fonctionnalité de remplissage par magie afin d'extraire cette information.
Procedure
Results
Convertir des noms d'organisations en leur forme abrégée à l'aide du remplissage par magie
La fonction de remplissage par magie peut être utilisée pour transformer des noms, unités ou expressions en leur forme abrégée.
Dans cet exemple, le jeu de données à améliorer contient des données sur les personnes travaillant pour des organisations nationales ou internationales. Cependant, les noms complets des organisations sont souvent trop longs et moins connus que les acronymes correspondants. Afin de rendre le jeu de données plus simple à lire, vous allez utiliser la fonction de remplissage par magie pour convertir les noms complets en leurs acronymes.