Effets du masquage de données
Texte et types sémantiques
Dans le cas de données textuelles, Talend Data Preparation suggère automatiquement l'un des types sémantiques prédéfinis, l'un de vos types sémantiques ou le type Text. Dans le cas de types sémantiques personnalisés et prédéfinis, ils peuvent se baser sur une expression régulière ou sur un dictionnaire de valeurs.
Le tableau suivant liste les routines de masquage disponibles pour une colonne de type Text, ou tout type sémantique prédéfini ou personnalisé ainsi que ses effets sur la valeur Talendin 2018 is awesome par exemple.
Routine de masquage | Description | Paramètres | Sortie |
---|---|---|---|
Semantic masking | Dans le cas de types sémantiques basés sur des expressions régulières, la fonction va générer des enregistrements aléatoires correspondant au modèle d'expression régulière. Note InformationsRemarque : Les types sémantiques construits avec des expressions régulières qui ne sont pas compatibles avec la bibliothèque dk.brics.automaton (uniquement en anglais) ne supportent pas le masquage sémantique. Tous les caractères de l'enregistrement sont remplacés aléatoirement.
|
Mode de masquage : Random ou Repeatable | Äåòçôî ëð 1889 òn äipïåvu |
Dans le cas de types sémantiques basés sur un dictionnaire, la fonction va remplacer les enregistrements par les valeurs extraites du dictionnaire utilisé pour créer le type sémantique. | |||
Keep characters between two positions | Tous les caractères compris dans l'intervalle sélectionné restent inchangés, tandis que ceux hors de l'intervalle sont supprimés. | Début de l'index : 11 | 2018 is awesome |
Fin de l'index : 25 | |||
Generate from Char Pattern | Un enregistrement contenant des caractères aléatoires sera créé depuis le modèle de votre choix. | Modèle de caractères : aaaaaa 9999 aaaaaaa | õaßayè 8908 æluäco |
Mode de masquage : Random ou Repeatable | |||
Remove characters between two positions | Tous les caractères compris dans l'intervalle sélectionné sont supprimés, tandis que ceux hors de l'intervalle restent inchangés. | Début de l'index : 7 | Talend is awesome |
Fin de l'index : 14 | |||
Replace all | Tous les caractères sont remplacés par le substitut de votre choix. | Remplacement : x | xxxxxxxxxxxxxxxxxxxxxxxxx |
Mode de masquage : Random ou Repeatable | |||
Replace all digits | Tous les chiffres sont remplacés par le substitut de votre choix. Les lettres restent inchangées. | Remplacement : 9 | Talend in 9999 is awesome |
Mode de masquage : Random ou Repeatable | |||
Replace all letters | Toutes les lettres sont remplacées par le substitut de votre choix. Les chiffres restent inchangés. | Remplacement : y | yyyyyy yy 2018 yy yyyyyyy |
Mode de masquage : Random ou Repeatable | |||
Replace characters between two positions | Tous les caractères compris dans l'intervalle sélectionné sont remplacés, tandis que ceux hors de l'intervalle restent inchangés. | Début de l'index : 1 | aaaaaa in 2018 is awesome |
Fin de l'index : 6 | |||
Remplacement : a | |||
Mode de masquage : Random ou Repeatable | |||
Replace n first characters | Remplace les n premiers caractères par le substitut de votre choix. Les autres restent inchangés. | Nombre de caractères : 17 | @@@@@@@@@@@@@@@@@ awesome |
Remplacement : @ | |||
Mode de masquage : Random ou Repeatable | |||
Replace n last characters | Remplace les n derniers caractères par le substitut de votre choix. Les autres restent inchangés. | Nombre de caractères : 10 | Talend in 2018 !!!!!!!!!! |
Remplacement : ! | |||
Mode de masquage : Random ou Repeatable | |||
Keep first n digits and replace following ones | Keep the first n digits as is and replaces subsequent ones with random digits. Les caractères non numériques restent inchangés. | Nombre de chiffres : 1 | Talend in 2436 is awesome |
Mode de masquage : Random ou Repeatable | |||
Conserver les n derniers chiffres et remplacer les précédents | Conserve les N derniers chiffres et remplace les précédents par des chiffres aléatoires. Les caractères non numériques restent inchangés. | Nombre de chiffres : 2 | Talend in 1618 is awesome |
Mode de masquage : Random ou Repeatable |
Valeurs numériques
Le tableau suivant liste les routine de masquage disponibles pour une colonne contenant des valeurs numériques, de type Integer ou Decimal, ainsi que leurs effets sur la valeur 21803 par exemple.
Routine de masquage | Paramètres | Sortie |
---|---|---|
Replace with random value | Variation maximale (%) : 10 | 21499 |
Mode de masquage : Random ou Repeatable | ||
Generate value between two values | Valeur minimale : 20000 | 21876 |
Valeur maximale : 22000 | ||
Mode de masquage : Random ou Repeatable |
Dates
Le tableau suivant liste les routines de masquage disponibles pour une colonne de type sémantique Date, ainsi que leurs effets sur la valeur 05/04/2018 par exemple.
Routine de masquage | Paramètres | Sortie |
---|---|---|
Replace with random date | Variation maximale (en jours) : 365 | 23/11/2017 |
Mode de masquage : Random ou Repeatable | ||
Keep year and set day and month to 01/01 | 01/01/2018 |