Valider des données à l'aide de règles de qualité de données et filtrer les données invalides
Le Job dans ce scénario utilise :
- Le composant tDataQualityRules pour valider les données à l'aide d'une règle de qualité de données depuis Talend Cloud Data Stewardship.
- Le composant tFilterRow pour filtrer les données non exécutables.
Le Job utilise la règle de qualité de données suivante :
Vous pouvez télécharger et extraire le fichier suivant : scholarship_programs.zip.
Configurer votre Job
Procédure
Configurer le composant tFixedFlowInput
Procédure
Configurer le composant tDataQualityRules
Avant de commencer
- Vous avez créé au moins une règle de qualité de données dans Talend Cloud Data Stewardship.
- Vous avez un jeton d'accès personnel. Pour en générer un, consultez https://help.talend.com/r/fr-FR/Cloud/management-console-user-guide/cloud-access-token.Note InformationsConseil : Talend Cloud Data Stewardship est utilisé dans cet exemple. Vous pouvez également saisir l'URL de la version hybride de Talend Data Stewardship 8.0 R2022-07 ou une version supérieure et Talend Cloud Data Inventory.
Pourquoi et quand exécuter cette tâche
Procédure
Configurer le tExtractJSONFields
Pourquoi et quand exécuter cette tâche
Procédure
Configurer le tFilterRow
Pourquoi et quand exécuter cette tâche
- NE : La règle ne peut être exécutée sur les données.
- Invalide : Les données sont conformes à la condition mais pas à l'expression de validation.
Procédure
Configurer les composants tLogRow
Procédure
Exécuter le Job
Procédure
Sauvegardez votre Job et appuyez sur F6 pour l'exécuter.
Résultats
- le code de statut est 2632 et la date est 2021-09-01,
OU
- le code de statut n'est pas 2632 et le programme se termine par 10AB ou 10AC.
.-------+----+-------+-----------+-----------.
| main |
|=------+----+-------+-----------+----------=|
|ID |Code|Program|EffectiveOn|Nationality|
|=------+----+-------+-----------+----------=|
|1002145|2632|2310AB |2021-09-01 |Canada |
|1002146|1132|3610AC |2021-10-01 |US |
|1002149|2632|3711AB |2021-09-01 |US |
|1002150|2632|2310AB |2021-09-01 |US |
|1002151|2632|3711AB |2021-09-01 |US |
|1002152|2632|2310AB |2021-09-01 |US |
|1002153|2632|3711AB |2021-09-01 |US |
|1002155|2675|3610AC |2021-10-01 |US |
|1002156|2675|2310AB |2021-10-01 |Canada |
|1002158|2632|2310AB |2021-09-01 |US |
|1002159|1132|2310AB |2021-10-01 |US |
|1002162|2675|2310AB |2021-10-01 |US |
|1002163|2632|3610AC |2021-09-01 |US |
'-------+----+-------+-----------+-----------'
.-------+----+-------+-----------+-----------+------.
| NE |
|=------+----+-------+-----------+-----------+-----=|
|ID |Code|Program|EffectiveOn|Nationality|Status|
|=------+----+-------+-----------+-----------+-----=|
|1002161|abcd|3611AC |2021-09-01 |US |NE |
'-------+----+-------+-----------+-----------+------'
Le statut NE signifie que la règle ne peut être exécutée sur les données. Dans ce scénario, le code de statut est abcd mais la condition de règle est is equal to 2632.
Les autres données invalides signifient :
- le code de statut est 2632 mais la date n'est pas 2021-09-01,
ou
- le code de statut n'est pas 2632 et le programme ne se termine pas par 10AB ou 10AC.
.-------+----+-------+-----------+-----------+-------+----------------------------------. | OtherInvalid | |=------+----+-------+-----------+-----------+-------+---------------------------------=| |ID |Code|Program|EffectiveOn|Nationality|Status |errorMessage | |=------+----+-------+-----------+-----------+-------+---------------------------------=| |1002147|2632|3610AC |2022-01-01 |Canada |Invalid|Status.compareTo("NE") == 0 failed| |1002148|2632|2310AB |2022-01-01 |Canada |Invalid|Status.compareTo("NE") == 0 failed| |1002154|2632|3610AC |2022-01-01 |Canada |Invalid|Status.compareTo("NE") == 0 failed| |1002157|2632|3610AC |2022-01-01 |Canada |Invalid|Status.compareTo("NE") == 0 failed| |1002160|2632|2310AB |2022-01-01 |Canada |Invalid|Status.compareTo("NE") == 0 failed| |1002164|2675|3611AC |2021-09-01 |US |Invalid|Status.compareTo("NE") == 0 failed| '-------+----+-------+-----------+-----------+-------+----------------------------------'
Lorsque vous sauvegardez le Job, un fichier JAR contenant la définition de règle est créé dans :
studio-path\configuration\.m2\repository\org\talend\libraries\rules-number