Accéder au contenu principal Passer au contenu complémentaire

Créer une règle de qualité de données en mode simple

Pourquoi et quand exécuter cette tâche

Dans cet exemple, vous travaillez dans une université. Vous avez remarqué que des jeux de données ont été mélangés et vous souhaitez vérifier que les bourses ont bien été attribuées aux bon·nes étudiant·es.

La règle de qualité de données vérifie que les étudiant·es ont bien la citoyenneté des États-Unis et que leur code de statut est bien 2632, puis qu'une bourse leur a été attribuée, prenant effet le 1er septembre 2021, dont le code termine par 10AB ou 10AC.

Voici un échantillon du jeu de données :

Procédure

  1. Connectez-vous en tant que gestionnaire de règles.
  2. Dans le panneau de gauche, cliquez sur Data quality rules (Règles de qualité de données) > Add rule (Ajouter une règle).
  3. Saisissez le nom : ScholarshipProgram.
  4. Saisissez la description : Checking the status code 2632.
    La description est facultative. Ele vous permet de trouver une règle lorsque les noms de règles sont similaires.
  5. Dans la partie If, cliquez sur Add a row (Ajouter une ligne) :
    1. Sélectionnez Variable et saisissez le nom StatusCode.
      Les caractères supportés sont [a-z], [A-Z], [0-9] et les caractères spéciaux sont : _ . @ $ #.
    Note InformationsRemarque : Les règles de qualité de données sont des modèles. Vous allez associer les variables aux attributs lors de l'application de la règle à un modèle de données.
    1. Sélectionnez l'opérateur is equal to (est égal à).
      Pour plus d'informations concernant les opérateurs, consultez Opérateurs.
    2. Sélectionnez Value (Valeur) et saisissez 2632.
    3. Ajoutez une ligne pour la sous-condition : Citizenship is (est) US.
    4. Sélectionnez l'opérateur logique And (Et).
  6. Dans la partie Then, ajoutez trois lignes :
    1. Pour regrouper les deux premières lignes, passez votre curseur sur les lignes et cochez les cases à droite.
    2. Cliquez sur Group (Grouper) dans la barre d'actions.
      Pour plus d'informations concernant les actions, consultez Gérer les lignes en mode simple.
    3. Sélectionnez l'opérateur logique And (Et).
    4. Définissez tous les champs devant être validés pour vérifier que les étudiant·es ont bien eu une bourse qui prend effet le 1er septembre 2021 et dont le code termine par 10AB ou 10AC.
    La partie Else vous permet de définir une alternative lorsque la condition (If) n'est pas remplie.

    Dans cet exemple, laissez la partie Else vide. Les valeurs ne respectant pas la condition seront classées comme valeurs non applicables.

    La règle de qualité de données est définie comme suit :
  7. Cliquez sur Save (Enregistrer).

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.