Accéder au contenu principal Passer au contenu complémentaire

Mettre à jour et lire des données depuis une branche Iceberg

L'étape suivante de ce scénario consiste à mettre à jour les données de la nouvelle branche Iceberg. Vous pourrez ensuite voir la mise à jour en comparant les résultats d'une même requête sur la table Iceberg principale et sur la branche Iceberg.

Pourquoi et quand exécuter cette tâche

Pour cette tâche, utilisez les sous-Jobs Update branch, Read from main branch et Read from cleaned branch.

Procédure

  1. Dans la vue Basic settings du tIcebergRow nommé Update branch, configurez les paramètres comme suit :
    Vue Basic settings du tIcebergRow.
    1. Dans la liste déroulante Connection, sélectionnez le composant de connexion à utiliser. Dans cet exemple, c'est le tIcebergConnection_1.
    2. Dans le champ SQL query, saisissez la requête SQL à effectuer. Dans cet exemple, la requête est "UPDATE default.marketing_toclean.branch_cleaned_data SET membership_type=null where (last_purchase_date > 40 or total_spend < 450) and membership_type='Bronze'", ce qui vous permet de supprimer le statut de membre Bronze aux client·es ayant dépensé moins de 450 $ ou n'ayant pas effectué d'achat depuis 40 jours.
    Note InformationsConseil : Lorsque vous souhaitez exécuter une requête sur une branche Iceberg, la syntaxe à suivre est default.nameoftheoriginaltable.branch_branchname.
  2. Exécutez le sous-Job Update branch en cliquant sur le bouton Run dans l'onglet Run.
    Les données sont mises à jour sur la branche marketing_toclean.
  3. Dans la vue Basic settings du tIcebergInput du sous-Job Read from main branch, configurez les paramètres comme suit :
    Vue Basic settings du tIcebergInput.
    1. Dans la liste déroulante Property Type, sélectionnez l'emplacement où stocker les données. Dans cet exemple, le stockage est ponctuel, Built-In.
    2. Dans le champ SQL query, saisissez la requête SQL à effectuer. Dans cet exemple, la requête est "SELECT * FROM marketing_toclean WHERE membership_type='Bronze'", ce qui vous permet de sélectionner uniquement les client·es ayant le statut de membre Bronze dans la table Iceberg marketing_toclean.
    3. Dans la liste déroulante Connection, sélectionnez le composant de connexion à utiliser. Dans cet exemple, c'est le tIcebergConnection_1.
    4. Laissez les autres paramètres tels qu'ils sont.
  4. Dans la vue Basic settings du tLogRow du sous-Job Read from main branch, configurez les paramètres comme suit :
    Vue Basic settings du tLogRow.
    1. Sélectionnez l'option Basic dans la section Mode.
    2. Dans le champ Field Separator, saisissez le séparateur qui délimitera les données dans l'affichage des logs. Dans cet exemple, le séparateur est "|".
    3. Laissez les autres paramètres tels qu'ils sont.
  5. Répétez les étapes 3 et 4 pour le sous-Job Read from cleaned branch, afin qu'il lise les données de la branche Iceberg branch_cleaned. Vous devez simplement modifier la requête SQL dans le tIcebergInput comme ceci : "SELECT * FROM default.marketing_toclean.branch_cleaned_data WHERE membership_type='Bronze'"
  6. Exécutez les sous-Jobs Read from main branch et Read from cleaned branch en cliquant sur le bouton Run dans l'onglet Run.
    Les résultats s'affichent dans la console d'exécution.

Résultats

Vous pouvez à présent comparer le résultat de la table Iceberg marketing_toclean, de 116 à celui de la branche Iceberg cleaned_data, de 66. Ces résultats différents signifient que les données ont bien été mises à jour dans la branche cleaned_data.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.