Appliquer une préparation sur des tables ADLS Gen2 Delta
Ce scénario récupère des données depuis un système de fichiers Azure ADLS Gen2, prépare les données et les affiche.
Ce scénario présente comment récupérer une table Delta d'un système de fichiers ADLS Gen2, appliquer une préparation compatible sur le flux du Job et lire les données qui en résultent.
Le composant tAzureAdlsGen2Input vous permet d'accéder à votre stockage Azure, plus particulièrement à vos tables Delta. En utilisant le composant tDataprepRun au milieu de votre Job, vous pouvez même réutiliser une préparation existante, créée dans Talend Data Preparation, pour transformer et nettoyer les données avant de les lire ou de les écrire dans la destination de votre choix.
Le scénario suivant décrit un Job simple qui :
- Récupère des données client·es d'une table Databricks Delta
- Applique directement une préparation avec un schéma compatible
- Lit les données dans le composant de sortie
Dans cet exemple, la table Delta contient des informations client·es simples, comme les noms, les âges, les dates d'anniversaire ou encore les numéros de téléphone.
Ce scénario suppose qu'une préparation a été précédemment créée, sur un jeu de données ayant le même schéma que les données d'entrée du Job. Dans ce cas, la préparation existante est nommée preparation_adlsgen2.
Cette préparation simple met les noms de famille en majuscules et modifie le format de date.