Lier les composants pour définir le flux de données Delta Lake
Glissez et liez les composants à utiliser pour lire et traiter vos données Delta Lake.
Procédure
- Dans la perspective Integration du Studio, créez un Job Spark Batch vide, depuis le nœud Job Designs de la vue Repository.
- Dans l'espace de modélisation, saisissez le nom du composant à utiliser et sélectionnez ce composant dans la liste qui apparaît. Dans ce scénario, les composants sont tS3Configuration (libellé s3_flights), deux composants tDeltaLakeInput (libellés flights_latest_version et flights_first_version, respectivement), deux composants tAggregateRow (libellés count_per_flights), deux composants tPartition (libellés repart), un tMap et un tFileOutputDelimited.
- Connectez ces composants à l'aide d'un lien de type comme illustré dans l'image ci-dessus.
- Laissez le composant tS3Configuration seul, sans connexion.