Calculer l'évolution jour après jour des vols aux États-Unis en utilisant un jeu de données Delta Lake
Le Job de ce scénario utilise un jeu de données Delta Lake d'exemple afin de calculer jour après jour l'indicateur clé de performance (KPI) de vols aux États-Unis.
Pour plus de technologies supportées par Talend, consultez Composants Talend.
Prérequis :
- Avec Delta Lake, vous devez utiliser le système de fichier S3, Azure ou HDFS.
- Assurez-vous que les identifiants à utiliser ont les permissions et droits d'accès de lecture et d'écriture sur ce système de fichiers.
- Le jeu de données Delta Lake d'exemple à utiliser a été téléchargé depuis Talend Help Center et sauvegardé dans votre système de fichiers. Ce jeu de données est utilisé à des fins de démonstration uniquement, il contient deux snapshots de vols américains par date, ce qui implique une évolution de ces vols à chaque date.
Même s'il n'est pas toujours requis, il est recommandé d'installer un Jobserver Talend sur le nœud d'extrémité de votre cluster Hadoop. Dans la fenêtre des Preferences de votre Studio ou dans Talend Administration Center, s'il est disponible pour exécution de vos Jobs, définissez ce Jobserver comme le serveur d'exécution distant de vos Jobs.