Calculer l'évolution jour après jour des vols aux États-Unis en utilisant un jeu de données Delta Lake
Le Job de ce scénario utilise un jeu de données Delta Lake d'exemple afin de calculer jour après jour l'indicateur clé de performance (KPI) de vols aux États-Unis.
Prérequis :
- Avec Delta Lake, vous devez utiliser le système de fichier S3 ou Azure.
- Assurez-vous que les identifiants à utiliser ont les permissions et droits d'accès de lecture et d'écriture sur ce système de fichiers.
- Le jeu de données Delta Lake d'exemple à utiliser a été téléchargé depuis Talend Help Center et sauvegardé dans votre système de fichiers. Ce jeu de données est utilisé à des fins de démonstration uniquement, il contient deux snapshots de vols américains par date, ce qui implique une évolution de ces vols à chaque date.
Même si ce n'est pas toujours requis, il est recommandé d'installer un Talend JobServer sur le nœud passerelle de votre cluster Hadoop. Dans la fenêtre des Preferences de votre Studio ou dans Studio Talend ou Talend Administration Center, s'il est disponible pour exécution de vos Jobs, définissez ce Talend JobServer comme le serveur d'exécution distant de vos Jobs.