Lire des données depuis une connexion HDFS sur Spark
En utilisant une métadonnée HDFS prédéfinie, vous pouvez lire des données depuis un système de fichiers HDFS sur Spark.
Avant de commencer
- Ce tutoriel utilise un cluster Hadoop. Vous devez avoir un cluster Hadoop disponible.
- Vous avez également configuré une métadonnée HDFS (consultez Créer une définition de métadonnée de cluster Hadoop et Importer une définition de métadonnée de cluster Hadoop).
- Vous avez configuré votre connexion HDFS sur Spark, consultez Configurer une connexion HDFS pour exécution sur Spark).