Configurer la connexion à votre plateforme Big Data
Configurer la connexion à une distribution Hadoop donnée dans le Repository vous permet d'éviter de configurer cette connexion à chaque fois que vous devez utiliser la même plateforme.
La plateforme Big Data à utiliser dans cet exemple est un cluster Databricks V5.4, avec Azure Data Lake Storage Gen2.
Avant de commencer
-
Assurez-vous que votre cluster Spark dans Databricks a bien été créé.
Pour plus d'informations, consultez Créer un espace de travail Azure Databricks dans la documentation Azure.
- Vous devez avoir un compte Azure.
- Le compte de stockage Azure Data Lake Storage Gen2 à utiliser doit avoir été créé et vous devez avoir les droits en lecture écriture sur celui-ci. Pour plus d'informations concernant la création de ce type de compte de stockage, consultez Créer un compte de stockage Azure Data Lake Storage Gen2 dans la documentation Azure.
-
La perspective Integration est active.
Pourquoi et quand exécuter cette tâche
Procédure
Résultats
La nouvelle connexion, nommée movie_library dans cet exemple, est affichée dans le dossier Hadoop cluster de la vue Repository.