Crawling de multiples jeux de données
Si vous devez importer un grand nombre de jeux de données d'une même source, au lieu de les créer un par un dans Talend Cloud Data Inventory, vous pouvez créer un crawler pour récupérer une liste complète de ressources en une opération.
Le crawling d'une connexion vous permet de récupérer des données à grande échelle et d'enrichir votre inventaire plus efficacement. Après avoir sélectionné une connexion, vous pourrez importer tout son contenu, ou une partie de son contenu, via une recherche et un filtre. Vous pourrez également sélectionner les utilisateur·trices ayant accès aux jeux de données créés.
- Le Crawling de jeux de données à l'aide de la sélection dynamique permet de récupérer toutes les tables correspondant à un filtre spécifique, quel que soit le contenu de la source de données, à tout moment.
- La Crawling de jeux de données à l'aide de la sélection manuelle permet de sélectionner manuellement les tables à récupérer à partir de l'état actuel de votre source de données.
Le crawling d'une connexion pour plusieurs jeux de données est soumis aux prérequis et limitations suivant·es :
- Le rôle Dataset administrator (Administrateur des jeux de données) ou Dataset manager (Gestionnaire des jeux de données) vous a été attribué dans Talend Management Console, ou vous avez au moins le droit Crawling - Add (Crawling - Ajout).
- Vous utilisez une version 2022-02 ou supérieure du moteur distant.
- Vous ne pouvez crawler des données que d'une connexion JDBC. Un seul crawler peut être créé à la fois, à partir d'une connexion.
Procédure
Résultats
Vous ne pouvez plus modifier la configuration d'un crawler une fois son exécution démarrée. Si le crawler est arrêté ou s'est terminé, vous pouvez modifier la sélection de tables, le nom et la description du crawler. Cependant, vous ne pouvez pas modifier les paramètres de partage. Pour crawler à nouveau la connexion, avec différents paramètres, supprimez le crawler et créez-en un nouveau.
Il est possible d'utiliser le nom d'un crawler comme facette dans une recherche de jeux de données, pour voir tous les jeux de données liés à un crawler donné.