Accéder au contenu principal

tDataprepRun

Ce composant applique une préparation faite à l'aide de Talend Data Preparation dans un Job d'intégration de données standard.

Le composant tDataprepRun récupère une préparation faite à l'aide de Talend Data Preparation et l'applique sur un jeu de données.

À l'aide de la liste déroulante Deployment dans la vue Basic settings du composant tDataprepRun, vous pouvez sélectionner l'une des deux versions du composant :

  • la version de déploiement On-Premises deployment, exécutant la préparation sur le serveur de Talend Data Preparation,
  • Availability-noteBeta
    ou la version de déploiement Cloud deployment, effectuant l'exécution sur le même moteur que votre Job. Vos données ne quittent pas votre infrastructure. Le seul échange effectué est la récupération des informations de préparation depuis Talend Cloud Data Preparation.
Note InformationsRemarque : Ce composant n'est pas intégré par défaut à votre Studio Talend. Vous devez installer les composants Talend Data Preparation depuis la section Data Integration > Components du Gestionnaire des fonctionnalités, avant de pouvoir l'utiliser dans votre Studio Talend. Pour plus d'informations, consultez Installer les fonctionnalités à l'aide du Gestionnaire des fonctionnalités.
Note InformationsRemarque : Pour référence, le tDataprepRun peut traiter des jeux de données contenant jusqu'à 10 millions de lignes et 100 colonnes (7 Go), à une vitesse d'environ 200 lignes par seconde (150 ko/s) pour une préparation contenant 60 étapes (ces chiffres sont indicatifs et susceptibles de varier). Pour de meilleures performances ou pour des jeux de données contenant plus de 10 millions de lignes, pensez à utiliser des Jobs Spark.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.