Propriétés du tHConvertFile pour Apache Spark Batch
Ces propriétés sont utilisées pour configurer le tHConvertFile s'exécutant dans le framework de Jobs Spark Batch.
Le composant tHConvertFile Spark Batch appartient à la famille Processus en cours.
Ce composant est disponible dans les produits Talend Platform avec Big Data et dans Talend Data Fabric.
Basic settings
Storage |
Pour vous connecter à une installation HDFS, cochez la case Define a storage configuration component et sélectionnez le nom du composant à utiliser, parmi ceux disponibles dans la liste déroulante. Cette option nécessite d'avoir précédemment configuré la connexion à l'installation HDFS à utiliser, comme décrit dans la documentation du composant tHDFSConfiguration. Si vous laissez la case Define a storage configuration component décochée, vous pouvez convertir les fichiers seulement en local. |
Configure Component |
Pour configurer le composant, cliquez sur le bouton [...] et, dans la fenêtre Component Configuration, effectuez les actions suivantes.
|
Input |
Cliquez sur le bouton [...] pour définir le chemin d'accès à l'emplacement où est stocké le fichier d'entrée. Vous pouvez également saisir manuellement le chemin d'accès, entre guillemets. |
Output |
Cliquez sur le bouton [...] afin de définir le chemin d'accès à l'emplacement où est stocké le fichier de sortie. Vous pouvez également saisir manuellement le chemin d'accès, entre guillemets. |
Action |
Dans la liste déroulante, sélectionnez :
|
Open Structure Editor |
Cliquez sur le bouton [...] pour ouvrir la structure afin de la modifier dans l'éditeur Structure Editor de Talend Data Mapper. Pour plus d'informations, consultez Éditeur de structure de sortie hiérarchique. |
Fusionner les résultats en un fichier |
Par défaut, le composant tHConvertFile crée plusieurs fichiers part. Cochez cette case pour fusionner ces fichiers en un seul fichier. Les options suivantes sont utilisées pour gérer les fichiers sources et cible :
Note InformationsAvertissement : Utiliser cette option avec une sortie Avro crée un fichier Avro invalide. Comme chaque partie commence par un en-tête Avro Schema, le fichier fusionné aura plusieurs Avro Schema, ce qui est invalide.
|
Paramètres avancés
Die on error |
Cochez cette case pour arrêter l'exécution du Job lorsqu'une erreur survient. Décochez la case pour ignorer les lignes en erreur et terminer le processus. |
Use old Eclipse runtime (deprecated) |
Cochez cette case pour inclure l'ancien environnement d'exécution Eclipse dans votre Job.
Note InformationsRemarque : Cette option est disponible uniquement si vous avez installé la mise à jour mensuelle R2024-03 du Studio Talend ou une mise à jour plus récente fournie par Talend. Pour plus d'informations, contactez votre administrateur ou administratrice.
|
Utilisation
Règle d'utilisation | Ce composant est utilisé avec le tHDFSConfiguration, définissant la connexion au stockage HDFS, ou en tant que composant standalone pour convertir des fichiers locaux uniquement. |
Utilisation avec Talend Runtime | Si vous souhaitez déployer un Job ou une Route contenant un composant de mapping de données avec Talend Runtime, vous devez d'abord installer la fonctionnalité Talend Data Mapper. Pour plus d'informations, consultez Utiliser Talend Data Mapper avec Talend Runtime. |