Propriétés du tExtractJSONFields pour Apache Spark Batch
Ces propriétés sont utilisées pour configurer le tExtractJSONFields s'exécutant dans le framework de Jobs Spark Batch.
Le composant tExtractJSONFields Spark Batch appartient à la famille Processus en cours.
Le composant de ce framework est disponible dans tous les produits Talend avec Big Data nécessitant une souscription et dans Talend Data Fabric.
Basic settings
Propriétés | Description |
---|---|
Property type |
|
Schema et Edit Schema |
|
Read by |
Sélectionnez un moyen d'extraire les données JSON du fichier.
|
JSON field |
Liste des champs JSON à extraire. |
Loop Jsonpath query |
Saisissez le JSONPath ou le XPath du nœud sur lequel se base la boucle. Si vous avez sélectionné Xpath dans la liste déroulante Read by, le champ Loop Xpath query s'affiche. |
Mapping |
Renseignez cette table pour mapper les colonnes définies dans le schéma aux nœuds JSON correspondants.
|
Die on error |
Cochez cette case pour arrêter l'exécution du Job lorsqu'une erreur survient. |
Advanced settings
Propriétés | Description |
---|---|
Encodage |
Sélectionnez l'encodage à partir de la liste ou sélectionnez Custom et définissez-le manuellement. Ce champ est obligatoire pour la manipulation des données de base de données. Les encodages supportés dépendent de la JVM que vous utilisez. Pour plus d'informations, consultez https://docs.oracle.com. |
Utilisation
Conseils d'utilisation | Description |
---|---|
Règle d'utilisation |
Ce composant est utilisé comme étape intermédiaire. Ce composant, ainsi que la Palette Spark Batch à laquelle il appartient, ne s'affiche que lorsque vous créez un Job Spark Batch. Notez que, dans cette documentation, sauf mention contraire, un scénario présente uniquement des Jobs Standard, c'est-à-dire des Jobs Talend traditionnels d'intégration de données. |
Connexion à Spark |
Dans l'onglet Spark Configuration de la vue Run, définissez la connexion à un cluster Spark donné pour le Job complet. De plus, puisque le Job attend ses fichiers .jar dépendants pour l'exécution, vous devez spécifier le répertoire du système de fichiers dans lequel ces fichiers .jar sont transférés afin que Spark puisse accéder à ces fichiers :
Cette connexion fonctionne uniquement pour le Job dans lequel vous l'avez définie. |