Concevoir le flux de données à écrire et à chiffrer dans EMR
Liez les composants pour construire le flux de données.
Procédure
Dans la perspective Integration du Studio Talend, créez un Job Spark Batch vide, à partir du nœud Job Designs, dans la vue Repository.
Dans l'espace de modélisation, saisissez le nom du composant à utiliser et sélectionnez ce composant dans la liste qui apparaît. Dans ce scénario, les composants sont tHDFSConfiguration (appelé emr_hdfs), tS3Configuration, tFixedFlowInput, tAggregateRow et tFileOutputParquet.
Le composant tFixedFlowInput est utilisé pour charger les données d'exemple dans le flux de données. En pratique, utilisez le composant d'entrée spécifique au format des données ou le système source à utiliser au lieu du tFixedFlowInput.
Reliez le tFixedFlowInput, le tAggregateRow et le tFileOutputParquet à l'aide de liens Row > Main.
Laissez les composants tHDFSConfiguration et tS3Configuration seuls, sans connexion.
Cette page vous a-t-elle aidé ?
Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.