Accéder au contenu principal Passer au contenu complémentaire

Concevoir le flux de données à écrire et à chiffrer dans EMR

Liez les composants pour construire le flux de données.

Procédure

  1. Dans la perspective Integration du Studio, créez un Job Spark Batch vide, depuis le nœud Job Designs de la vue Repository.
  2. Dans l'espace de modélisation, saisissez le nom du composant à utiliser et sélectionnez ce composant dans la liste qui apparaît. Dans ce scénario, les composants sont tHDFSConfiguration (appelé emr_hdfs), tS3Configuration, tFixedFlowInput, tAggregateRow et tFileOutputParquet.
    Le composant tFixedFlowInput est utilisé pour charger les données d'exemple dans le flux de données. En pratique, utilisez le composant d'entrée spécifique au format des données ou le système source à utiliser au lieu du tFixedFlowInput.
  3. Reliez le tFixedFlowInput, le tAggregateRow et le tFileOutputParquet à l'aide de liens Row > Main.
  4. Laissez les composants tHDFSConfiguration et tS3Configuration seuls, sans connexion.

Cette page vous a-t-elle aidé ?

Si vous rencontrez des problèmes sur cette page ou dans son contenu – une faute de frappe, une étape manquante ou une erreur technique – faites-le-nous savoir.