tHiveOutput
Ce composant se connecte à une base de données Hive et écrit les données qu'il reçoit dans une table Hive ou dans un répertoire spécifié.
Lorsque ACID est activé côté Hive, un Job Spark ne peut pas supprimer ou mettre à jour une table, à moins que des données soient compactées, ce Job ne peut pas non plus lire correctement des données agrégées d'une table Hive. Cette limitation est connue et décrite dans le système de suivi des bugs : https://issues.apache.org/jira/browse/SPARK-15348 (uniquement en anglais) (en anglais).
Pour plus de technologies supportées par Talend, consultez Composants Talend.
Selon le produit Talend que vous utilisez, ce composant peut être utilisé dans un framework de Jobs, dans plusieurs, ou dans tous les frameworks :
-
Spark Batch : consultez Propriétés du tHiveOutput pour Apache Spark Batch.
Le composant de ce framework est disponible dans tous les produits Talend avec Big Data et dans Talend Data Fabric.
-
Spark Streaming : consultez Propriétés du tHiveOutput pour Apache Spark Streaming.
Ce composant est disponible dans Talend Real Time Big Data Platform et dans Talend Data Fabric.