tHiveInput
Ce composant extrait des données de Hive et les envoie au composant qui suit.
Le tHiveInput est le composant dédié à la base de données Hive (le système de data warehouse Hive). Il peut exécuter une requête HiveQL données afin d'extraire des données de Hive.
Lorsque ACID est activé côté Hive, un Job Spark ne peut pas supprimer ou mettre à jour une table, à moins que des données soient compactées, ce Job ne peut pas non plus lire correctement des données agrégées d'une table Hive. Cette limitation est connue et décrite dans le système de suivi des bugs : https://issues.apache.org/jira/browse/SPARK-15348 (uniquement en anglais) (en anglais).
Pour plus de technologies supportées par Talend, consultez Composants Talend.
Selon le produit Talend que vous utilisez, ce composant peut être utilisé dans un framework de Jobs, dans plusieurs, ou dans tous les frameworks :
-
Standard : consultez Propriétés du tHiveInput Standard.
Le composant de ce framework est disponible dans tous les produits Talend avec Big Data et dans Talend Data Fabric.
-
Spark Batch : consultez Propriétés du tHiveInput pour Apache Spark Batch.
Le composant de ce framework est disponible dans tous les produits Talend avec Big Data et dans Talend Data Fabric.
-
Spark Streaming : consultez Propriétés du tHiveInput pour Apache Spark Streaming.
Ce composant est disponible dans Talend Real Time Big Data Platform et dans Talend Data Fabric.