tHiveInput
Hiveからデータを抽出し、データを後続のコンポーネントに送ります。
HiveではSparkから外部テーブルにアクセスできますが、ACIDトランザクションはサポートされていません。
tHiveInputはHiveデータベースの専用コンポーネントです(Hive Data Warehouseシステム)。Hiveからデータを抽出するために特定のHiveQLクエリーを実行できます。
Hive側でACIDが有効になっている場合、Sparkジョブはテーブルを削除またはアップデートできず、データが圧縮されない限り、このジョブはHiveテーブルから集計データを正しく読み取ることができません。これは、Sparkバグ追跡システムで説明されている既知の制限です。
デフォルトで、このコンポーネントはTalend Studioと共には出荷されていません。機能マネージャーを使ってインストールする必要があります。 詳細は、機能マネージャーを使って機能をインストールをご覧ください。