次のステップ
Talend StudioとTalend Administration CenterがTalendジョブを使ってビッグデータを管理するうえでどのように役立つかを見てきました。データにアクセスし、所定のHadoopクラスターにTalendジョブ経由で移動し、データをフィルター処理して変換し、フィルター処理して変換したデータをHadoopクラスターのHDFSシステムに保存する方法について学びました。その際に、使用頻度の高いHadoop接続を[Repository] (リポジトリー)内で一元管理してそれらの接続をジョブ内で再利用しやすいようにする方法を学びました。
Talend Studioの詳細は、以下を参照してください。
-
Talend Studioユーザーガイド
-
Talendコンポーネントに関するドキュメンテーション
Talend Administration Centerの詳細は、Talend Administration Centerユーザーガイドを参照してください。
データがクリーンであること確認するには、Talend StudioとTalend Data Preparationのプロファイリングおよびクレンジングの機能が使用できます。
Talend製品とソリューションの詳細は、www.talend.com (英語のみ)を参照してください。