tHDFSOutputコンポーネントを使えば、HDFSにデータを書き込めます。
手順
-
[Repository] (リポジトリー)でを展開した後に、目的のHadoopクラスターメタデータを展開します。
-
HDFSメタデータを[Designer] (デザイナー)にドラッグ&ドロップします。
[Components] (コンポーネント)ウィンドウが表示されます。
-
tHDFSOutputコンポーネントを選択します。
-
入力コンポーネントを追加します。
例
テスト用の架空データが生成されるよう、
tRowGeneratorコンポーネントを追加します(
ランダムデータを生成をご覧ください)。
-
入力コンポーネントを右クリックします。
-
を選択します。
-
tHDFSOutputコンポーネントをクリックし、両コンポーネントをリンクさせます。
-
tHDFSOutputコンポーネントをダブルクリックします。
このコンポーネントは事前定義済みのHDFSメタデータ接続情報によって設定されています。
-
[File Name] (ファイル名)フィールドにファイルパスと目的のファイルの名前を入力します。
- オプション:
[Action] (アクション)で[Overwrite] (上書き)を選択します。
タスクの結果
入力コンポーネント(
tRowGeneratorコンポーネントなど)はデータを読み取り、
tHDFSOutputコンポーネントはメタデータで定義された接続を使ってHDFSシステムにデータを書き込みます。