メイン コンテンツをスキップする 補完的コンテンツへスキップ

YARNでHDFS接続からデータを読み取る

事前定義済みHDFSメタデータを使えば、YARNのHDFSファイルシステムからデータを読み取ることができます。

始める前に

手順

  1. 入力コンポーネントをダブルクリックします。
    コンポーネントがHDFSのメタデータ情報と共に設定されます。
  2. [Edit schema] (スキーマを編集)の横にある[...]ボタンをクリックします。
  3. プラスボタンをクリックしてデータカラムを追加します。

    1. CustomerID
    2. FirstName
    3. LastName
  4. [Types] (タイプ)カラムを選択します。

    CustomerIDには、Integer Typeを選択します。
  5. [OK]をクリックします。
  6. [File Name] (ファイル名)フィールドにファイルパスと目的のファイルの名前を入力します。

タスクの結果

以上でtFileInputDelimitedコンポーネントが設定され、YARNのHDFSからデータを読み取れるようになります。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。