メイン コンテンツをスキップする 補完的コンテンツへスキップ

機械学習用のHadoopクラスターを作成

このセクションでは、Hadoopクラスターを作成して、機械学習ルーチンを開発する方法について説明します。

手順

  1. [Metadata] (メタデータ)を展開します。
  2. [Hadoop Cluster] (Hadoopクラスター)を右クリックし、新しいクラスターを作成します。
  3. 名前を入力します。この例ではMarketingCampaignDataです。
  4. クラスター上でLinux OSユーザーを指定します。

    ここでは、pucciniが既に作成されまています。

    この記事で使われるトレーニングデータとテストデータは、元のソースから多少変更されて、HDFS内に事前ロードされました。これらのデータセットは、[Downloads] (ダウンロード)パネルからダウンロードできます。

  5. HDFS接続を以下のように設定します。
    • [Row Separator] (行区切り): 標準の行末 ("\n")。
    • [Field Separator] (フィールド区切り): カンマ (",")。
    • [Header] (ヘッダー)チェックボックスをオンにします。ドロップダウンリストから1を選択し、[Set heading row as column names] (カラム名として先頭行を設定)チェックボックスをオンにします。

このページは役に立ちましたか?

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。