このセクションでは、トレーニングデータスキーマ参照を作成して、機械学習ルーチンを開発する方法について説明します。
手順
-
事前に作成したHDFS接続を右クリックして、[Retrieve Schema] (スキーマを取得)を選択します。
-
/user/puccini/machinelearning/decisiontrees/marketing/marketing_campaign_train.csvにある、事前ロードされたトレーニングデータファイルに移動します。
-
[Next] (次へ)をクリックし、スキーマに名前を付け、必要に応じてデータ型を調整します。
この場合は、デフォルトは正確です。
-
[Finish] (終了)をクリックします。
-
パレットにtHDFSConfigurationコンポーネントを追加します。
-
[PropertyType] (プロパティタイプ)を[Repository] (リポジトリー)に設定します。
-
作成したHDFS接続(MarketingCampaignData)を選択します。