このセクションでは、トレーニングデータスキーマ参照を作成して、機械学習ルーチンを開発する方法について説明します。
手順
-
事前に作成したHDFS接続を右クリックして、[Retrieve Schema] (スキーマを取得)を選択します。
-
事前ロード済みのトレーニングデータファイルに移動します。
この例では、/user/puccini/machinelearning/decisiontrees/marketing/marketing_campaign_train.csvです。
-
[Next] (次へ)をクリックし、スキーマに名前を付け、必要に応じてデータ型を調整します。
この例では、デフォルトは正確です。
-
[Finish] (終了)をクリックします。
-
ワークスペースにtHDFSConfigurationコンポーネントを追加します。
-
[PropertyType] (プロパティタイプ)を[Repository] (リポジトリー)に設定します。
-
作成したHDFS接続(MarketingCampaignData)を選択します。