実験の作成と構成

最初のステップとして、実験を作成して構成します。前にアップロードしたトレーニングデータセットを使用して、展開し予測できる状態になるまでモデルをトレーニングします。

新しい実験を作成する

次の手順を実行します。

Analytics アクティビティセンターの [作成] ページに移動し、 [ML 実験] を選択します。
実験の名前を入力します (例: Customer churn tutorial)。
必要に応じて、説明とタグを追加します。
実験のスペースを選択します。個人スペースまたは共有スペースを選択できます。
[作成] をクリックします。
トレーニングデータセットファイルを選択します。これは、CSV または QVD のどちらを使用しているかに応じて、次のいずれかになります。
- ML - Churn data - training.csv
- ML - Churn data - training.qvd

実験の構成を開始する準備は完了していますが、開始する前に、データセットに注目してみましょう。

まず、 [データ] タブから始めます。既定のビューは、テーブルの行スキーマビューです。ここでは、各行がデータセットの列を表すテーブルを確認できます。自動データ作成において、統計と洞察が生成されています。スキーマの右側までスクロールしないと、洞察が表示されない場合があります。

カーディナリティが高いため、AccountID が除外されていることがわかります。これは、列に含まれる一意の値が多すぎることを意味します。Country の特徴量は、すべての行で同じ値という反対の理由で除外されています。これら 2 つの特徴量は、機械学習モデルに何の価値ももたらしません。

また、カテゴリ特徴量の Territory が impact encoded であることもわかります。警告三角形の警告および情報アイコンにカーソルを合わせると詳細が表示されます。

データビューをクリックします。このビューでは、サンプルデータを含む、各列の詳しい情報を確認できます。

機械学習モデルで顧客チャーンを予測するため、Churned をターゲットとしてデータセットの最後の列で選択します。

次の手順を実行します。

実験構成パネルで、Churned が選択されていることがわかります。また、どの特徴量が自動的に選択され、除外されるかを確認することもできます。Churned はターゲットであるため特徴量としては使用されません。この実験が二項分類問題として扱われることもわかります。

既定では、実験はインテリジェントモデル最適化を使用するように設定されています。確認するには、実験構成パネルで [モデルの最適化] を展開します。[インテリジェント] オプションを選択する必要があります。

特徴量の選択は、構成パネルの [特徴量] セクションで手動で構成できます。インテリジェントモデル最適化により、役に立たない特徴量を削除することにより特徴量の選択が自動的に処理されます。この設定をオンにすると、トレーニングに利用可能なすべての特徴量を含めることができます。

構成が完了し、トレーニングを開始する準備が整いました。

次の手順を実行します。

実験の実行が終了したら、結果のモデルメトリクスを確認する次のステップに進むことができます。

このページまたはコンテンツにタイポ、ステップの省略、技術的エラーなどの問題が見つかった場合はお知らせください。