実験の作成と構成
最初のステップとして、実験を作成して構成します。前にアップロードしたトレーニング データセットを使用して、展開し予測できる状態になるまでモデルをトレーニングします。
新しい実験を作成する
次の手順を実行します。
-
Analytics アクティビティ センターの [作成] ページに移動し、 [ML 実験] を選択します。
-
実験の名前を入力します (例: Customer churn tutorial)。
-
必要に応じて、説明とタグを追加します。
-
実験のスペースを選択します。個人スペースまたは共有スペースを選択できます。
-
[作成] をクリックします。
-
トレーニング データセット ファイルを選択します。これは、CSV または QVD のどちらを使用しているかに応じて、次のいずれかになります。
-
ML - Churn data - training.qvd
-
ML - Churn data - apply.qvd
-
データのレビュー
実験の構成を開始する準備は完了していますが、開始する前に、データセットに注目してみましょう。
まず、 [データ] タブから始めます。既定のビューは、 スキーマ ビューです。ここでは、各行がデータセットの列を表すテーブルを確認できます。自動データ作成において、統計と洞察が生成されています。スキーマの右側までスクロールしないと、洞察が表示されない場合があります。
カーディナリティが高いため、AccountID が除外されていることがわかります。これは、列に含まれる一意の値が多すぎることを意味します。Country の特徴量は、すべての行で同じ値という反対の理由で除外されています。これら 2 つの特徴量は、機械学習モデルに何の価値ももたらしません。
また、カテゴリ特徴量の Territory が impact encoded であることもわかります。警告 および情報
アイコンにカーソルを合わせると詳細が表示されます。
Qlik Predict のトレーニング データセットのスキーマ ビュー

データ ビュー をクリックします。このビューでは、サンプル データを含む、各列の詳しい情報を確認できます。
データ ビュー

ターゲットの選択
機械学習モデルで顧客チャーンを予測するため、Churned をターゲットとしてデータセットの最後の列で選択します。
次の手順を実行します。
-
スキーマ ビューに戻ります。
-
Churned にカーソルを合わせ、表示されるターゲット
アイコンをクリックします。
ターゲットとして選択されているスキーマ ビューの行

実験構成パネルで、Churned が選択されていることがわかります。また、どの特徴量が自動的に選択され、除外されるかを確認することもできます。Churned はターゲットであるため特徴量としては使用されません。この実験が二項分類問題として扱われることもわかります。
[実験構成] パネルに表示される情報

特徴量選択とモデルの最適化
既定では、実験はインテリジェント モデル最適化を使用するように設定されています。確認するには、実験構成パネルで [モデルの最適化] を展開します。[インテリジェント] オプションを選択する必要があります。
[実験構成] パネルでインテリジェント モデル最適化を確認する

特徴量の選択は、構成パネルの [特徴量] セクションで手動で構成できます。インテリジェント モデル最適化により、役に立たない特徴量を削除することにより特徴量の選択が自動的に処理されます。この設定をオンにすると、トレーニングに利用可能なすべての特徴量を含めることができます。
実験のトレーニング
構成が完了し、トレーニングを開始する準備が整いました。
次の手順を実行します。
-
実験ウィンドウの右下隅にある [実験を実行] をクリックします。
実験の実行が終了したら、結果のモデル メトリクスを確認する次のステップに進むことができます。