インテリジェント モデル最適化
インテリジェント モデル最適化により、実験でトレーニングしたモデルが自動的に改良されます。インテリジェントなモデル最適化により、モデルのパフォーマンスに悪影響を及ぼす可能性がある機能はモデルのトレーニングから自動的に除外されます。関連機能がすべて含まれており、十分に準備されたトレーニング データセットがあれば、インテリジェントなモデル最適化によって、単独のバージョン内ですぐに展開できるモデルをトレーニングできます。
インテリジェント モデル最適化とは
インテリジェント モデル最適化により、モデル改良プロセスの多くの処理が自動化されます。インテリジェント モデル最適化により、モデルの予測可能性を低下させる特徴量が識別され、削除されます。
インテリジェント モデル最適化を使用する
新しい ML 実験では、インテリジェント モデル最適化が既定でオンになっています。実行する実験のバージョンごとにオンまたはオフに切り替えることができます。
インテリジェント最適化をオンにして実験バージョンを実行すると、最適化の結果を [モデル トレーニングの概要] で確認できます。この概要は、[モデルの洞察] の [モデル] タブに表示されます。下線付きの用語の上にカーソルを合わせると、ツール ヒントで詳しい説明が表示されます。
[モデル トレーニングの概要] は、実験バージョンでトレーニングされたモデルごとに異なります。
インテリジェント モデル最適化中に、次のいずれかの理由で特徴量がドロップされる可能性があります。
-
ターゲット漏洩: 特徴量はターゲット漏洩の影響を受ける疑いがあります。ターゲット漏洩の影響を受ける特徴量には、予測しようとしているターゲット列に関する情報が含まれています。たとえば、特徴量はターゲットから直接派生したものであったり、予測時には知られていない情報を含んでいたりします。ターゲット漏洩の原因となる特徴量は、モデルのパフォーマンスに関して誤った確信を与える可能性があります。実世界の予測では、モデルのパフォーマンスが大きく低下します。
-
低い Permutation Importance: この特徴量は、モデルの予測にほとんど影響を与えません。これらの特徴量を削除すると、統計ノイズが減少し、モデルのパフォーマンスが向上します。
-
相関が高い: この特徴量は、実験内の 1 つ以上の他の特徴量と高い相関関係があります。相関が高すぎる特徴量は、トレーニング モデルでの使用には適していません。
実験内の [データ] タブでは、各モデルでドロップされた特徴量に関するインサイトを表示できます。[インサイト] は、インテリジェント モデル最適化プロセス以外でドロップされた特徴量も参照します。各インサイトの詳細については、「データセットのインサイトの解釈」を参照してください。
インテリジェント モデル最適化の仕組み
インテリジェント モデル最適化を使用:
- 手動の最適化よりも多くのモデルがトレーニングされます。特徴量の選択はモデル レベルで処理されます。つまり、手動による最適化とは異なり、バージョン内の各モデルに異なる特徴量の選択を含めることができます。
- 品質保証のため、ベースライン モデル (バージョン用に構成した特徴量セット全体でトレーニングされたモデル) は引き続きトレーニングされます。これは、インテリジェント最適化によって実際にモデル スコアが向上しているかどうかを確認するのに役立ちます。
- より大きなトレーニング データセットの場合、モデルはさまざまなサンプリング比率でトレーニングされます。 これにより、トレーニング プロセスを高速化できます。詳細は、トレーニング データのサンプリングをご覧ください。
トレーニング データのサンプリング
大量のデータを使用してモデルをトレーニングする場合、AutoML はサンプリングを使用して、元のデータセットのさまざまなサブセット (サンプリング比率) でモデルをトレーニングします。サンプリングは、トレーニング プロセスを高速化するために使用されます。トレーニングの開始時に、モデルは小さなサンプリング比率でトレーニングされます。トレーニングが継続されるにつれて、モデルは徐々により大きなデータ部分でトレーニングされるようになります。最終的に、モデルはデータセット全体(サンプリング比率 100%)でトレーニングされます。
モデル トレーニング データの分析中、トレーニング データセットの 100% 未満でトレーニングされたモデルは、一部のビューに表示されません。
インテリジェント最適化をオフにする
インテリジェント最適化をオフにする場合、トレーニングを手動で最適化します。トレーニング プロセスをより細かく制御する必要がある場合は、手動で最適化すると便利です。特に、インテリジェント モデル最適化を備えたバージョンを実行し、手動で小さな調整を行う必要がある場合は、この設定をオフにすることをお勧めします。
次の手順を実行します。
実験で、 [構成を見る] をクリックします。
実験構成パネルが開きます。
少なくとも 1 つのバージョンの実験をすでに実行している場合は、 [新しいバージョン] をクリックします。
パネルで、 [モデル最適化] を展開します。
[インテリジェント] から [手動] に切り替えます。
考慮事項
インテリジェント モデル最適化を使用する場合は、次の点を考慮してください。
インテリジェント モデル最適化を使用しても、トレーニングによって高品質のモデルが生成されるとは限りません。信頼性の高いモデルを作成するには、データセットの準備と実験の構成段階も不可欠になります。適切に準備されたデータセットがない場合、または構成に重要な特徴量が欠けている場合、モデルが本番環境のユースケースで適切に機能する保証はありません。これらのステージの詳細については、次を参照してください。
あるバージョンでインテリジェント モデル最適化を有効にすると、このバージョンの各モデルには個別の特徴量のセットが含まれるようになります。一方、手動最適化でトレーニングされたバージョンのすべてのモデルには、同じ特徴量のセットが含まれます。
インテリジェント モデル最適化では、バージョンの構成に含めた特徴量とアルゴリズムのみが使用されます。
ハイパーパラメーターの最適化
ハイパーパラメーターの最適化は、インテリジェント モデル最適化では使用できません。ハイパーパラメーターの最適化を有効にするには、モデル最適化を [手動] に設定する必要があります。
詳細は、ハイパーパラメーターの最適化をご覧ください。
例
インテリジェント モデル最適化の利点を示す例については、「例 – 自動機械学習によるモデルのトレーニング」を参照してください。