ハイパーパラメーターを調整し、K-分割交差検証を使ってマッチングモデルを向上
K-分割交差検証法を使ってモデルをテスト
K-分割交差検証法では、独立したデータセットでモデルが適する程度を評価します。
モデルをテストするには、データセットがkサブセットに分割されて、ランダムフォレストアルゴリズムがk回実行されます:
- 反復処理されるたびに、kの1つは検証セットとして保持されて、残りのk-1サブセットはトレーニングセットとなります。
- 各k実行のスコアが計算されてから、その得られたスコアが平均化されて、グローバルスコアを算出します。
グリッド検索を使って、ランダムフォレストアルゴリズムのハイパーパラメーターを調整
2つのランダムフォレストアルゴリズムのハイパーパラメーターの値を指定できます:
- デシジョンツリーの数
- デシジョンツリーの最大深度
モデルのクオリティを向上させたり、ハイパーパラメーターを調整したりするには、指定した制限内で、グリッド検索は2つのランダムフォレストアルゴリズムのハイパーパラメーター値の各組み合わせに対してモデルをビルドします。
サンプル:
- ツリーの数は、ステップ5で5から50までの範囲です。
- ツリーの深度は、ステップ1で5から10までの範囲です。
このサンプルには、異なる組み合わせが60組(10×6)あります。
最適モデルのトレーニングに使用される2つのハイパーパラメーター値の最適な組み合わせのみが保持されます。この測定はK-分割交差検証によってレポートされます。