Оптимизация гиперпараметров
Моделям машинного обучения требуются различные ограничения, веса или скорости обучения для обобщения различных шаблонов данных. Эти показатели называются гиперпараметрами и используются для управления процессом обучения. Гиперпараметры необходимо настроить так, чтобы модель могла оптимально решать задачу машинного обучения.
По умолчанию Qlik Predict использует предопределенный набор значений гиперпараметров для каждого алгоритма, применяемого при обучении модели. Это стандартные оптимизированные значения, общепринятые в сообществе специалистов по анализу данных. Автоматически выбирается наиболее эффективное сочетание значений гиперпараметров.
Однако в некоторых случаях может потребоваться точная настройка модели для получения оптимальных результатов прогнозирования. Это можно сделать с помощью оптимизации гиперпараметров (HPO).
Qlik Predict выполняет оптимизацию гиперпараметров только для лучшего алгоритма из набора, выбранного в конфигурации эксперимента. Сначала запускается случайный поиск, а затем поиск по сетке для поиска лучших гиперпараметров для алгоритма.
Перед использованием оптимизации гиперпараметров необходимо учесть несколько важных моментов:
-
Не используйте оптимизацию гиперпараметров при первом обучении модели. Она предназначена для использования после того, как модель уже обучена и результаты вас устраивают. Этот процесс часто требует повторной доработки и переобучения.
-
Оптимизация гиперпараметров значительно увеличивает время обучения. Если процесс обучения модели занимает пять минут при использовании стандартных предопределенных значений гиперпараметров, то обучение той же модели с включенной оптимизацией гиперпараметров может занять несколько часов.
Алгоритмы, используемые при оптимизации гиперпараметров
Оптимизация гиперпараметров ограничена определенными алгоритмами и типами моделей. Она специально разработана для работы со следующими типами моделей и алгоритмами:
-
Модели бинарной классификации
-
Классификация CatBoost
-
Регрессия Elastic Net
-
Регрессия Lasso
-
Классификация LightGBM
-
Логистическая регрессия
-
Классификация Random Forest
-
Классификация XGBoost
-
-
Модели регрессии
-
Регрессия CatBoost
-
Регрессия LightGBM
-
Регрессия Random Forest
-
Регрессия XGBoost
-
Включение оптимизации гиперпараметров
Выполните следующие действия.
-
В эксперименте щелкните Просмотреть конфигурацию.
Откроется панель конфигурации эксперимента.
-
При необходимости щелкните Создать новую версию, чтобы настроить следующую версию.
-
На панели разверните раздел Оптимизация модели.
-
Переключитесь с режима Интеллектуальная на режим Вручную.
Оптимизация гиперпараметров недоступна при интеллектуальной оптимизации модели.
-
Установите флажок Оптимизация гиперпараметров.
Просмотр значений гиперпараметров
Просматривайте значения гиперпараметров на вкладке Сравнить во время подробного анализа модели. Для получения дополнительной информации см. Выполнение подробного анализа модели.