Создание и настройка эксперимента
Первым шагом является создание и настройка эксперимента. Будет использоваться набор данных для обучения, загруженный ранее, чтобы обучить модель, пока она не будет готова к развертыванию и прогнозированию.
Создание нового эксперимента
Выполните следующие действия.
-
Перейдите на страницу «Создать» центра активности Аналитика и выберите Эксперимент машинного обучения.
-
Введите имя эксперимента, например: «Обучение для прогнозирования оттока клиентов».
-
При необходимости добавьте описание и теги.
-
Выберите пространство для эксперимента. Это может быть личное или общее пространство.
-
Щелкните Создать.
-
Выберите файл набора данных для обучения. Это может быть один из следующих файлов в зависимости от того, какой используется формат ― CSV или QVD:
-
AutoML Tutorial - Churn data - train.csv
-
AutoML Tutorial - Churn data - train.qvd
-
Анализ данных
Теперь все готово, чтобы приступить к настройке эксперимента, но прежде чем начать, давайте взглянем на набор данных.
Сначала необходимо открыть вкладку Данные. Видом по умолчанию является Вид схемы. Здесь мы видим таблицу, в которой каждая строка представляет столбец в наборе данных. Статистические и аналитические данные были получены в ходе автоматической подготовки данных. Может потребоваться прокрутить схему до конца вправо, чтобы увидеть раздел Наблюдения.
В таблице видно, что столбец AccountID был исключен из-за высокой кардинальности. Это означает, что столбец содержит слишком много уникальных значений. Признак Country был исключен по прямо противоположной причине: его значение одинаково во всех строках.Эти два признака не представляют никакой прогнозной ценности для моделей машинного обучения.
Мы также видим, что категориальный признак Territory задан методом кодирования влияния. Наведите курсор на значки предупреждения и информации , чтобы получить дополнительную информацию.
Щелкните Вид данных. В этом виде можно найти дополнительную информацию о каждом столбце, включая образцы данных.
Выбор цели
Для того чтобы модель машинного обучения спрогнозировала отток клиентов, в качестве цели необходимо выбрать Churned, это последний столбец в наборе данных.
Выполните следующие действия.
-
Вернитесь в Вид схемы.
-
Наведите курсор на Churned и щелкните появившийся значок цели .
На панели конфигурации эксперимента видно, что сейчас выбрано Churned. Также видно, какие признаки выбраны и исключены автоматически. Так как Churned является целью, это поле нельзя использовать в качестве признака. Также видно, что этот эксперимент будет обрабатываться как задача двоичной классификации.
Выбор признаков
При первом запуске эксперимента будут использоваться все признаки и алгоритмы, выбранные по умолчанию. Однако если вы уже знаете (из вашего бизнес-опыта), что определенные признаки никак не влияют на цель, вы можете отменить их выбор на данном этапе, чтобы исключить их из обучения.
Изменение параметров оптимизации
Интеллектуальная оптимизация моделей по умолчанию включена. При использовании интеллектуальной оптимизации моделей AutoML обеспечивает автоматическое уточнение обучения моделей. Однако цель этого учебного пособия ― показать, как вручную выявлять определенные проблемы с данными признаков и результатами обучения.
Для ознакомления с примером обучения моделей с использованием интеллектуальной оптимизации см. раздел Пример: обучение моделей с применением AutoML (автоматизированное машинное обучение).
Давайте отключим интеллектуальную оптимизацию модели, чтобы продемонстрировать ручное уточнение.
Выполните следующие действия.
-
Разверните раздел Оптимизация модели на панели конфигурации эксперимента.
-
Переключитесь из режима Интеллектуальная в режим Ручная.
Обучение эксперимента
Настройка завершена, и теперь можно приступать к обучению.
Выполните следующие действия.
-
Нажмите Запустить эксперимент в правом нижнем углу окна эксперимента.
Когда обучение эксперимента будет завершено, можно перейти к следующему шагу, который предполагает анализ полученных метрик модели.