Создание и настройка эксперимента
Первым шагом является создание и настройка эксперимента. Вы будете использовать загруженный ранее набор данных для обучения, чтобы обучить модель, пока она не будет готова к развертыванию для создания прогнозов.
Создание нового эксперимента
Выполните следующие действия.
-
Перейдите на страницу «Создать» Аналитика центра активности и выберите Эксперимент ML.
-
Введите имя эксперимента, например Customer churn tutorial.
-
При необходимости добавьте описание и теги.
-
Выберите пространство для эксперимента. Это может быть ваше личное пространство или общее пространство.
-
Нажмите Создать.
-
Выберите файл набора данных для обучения. Это будет один из следующих вариантов в зависимости от того, работаете ли вы с CSV или QVD:
-
ML - Churn data - training.csv
-
ML - Churn data - training.qvd
-
Просмотр данных
Теперь все готово для настройки эксперимента, но перед началом давайте взглянем на набор данных.
Мы начинаем на вкладке Настройка. По умолчанию используется представление Представление схемы. Здесь представлена таблица, в которой каждая строка соответствует столбцу в наборе данных. Статистика и аналитика были созданы в ходе автоматической подготовки данных. Возможно, вам придется прокрутить схему вправо, чтобы увидеть столбец Аналитика.
Мы видим, что столбец AccountID был исключен из-за высокой кратности. Это означает, что столбец содержит слишком много уникальных значений. Характеристика Country была исключена по противоположной причине: значение одинаково для всех строк. Эти две характеристики не принесут никакой пользы моделям машинного обучения.
Мы также видим, что категориальная характеристика Territory была закодирована с учетом влияния. Наведите курсор на значок предупреждения и значок информации
для получения дополнительной информации.
Представление схемы для обучающего набора данных в Qlik Predict
Нажмите Просмотр данных. В этом представлении можно увидеть дополнительную информацию о каждом столбце, включая данные образца.
Просмотр данных
Выбор целевого показателя
Мы хотим, чтобы наша модель машинного обучения прогнозировала отток клиентов, поэтому мы выбираем Churned, последний столбец в наборе данных, в качестве целевого показателя.
Выполните следующие действия.
-
Вернитесь в представление
Представление схемы.
-
Наведите курсор на Churned и нажмите на появившийся значок целевого показателя
.
Строка в представлении схемы выбрана в качестве целевого показателя
На панели настройки эксперимента разверните раздел Параметры эксперимента. Вы увидите, что в качестве целевого показателя выбран столбец Churned. На основе целевого показателя и доступных данных характеристик для параметра Тип эксперимента установлено значение Бинарная классификация.
Вы также можете увидеть, какие характеристики выбираются и исключаются автоматически. Столбец Churned является целевым показателем, поэтому он не будет использоваться в качестве характеристики.
Информация, отображаемая на панели настройки
Выбор характеристик и оптимизация моделей
По умолчанию в эксперименте настроено использование интеллектуальной оптимизации моделей. Чтобы подтвердить это, разверните раздел Оптимизация моделей на панели настройки эксперимента. Должен быть выбран вариант Интеллектуальная.
Подтверждение интеллектуальной оптимизации моделей на панели настройки

Выбор характеристик можно настроить вручную в разделе Характеристики панели настройки. При интеллектуальной оптимизации моделей выбор характеристик выполняется автоматически путем удаления неэффективных характеристик. При включении этого параметра мы можем включить все доступные характеристики в обучение.
Обучение эксперимента
Настройка завершена, и мы готовы начать обучение.
Выполните следующие действия.
-
Нажмите Запустить эксперимент.
После завершения работы эксперимента можно переходить к следующему шагу — просмотру полученных метрик модели.