Создание и настройка эксперимента

Первым шагом является создание и настройка эксперимента. Вы будете использовать набор данных для обучения, загруженный ранее, чтобы обучать модель, пока она не будет готова к тому, чтобы ее развернуть для создания прогнозов.

Создание нового эксперимента

Выполните следующие действия.

Перейдите на страницу создания Аналитика центра активности и выберите ML-эксперимент.
Введите имя для вашего эксперимента, например, Учебное пособие по оттоку клиентов.
При желании добавьте описание и теги.
Выберите пространство для вашего эксперимента. Это может быть ваше личное пространство или общее пространство.
Нажмите Создать.
Выберите файл набора данных для обучения. Это будет один из следующих файлов, в зависимости от того, работаете ли вы с CSV или QVD:
- ML - Churn data - training.csv
- ML - Churn data - training.qvd

Просмотр данных

Теперь вы готовы начать настройку эксперимента, но перед началом давайте посмотрим на набор данных.

Мы начинаем на вкладке Конфигурация. Представлением по умолчанию является Строки таблицы Представление схемы. Здесь мы можем видеть таблицу, где каждая строка представляет столбец в вашем наборе данных. Статистика и наблюдения были сгенерированы в процессе автоматической подготовки данных. Возможно, вам придется прокрутить схему вправо, чтобы увидеть Наблюдения.

Мы видим, что AccountID был исключен из-за высокой кардинальности. Это означает, что столбец содержит слишком много уникальных значений. Характеристика Country была исключена по противоположной причине: значение одинаково для всех строк. Эти две характеристики не принесут никакой пользы моделям машинного обучения.

Мы также можем видеть, что категориальная характеристика Territory была закодирована методом impact encoding. Наведите курсор на значки предупреждения Предупреждающий треугольник и информации Информация для получения дополнительной информации.

Представление схемы в ML-эксперименте с аналитикой о характеристиках. — Представление схемы для набора данных для обучения в Qlik Predict

Нажмите Профиль Представление данных. В этом представлении мы можем увидеть больше информации о каждом столбце, включая данные образца.

Представление данных в конфигурации эксперимента. — Представление данных

Выбор цели

Мы хотим, чтобы наша модель машинного обучения прогнозировала отток клиентов, поэтому мы выбираем Churned, последний столбец в наборе данных, в качестве нашей цели.

Выполните следующие действия.

Переключитесь обратно на Представление схемы.
Нажмите переключатель для Churned.

Строка таблицы для выбранной цели. — Строка в представлении схемы выбрана в качестве цели

На панели конфигурации эксперимента разверните Настройки эксперимента. Вы можете видеть, что Churned был выбран в качестве цели. На основе вашей цели и доступных данных характеристик, Тип эксперимента — Бинарная классификация.

Вы также можете видеть, какие характеристики автоматически выбраны и исключены. Churned является целью, поэтому он не будет использоваться как характеристика.

Панель конфигурации эксперимента с выбранной целью, типом эксперимента и выбором характеристик по умолчанию — Информация, отображаемая на панели конфигурации

Выбор характеристик и оптимизация модели

По умолчанию эксперимент настроен на использование интеллектуальной оптимизации модели. Для подтверждения разверните Оптимизация модели на панели конфигурации эксперимента. Должна быть выбрана опция Интеллектуальная.

Панель конфигурации эксперимента с включенной интеллектуальной оптимизацией модели — Подтверждение интеллектуальной оптимизации модели на панели конфигурации

Выбор характеристик можно настроить вручную в разделе Характеристики на панели конфигурации. При интеллектуальной оптимизации модели выбор характеристик выполняется автоматически путем удаления бесполезных характеристик. При включенной этой настройке мы можем включить все доступные характеристики в обучение.

Обучение эксперимента

Настройка завершена, и мы готовы начать обучение.

Выполните следующие действия.

Нажмите Запустить эксперимент.

Когда выполнение эксперимента завершится, мы можем перейти к следующему шагу, который заключается в просмотре полученных метрик модели.

Помогла ли вам эта страница?

Если вы обнаружили какую-либо проблему на этой странице или с ее содержанием — будь то опечатка, пропущенный шаг или техническая ошибка, сообщите нам об этом!

Оставьте свой отзыв здесь