Создание и настройка эксперимента | Qlik Cloud Справка
Перейти к основному содержимому Перейти к дополнительному содержимому

Создание и настройка эксперимента

Первым шагом является создание и настройка эксперимента. Вы будете использовать загруженный ранее набор данных для обучения, чтобы обучить модель, пока она не будет готова к развертыванию для создания прогнозов.

Создание нового эксперимента

  1. Перейдите на страницу «Создать» Аналитика центра активности и выберите Эксперимент ML.

  2. Введите имя эксперимента, например Customer churn tutorial.

  3. При необходимости добавьте описание и теги.

  4. Выберите пространство для эксперимента. Это может быть ваше личное пространство или общее пространство.

  5. Нажмите Создать.

  6. Выберите файл набора данных для обучения. Это будет один из следующих вариантов в зависимости от того, работаете ли вы с CSV или QVD:

    • ML - Churn data - training.csv

    • ML - Churn data - training.qvd

Просмотр данных

Теперь все готово для настройки эксперимента, но перед началом давайте взглянем на набор данных.

Мы начинаем на вкладке Настройка. По умолчанию используется представление Строки таблицы Представление схемы. Здесь представлена таблица, в которой каждая строка соответствует столбцу в наборе данных. Статистика и аналитика были созданы в ходе автоматической подготовки данных. Возможно, вам придется прокрутить схему вправо, чтобы увидеть столбец Аналитика.

Мы видим, что столбец AccountID был исключен из-за высокой кратности. Это означает, что столбец содержит слишком много уникальных значений. Характеристика Country была исключена по противоположной причине: значение одинаково для всех строк. Эти две характеристики не принесут никакой пользы моделям машинного обучения.

Мы также видим, что категориальная характеристика Territory была закодирована с учетом влияния. Наведите курсор на значок предупреждения Предупреждающий треугольник и значок информации Предупреждающий треугольник для получения дополнительной информации.

Представление схемы для обучающего набора данных в Qlik Predict

Представление схемы в эксперименте ML с аналитикой характеристик.

Нажмите Просмотр данных Просмотр данных. В этом представлении можно увидеть дополнительную информацию о каждом столбце, включая данные образца.

Просмотр данных

Просмотр данных в настройке эксперимента.

Выбор целевого показателя

Мы хотим, чтобы наша модель машинного обучения прогнозировала отток клиентов, поэтому мы выбираем Churned, последний столбец в наборе данных, в качестве целевого показателя.

  1. Вернитесь в представление Строки таблицы Представление схемы.

  2. Наведите курсор на Churned и нажмите на появившийся значок целевого показателя Целевой показатель.

Строка в представлении схемы выбрана в качестве целевого показателя

Строка таблицы для выбранного целевого показателя.

На панели настройки эксперимента разверните раздел Параметры эксперимента. Вы увидите, что в качестве целевого показателя выбран столбец Churned. На основе целевого показателя и доступных данных характеристик для параметра Тип эксперимента установлено значение Бинарная классификация.

Вы также можете увидеть, какие характеристики выбираются и исключаются автоматически. Столбец Churned является целевым показателем, поэтому он не будет использоваться в качестве характеристики.

Информация, отображаемая на панели настройки

Панель настройки эксперимента с выбранным целевым показателем, типом эксперимента и выбором характеристик по умолчанию

Выбор характеристик и оптимизация моделей

По умолчанию в эксперименте настроено использование интеллектуальной оптимизации моделей. Чтобы подтвердить это, разверните раздел Оптимизация моделей на панели настройки эксперимента. Должен быть выбран вариант Интеллектуальная.

Подтверждение интеллектуальной оптимизации моделей на панели настройки

Панель настройки эксперимента с включенной интеллектуальной оптимизацией моделей

Выбор характеристик можно настроить вручную в разделе Характеристики панели настройки. При интеллектуальной оптимизации моделей выбор характеристик выполняется автоматически путем удаления неэффективных характеристик. При включении этого параметра мы можем включить все доступные характеристики в обучение.

Обучение эксперимента

Настройка завершена, и мы готовы начать обучение.

  • Нажмите Запустить эксперимент.

После завершения работы эксперимента можно переходить к следующему шагу — просмотру полученных метрик модели.

Помогла ли вам эта страница?

Если вы обнаружили какую-либо проблему на этой странице или с ее содержанием — будь то опечатка, пропущенный шаг или техническая ошибка, сообщите нам об этом!