Перейти к основному содержимому Перейти к дополнительному содержимому

Создание и настройка эксперимента

Первым шагом является создание и настройка эксперимента. Будет использоваться набор данных для обучения, загруженный ранее, чтобы обучить модель, пока она не будет готова к развертыванию и прогнозированию.

Создание нового эксперимента

  1. Перейдите на страницу «Создать» центра активности Аналитика и выберите Эксперимент машинного обучения.

  2. Введите имя эксперимента, например: «Обучение для прогнозирования оттока клиентов».

  3. При необходимости добавьте описание и теги.

  4. Выберите пространство для эксперимента. Это может быть личное или общее пространство.

  5. Щелкните Создать.

  6. Выберите файл набора данных для обучения. Это может быть один из следующих файлов в зависимости от того, какой используется формат ― CSV или QVD:

    • ML - Churn data - training.qvd

    • ML - Churn data - apply.qvd

Анализ данных

Теперь все готово, чтобы приступить к настройке эксперимента, но прежде чем начать, давайте взглянем на набор данных.

Сначала необходимо открыть вкладку Данные. Видом по умолчанию является Строки таблицы Вид схемы. Здесь мы видим таблицу, в которой каждая строка представляет столбец в наборе данных. Статистические и аналитические данные были получены в ходе автоматической подготовки данных. Может потребоваться прокрутить схему до конца вправо, чтобы увидеть раздел Наблюдения.

В таблице видно, что столбец AccountID был исключен из-за высокой кардинальности. Это означает, что столбец содержит слишком много уникальных значений. Признак Country был исключен по прямо противоположной причине: его значение одинаково во всех строках.Эти два признака не представляют никакой прогнозной ценности для моделей машинного обучения.

Мы также видим, что категориальный признак Territory задан методом кодирования влияния. Наведите курсор на значки предупреждения Предупреждающий треугольник и информации Предупреждающий треугольник, чтобы получить дополнительную информацию.

Схема обучающих данных в Qlik Predict

Вид схемы в эксперименте машинного обучения с предполагаемыми признаками.

Щелкните Вид данных Вид данных. В этом виде можно найти дополнительную информацию о каждом столбце, включая образцы данных.

Вид данных

Вид данных в конфигурации эксперимента.

Выбор цели

Для того чтобы модель машинного обучения спрогнозировала отток клиентов, в качестве цели необходимо выбрать Churned, это последний столбец в наборе данных.

  1. Вернитесь в Строки таблицы Вид схемы.

  2. Наведите курсор на Churned и щелкните появившийся значок цели Цель.

Строка на виде схемы выбрана в качестве цели

Строка таблицы для выбранной цели.

На панели конфигурации эксперимента видно, что сейчас выбрано Churned. Также видно, какие признаки выбраны и исключены автоматически. Churned является целью, поэтому не будет использоваться в качестве признака. Также видно, что этот эксперимент будет обрабатываться как задача двоичной классификации.

Информация, отображаемая на панели Конфигурация эксперимента

Панель конфигурации эксперимента с выбранной целью и выборкой признаков по умолчанию

Выбор признака и оптимизация модели

По умолчанию в эксперименте используется интеллектуальная оптимизация моделей. Чтобы убедиться в этом, разверните раздел Оптимизация модели на панели конфигурации эксперимента. Должен быть выбран тип оптимизации Интеллектуальная.

Подтверждение интеллектуальной оптимизации модели в панели Конфигурации эксперимента.

Панель «Конфигурация эксперимента» с включенной интеллектуальной оптимизацией модели

Признаки можно выбрать вручную в разделе Признаки на панели конфигурации. При интеллектуальной оптимизации модели выбор признаков осуществляется автоматически путем удаления незначащих признаков. Эта настройка позволяет включить в обучение все доступные признаки.

Обучение эксперимента

Настройка завершена, и теперь можно приступать к обучению.

  • Нажмите Запустить эксперимент в правом нижнем углу окна эксперимента.

Когда обучение эксперимента будет завершено, можно перейти к следующему шагу, который предполагает анализ полученных метрик модели.

Помогла ли вам эта страница?

Если вы обнаружили какую-либо проблему на этой странице или с ее содержанием — будь то опечатка, пропущенный шаг или техническая ошибка, сообщите нам об этом!