Пример: обучение моделей с применением AutoML (автоматизированное машинное обучение)
В этом примере модели машинного обучения будут обучаться с использованием интеллектуальной оптимизации модели. При использовании интеллектуальной оптимизации модели AutoML автоматически выполняет процесс итерации и уточнения моделей.
Для получения дополнительной информации об интеллектуальной оптимизации моделей см. раздел Интеллектуальная оптимизация модели.
Что вы узнаете
В этом примере вы узнаете:
-
Как создать и настроить эксперимент машинного обучения
-
Как интеллектуальная оптимизация может обеспечить автоматическое уточнение модели
-
Как просматривать и анализировать результаты обучения
Другие замечания
Интеллектуальная оптимизация модели значительно упрощает уточнение моделей, если используется хорошо подготовленный набор данных. Чтобы обеспечить высокое качество модели в реальных сценариях применения, важно с самого начала следовать структурной схеме и подготовить набор данных для обучения с релевантными признаками и данными. Для получения дополнительной информации см.:
Интеллектуальную оптимизацию модели можно, на свое усмотрение, выключать для каждой версии экспериментов. Когда этот параметр отключен, оптимизация моделей выполняется вручную. Ручная оптимизация может быть полезна, если требуется внести конкретные исправления в конфигурацию эксперимента. Можно выполнить версию с использованием интеллектуальной оптимизации модели, а затем выключить ее, чтобы внести мелкие правки вручную, при этом использовать преимущества автоматического уточнения.
Этот пример описывает обучение эксперимента с использованием интеллектуальной оптимизации. Для получения полного руководства по использованию ручной оптимизации см. раздел Учебное пособие «Создание и визуализация данных прогнозирования». Это учебное пособие также содержит полные инструкции по развертыванию моделей, созданию прогнозов и визуализации данных прогнозов с помощью интерактивных приложений Qlik Sense.
Кому следует изучить этот пример
Этот пример следует изучить, чтобы научиться использовать интеллектуальную оптимизацию модели для уточнения моделей машинного обучения.
Прежде чем приступить к работе с этим примером, требуется следующее:
-
Право пользователя «Профессионал» или Full User
-
Роль безопасности Automl Experiment Contributor в клиенте
-
Необходимые роли в используемых пространствах для совместной работы. См.: Управление разрешениями в общих пространствах
Если пользователю не удается просматривать или создавать ресурсы машинного обучения, значит, у него отсутствуют необходимые роли, права или разрешения. Для получения информации необходимо обратиться к администратору клиента.
Для получения дополнительной информации см. раздел Кто может работать с Qlik AutoML.
Что требуется сделать перед началом работы
Загрузите этот пакет и распакуйте его на рабочем столе:
Пример AutoML: интеллектуальная оптимизация модели
Пакет содержит набор данных для обучения, который будет использоваться для обучения моделей. Набор данных содержит информацию о клиентах, у которых истек срок продления подписки, и они приняли решение отменить подписку или же продолжить пользоваться ею.
Выполните следующие действия.
-
Откройте центр активности Аналитика.
-
Перейдите на страницу «Создать», выберите Набор данных, а затем Загрузить файл данных.
-
Перетащите файл AutoML Example - Churn data - training.csv в диалоговое окно загрузки.
-
Выберите пространство. Это может быть ваше личное пространство или общее пространство, если вы хотите, чтобы у других пользователей был доступ к этим данным.
-
Нажмите Загрузить.
Теперь набор данных загружен и можно приступать к созданию эксперимента.
Часть 1. Создание эксперимента
Выполните следующие действия.
-
Перейдите на страницу «Создать» центра активности Аналитика и выберите Эксперимент машинного обучения.
-
Введите имя эксперимента, например: Пример интеллектуальной оптимизации.
-
При необходимости добавьте описание и теги.
-
Выберите пространство для эксперимента. Это может быть личное или общее пространство.
-
Щелкните Создать.
-
Выберите файл AutoML Example - Churn data - training.csv.
Часть 2. Настройка конфигурации эксперимента
На следующем этапе можно настроить конфигурацию эксперимента.
При интеллектуальной оптимизации модели требуется меньше действий по первоначальной настройке, чем при ручной оптимизации. В этом случае мы выберем цель и будем использовать все признаки, включенные по умолчанию.
Выбор цели
Для того чтобы модель машинного обучения спрогнозировала отток клиентов, в качестве цели необходимо выбрать Churned, это последний столбец в наборе данных.
В эксперименте должна отображаться только вкладка Данные. Цель можно выбрать несколькими способами, но здесь используется Вид схемы, который открывается по умолчанию.
Выполните следующие действия.
-
В схеме наведите курсор на Churned и щелкните появившийся значок цели
.
Выбор цели в Виде схемы

Подтверждение выбора признака
После выбора цели по умолчанию включаются все доступные и рекомендованные признаки. В Виде схемы подтвердите, что выбраны два признака. Рядом с каждым включенным признаком должен быть установлен флажок. Признак Country недоступен для использования. AccountID не рекомендуется использовать по причине высокой кардинальности, поэтому мы не станем его выбирать.
Схема с выборкой признаков по умолчанию

Подтверждение интеллектуальной оптимизации
Справа на странице должна быть открыта панель для настройки дополнительных параметров. Необходимо проверить, что включена интеллектуальная оптимизация модели.
Выполните следующие действия.
-
Если панель конфигурация эксперимента не открыта, щелкните
или Посмотреть конфигурацию, чтобы открыть ее.
-
На панели разверните пункт Оптимизация модели.
-
Должен быть выбран тип оптимизации Интеллектуальная.
Подтверждение версии эксперимента выполняется с использованием типа оптимизации Интеллектуальная

Выполнение обучения
Нажмите кнопку Запустить эксперимент в нижнем правом углу страницы, чтобы начать обучение модели.
Часть 3. Просмотр результатов
После завершения обучения появляется и открывается вкладка Модели. Здесь можно просмотреть, какие оптимизации были выполнены во время обучения. Лучшая модель, помеченная значком , выбирается автоматически. Проанализируем эту модель.
Взгляните на Краткое описание обучения модели. Здесь отображаются результаты интеллектуальной оптимизации для этой модели. В этом случае видно, что следующие признаки были отброшены, так же указаны причины этого:
-
DaysSinceLastService отброшен из-за подозрения на утечку цели. В этом случае столбец содержал данные с неправильной логикой. Выполнялся активный подсчет дней с момента последнего билета обращения в службу поддержки для клиентов, которые отказались от услуг (в некоторых случаях еще несколько лет назад). Этот признак потребовалось удалить, так как он бы приводил к неправильной оценке производительности модели и к низкой производительности модели в случае развертывания. См. раздел Утечка данных
-
PriorPeriodUsage и PriorPeriodUsage-Rounded отброшены, так как имели слишком высокую корреляцию с другим признаком. Признак, с которым они коррелировались, по-прежнему включен в обучение. См. Корреляция.
-
CurrentPeriodUsage, CustomerTenure, StartMonth, Territory, DeviceType и StartWeek все были отброшены вследствие низкой важности перестановки. Признаки, которые оказывают низкое воздействие на модель, рассматриваются как статистический шум и могут удаляться для повышения производительности. См. Общие сведения о важности перестановки.
Диаграмма Краткое описание обучения модели, которая демонстрирует признаки, отображенные в результате интеллектуальной оптимизации

Сейчас эти признаки удалены, и на визуализациях отображаются признаки, оказывающие самое большое воздействие, а также некоторые индикаторы прогностической производительности модели. Содержимое этих диаграмм помогает оценить, отсутствует ли что-то в наборе признаков и искажены ли результаты.
Для получения дополнительной информации об анализе моделей с помощью этих визуализаций см. раздел Выполнение быстрого анализа модели.
Более глубокий анализ
Если требуется глубже исследовать метрики модели, переходите между вкладками эксперимента Сравнение и Анализ. Эти вкладки дают более подробное представление метрик в интерактивном режиме.
Для получения дополнительной информации см. разделы Сравнение моделей и Выполнение подробного анализа модели.
Следующие шаги
Используя набор данных высокого качества, интеллектуальная оптимизация создает готовые к развертыванию модели, которые требуют незначительных итераций или совсем их не требуют. На этом этапе рекомендуется выполнить развертывание модели с самой высокой производительностью. В противном случае можно продолжить уточнение моделей вручную или обновить данные обучения и повторно выполнить интеллектуальную оптимизацию модели.
Для получения дополнительный информации о следующих действиях см. разделы:
Спасибо!
Работа с данным примером завершена. Мы надеемся, что вы научились использовать интеллектуальную оптимизацию модели для простого обучения готовых к развертыванию моделей машинного обучения.
Дополнительные материалы и ресурсы
- Программа Qlik предлагает широкий набор ресурсов для дополнительного изучения.
- Доступна Qlikинтерактивная справка.
- Обучение, в том числе бесплатные онлайн-курсы, доступно в разделе Qlik Learning.
- Дискуссионные форумы, блоги и многое другое находится в разделе Qlik Community.
Ваше мнение важно
Мы высоко ценим любые ваши отзывы. Используйте раздел ниже, чтобы сообщить нам свое мнение о нашей работе.