Пример: обучение моделей с применением AutoML (автоматизированное машинное обучение)
В этом примере модели машинного обучения будут обучаться с использованием интеллектуальной оптимизации модели. При использовании интеллектуальной оптимизации модели AutoML автоматически выполняет процесс итерации и уточнения моделей.
Для получения дополнительной информации об интеллектуальной оптимизации моделей см. раздел Интеллектуальная оптимизация модели.
Что вы узнаете
В этом примере вы узнаете:
-
Как создать и настроить эксперимент машинного обучения
-
Как интеллектуальная оптимизация может обеспечить автоматическое уточнение модели
-
Как просматривать и анализировать результаты обучения
Другие замечания
Интеллектуальная оптимизация модели значительно упрощает уточнение моделей, если используется хорошо подготовленный набор данных. Чтобы обеспечить высокое качество модели в реальных сценариях применения, важно с самого начала следовать структурной схеме и подготовить набор данных для обучения с релевантными признаками и данными. Для получения дополнительной информации см.:
Интеллектуальную оптимизацию модели можно, на свое усмотрение, выключать для каждой версии экспериментов. Когда этот параметр отключен, оптимизация моделей выполняется вручную. Ручная оптимизация может быть полезна, если требуется внести конкретные исправления в конфигурацию эксперимента. Можно выполнить версию с использованием интеллектуальной оптимизации модели, а затем выключить ее, чтобы внести мелкие правки вручную, при этом использовать преимущества автоматического уточнения.
Этот пример описывает обучение эксперимента с использованием интеллектуальной оптимизации. Для получения полного руководства по использованию ручной оптимизации см. раздел Учебное пособие «Создание и визуализация данных прогнозирования». Это учебное пособие также содержит полные инструкции по развертыванию моделей, созданию прогнозов и визуализации данных прогнозов с помощью интерактивных приложений Qlik Sense.
Кому следует изучить этот пример
Этот пример следует изучить, чтобы научиться использовать интеллектуальную оптимизацию модели для уточнения моделей машинного обучения.
Прежде чем приступить к работе с этим примером, требуется следующее:
-
Право пользователя «Профессионал» или Full User
-
Роль безопасности Automl Experiment Contributor в клиенте
-
Необходимые роли в используемых пространствах для совместной работы. См.: Управление разрешениями в общих пространствах
Если пользователю не удается просматривать или создавать ресурсы машинного обучения, значит, у него отсутствуют необходимые роли, права или разрешения. Для получения информации необходимо обратиться к администратору клиента.
Для получения дополнительной информации см. раздел Кто может работать с Qlik AutoML.
Что требуется сделать перед началом работы
Загрузите этот пакет и распакуйте его на рабочем столе:
Пример AutoML: интеллектуальная оптимизация модели
Пакет содержит набор данных для обучения, который будет использоваться для обучения моделей. Набор данных содержит информацию о клиентах, у которых истек срок продления подписки, и они приняли решение отменить подписку или же продолжить пользоваться ею.
Выполните следующие действия.
-
Откройте центр активности Аналитика.
-
Перейдите на страницу «Создать», выберите Набор данных, а затем Загрузить файл данных.
-
Перетащите файл AutoML Example - Churn data - training.csv в диалоговое окно загрузки.
-
Выберите пространство. Это может быть ваше личное пространство или общее пространство, если вы хотите, чтобы у других пользователей был доступ к этим данным.
-
Нажмите Загрузить.
Теперь набор данных загружен и можно приступать к созданию эксперимента.
Часть 1. Создание эксперимента
Выполните следующие действия.
-
Перейдите на страницу «Создать» центра активности Аналитика и выберите Эксперимент машинного обучения.
-
Введите имя эксперимента, например: Пример интеллектуальной оптимизации.
-
При необходимости добавьте описание и теги.
-
Выберите пространство для эксперимента. Это может быть личное или общее пространство.
-
Щелкните Создать.
-
Выберите файл AutoML Example - Churn data - training.csv.
Часть 2. Настройка конфигурации эксперимента
На следующем этапе можно настроить конфигурацию эксперимента.
При интеллектуальной оптимизации модели требуется меньше действий по первоначальной настройке, чем при ручной оптимизации. В этом случае мы выберем цель и будем использовать все признаки, включенные по умолчанию.
Выбор цели
Для того чтобы модель машинного обучения спрогнозировала отток клиентов, в качестве цели необходимо выбрать Churned, это последний столбец в наборе данных.
В эксперименте должна отображаться только вкладка Данные. Цель можно выбрать несколькими способами, но здесь используется Вид схемы, который открывается по умолчанию.
Выполните следующие действия.
-
В схеме наведите курсор на Churned и щелкните появившийся значок цели .
Подтверждение выбора признака
После выбора цели по умолчанию включаются все доступные и рекомендованные признаки. В Виде схемы подтвердите, что выбраны два признака. Рядом с каждым включенным признаком должен быть установлен флажок. Признак Country недоступен для использования. AccountID не рекомендуется использовать по причине высокой кардинальности, поэтому мы не станем его выбирать.
Подтверждение интеллектуальной оптимизации
Справа на странице должна быть открыта панель для настройки дополнительных параметров. Необходимо проверить, что включена интеллектуальная оптимизация модели.
Выполните следующие действия.
-
Если панель конфигурация эксперимента не открыта, щелкните или Посмотреть конфигурацию, чтобы открыть ее.
-
На панели разверните пункт Оптимизация модели.
-
Должен быть выбран тип оптимизации Интеллектуальная.
Выполнение обучения
Нажмите кнопку Запустить эксперимент в нижнем правом углу страницы, чтобы начать обучение модели.
Часть 3. Просмотр результатов
После завершения обучения появляется и открывается вкладка Модели. Здесь можно просмотреть, какие оптимизации были выполнены во время обучения. Лучшая модель, помеченная значком , выбирается автоматически. Проанализируем эту модель.
Взгляните на Краткое описание обучения модели. Здесь отображаются результаты интеллектуальной оптимизации для этой модели. В этом случае видно, что следующие признаки были отброшены, так же указаны причины этого:
-
DaysSinceLastService отброшен из-за подозрения на утечку цели. В этом случае столбец содержал данные с неправильной логикой. Выполнялся активный подсчет дней с момента последнего билета обращения в службу поддержки для клиентов, которые отказались от услуг (в некоторых случаях еще несколько лет назад). Этот признак потребовалось удалить, так как он бы приводил к неправильной оценке производительности модели и к низкой производительности модели в случае развертывания. См. раздел Утечка данных
-
PriorPeriodUsage и PriorPeriodUsage-Rounded отброшены, так как имели слишком высокую корреляцию с другим признаком. Признак, с которым они коррелировались, по-прежнему включен в обучение. См. Корреляция.
-
CurrentPeriodUsage, CustomerTenure, StartMonth, Territory, DeviceType и StartWeek все были отброшены вследствие низкой важности перестановки. Признаки, которые оказывают низкое воздействие на модель, рассматриваются как статистический шум и могут удаляться для повышения производительности. См. Общие сведения о важности перестановки.
Сейчас эти признаки удалены, и на визуализациях отображаются признаки, оказывающие самое большое воздействие, а также некоторые индикаторы прогностической производительности модели. Содержимое этих диаграмм помогает оценить, отсутствует ли что-то в наборе признаков и искажены ли результаты.
Для получения дополнительной информации об анализе моделей с помощью этих визуализаций см. раздел Выполнение быстрого анализа модели.
Более глубокий анализ
Если требуется глубже исследовать метрики модели, переходите между вкладками эксперимента Сравнение и Анализ. Эти вкладки дают более подробное представление метрик в интерактивном режиме.
Для получения дополнительной информации см. разделы Сравнение моделей и Выполнение подробного анализа модели.
Следующие шаги
Используя набор данных высокого качества, интеллектуальная оптимизация создает готовые к развертыванию модели, которые требуют незначительных итераций или совсем их не требуют. На этом этапе рекомендуется выполнить развертывание модели с самой высокой производительностью. В противном случае можно продолжить уточнение моделей вручную или обновить данные обучения и повторно выполнить интеллектуальную оптимизацию модели.
Для получения дополнительный информации о следующих действиях см. разделы:
Спасибо!
Работа с данным примером завершена. Мы надеемся, что вы научились использовать интеллектуальную оптимизацию модели для простого обучения готовых к развертыванию моделей машинного обучения.
Дополнительные материалы и ресурсы
- Qlik предлагает широкий спектр материалов и ресурсов для дополнительного изучения.
- Доступна Qlikинтерактивная справка.
- Обучающие материалы, в том числе бесплатные онлайн-курсы, доступны в разделе Qlik Continuous Classroom.
- Форумы для обсуждений, блоги и многое другое можно найти в разделе Qlik Community.
Ваше мнение важно
Мы высоко ценим любые ваши отзывы. Используйте раздел ниже, чтобы сообщить нам свое мнение о нашей работе.