Знакомство с автоматизированным машинным обучением
Автоматизируйте машинное обучение для своей команды аналитиков с помощью Qlik AutoML. Благодаря простому интерфейсу без кода можно легко создавать эксперименты машинного обучения, позволяющие генерировать модели и создавать прогнозирования.
Что такое машинное обучение
Машинное обучение — это область искусственного интеллекта и науки о данных, которая основное внимание уделяет выявлению закономерностей в исторических данных для прогнозирования будущих результатов. Алгоритмы обучаются на основе данных, чтобы создавать прогнозные модели без специального программирования на выполнение этой задачи. Модель машинного обучения может помочь в решении таких задач, как:
-
Продлит ли клиент фитнес-клуба свой абонемент?
-
Какова ожидаемая пожизненная ценность данного клиента?
Для получения дополнительной информации об основных понятиях см. раздел Общее представление о машинном обучении. Здесь вы также узнаете об упорядоченной структуре для формулирования задач машинного обучения и подготовки наборов данных.
Что можно делать с помощью автоматизированного машинного обучения
Создавайте эксперименты с машинным обучением в Qlik Sense. В центре активности Аналитика можно работать над экспериментом вместе с другими пользователями и легко загружать данные из каталога для обучения модели.
Интегрируйте прогнозную аналитику в приложения Qlik Sense и делитесь своими результатами. Исследуйте данные при помощи визуализаций и интерактивных сценариев альтернатив, чтобы понять, как изменение различных параметров может повлиять на желаемый результат.
Кроме того, вы можете выполнять прогнозирование с использованием наборов данных, хранящихся в каталоге, или оперативно создавать прогнозы в реальном времени с помощью API-интерфейсов Qlik Sense.
Как работают эксперименты
В ходе эксперимента производится обучение алгоритмов машинного обучения на основе определенного набора данных с конкретной целью. При обучении создаются модели машинного обучения, которые можно использовать для прогнозирования.
Большая часть процесса автоматизирована благодаря автоматизированному машинному обучению. При создании эксперимента и загрузке набора данных выполняется автоматический анализ набора данных. Данные предварительно обрабатываются, чтобы они были готовы к машинному обучению. Статистика и другие сведения о каждом столбце отображаются, что облегчает выбор цели. При запуске обучения несколько алгоритмов начинают поиск закономерностей в данных. Для получения дополнительной информации о создании и обучении экспериментов см. раздел Работа с экспериментами.
Оценки и ранжирование позволяют оценить созданные модели машинного обучения по окончании обучения. Посредством изменения параметров и количества итераций обучения можно создать несколько версий. Выберите модель с наилучшими показателями для набора данных и разверните ее, чтобы запустить прогнозирование. Для получения дополнительной информации см. раздел Работа с развертываниями машинного обучения.
Как показано на рисунке ниже, эксперимент может иметь несколько версий, каждая из которых использует один или несколько алгоритмов. Модель с наиболее эффективным алгоритмом можно развернуть для прогнозирования. Это означает, что из одного эксперимента может получиться несколько развертываний машинного обучения.
Доступ пользователей к AutoML
Для получения полных сведений о том, как пользователи могут получить доступ к Qlik AutoML, см. раздел Кто может работать с Qlik AutoML.
Ограничения AutoML и возможности в соответствии с условиями лицензии
AutoML — это дополнительная платная опция. Некоторые ограниченные функциональные возможности включены в применимые подписки. Наличие конкретных функций и метрик зависит от уровня вашей подписки.
Ограничения
-
Производительность API-интерфейса Qlik AutoML ограничена 300 запросами в минуту.
-
Максимальное количество столбцов в наборе данных: 500
Это касается наборов данных, используемых для обучения экспериментов и создания прогнозирований. При этом ограничивается количество столбцов, используемых в качестве признаков в версии эксперимента. В наборе данных может быть и больше столбцов. Ограничения рассчитываются при включении столбцов в набор данных.
Возможности в соответствии с условиями лицензии
Лицензия пользователя определяет объемы по различным метрикам, регулирующие возможности использования Qlik AutoML. Метрики использования измеряются как комбинация использования услуг AutoML через пользовательский интерфейс AutoML , анализ ключевых факторов в приложении Qlik Sense и через общедоступные API-интерфейсы.
Доступно несколько уровней AutoML в зависимости от бизнес-потребностей. Уровни бывают двух типов.
-
Включенный уровень: это базовая функция AutoML и ограниченными возможностями. Она включена в подписку на Qlik Sense Enterprise SaaS, Аналитика Qlik Cloud Standard, Аналитика Qlik Cloud Premium, Qlik Cloud Enterprise или Qlik Talend Cloud(Standard, Premium или Enterprise). Включенный уровень подходит для ознакомления и для оценки пользы, которую Qlik AutoML может принести с точки зрения удовлетворения бизнес-потребностей. Он не подходит для рабочих сценариев применения. Для получения более полных возможностей рекомендуется приобрести платный уровень Qlik AutoML.
-
Платные уровни: для рабочих сценариев применения предусмотрено несколько пакетов, обеспечивающих полный набор возможностей AutoML. Они предоставляется в виде платных дополнений к подписке Qlik Cloud.
Следующие функции доступны только в платных уровнях Qlik AutoML:
-
Оптимизация гиперпараметров
-
Графики прогнозирования
-
Прогнозы в реальном времени
-
Коннектор Qlik AutoML
Для получения дополнительной информации о том, что включено в каждый тип уровня AutoML, см. таблицу ниже.
Измерительное | Описание | Доступно во включенном уровне | Доступно в платных уровнях |
---|---|---|---|
Развернутые модели | Уровень, включенный в подписку Qlik Cloud, определяет максимальное количество моделей, которое можно развернуть во всех клиентах, созданных в рамках лицензии. Этот предел потребления определяется по модели, то есть несколько развертываний машинного обучения на основе одной модели считаются одной развернутой моделью. | Да | Да |
Одновременное обучение | Это количество моделей, которые клиент может обучать параллельно. При использовании включенного уровня Qlik AutoML каждая модель должна запускаться после завершения обучения предыдущей. Платные уровни включают возможность одновременного обучения нескольких моделей в клиенте. | Нет | Да |
Увеличенный размер набора данных | Платные уровни предоставляют увеличенный размер базы данных для обучения моделей. | Нет | Да |
Пакетное прогнозирование в ручном режиме | Прогнозируйте все строки в наборе данных вручную. | Да | Да |
Пакетное прогнозирование по графику | Настраивайте графики, чтобы запускать прогнозирование автоматически, а не вручную. Графики прогнозирования доступны только в платных уровнях Qlik AutoML. Для получения дополнительной информации см. раздел Создание графика прогнозирования. | Нет | Да |
Прогнозы в реальном времени | Используйте этот API-интерфейс, чтобы с помощью развертываний машинного обучения выполнять прогнозирование в реальном времени. Для получения дополнительной информации см. раздел Создание прогнозов в реальном времени. | Нет | Да |
Коннектор Qlik AutoML в Аналитика Qlik Cloud | Этот аналитический коннектор позволяет загружать данные из интегрированной платформы Qlik AutoML в Qlik Cloud. Для получения дополнительной информации см. раздел Источник аналитики Qlik AutoML. | Нет | Да |
Оптимизация гиперпараметров | Оптимизация гиперпараметров позволяет точно настроить модели AutoML, чтобы улучшить контроль за процессом обучения. Для получения дополнительной информации см. раздел Оптимизация гиперпараметров. | Нет | Да |
Мониторинг развернутой модели | Используйте встроенные инструменты мониторинга для оценки моделей, развернутых в рамках развертывания машинного обучения. Можно отслеживать дрейф признака с течением времени, а также подробные сведения об использовании модели для прогнозирования. Для получения дополнительной информации см. раздел Мониторинг производительности и использования развернутых моделей. | Нет | Да |
Для получения подробной информации о метриках лицензии см. описание продукта Подписки Qlik Cloud®. Администраторы могут просматривать информацию о лицензии и отслеживать количество развернутых моделей в центре активности Администрирование. Для получения дополнительной информации см. раздел Мониторинг потребления ресурсов.