Учебное пособие «Создание и визуализация данных прогнозирования»
В этом учебном пособии рассматривается порядок использования Qlik AutoML для обучения и развертывания модели машинного обучения для прогнозирования. Здесь также даются инструкции по визуализации данных прогнозирования в приложении Qlik Sense.
Мы рассмотрим сценарий оттока клиентов в качестве классического примера задачи двоичной классификации.Цель заключается в том, чтобы с высокой точностью спрогнозировать, отменит ли клиент свою подписку или же продолжит пользоваться ею. Этот тип задачи допускает только два результата: истина или ложь (клиент уйдет или клиент останется).
Для решения этой задачи машинного обучения мы начнем с обработки набора данных, для которого нам уже известен результат, а затем применим статистическую модель, созданную на основе этого набора данных, к новым данным, для которых необходимо спрогнозировать результат.
Данное учебное пособие начинается с создания эксперимента. Здесь вы будете обучать модели и выполнять развертывание одной из них в рамках развертывания машинного обучения. Это развертывание машинного обучения будет использоваться для создания прогнозов, которые можно визуализировать в приложении Qlik Sense.
Что вы узнаете
После завершения изучения данного учебного пособия вы будете знать, какие шаги необходимо выполнить, чтобы создать и настроить эксперимент. Вы также научитесь интерпретировать оценки модели. И наконец, вы сможете выполнить развертывание модели обучения и узнаете, как создавать убедительные визуализации Qlik Sense с помощью данных прогнозирования в Аналитика Qlik Cloud.
В этом учебном пособии описывается, как вручную выполнять итерацию моделей путем выявления распространенных проблем в наборе данных и результатах обучения. По умолчанию Qlik AutoML обучает модели с использованием интеллектуальной оптимизации моделей. При интеллектуальной оптимизации автоматическая доработка выполняется во время обучения. Это увеличивает вероятность того, что модели будут готовы к развертыванию после выполнения одной версии с минимальной потребностью в дальнейших итераций. Для ознакомления с примером обучения моделей с использованием интеллектуальной оптимизации см. раздел Пример: обучение моделей с применением AutoML (автоматизированное машинное обучение).
Кому следует ознакомиться с этим учебным пособием
Данное учебное пособие предназначено для пользователей, которые хотят познакомиться с автоматизированным машинным обучением и визуализацией данных в Аналитика Qlik Cloud. Некоторые базовые знания о машинном обучении Qlik Sense приветствуются, но не являются обязательными.
Для работы с этим учебным пособием требуется следующее:
-
Право пользователя «Профессионал» или Full User
-
Роли безопасности Automl Experiment Contributor и Automl Deployment Contributor в клиенте Qlik Cloud
-
Разрешения для утверждения развернутых моделей. В частности, необходимо одно из перечисленного ниже:
-
Одобрите или отклоните ваши модели AutoML (разрешение для пользователя)
-
Одобрите или отклоните модели AutoML (разрешение для администратора)
-
-
Необходимые роли в пространствах, где потребуется работать. См.: Управление разрешениями в общих пространствах и Управление разрешениями в управляемых пространствах
Если пользователю не удается просматривать или создавать ресурсы машинного обучения, значит, у него отсутствуют необходимые роли, права или разрешения. Для получения информации необходимо обратиться к администратору клиента.
Для получения дополнительной информации см. раздел Кто может работать с Qlik AutoML.
Что требуется сделать перед началом работы
Во-первых, необходимо загрузить материалы учебного пособия, ссылки на которые приводятся ниже. Выберите рабочий процесс CSV и QVD. Загружать предварительно настроенное приложение необязательно.
Загрузив необходимые материалы, распакуйте их на рабочий стол.
-
AutoMLTutorialDatasetsCSV: Contains tutorial data in CSV format. This option is easier for getting started quickly.
-
AutoMLTutorialDatasetsQVF содержит данные учебного пособия в формате скриптов .qvf, которые можно запускать для создания QVD. Этот вариант требует больше времени, чем CSV, но он полезен при обучении работе с форматами данных и скриптами Qlik.
-
AutoMLTutorialPreConfiguredApp: этот элемент не является обязательным. Это образец приложения Qlik Sense, которое будет создано в ходе работы с учебным пособием. Это позволит пропустить этапы обучения и разработки, чтобы быстро получить практический опыт разработки прогностического приложения.
Для получения дополнительной информации см. раздел Альтернативный рабочий процесс: загрузка предварительно настроенного приложения.
Набор данных для обучения содержит информацию о клиентах, у которых истек срок продления подписки, и они приняли решение отменить подписку или же продолжить пользоваться ею.
Набор данных для применения содержит информацию о новых клиентах, у которых дата продления подписки еще не наступила. Пока не известно, отменят ли эти клиенты свою подписку. Цель данного учебного пособия заключается в том, чтобы спрогнозировать поведение этих клиентов, чтобы снизить вероятность их оттока.
Вариант 1: наборы данных для учебного пособия AutoML (CSV)
Выполните следующие действия.
Откройте центр активности Аналитика.
Перейдите на страницу «Создать», выберите Набор данных, а затем Загрузить файл данных.
Перетащите файл AutoML Tutorial - Churn data - training.csv в диалоговое окно загрузки.
Затем перетащите файл AutoML Tutorial - Churn data - apply.csv в диалоговое окно загрузки.
Выберите пространство. Это может быть ваше личное пространство или общее пространство, если вы хотите, чтобы у других пользователей был доступ к этим данным.
Щелкните команду Загрузить.
Теперь наборы данных загружены и можно приступать к созданию эксперимента.
Вариант 2: наборы данных для учебного пособия AutoML (CSV)
Выполните следующие действия.
Откройте центр активности Аналитика.
Перейдите на страницу «Создать», выберите Загрузить, а затем Набор данных.
Перетащите эти файлы в диалоговое окно загрузки.
AutoML Tutorial - Churn data - training.qvf
AutoML Tutorial - Churn data - apply.qvf
Выберите пространство. Это может быть ваше личное пространство или общее пространство, если вы хотите, чтобы у других пользователей был доступ к этим данным.
Нажмите Загрузить.
Для каждого загруженного скрипта выполните следующие действия.
Откройте скрипт и перейдите на вкладку Редактор.
В разделе Редактор щелкните Экспортировать данные.
Набор данных QVD создается в том же пространстве, куда загружен скрипт.
Теперь наборы данных созданы, и можно приступать к созданию эксперимента.
Уроки, содержащиеся в данном учебном пособии
Темы, представленные в данном учебном пособии, рассчитаны на последовательное изучение. Однако вы можете в любое время прерваться и снова вернуться к ним.
Дополнительные материалы и ресурсы
- Qlik предлагает широкий спектр материалов и ресурсов для дополнительного изучения.
- Доступна Qlikинтерактивная справка.
- Обучающие материалы, в том числе бесплатные онлайн-курсы, доступны в разделе Qlik Continuous Classroom.
- Форумы для обсуждений, блоги и многое другое можно найти в разделе Qlik Community.
Ваше мнение важно
Мы высоко ценим любые ваши отзывы. Используйте раздел ниже, чтобы сообщить нам свое мнение о нашей работе.