Учебное пособие «Создание и визуализация данных прогнозирования»
В этом руководстве описывается, как использовать Qlik Predict для обучения и развертывания модели машинного обучения и как делать прогнозы с применением этой модели. Здесь также даются инструкции по визуализации данных прогнозирования в приложении Qlik Sense.
Мы рассмотрим сценарий оттока клиентов в качестве классического примера задачи двоичной классификации.Цель заключается в том, чтобы с высокой точностью спрогнозировать, отменит ли клиент свою подписку или же продолжит пользоваться ею. Этот тип задачи допускает только два результата: истина или ложь (клиент уйдет или клиент останется).
Для решения этой задачи машинного обучения мы начнем с обработки набора данных, для которого нам уже известен результат, а затем применим статистическую модель, созданную из этого набора данных, к новым данным, для которых необходимо спрогнозировать результат.
Данное учебное пособие начинается с создания эксперимента. Здесь вы будете обучать модели и выполнять развертывание одной из них в рамках развертывания машинного обучения. Это развертывание машинного обучения будет использоваться для создания прогнозов, которые можно визуализировать в приложении Qlik Sense.
Что вы узнаете
После завершения изучения данного учебного пособия вы будете знать, какие шаги необходимо выполнить, чтобы создать и настроить эксперимент. Вы также научитесь интерпретировать оценки модели. И наконец, вы сможете выполнить развертывание модели обучения и узнаете, как создавать убедительные визуализации Qlik Sense с помощью данных прогнозирования в Аналитика Qlik Cloud.
По умолчанию Qlik Predict обучает модели, применяя технологию интеллектуальной оптимизации моделей. При интеллектуальной оптимизации автоматическая доработка выполняется во время обучения. Это увеличивает вероятность того, что модели будут готовы к развертыванию после выполнения одной версии с минимальной потребностью в дальнейших итераций.
Кому следует ознакомиться с этим учебным пособием
Данное учебное пособие предназначено для пользователей, которые хотят познакомиться с автоматизированным машинным обучением и визуализацией данных в Аналитика Qlik Cloud. Некоторые базовые знания о машинном обучении Qlik Sense приветствуются, но не являются обязательными.
Для завершения этого руководства вам потребуются соответствующие разрешения в Qlik Cloud клиенте и в пространствах, где вы будете работать. Некоторые из них назначаются администраторами. Если вы столкнетесь с ошибками разрешений во время прохождения руководства, обратитесь к администратору вашего клиента. Вам нужны разрешения для следующего:
Создание экспериментов машинного обучения и работа с ними
Создание, использование и организация экспериментов машинного обучения
Создание развертываний машинного обучения и работа с ними
Развертывание моделей и создание развертываний машинного обучения
Активация развернутых моделей
Работа с аналитическими приложениями
Что требуется сделать перед началом работы
Во-первых, необходимо загрузить материалы учебного пособия, ссылки на которые приводятся ниже. Выберите рабочий процесс CSV и QVD. Загружать предварительно настроенное приложение необязательно.
Загрузив необходимые материалы, распакуйте их на рабочий стол.
MLTutorialDataCSV: содержит данные учебного пособия в формате CSV. Этот вариант позволяет быстро приступить к работе.
MLTutorialDataQVF содержит данные учебного пособия в формате скриптов .qvf, которые можно запускать для создания QVD. Этот вариант требует больше времени, чем CSV, но он полезен при обучении работе с форматами данных и скриптами Qlik.
MLTutorialPreConfiguredApp: этот элемент не является обязательным. Это образец приложения Qlik Sense, которое будет создано в ходе работы с учебным пособием. Это позволит пропустить этапы обучения и разработки, чтобы быстро получить практический опыт разработки прогностического приложения.
Для получения дополнительной информации см. раздел Альтернативный рабочий процесс: загрузка предварительно настроенного приложения.
Набор данных для обучения содержит информацию о клиентах, у которых истек срок продления подписки, и они приняли решение отменить подписку или же продолжить пользоваться ею.
Набор данных для применения содержит информацию о новых клиентах, у которых дата продления подписки еще не наступила. Пока не известно, отменят ли эти клиенты свою подписку. Цель данного учебного пособия заключается в том, чтобы спрогнозировать поведение этих клиентов, чтобы снизить вероятность их оттока.
Вариант 1. Учебные наборы данных Qlik Predict (CSV)
Выполните следующие действия.
Откройте центр активностиАналитика.
Перейдите на страницу «Создать», выберите Набор данных, а затем Загрузить файл данных.
Перетащите файл ML - Churn data - training.csv в диалоговое окно загрузки.
Затем перетащите файл ML - Churn data - apply.csv в диалоговое окно загрузки.
Выберите пространство. Это может быть ваше личное пространство или общее пространство, если вы хотите, чтобы у других пользователей был доступ к этим данным.
Щелкните Загрузить.
Теперь наборы данных загружены и можно приступать к созданию эксперимента.
Вариант 2. Учебные наборы данных Qlik Predict(QVD)
Выполните следующие действия.
Откройте центр активности Аналитика.
Перейдите на страницу «Создать», выберите Загрузить, а затем Набор данных.
Перетащите эти файлы в диалоговое окно загрузки.
ML - Churn data - training.qvf
ML - Churn data - apply.qvf
Выберите пространство. Это может быть личное пространство или общее пространство, если необходимо, чтобы у других пользователей был доступ к этим данным.
Щелкните Загрузить.
Для каждого загруженного скрипта выполните следующие действия.
Откройте скрипт и перейдите на вкладку Редактор.
В разделе Редактор щелкните Экспортировать данные.
Набор данных QVD создается в том же пространстве, куда загружен скрипт.
Теперь наборы данных созданы, и можно приступать к созданию эксперимента.
Уроки, содержащиеся в данном учебном пособии
Темы, представленные в данном учебном пособии, рассчитаны на последовательное изучение. Однако вы можете в любое время прерваться и снова вернуться к ним.
Дополнительные материалы и ресурсы
- Qlik предлагает широкий спектр материалов и ресурсов для дополнительного изучения.
- Доступна Qlikинтерактивная справка.
- Обучение, в том числе бесплатные онлайн-курсы, доступно в разделе Qlik Learning.
- Дискуссионные форумы, блоги и многое другое находится в разделе Qlik Community.
Ваше мнение важно
Мы высоко ценим любые ваши отзывы. Используйте раздел ниже, чтобы сообщить нам свое мнение о нашей работе.