Перейти к основному содержимому Перейти к дополнительному содержимому

Учебное пособие «Создание и визуализация данных прогнозирования»

В этом учебном пособии рассматривается порядок использования Qlik AutoML для обучения и развертывания модели машинного обучения для прогнозирования. Здесь также даются инструкции по визуализации данных прогнозирования в приложении Qlik Sense.

Мы рассмотрим сценарий оттока клиентов в качестве классического примера задачи двоичной классификации.Цель заключается в том, чтобы с высокой точностью спрогнозировать, отменит ли клиент свою подписку или же продолжит пользоваться ею. Этот тип задачи допускает только два результата: истина или ложь (клиент уйдет или клиент останется).

Для решения этой задачи машинного обучения мы начнем с обработки набора данных, для которого нам уже известен результат, а затем применим статистическую модель, созданную на основе этого набора данных, к новым данным, для которых необходимо спрогнозировать результат.

Данное учебное пособие начинается с создания эксперимента. Здесь вы будете обучать модели и выполнять развертывание одной из них в рамках развертывания машинного обучения. Это развертывание машинного обучения будет использоваться для создания прогнозов, которые можно визуализировать в приложении Qlik Sense.

Что вы узнаете

После завершения изучения данного учебного пособия вы будете знать, какие шаги необходимо выполнить, чтобы создать и настроить эксперимент. Вы также научитесь интерпретировать оценки модели. И наконец, вы сможете выполнить развертывание модели обучения и узнаете, как создавать убедительные визуализации Qlik Sense с помощью данных прогнозирования в Аналитика Qlik Cloud.

В этом учебном пособии описывается, как вручную выполнять итерацию моделей путем выявления распространенных проблем в наборе данных и результатах обучения. По умолчанию Qlik AutoML обучает модели с использованием интеллектуальной оптимизации моделей. При интеллектуальной оптимизации автоматическая доработка выполняется во время обучения. Это увеличивает вероятность того, что модели будут готовы к развертыванию после выполнения одной версии с минимальной потребностью в дальнейших итераций. Для ознакомления с примером обучения моделей с использованием интеллектуальной оптимизации см. раздел Пример: обучение моделей с применением AutoML (автоматизированное машинное обучение).

Кому следует ознакомиться с этим учебным пособием

Данное учебное пособие предназначено для пользователей, которые хотят познакомиться с автоматизированным машинным обучением и визуализацией данных в Аналитика Qlik Cloud. Некоторые базовые знания о машинном обучении Qlik Sense приветствуются, но не являются обязательными.

Для работы с этим учебным пособием требуется следующее:

  • Право пользователя «Профессионал» или Full User

  • Роли безопасности Automl Experiment Contributor и Automl Deployment Contributor в клиенте Qlik Cloud

  • Разрешения для утверждения развернутых моделей. В частности, необходимо одно из перечисленного ниже:

    • Одобрите или отклоните ваши модели AutoML (разрешение для пользователя)

    • Одобрите или отклоните модели AutoML (разрешение для администратора)

  • Необходимые роли в пространствах, где потребуется работать. См.: Управление разрешениями в общих пространствах и Управление разрешениями в управляемых пространствах

Если пользователю не удается просматривать или создавать ресурсы машинного обучения, значит, у него отсутствуют необходимые роли, права или разрешения. Для получения информации необходимо обратиться к администратору клиента.

Для получения дополнительной информации см. раздел Кто может работать с Qlik AutoML.

Что требуется сделать перед началом работы

Во-первых, необходимо загрузить материалы учебного пособия, ссылки на которые приводятся ниже. Выберите рабочий процесс CSV и QVD. Загружать предварительно настроенное приложение необязательно.

Загрузив необходимые материалы, распакуйте их на рабочий стол.

  • AutoMLTutorialDatasetsCSV: Contains tutorial data in CSV format. This option is easier for getting started quickly.

  • AutoMLTutorialDatasetsQVF содержит данные учебного пособия в формате скриптов .qvf, которые можно запускать для создания QVD. Этот вариант требует больше времени, чем CSV, но он полезен при обучении работе с форматами данных и скриптами Qlik.

  • AutoMLTutorialPreConfiguredApp: этот элемент не является обязательным. Это образец приложения Qlik Sense, которое будет создано в ходе работы с учебным пособием. Это позволит пропустить этапы обучения и разработки, чтобы быстро получить практический опыт разработки прогностического приложения.

    Для получения дополнительной информации см. раздел Альтернативный рабочий процесс: загрузка предварительно настроенного приложения.

Набор данных для обучения содержит информацию о клиентах, у которых истек срок продления подписки, и они приняли решение отменить подписку или же продолжить пользоваться ею.

Набор данных для применения содержит информацию о новых клиентах, у которых дата продления подписки еще не наступила. Пока не известно, отменят ли эти клиенты свою подписку. Цель данного учебного пособия заключается в том, чтобы спрогнозировать поведение этих клиентов, чтобы снизить вероятность их оттока.

Вариант 1: наборы данных для учебного пособия AutoML (CSV)

  1. Откройте центр активности Аналитика.

  2. Перейдите на страницу «Создать», выберите Набор данных, а затем Загрузить файл данных.

  3. Перетащите файл AutoML Tutorial - Churn data - training.csv в диалоговое окно загрузки.

  4. Затем перетащите файл AutoML Tutorial - Churn data - apply.csv в диалоговое окно загрузки.

  5. Выберите пространство. Это может быть ваше личное пространство или общее пространство, если вы хотите, чтобы у других пользователей был доступ к этим данным.

  6. Щелкните команду Загрузить.

Теперь наборы данных загружены и можно приступать к созданию эксперимента.

Вариант 2: наборы данных для учебного пособия AutoML (CSV)

  1. Откройте центр активности Аналитика.

  2. Перейдите на страницу «Создать», выберите Загрузить, а затем Набор данных.

  3. Перетащите эти файлы в диалоговое окно загрузки.

    • AutoML Tutorial - Churn data - training.qvf

    • AutoML Tutorial - Churn data - apply.qvf

  4. Выберите пространство. Это может быть ваше личное пространство или общее пространство, если вы хотите, чтобы у других пользователей был доступ к этим данным.

  5. Нажмите Загрузить.

  6. Для каждого загруженного скрипта выполните следующие действия.

    1. Откройте скрипт и перейдите на вкладку Редактор.

    2. В разделе Редактор щелкните Экспортировать данные.

    Набор данных QVD создается в том же пространстве, куда загружен скрипт.

Теперь наборы данных созданы, и можно приступать к созданию эксперимента.

Уроки, содержащиеся в данном учебном пособии

Темы, представленные в данном учебном пособии, рассчитаны на последовательное изучение. Однако вы можете в любое время прерваться и снова вернуться к ним.

Дополнительные материалы и ресурсы

  • Qlik предлагает широкий спектр материалов и ресурсов для дополнительного изучения.
  • Доступна Qlikинтерактивная справка.
  • Обучающие материалы, в том числе бесплатные онлайн-курсы, доступны в разделе Qlik Continuous Classroom.
  • Форумы для обсуждений, блоги и многое другое можно найти в разделе Qlik Community.

Ваше мнение важно

Мы высоко ценим любые ваши отзывы. Используйте раздел ниже, чтобы сообщить нам свое мнение о нашей работе.

Помогла ли вам эта страница?

Если вы обнаружили какую-либо проблему на этой странице и с ее содержанием — будь то опечатка, пропущенный шаг или техническая ошибка, сообщите нам об этом, чтобы мы смогли ее исправить!