Перейти к основному содержимому Перейти к дополнительному содержимому

Визуализация данных прогнозирования в приложении Qlik Sense

Заключительный этап процесса — создание аналитического приложения Qlik Sense для визуализации созданных данных прогнозирования.

Альтернативный рабочий процесс: загрузка предварительно настроенного приложения

Вместо выполнения остальных шагов, перечисленных в этом разделе, можно загрузить приложение Customer churn predictions.qvf, скачанное перед началом работы с этим учебным пособием, в хаб.

Остальные пункты на этой странице содержат инструкции по созданию подобного приложения. Данные прогнозирования в приложении и ваши собственные данные прогнозирования будут несколько отличаться.

Загружаемое приложение содержит дополнительный лист с заголовком Individual Customer Analysis, в котором используются условные выражения для детального анализа одной учетной записи пользователя за один раз.

Приступая к работе

В хабе щелкните Добавить новое > Новое аналитическое приложение. Выберите пространство для приложения и назовите его Прогнозирование оттока клиентов.

Щелкните команду Создать.

Примечание к информацииСпособ взаимодействия с приложением зависит от того, используется ли устройство с сенсорным экраном и включена ли поддержка сенсорного ввода. Для получения дополнительной информации см. раздел Меню, включаемое на сенсорных устройствах длительным касанием.

Создание модели данных

Выбор данных

Требуется добавить необходимые данные в приложение. Они включают набор данных для применения (загруженный в начале работы с учебным пособием) и два набора данных, созданных на основе прогнозирования.

  1. В новом приложении щелкните, чтобы добавить данные из каталога данных.

  2. В окне Каталог данных установите флажки рядом со следующими тремя наборами данных:

    • Набор данных для примененияCustomer churn data - apply.csv

    • Набор данных для прогнозированияCustomer churn data - apply_Prediction.csv

    • Набор данных Coordinate SHAP: Customer churn data - apply_Prediction_Coordinate_SHAP.csv

  3. Щелкните Далее.

  4. Откроется панель сводки. Щелкните набор данных Customer churn data - apply.csv, чтобы развернуть список полей, доступных для загрузки.

  5. Щелкните значок Крестик рядом с любыми признаками, выбор которых был отменен при обучении модели. Щелкните рядом с DaysSinceLastService, а также рядом с любыми признаками, которые были исключены из-за слабого влияния на модель.

  6. Щелкните Загрузить в приложение.

Связывание данных

На данном этапе вы добавили данные в приложение, но подключенная модель данных будет построена только после связывания наборов данных друг с другом. В данном случае поле AccountID будет индексом, объединяющим наборы данных.

В приложении открывается Диспетчер данных. Отображаются три набора данных, но они не объединены, а представляют собой отдельные сущности.

  1. В приложении открывается Диспетчер данных. Отображаются три набора данных, но они не объединены, а представляют собой отдельные сущности.

  2. На правой панели Диспетчера данных найдите рекомендацию связи AccountID.

  3. Нажмите Применить. Теперь таблицы должны быть объединены.

  4. Щелкните команду Загрузить данные.

Проверка связей в Просмотр модели данных

Прежде чем создавать визуализации в приложении, следует проверить, что данные связаны надлежащим образом.

  1. В строке навигации в верхней части интерфейса щелкните раскрывающееся меню на вкладке Подготовить и выберите Просмотр модели данных.

  2. Убедитесь, что три набора данных связаны надлежащим образом. Поле AccountID должно выступать в роли ключа для всех трех наборов данных. Модель данных приложения должна выглядеть, как показано ниже.

    Экран просмотра модели данных, где открыта модель данных приложения с прогнозированием

    Проверка того, что модель данных вновь созданного приложения с прогнозированием настроена правильно.

Теперь вы готовы приступить к созданию аналитического содержимого. Нажмите Лист на вкладке Анализ на панели навигации.

Первый лист Информационная панель «Агрегированные прогнозы»

Первый лист посвящен анализу прогнозов в агрегированной форме.

  1. При этом должен быть активен режим редактирования листа. Нажмите Расширенные параметры.

  2. Правой кнопкой мыши щелкните существующую визуализацию на листе и удалите ее. Это признак рекомендаций по созданию диаграмм, который мы не будем использовать в данном учебном пособии.

  3. Присвойте листу заголовок, например Агрегированные прогнозы. Для этого щелкните в любом месте пустого листа, чтобы открыть панель Свойства листа в правой части интерфейса. В поле Заголовок введите имя листа.

Круговая диаграмма

Круговая диаграмма позволяет легко визуализировать пропорциональную разбивку данных. В данном случае будет разумным разбить данные по прогнозируемым результатам (yes или no).

  1. Перетащите круговую диаграмму на лист.

  2. Добавьте Churned_predicted как измерение.

  3. Добавьте Count(AccountID) как меру.

  4. При необходимости отключите параметр Метка измерения на вкладке ВидПредставление на панели свойств.

  5. Разверните измерение в области Данные на панели свойств и в поле Метка для измерения введите Прогноз на отток.

    Метка обновляется в легенде.

Фильтр

Эта информационная панель будет использоваться для широкого анализа всей модели данных. Однако при этом почти определенно будет играть важную роль возможность быстрой фильтрации данных по различным измерениям для анализа специфических когорт.

Создайте фильтр с несколькими списками. В каждом списке можно сделать выборки значений в рамках одного измерения.

  1. Перетащите фильтр на лист.

  2. Добавьте поля в фильтр. Это могут быть измерения, которые, как ожидается, будут иметь существенное значение для прогнозируемых результатов.

  3. Измените каждый список по необходимости, для этого щелкните поле в области Данные на панели свойств. Будет открыто окно Свойства списка.

    Например, может потребоваться изменить метку поля и задать параметру Свернуть поле списка значение Всегда, чтобы освободить пространство листа.

Измените размер фильтра, чтобы он отображался в виде панели на одной стороне листа.

Объекты КПЭ

Ключевые показатели эффективности (КПЭ) — это отличный способ отображения одного значения, особенно важного для анализа данных. Здесь мы создадим три диаграммы КПЭ.

  1. Создайте пустую диаграмму КПЭ. Добавьте следующую меру:

    =Count(Churned_predicted)

    Таким образом будет рассчитываться общее количество клиентов, для которых спрогнозирован отток.

  2. Присвойте мере метку Общее количество клиентов.

  3. Задайте для параметра Формат чисел значение Число и представьте значения в формате 1,000 (без десятичных дробей или процентов).

  4. Создайте еще одну пустую диаграмму КПЭ. Добавьте следующую меру:

    =Count({<Churned_predicted={"yes"}>}(Churned_predicted))

    Это выражение множества для расчета количества значений yes, отображаемых в поле Churned_predicted.

  5. Присвойте мере метку Прогноз на отток.

  6. Настройте в диаграмме такой же формат числа, как и в первой диаграмме КПЭ.

  7. Создайте третью пустую диаграмму КПЭ. Добавьте следующую меру:

    =Count({<Churned_predicted={"no"}>}(Churned_predicted))

    Здесь рассчитывается количество значений no, отображаемых в поле Churned_predicted.

  8. Присвойте мере метку Прогноз на сохранение.

Гистограмма

Можно визуализировать распределение значений вероятности прогноза с помощью гистограммы.

Перетащите гистограмму на лист и присвойте ей заголовок. Добавьте Churned_yes как измерение.

Линейчатые диаграммы со стопками полос

Для анализа прогнозирований по категориальному полю, такому как тип плана, можно создать линейчатую диаграмму с индивидуальными анализами множеств, расположенными стопкой один над другим.

  1. Перетащите линейчатую диаграмму на лист и назовите ее Прогнозы оттока по типу плана.

  2. Добавьте PlanType как измерение. Присвойте ему метку Тип плана.

  3. Добавьте следующую меру:

    =Count({<Churned_predicted={"no"}>}(Churned_predicted))

    Присвойте мере метку Прогноз на сохранение.

  4. Добавьте следующую меру:

    =Count({<Churned_predicted={"yes"}>}(Churned_predicted))

    Присвойте мере метку Прогноз на отток.

  5. Выберите ВидПредставление, затем измените макет с Сгруппированный на Стопкой.

  6. Уберите полосу прокрутки и задайте параметру Метки значений значение Вкл.

  7. Задайте параметрам Метки сегментов и Метки итоговых значений значение Авто.

Завершив настройку, можно создать подобную линейчатую диаграмму с теми же двумя мерами, но с другим категориальным измерением, таким как NumberOfPenalties.

График распределения для анализа отдельных значений цифровых полей

С помощью графика распределения можно представить данные для прогнозирования по мере с различными числовыми значениями. В этом разделе мы создадим диаграмму для отображения прогнозов оттока по базовому тарифу с различными группировками по оценке услуг клиентом.

  1. Перетащите график распределения на лист и назовите его Прогнозы оттока по базовому тарифу и оценке услуг.

  2. Добавьте AccountID в качестве измерения для точек.

  3. Добавьте следующую меру на ось x:

    =Avg(BaseFee)

  4. Добавьте следующее вычисляемое измерение на ось y:

    =Round(ServiceRating,2)

    Это создает группировки на оси y для приблизительных значений ServiceRating. Чем больше значение, тем выше клиент оценил качество услуги.

  5. Выберите ВидПредставление, затем уменьшите значение Размер пузырьков до 20 и включите параметр Разнести точки.

  6. В области Цвета и легенда задайте параметру Цвета значение Пользовательские.

  7. Выберите параметр, чтобы применять к данным цвет по следующему измерению:

    =Churned_predicted

    Таким образом назначается один цвет каждому из значений в поле Churned_predicted. В данном случае будут отображаться два цвета.

  8. Добавьте метки для измерения и меры, затем добавьте следующую метку для пользовательской настройки цвета: Прогноз на отток.

Подобные диаграммы можно создавать для анализа различных числовых полей, подставляя другие агрегирования полей вместо меры BaseFee.

Настройте визуализации на листе так, чтобы они выглядели примерно так, как показано ниже.

Лист «Анализ прогнозирований»

Информационная панель «Прогнозирования» с объектами диаграммы для анализа данных для прогнозирования.

Второй лист: Информационная панель агрегированных значений SHAP

Затем создайте лист, посвященный анализу агрегированных значений SHAP.

  1. Создайте новый лист и откройте режим расширенного редактирования.

  2. Присвойте листу заголовок (например, Агрегированные значения SHAP).

Ранжирование важности SHAP

Диаграмма этого типа похода на автоматически генерируемую диаграмму, которая могла встречаться при настройке версий эксперимента. Здесь мы создадим диаграмму для набора данных прогнозирования.

Цель диаграммы этого типа — отображать признаки, которые делают наибольший вклад в результат, отображаемый в столбце Churned. Необходимо знать, что поскольку будут использоваться абсолютные значения, результаты SHAP могут быть положительными (значение yes) или отрицательным (значение no). При желании также можно использовать выражение, которое не рассчитывает абсолютное значение.

  1. Перетащите линейчатую диаграмму на пустой лист.

  2. Назовите диаграмму Важность SHAP по признаку.

  3. Добавьте измерение automl_feature и присвойте ему метку Признак.

    Это позволит представить агрегированные данные по всем включенным признакам.

  4. Добавьте следующую вычисленную меру:

    =fabs(Avg(SHAP_value))

  5. В поле Метка введите Среднее абсолютное значение SHAP.

  6. На панели свойств в разделе ВидПредставление удалите полосу прокрутки, если она есть, и измените ориентацию диаграммы с Вертикальная на Горизонтальная.

  7. В области Сортировка перетащите меру, чтобы она оказалась над измерением, если это еще не сделано. Оставьте для сортировки каждого поля значение Авто.

    При этом диаграмма сортируется по значениям мер в нисходящем порядке.

Матричный контейнер

Можно создать матричный контейнер с целью фильтрации данных для значений конкретных полей в измерении. В данном случае мы можем разбить значения SHAP для каждого из четырех типов плана, предлагаемых клиентам.

Чтобы создать объект матричного контейнера, необходимо задать измерение и основную визуализацию. Мы преобразуем только что созданную диаграмму «Ранжирование важности SHAP» в основную визуализацию.

  1. Правой кнопкой щелкните диаграмму Среднее абсолютное значение SHAP на листе, затем выберите Связанный объект Добавить к основным элементам.
  2. Оставьте имя по умолчанию и нажмите кнопку Добавить.
  3. На панели ресурсов выберите Пользовательские объекты > Qlik Visualization Bundle, перетащите матричный контейнер на лист.

  4. Добавьте PlanType как измерение.

  5. Щелкните Добавить основную визуализацию внутри диаграммы, затем добавьте диаграмму Средние абсолютные значения SHAP.

  6. На панели свойств выберите ВидОбщие, затем включите параметр Показать заголовки и присвойте диаграмме заголовок Важность SHAP по типу плана.

  7. Измените размер матричного контейнера, чтобы он был достаточно широким для отображения названий признаков в диаграммах. Если отображаются не все метки, отрегулируйте масштаб в окне браузера.

В качестве альтернативы, для отображения этих данных можно создать индивидуальные диаграммы с выражениями множества для каждого значения измерения, которое требуется проанализировать. В данном случае можно создать отдельную диаграмму для каждого из четырех типов плана.

Многократное использование фильтра

Фильтр, созданный на первом листе, можно повторно использовать на этом листе. В расширенном режиме редактирования щелкните фильтр правой кнопкой и выберите «Копировать». Вставьте его на лист Агрегированные значения SHAP.

Карта дерева

Также можно визуализировать разбивку значений SHAP с использованием карты дерева. Перетащите карту дерева на лист и добавьте те же измерение и меру, которые использовались при ранжировании важности SHAP.

Настройте визуализации на листе так, чтобы они выглядели примерно так, как показано ниже.

Агрегированные значения SHAP в режиме анализа

Заполненный лист в режиме потребления с разными визуализациями на основе SHAP.

Использование приложения

После завершения процесса создания приложение готово к использованию для анализа данных.

Щелкните Изменить лист, чтобы перейти в режим анализа. В этом виде можно делать выборки (в фильтрах или в других местах листа), чтобы фильтровать данные для специфического анализа подмножеств данных. Например, может потребоваться анализировать конкретный тип плана или регион клиента и сравнить результаты с другими подмножествами данных.

Спасибо!

Вы закончили изучение данного учебного пособия. Мы надеемся, что вы узнали для себя что-то новое и поняли, что автоматизированное машинное обучение — это быстрый и простой способ создания прогнозных моделей. Qlik Sense — это мощный инструмент, который позволяет без труда визуализировать данные прогнозирования и делать ценные наблюдения на основе этих данных.

Помогла ли вам эта страница?

Если вы обнаружили какую-либо проблему на этой странице и с ее содержанием — будь то опечатка, пропущенный шаг или техническая ошибка, сообщите нам об этом, чтобы мы смогли ее исправить!