Визуализация данных прогнозирования в приложении Qlik Sense
Последним шагом в этом процессе является создание аналитического приложения Qlik Sense для визуализации сгенерированных данных прогнозирования.
Альтернативный рабочий процесс: загрузка предварительно настроенного приложения
Вместо того чтобы выполнять оставшиеся шаги в этом разделе, вы можете загрузить приложение Customer churn predictions.qvf, которое вы загрузили в начале этого учебного пособия, в центр активности Аналитика.
Оставшиеся разделы на этой странице помогут вам создать аналогичное приложение. Между данными прогнозирования в приложении и вашими собственными данными прогнозирования будут некоторые различия.
Загружаемое приложение содержит дополнительный лист под названием Individual Customer Analysis, на котором используются условные выражения для детального анализа одной учетной записи клиента за раз.
Приступая к работе
В центре активности Аналитика перейдите на страницу создания и нажмите Приложение. Выберите пространство для приложения и назовите его Customer churn predictions.
Нажмите Создать.
Создание модели данных
Выбор данных
Вам необходимо добавить нужные данные в приложение. Они состоят из набора данных применения (загруженного в начале учебного пособия) и двух наборов данных, сгенерированных на основе прогноза.
Выполните следующие действия.
-
В новом приложении нажмите, чтобы добавить данные из Каталог данных.
-
В каталоге данных установите флажки рядом со следующими тремя наборами данных:
-
Набор данных применения: ML - Churn data - apply.csv или ML - Churn data - apply.qvd
-
Набор данных прогнозирования: ML - Prediction output.parquet
-
Набор данных Coordinate SHAP: ML - Prediction output_Coordinate_SHAP.parquet
-
-
Нажмите Далее.
-
Появится панель сводки. Нажмите на набор данных ML - Churn data - apply, чтобы развернуть доступные поля для загрузки.
-
Нажмите значок
рядом с любыми характеристиками, которые были отменены во время обучения модели. Вам необходимо оставить AccountID в списке, так как это ключевое поле. Для справки вернитесь к созданной конфигурации прогнозирования и сравните схемы модели и набора данных применения (для получения общей информации см. Изменение конфигураций прогнозирования).
-
Нажмите Загрузить в приложение.
Связывание данных
На этом этапе вы добавили данные в приложение, но связанная модель данных не будет построена, пока вы не свяжете наборы данных вместе. В этом случае поле AccountID будет индексом, связывающим наборы данных.
В вашем приложении теперь открыт Диспетчер данных. Вы увидите три набора данных, но они показаны как отдельные сущности, которые не связаны.
Выполните следующие действия.
-
В вашем приложении теперь открыт Диспетчер данных. Вы увидите три набора данных, но они показаны как отдельные сущности, которые не связаны.
-
На правой панели Диспетчер данных найдите предложение по связыванию AccountID.
-
Нажмите Применить. Теперь таблицы должны быть связаны друг с другом.
-
Нажмите Загрузить данные.
Проверка связей в Просмотр модели данных
Перед созданием любых визуализаций в приложении следует убедиться, что данные связаны правильно.
Выполните следующие действия.
-
На панели навигации в верхней части интерфейса откройте меню навигации приложения и выберите Просмотр модели данных.
-
Убедитесь, что три набора данных связаны правильно. Поле AccountID должно выступать в качестве ключа для всех трех наборов данных. Модель данных приложения должна выглядеть как на следующем изображении.
Просмотр модели данных, показывающий модель данных приложения прогнозирования
Теперь вы готовы приступить к созданию аналитического контента. Нажмите Лист на вкладке Анализ на панели навигации.
Первый лист: информационная панель агрегированных прогнозов
Первый лист будет посвящен анализу прогнозов в агрегированном виде.
Выполните следующие действия.
-
Теперь вы должны находиться в режиме редактирования листа.
-
Щелкните правой кнопкой мыши любую существующую визуализацию на листе и удалите ее. Это функция предложения диаграмм, которую мы не будем использовать в этом учебном пособи.
-
Дайте листу название, например Aggregated Predictions. Для этого щелкните в любом месте пустого листа, чтобы открыть Свойства листа в правой части интерфейса. В разделе Заголовок введите имя листа.
Круговая диаграмма
Круговая диаграмма позволяет легко визуализировать пропорциональную разбивку данных. В этом случае имеет смысл разбить данные по прогнозируемым результатам (yes или no).
Выполните следующие действия.
-
Перетащите круговую диаграмму на лист.
-
Добавьте Churned_predicted в качестве измерения.
-
Добавьте следующую меру:
Count(AccountID) -
При желании отключите Метка измерения в разделе Вид > Представление на панели свойств.
-
Разверните измерение в разделе Данные на панели свойств и измените Метка для измерения на Predicted to Churn.
Метка обновится в легенде.
Фильтр
Эта информационная панель предназначена для широкого анализа всей модели данных. Однако почти наверняка будет важно иметь возможность быстро фильтровать данные по различным измерениям для анализа конкретных когорт.
Создайте Фильтр с несколькими списками. Каждый список позволяет выбирать значения в рамках одного измерения.
Выполните следующие действия.
-
Перетащите Фильтр на лист.
-
Добавьте поля в Фильтр. Это могут быть измерения, которые, как вы ожидаете, будут иметь значение для прогнозируемых результатов.
-
Измените каждый список по мере необходимости, щелкнув поле в разделе Данные на панели свойств. Откроется окно Свойства списка.
Например, вы можете изменить метку поля и установить для параметра Свернуть список значение Всегда, чтобы сэкономить место на листе.
Измените размер Фильтра так, чтобы он отображался как панель на одной стороне листа.
Объекты Ключевой показатель эффективности
Ключевые показатели эффективности — отличный способ отобразить одно значение для особо важного анализа ваших данных. Здесь мы создадим три диаграммы Ключевой показатель эффективности.
Выполните следующие действия.
-
Создайте пустую диаграмму Ключевой показатель эффективности. Добавьте следующую меру:
=Count(Churned_predicted)Это позволит рассчитать общее количество клиентов, для которых мы сгенерировали прогнозы оттока.
-
Назовите меру Total # of Customers.
-
Установите для параметра Форматирование чисел значение Число и представьте значения в формате 1,000 (без десятичных знаков или процентных значений).
-
Создайте еще одну пустую диаграмму Ключевой показатель эффективности. Добавьте следующую меру:
=Count({<Churned_predicted={"yes"}>}(Churned_predicted))Это выражение множества, вычисляющее количество раз, когда значение yes отображалось в поле Churned_predicted.
-
Назовите меру Predicted to Churn.
-
Настройте форматирование чисел диаграммы с теми же настройками, что и для первого Ключевого показателя эффективности.
-
Создайте третью пустую диаграмму Ключевой показатель эффективности. Добавьте следующую меру:
=Count({<Churned_predicted={"no"}>}(Churned_predicted))Это вычисляет количество раз, когда значение no отображалось в поле Churned_predicted.
-
Назовите меру Predicted to Stay.
Гистограмма
Вы можете визуализировать распределение значений вероятности прогноза с помощью гистограммы.
Перетащите гистограмму на лист и дайте ей название. Добавьте Churned_yes в качестве измерения.
Линейчатые диаграммы стопкой
Чтобы проанализировать прогнозы по категориальному полю, такому как тип плана, вы можете создать линейчатую диаграмму с отдельными анализами множеств, расположенными стопкой друг на друге.
Выполните следующие действия.
-
Перетащите линейчатую диаграмму на лист и назовите ее Churn Predictions by Plan Type.
-
Добавьте PlanType в качестве измерения. Назовите его Plan Type.
-
Добавьте следующую меру:
=Count({<Churned_predicted={"no"}>}(Churned_predicted))Назовите меру Predicted to Stay.
-
Добавьте следующую меру:
=Count({<Churned_predicted={"yes"}>}(Churned_predicted))Назовите меру Predicted to Churn.
-
В разделе Вид > Представление измените макет с Сгруппированные на Стопкой.
-
Удалите полосу прокрутки и установите для параметра Метки значений значение Вкл..
-
Настройте Метки сегментов и Метки итогов на Авто.
По завершении вы можете создать аналогичную линейчатую диаграмму с теми же двумя мерами, но с другим категориальным измерением, например NumberOfPenalties.
Диаграмма распределения для анализа отдельных числовых значений полей
Диаграмму распределения можно использовать для представления данных прогнозирования по мере с различными числовыми значениями. В этом разделе вы создадите диаграмму для отображения прогнозов оттока по базовой плате с отдельными группировками для рейтинга обслуживания клиента.
Выполните следующие действия.
-
Перетащите диаграмму распределения на лист и назовите ее Churn Predictions by Base Fee and Service Rating.
-
Добавьте AccountID в качестве измерения для точек.
-
Добавьте следующую меру на ось X:
=Avg(BaseFee) -
Добавьте следующее вычисляемое измерение на ось Y:
=Round(ServiceRating,2)Это создает группировки вдоль оси Y для приблизительных значений ServiceRating. Чем выше значение, тем выше клиент оценил качество своего обслуживания.
-
В разделе Вид > Представление уменьшите Размер пузырька до 20 и включите Точки дрожания.
-
В разделе Цвета и легенда установите для параметра Цвета значение Пользовательские.
-
Выберите параметр для раскрашивания данных по следующему измерению:
=Churned_predictedЭто назначит один цвет для каждого из значений в поле Churned_predicted. В этом случае будут отображаться два цвета.
-
Добавьте метки к измерению и мере, а также добавьте следующую метку к пользовательской настройке цвета: Predicted to Churn.
Аналогичные диаграммы можно создать для анализа различных числовых полей, подставив другие агрегирования полей вместо меры BaseFee.
Настройте визуализации на листе так, чтобы они выглядели аналогично изображению ниже.
Лист анализа прогнозов

Второй лист: информационная панель агрегированных значений SHAP
Затем создайте лист, посвященный анализу агрегированных значений SHAP.
Выполните следующие действия.
-
Создайте новый лист.
-
Дайте листу название (например, Aggregated SHAP).
Ранжирование важности SHAP
Этот тип диаграммы похож на автоматически сгенерированную диаграмму, которую вы могли видеть при настройке версий эксперимента. Здесь мы создадим ее для прогнозируемого набора данных.
Цель этого типа диаграммы — показать характеристики, которые вносят наибольший вклад в результат, отображаемый в столбце Churned. Нам нужно знать, что, поскольку мы будем использовать абсолютные значения, результаты SHAP могут быть как положительными (значение yes), так и отрицательными (значение no). При желании вы также можете использовать выражение, которое не вычисляет абсолютное значение.
Выполните следующие действия.
-
Перетащите линейчатую диаграмму на пустой лист.
-
Назовите диаграмму SHAP Importance by Feature.
-
Добавьте automl_feature в качестве измерения и назовите его Feature.
Это позволяет представить агрегированные данные по всем включенным характеристикам.
-
Добавьте следующую вычисляемую меру:
=fabs(Avg(SHAP_value)) -
В разделе Метка введите Average Absolute SHAP.
-
На панели свойств в разделе Вид > Представление удалите полосу прокрутки, если она есть, и измените ориентацию диаграммы с Вертикальная на Горизонтальная.
-
В разделе Сортировка перетащите меру над измерением, если это еще не сделано. Оставьте для сортировки каждого поля значение Авто.
Это отсортирует диаграмму по значениям меры в порядке убывания.
Матричный контейнер
Вы можете создать Матричный контейнер для фильтрации данных по определенным значениям полей в рамках измерения. В этом случае мы можем разбить значения SHAP для каждого из четырех типов планов, предлагаемых клиентам.
Чтобы создать объект Матричный контейнер, необходимо указать измерение и основную визуализацию. Мы преобразуем только что созданное ранжирование важности SHAP в основную визуализацию.
Выполните следующие действия.
- Щелкните правой кнопкой мыши диаграмму Average Absolute SHAP на листе, а затем выберите
Добавить в основные элементы.
- Оставьте имя по умолчанию и нажмите Добавить.
-
В разделе Пользовательские объекты > Qlik Visualization bundle на панели ресурсов перетащите Матричный контейнер на лист.
-
Добавьте PlanType в качестве измерения.
-
Нажмите Добавить основную визуализацию внутри диаграммы, а затем добавьте диаграмму Average Absolute SHAP.
-
В разделе Вид > Общие на панели свойств включите Показать заголовки и назовите диаграмму SHAP Importance by Plan Type.
-
Измените размер Матричного контейнера так, чтобы он был достаточно широким для отображения названий характеристик на диаграммах. Если отображаются не все метки, отрегулируйте масштаб в окне браузера.
В качестве альтернативы вы можете отобразить эти данные, создав отдельные диаграммы с выражениями множеств для каждого значения измерения, которое вы хотите проанализировать. В этом случае вы можете создать отдельную диаграмму для каждого из четырех типов планов.
Повторное использование Фильтра
Фильтр, созданный на первом листе, можно повторно использовать на этом листе. В режиме редактирования листа щелкните правой кнопкой мыши Фильтр и скопируйте его. Вставьте его на лист Aggregated SHAP.
Древовидная карта
Вы также можете визуализировать разбивку значений SHAP с помощью древовидной карты. Перетащите древовидную карту на лист и добавьте те же измерение и меру, которые вы использовали в ранжировании важности SHAP.
Настройте визуализации на листе так, чтобы они выглядели аналогично изображению ниже.
Лист Aggregated SHAP в режиме анализа

Использование приложения
После завершения создания приложения оно готово к использованию для анализа данных.
Нажмите Изменить лист, чтобы переключиться в режим анализа. В этом представлении вы можете делать выборки (в Фильтрах или в другом месте на листе), чтобы фильтровать данные для конкретного анализа подмножеств данных. Например, вы можете проанализировать определенный тип плана клиента или регион и сравнить полученные результаты с другими подмножествами данных.
Спасибо!
Вы дошли до конца этого учебного пособия. Мы надеемся, что вы узнали что-то новое и поняли, что автоматизированное машинное обучение — это быстрый и простой способ создания прогностических моделей. Qlik Sense — это мощный инструмент, который позволяет легко визуализировать данные прогнозирования и получать значимую информацию о ваших данных.