Выявление основных факторов влияния в ваших данных с помощью анализа ключевых факторов
С помощью анализа ключевых факторов можно определять и сравнивать источники определенных тенденций в данных. Анализ ключевых факторов помогает визуализировать и ранжировать влияние, которое определенный набор факторов оказывает на текущие данные для конкретного целевого поля. Используйте полученные аналитические сведения для улучшения и совершенствования процессов аналитики и принятия решений в вашей организации.
Анализ ключевых факторов доступен в приложении Qlik Sense. Выполняйте анализ ключевых факторов в виде листа в режиме анализа.
Анализ ключевых факторов недоступен в Qlik Sense Business, Аналитика Qlik Cloud Standard или Qlik Anonymous Access.
Анализ ключевых факторов в приложении Qlik Sense
Что такое анализ ключевых факторов?
Анализ ключевых факторов — это форма статистического исследования данных, которая позволяет определить степень влияния различных факторов на результат одной целевой метрики. Анализ выполняется как для количественных, так и для качественных данных. Цель анализа ключевых факторов — выяснить, что именно вызывает определенную тенденцию в данных, и использовать эти сведения для принятия прямых мер или повышения осведомленности организации.
В бизнес-аналитике общими целями, для которых необходимо оценить факторы влияния, являются такие поля, как Продажи, Удовлетворенность клиентов, Маржа, Отток и Себестоимость продаж. Примеры факторов (ключевых факторов) включают Продукт, Местоположение, Номер магазина и Менеджер.
Метрики, оцениваемые в анализе ключевых факторов, различаются для каждой организации и варианта использования. Целевая метрика и различные факторы, влияющие на ее результаты, зависят от проблемы, которую вы пытаетесь решить, доступных данных и других факторов.
Зачем использовать анализ ключевых факторов?
Анализ ключевых факторов полезен в бизнес-аналитике, поскольку его можно применять различными способами для улучшения ключевых показателей эффективности. Вы можете использовать анализ ключевых факторов для решения проблем и получения аналитических сведений, связанных с инвестициями в продукты, увеличением доходов, снижением затрат, удовлетворенностью клиентов и многим другим.
В Qlik Sense анализ ключевых факторов интегрирован в пользовательский интерфейс приложения. Используя встроенные в Qlik Sense возможности анализа данных в реальном времени, можно запускать новый анализ ключевых факторов при каждом изменении данных приложения. Это позволяет постоянно отслеживать изменения в данных и быстро выявлять возникающие тенденции, чтобы при необходимости принимать своевременные и эффективные меры.
Как это работает
Анализ ключевых факторов сосредоточен вокруг идеи влияния. В Qlik Sense анализ ключевых факторов оценивает влияние, которое определенные поля (характеристики или ключевые факторы) оказывают на конкретное интересующее поле (цель).
Данные, используемые в анализе
Анализ ключевых факторов — это специфическое исследование подмножества ваших данных. При создании анализа вы выбираете определенные поля в качестве компонентов анализа.
Для каждого анализа необходимо выбрать следующие структурные элементы:
-
Цель
-
Несколько характеристик
После выбора этих компонентов из вашей модели данных создается определенный набор данных с использованием цели и характеристик. Анализ ключевых факторов использует этот набор данных, а не всю модель данных, чтобы определить влияние, которое характеристики оказывают на цель. Поля, которые не включены в конфигурацию, не анализируются.
Дополнительная информация о каждом компоненте представлена ниже.
Расчет влияния
В Qlik Sense анализ ключевых факторов выполняется путем вычисления значений SHAP для каждого значения данных характеристики в анализируемом подмножестве данных. Эти значения SHAP генерируются на основе модели, обученной с помощью Qlik Predict. Модели используют алгоритм случайного леса для генерации значений SHAP.
Значение SHAP — это расчет степени влияния значения данных на соответствующее целевое значение по отношению к другим характеристикам в наборе данных, специально созданном на основе конфигурации анализа ключевых факторов. При просмотре результатов анализа ключевых факторов вы видите агрегированные значения SHAP по всем или определенному набору записей в наборе данных.
Для получения дополнительной информации о важности SHAP в Qlik Predict см. Общие сведения о важности SHAP в обучении эксперимента.
Цель
Цель — это поле, для которого необходимо проанализировать ключевые факторы. Например, вы можете захотеть сравнить, как определенные факторы влияют на ваши продажи. В этом случае вы выберете меру продаж в качестве цели.
При выборе цели важно время доступности данных, особенно в отношении характеристик, которые вы решили включить в анализ. Для получения дополнительной информации о правильных временных рамках сбора данных для вашей цели и характеристик см. Характеристики.
Количество уникальных значений и тип данных в цели определяют тип проблемы, которую будет решать анализ. Это, в свою очередь, влияет на требования, которым должны соответствовать ваши данные. Для получения дополнительной информации см. Требования к данным.
Анализ ключевых факторов поддерживает следующие типы проблем:
-
Регрессия
-
Бинарная классификация
Регрессионные анализы
Регрессионные анализы используются, когда цель содержит большое количество уникальных числовых значений. Если вы используете числовое вычисление (меру) в качестве цели, анализ ключевых факторов, скорее всего, интерпретирует конфигурацию как проблему регрессии.
При выборе меры в качестве цели можно применить базовую агрегацию непосредственно к полю в конфигурации или выбрать существующий Основной элемент, если вы хотите использовать более сложное выражение.
Анализы бинарной классификации
Если ваша цель включает только два уникальных значения (например, да или нет), анализ ключевых факторов интерпретирует конфигурацию как проблему бинарной классификации. Анализы бинарной классификации создаются путем выбора бинарного измерения в качестве цели.
В качестве распространенного примера: если в вашем приложении есть поле Отток для отслеживания того, какие клиенты отказались от определенной услуги, вы можете выбрать поле Отток в качестве цели, чтобы выявить, какие факторы определяют эти решения клиентов.
Характеристики
Характеристики — это ваши ключевые факторы. Это поля, которые содержат извлекаемую информацию о том, что влияет на тенденции в данных. Например, при создании анализа ключевых факторов для выявления факторов, влияющих на продажи, вы можете выбрать такие измерения, как Местоположение, Тип продукта, Номер магазина и Торговый представитель, в качестве характеристик. Вычисляемые меры также можно использовать в качестве характеристик.
Следует включать только те характеристики, которые содержат данные, поддающиеся регистрации и собранные до момента сбора целевых данных. Если вы включите характеристики, содержащие данные, которые вы узнали бы только во время сбора данных для цели, анализ будет искажен и не будет представлять аналитической ценности.
Например, если вашей целью являются Продажи, не следует включать характеристики, содержащие данные, непосредственно полученные из нее. Аналогично, если вашей целью является поле Отток с бинарным результатом (Да или Нет), не следует включать характеристику, содержащую дату оттока клиента.
Для получения дополнительной информации о том, как определить недействительные результаты анализа, см. Выявление недействительных результатов.
Характеристике назначается один из двух следующих типов:
-
Категориальная характеристика: та, которая содержит значения данных на основе различных повторяющихся категорий. Примером категориальной характеристики может быть поле Континент, в котором есть лишь несколько возможных значений, и они интерпретируются не как необработанные числовые данные, а как текст. Числа могут использоваться в качестве категорий.
-
Числовая характеристика: та, в которой значения данных являются исключительно числовыми данными и не относятся к категориям.
Все включенные характеристики специально анализируются, чтобы определить, какое влияние каждая из них оказывает на текущие данные в цели.
Для получения дополнительной информации о требованиях к цели и включенным характеристикам см. Требования к данным.
Выборки в приложении
Выборки, сделанные в приложении, используются в анализе ключевых факторов. Например, вы можете захотеть выявить ключевые факторы для продаж, но при включении измерения Номер магазина в качестве характеристики вы можете захотеть проанализировать влияние только пяти конкретных магазинов в вашей организации. Для этого можно выбрать значения в приложении, а затем настроить анализ ключевых факторов.
Поскольку выборки по сути являются фильтрами, применяемыми к модели данных, важно понимать, что выполнение выборок в одном поле может повлиять на доступные данные, которые можно использовать в анализе.
Рекомендации по подписке клиента
Анализ ключевых факторов опирается на Qlik Predict для расчета влияния характеристик на цель. Это делается путем создания моделей машинного обучения, которые используются для расчета значений SHAP для точек диаграммы, соответствующих включенным характеристикам в выбранном подмножестве данных.
Создание анализа ключевых факторов потребляет услуги, измеряемые Qlik Predict. Определенный объем использования Qlik Predict включен в большинство подписок Qlik Cloud. Если требуется больше ресурсов, необходимо перейти на платный уровень Qlik Predict.
Обратитесь к владельцу сервисной учетной записи и ознакомьтесь с условиями используемой подписки, чтобы узнать о доступных ресурсах для использования анализа ключевых факторов.
Дополнительные сведения можно найти в следующих ресурсах:
-
Описание продукта для подписок Qlik Cloud®
Требования к данным
Минимальные требования к объему данных
Набор данных, созданный из вашей цели и характеристик, должен содержать не менее 400 ячеек. В противном случае вы не сможете запустить анализ.
Другие требования
К набору данных, созданному на основе вашей конфигурации анализа, применяются следующие требования:
-
Цель должна содержать не менее двух уникальных значений.
-
Если цель содержит от двух до десяти уникальных значений, каждое уникальное значение должно встречаться как минимум в десяти записях в наборе данных.
Если при запуске анализа ключевых факторов возникают ошибки, возможно, данные, выбранные для анализа, не соответствуют этим требованиям. Информацию о других проблемах, с которыми вы можете столкнуться, и список возможных решений см. в разделе Устранение неполадок .
Использование анализа ключевых факторов в Qlik Sense
Следующие разделы справки помогут вам начать создание и интерпретацию анализов ключевых факторов в Qlik Sense:
Ограничения
Список ограничений для анализа ключевых факторов приведен ниже:
-
Поля, содержащие типы данных даты, времени или метки времени, не поддерживаются для использования в качестве цели или характеристик.