Просмотр и интерпретация результатов анализа ключевых факторов
После выполнения анализа ключевых факторов можно просмотреть результаты, чтобы идентифицировать метрики о факторах, определяющих тренды данных для цели. Результаты предоставляют применимые на практике наблюдения, которые можно использовать для принятия более информированных решений.
Откройте панель Ресурсы, просматривая лист в analyze mode. Разверните панель Ключевые факторы, и выберите существующий анализ на панели, чтобы просмотреть результаты.
Результаты анализа ключевых факторов имеют срок действия и удаляются через 10 дней после выполнения анализа.
Просмотр сведений об анализе
В верхнем правом углу страницы результатов щелкните Просмотреть сведения, чтобы просмотреть информацию об анализе. Предоставляется следующая информация:
-
Время создания, последнего выполнения и срок действия
-
Цель и признаки, выбранные для конфигурации
-
Все выборки, которые были применены в приложении, на момент создания конфигурации анализа
Применение выборок из анализа к приложению
Выборки, сделанные при настройке конфигурации, сохраняются в анализе ключевых факторов. При просмотре сведений об анализе щелкните Применить выборки к приложению.
Это позволяет пересматривать листы приложения и ограничить специфические данные, которые могут быть источниками аномалий.
Сравнение общего влияния каждого признака
В разделе Основные ключевые факторы на странице результатов отображается вычисленное общее влияние каждого включенного признака в сравнении со всеми остальными признаками в анализе. В этом разделе есть линейчатая диаграмма и соответствующие наблюдения на естественном языке. В диаграмме признаки ранжируются от наибольшего до наименьшего влияния на цель.
Степень влияния отображается в виде абсолютных значений. Поэтому признак может иметь сильное отрицательное воздействие на поле Sales, но при этом отображаться как оказывающий наибольшее влияние на эту цель.
В диаграмме автоматически выбирается ключевой фактор, оказывающий наибольшее влияние, именно он определяет признак, анализируемый в области справа от раздела Основные ключевые факторы. Для получения дополнительной информации об анализе специфических сведений об отдельном признаке см. раздел Просмотр подробных метрик для одного признака.
Просмотр подробных метрик для одного признака
Более подробная информация об относительном влиянии определенного признака по сравнению с другими включенными признаками предоставляется в разделе соответствующего признака справа на странице. Выбранный признак в диаграмме Основные ключевые факторы анализируется более детально. По умолчанию выбирается ключевой фактор, оказывающий наибольшее влияние.
Создайте другую выборку в диаграмме Основные ключевые факторы для просмотра дополнительных сведений о том, какое влияние оказывают на цель уникальные значения в этом признаке.
В следующих разделах рассматривается каждый из доступных вариантов.
Диаграмма с разбивкой
Диаграмма с разбивкой ранжирует влияние, которое каждый уникальный признак оказывает на целевой результат. Можно переключать диаграмму между средним и общим влиянием.
Степень влияния отображается в виде абсолютных значений. Поэтому значение признака может иметь сильное отрицательное воздействие на поле Sales, но при этом отображаться как оказывающие наибольшее влияние на эту цель.
Диаграмма распределения
Диаграмма распределения также выполняет разбивку признака по уникальному значению. В наборе данных каждый экземпляр значения признака в записи визуализируется как пузырь. Пузыри распределяются и ранжируются в соответствии с влиянием на цель. Можно переключать диаграмму между средним и общим влиянием.
Степень влияния отображается в виде абсолютных значений. Поэтому значение признака может иметь сильное отрицательное воздействие на поле Sales, но при этом отображаться как оказывающие наибольшее влияние на эту цель.
Можно использовать диаграмму распределения для визуализации области, где диапазоны значений влияния обычно собираются в кластер. Это позволяет идентифицировать выбросы и аномальные значения, а также исследовать, почему они выбиваются из общих трендов.
Щелкните пузырь в диаграмме, чтобы получить дополнительные сведения о записи данных, к которой он относится. Сюда относятся значения других включенных признаков, связанных с этим признаком в наборе данных.
Просмотр наблюдений на естественном языке о результатах
Наблюдения на естественном языке доступны для метрик общего влияния, а также для метрик влияния отдельных признаков. Наблюдения могут предоставлять простые сводки результатов, например какие признаки имеют наибольшее влияние и какие признаки оказывают небольшое влияние на цель либо совсем не оказывают влияния.
Наблюдения также помогают идентифицировать, когда результаты анализа могут быть искажены вследствие неправильной конфигурации или ненадлежащей подготовки данных. Самое важное то, что если обнаруживается возможная утечка цели, информацию об этом можно найти в наблюдениях.
Идентификация недопустимых результатов
Если данные в результатах кажутся искаженными, это указывает на то, что анализ, вероятно, был настроен неправильно или что имеются проблемы с исходными данными, использованными для создания анализа.
Утечка цели в анализе ключевых факторов
Если оказывается, что на один признак приходится подавляющая доля влияния, оказываемого на цель, возможно, в конфигурации анализа происходит утечка цели. В таком случае результаты анализа не являются надежными.
Утечка цели ― это явление, при котором имеется зависимость между целью и признаком, приводящая к тому, что признаку приписывается нереалистичный и часто неправильный объем влияния на цель. Ниже приводится несколько возможных причин для этого:
-
Признак и цель являются прямыми производными друг друга. Например, если целью является Margin (Маржа) и включен признак Sales (Продажи), результаты могут быть искажены утечкой цели. Это связано с тем, что элемент Margin часто представляет собой расчет: вычитание Cost (Затраты) из Sales. По этой причине влияние Sales на Margin будет доминировать в анализе и не позволит оценить другие факторы.
-
Неправильная организация сбора и подготовки данных Например, цель является двоичным полем Churned (Отток), и включен признак DaysSinceLastService (вычисляемое поле, содержащее количество дней, в течение которых клиент не обращался за обслуживанием). Если вычисление в этом поле не останавливает автоматический подсчет дней после отказа клиента от услуги, то полю DaysSinceLastService будет приписано непропорционально большой объем влияния на Churned.
Метрики, искаженные за счет утечки цели, рассматриваются как недействительные. Рекомендуется повторно настроить конфигурации цели и признаков, исключив сущности, которые могут приводить к утечке цели.
Порядок интерпретации результатов и принятия соответствующих мер
Результаты анализа ключевых факторов могут указывать, что конкретное отслеживаемое измерение или мера в приложении влияет на изменение или поведение данных для цели.
Информацию, отображаемую на странице результатов можно, преобразовать в прямое действие с целью улучшения производительности и эффективности организации.
Пример из реальной жизни
Например, в разделе Основные ключевые факторы видно, что поле Product (Продукт) оказывает влияние на данные в цели Customer Satisfaction (Удовлетворенность клиента). Влияние на цель может быть как положительным, так и отрицательным. Чтобы узнать больше о том, какие именно значения поля Product оказывают наибольшее влияние на поле Customer Satisfaction, можно перейти в раздел результатов для отдельного признака и оценить значения признака Product в качестве определяющих факторов.
При этом можно наблюдать, что определенный продукт, демонстрирующий особенно высокую эффективность, оказывает значительное влияние на улучшение оценок в поле Customer Satisfaction.
На основе этих наблюдений можно принять решение об увеличении инвестиций в этот продукт в рамках маркетинга и разработок.