Визуализация значений SHAP в приложениях Qlik Sense
Значения SHAP помогают понять, что влияет на модель, а также на отдельные результаты. Создавайте визуализации значений SHAP в приложениях Qlik Sense, чтобы более детально изучать данные. В следующих примерах вы узнаете о том, какие наблюдения можно сделать, основываясь на этих значениях.
Подготовка
Прежде чем начать, выполните следующие подготовительные действия.
-
Создайте набор данных Coordinate SHAP. В этом наборе данных столбцы значений SHAP преобразованы в столбцы «признак» и «значение», что позволяет использовать несколько признаков на одном графике.
-
Для прогнозов двоичной классификации постройте график зависимости прогнозируемой вероятности от суммы значений SHAP в каждой строке и посмотрите на направление значений SHAP. Если наклон отрицательный, измените направление значений SHAP на противоположное, чтобы было легче интерпретировать визуализации.
Ранжирование важности признаков
Вы можете создать ранжирование важности признаков с помощью среднего значения абсолютных значений SHAP для каждого признака. На рисунке показана важность различных признаков, влияющих на вероятность ухода клиента.
Направление и распределение
Значения SHAP также можно использовать, чтобы узнать направление и распределение влияния каждого признака. На рисунке видно, какие признаки делают отток клиентов более или менее вероятным.
Важность признаков для когорт (групп людей)
Важность признаков можно определить для отдельных когорт. Например, можно сравнить наиболее важные признаки для клиентов с разными тарифными планами. На рисунке показаны важные для клиентов признаки в разбивке по тарифным планам.
На этой диаграмме используется матричный контейнер, в котором представлены конкретные значения полей в наборе данных. Подобные диаграммы также можно создать по отдельности, используя выражения множества.
Важность признаков на уровне строк
Важность SHAP можно использовать для того, чтобы определить важность признаков на уровне строк. Можно проанализировать и сравнить, какие признаки влияют на вероятность оттока разных клиентов, как показано на рисунке ниже.
Вариация признаков
Можно построить график, на котором будет показано влияние каждой вариации признака. Например, можно создать визуализации, чтобы показать среднее влияние тарифного плана клиента для каждого предлагаемого тарифного плана.
Непрерывные переменные
Значения SHAP можно использовать на точечных диаграммах для анализа тенденций, так как значения непрерывных переменных варьируются. На этом графике значений SHAP видно, что вероятность оттока клиентов, как правило, возрастает при повышении базового тарифа.
При необходимости также можно использовать линии регрессии и другие инструменты, с помощью которых можно получить новые наблюдения в данных.