Qlik Sense 앱에서 SHAP 값 시각화
SHAP 값은 개별 결과를 주도할 뿐만 아니라 모델을 주도하는 것이 무엇인지 이해하는 데 도움이 됩니다. Qlik Sense 앱에서 SHAP 값의 시각화를 구축하여 데이터를 더 자세히 탐색합니다. 다음 예에서는 얻을 수 있는 통찰력에 대한 아이디어를 제공합니다.
준비
시작하기 전에 다음 준비를 수행합니다.
-
Coordinate SHAP 데이터 집합을 생성합니다. 이 데이터 집합에는 단일 차트에서 여러 기능을 사용할 수 있는 "기능" 및 "값"으로 피벗된 SHAP 값 열이 있습니다.
-
이진 분류 예측의 경우 행당 SHAP 값의 합계에 대해 예측 확률을 표시하고 SHAP 값의 방향을 확인합니다. 기울기가 음수이면 시각화를 더 쉽게 해석할 수 있도록 SHAP 값의 방향을 반대로 합니다.
기능 중요도 순위
각 기능에 대한 SHAP 값의 평균 절대값을 사용하여 기능 중요도 순위를 만들 수 있습니다. 그림에서는 고객이 이탈할 확률에 대한 다양한 기능의 중요도를 보여 줍니다.
방향 및 배포
SHAP 값은 각 기능이 미치는 영향의 방향과 분포를 이해하는 데에도 사용할 수 있습니다. 그림에서 서로 다른 기능으로 인해 고객이 이탈할 가능성이 높아지는지 여부를 확인할 수 있습니다.
코호트에 대한 기능 중요도
특성 중요도는 별개의 코호트에 대해 만들어질 수 있습니다. 예를 들어, 고객의 가장 중요한 기능을 다른 계획 유형과 비교할 수 있습니다. 그림에서는 계획 유형별로 기능 영향 요인을 보여 줍니다.
이 차트는 격자 울타리 컨테이너를 사용하여 데이터의 특정 필드 값에 대한 데이터를 나타냅니다. 집합 표현식을 사용하여 유사한 차트를 개별적으로 만들 수도 있습니다.
행 수준의 기능 중요도
SHAP importance는 행 수준에서 기능 중요도를 이해하는 데 사용할 수 있습니다. 그림에서 볼 수 있듯이 다양한 고객의 이탈 확률에 영향을 미치는 기능을 조사하고 비교할 수 있습니다.
기능 변형
기능의 각 변형의 영향을 표시할 수 있습니다. 예를 들어, 제공하는 각 계획 유형에 대한 고객 계획 유형의 평균 영향을 표시하는 시각화를 만들 수 있습니다.
연속 변수
SHAP 값은 스캐터 차트에서 연속 변수 값이 변동함에 따라 추세를 분석하는 데 사용할 수 있습니다. 이 SHAP 값의 도표에서 고객의 이탈 확률이 일반적으로 기본 요금의 증가와 함께 증가한다는 것을 알 수 있습니다.
선택적으로 회귀선 및 기타 도구를 사용하여 데이터에서 새로운 통찰력을 발견할 수도 있습니다.