Qlik Sense 앱에서 예측 데이터 시각화
프로세스의 마지막 단계는 만든 예측 데이터를 시각화하기 위해 Qlik Sense 분석 앱을 만드는 것입니다.
대체 워크플로: 사전 구성된 앱 업로드
이 항목의 나머지 단계를 따르기보다는 이 자습서 시작 부분에서 다운로드한 Customer churn predictions.qvf 앱을 분석 활동 센터에 업로드할 수 있습니다.
이 페이지의 나머지 섹션에서는 유사한 앱을 만드는 과정을 안내합니다. 앱의 예측 데이터와 사용자의 예측 데이터 간에는 약간의 차이가 있습니다.
다운로드할 수 있는 앱에는 조건부 표현식을 사용하여 한 번에 단일 고객 계정에 대한 세부적인 분석을 장려하는 Individual Customer Analysis이라는 추가 시트가 포함되어 있습니다.
시작하기
분석 활동 센터에서 만들기 페이지로 이동하여 분석 앱을 클릭합니다. 앱 공간을 선택하고 이름을 Customer churn predictions로 지정합니다.
만들기를 클릭합니다.
데이터 모델 만들기
데이터 선택
앱에 필요한 데이터를 추가해야 합니다. 이는 적용 데이터 집합(자습서 시작 시 업로드됨)과 예측에서 생성된 두 개의 데이터 집합으로 구성됩니다.
다음과 같이 하십시오.
-
새 앱에서 클릭하여 데이터 카탈로그의 데이터를 추가합니다.
-
데이터 카탈로그에서 다음 세 가지 데이터 집합 옆에 있는 확인란을 클릭합니다.
-
데이터 집합 적용: AutoML Tutorial - Churn data - apply.csv 또는 AutoML Tutorial - Churn data - apply.qvd
-
예측 데이터 집합: AutoML Tutorial - Churn data - apply_Prediction.csv
-
SHAP 조정 데이터 집합: AutoML Tutorial - Churn data - apply_Prediction_Coordinate_SHAP.csv
-
-
다음을 클릭합니다.
-
요약 패널이 나타납니다. AutoML Tutorial - Churn data - apply.csv 데이터 집합을 클릭하여 로드할 수 있는 필드를 확장합니다.
-
모델 교육 중에 선택 취소된 기능 옆에 있는 아이콘을 클릭합니다.모델에 미치는 영향이 낮아 선택 취소한 기능과 마찬가지로 DaysSinceLastService이어야 합니다.
-
앱에 로드를 클릭합니다.
데이터 연결
이 시점에서 앱에 데이터를 추가했지만 데이터 집합을 서로 연결할 때까지 연결된 데이터 모델이 구성되지 않습니다. 이 경우 AccountID 필드는 데이터 집합을 서로 연결하는 인덱스가 됩니다.
이제 앱에서 데이터 관리자가 열립니다. 세 개의 데이터 집합이 표시되지만 연결되지 않은 별도의 엔터티로 표시됩니다.
다음과 같이 하십시오.
-
이제 앱에서 데이터 관리자가 열립니다. 세 개의 데이터 집합이 표시되지만 연결되지 않은 별도의 엔터티로 표시됩니다.
-
데이터 관리자의 오른쪽 창에서 AccountID 연결 제안을 찾습니다.
-
적용을 클릭합니다. 이제 테이블이 서로 연결되어야 합니다.
-
데이터 로드를 클릭합니다.
데이터 모델 뷰어에서 연관성 확인
앱에서 시각화를 구축하기 전에 데이터가 올바르게 연결되었는지 확인해야 합니다.
다음과 같이 하십시오.
-
인터페이스 상단의 탐색 막대에서 앱 탐색 메뉴를 열고 데이터 모델 뷰어를 선택합니다.
-
세 개의 데이터 집합이 제대로 연결되었는지 확인합니다. AccountID 필드는 세 가지 데이터 집합 모두에서 키 역할을 해야 합니다. 앱의 데이터 모델은 다음 이미지와 같아야 합니다.
이제 분석 콘텐츠 구축을 시작할 준비가 되었습니다. 탐색 막대의 분석 탭에서 시트를 클릭합니다.
첫 번째 시트: 집계된 예측 대시보드
첫 번째 시트에서는 집계된 형태의 예측 분석에 중점을 둡니다.
다음과 같이 하십시오.
-
이제 시트 편집 모드에 있어야 합니다. 고급 옵션을 클릭합니다.
-
시트의 기존 시각화를 마우스 오른쪽 버튼으로 클릭하고 삭제합니다. 이는 이 자습서에서는 사용하지 않을 차트 제안 기능입니다.
-
시트에 집계된 예측과 같은 제목을 지정합니다. 이렇게 하려면 빈 시트의 아무 곳이나 클릭하여 인터페이스 오른쪽에 있는 시트 속성을 엽니다. 제목 아래에 시트 이름을 입력합니다.
원형 차트
원형 차트를 사용하면 데이터의 비례 분할을 쉽게 시각화할 수 있습니다. 이 경우 예측된 결과(yes 또는 no)로 데이터를 분류하는 것이 합리적입니다.
다음과 같이 하십시오.
-
원형 차트를 시트로 끌어옵니다.
-
Churned_predicted을 차원으로 추가합니다.
-
Count(AccountID)을 측정값으로 추가합니다.
-
원하는 경우 속성 패널의 모양 > 프레젠테이션에서 차원 레이블을 끕니다.
-
속성 패널의 데이터 아래에서 차원을 확장하고 차원의 레이블을 이탈 예측으로 수정합니다.
범례에서 레이블이 업데이트됩니다.
필터 창
이 대시보드에서 전체 데이터 모델을 광범위하게 분석할 수 있습니다. 그러나 특정 집단을 분석하려면 다양한 차원에서 데이터를 신속하게 필터링할 수 있는 것이 거의 확실히 중요합니다.
여러 목록 상자가 있는 필터 창을 만듭니다. 각 목록 상자에서는 단일 차원 내에서 값을 선택할 수 있습니다.
다음과 같이 하십시오.
-
필터 창을 시트로 끕니다.
-
필터 창에 필드를 추가합니다. 이는 예측된 결과에 중요할 것으로 예측되는 차원일 수 있습니다.
-
속성 패널의 데이터 아래에 있는 필드를 클릭하여 필요에 따라 각 목록 상자를 수정합니다. 목록 상자 속성이 열립니다.
예를 들어, 필드 레이블을 변경하고 목록 상자 축소를 항상으로 설정하여 시트 공간을 절약할 수 있습니다.
시트의 한쪽 면에 패널로 표시되도록 필터 창의 크기를 조정합니다.
KPI 개체
KPI는 특히 중요한 데이터 분석에 대한 단일 값을 표시하는 좋은 방법입니다. 여기서는 3개의 KPI 차트를 만듭니다.
다음과 같이 하십시오.
-
빈 KPI 차트를 만듭니다. 다음 측정값을 추가합니다.
=Count(Churned_predicted)
이렇게 하면 이탈 예측을 생성한 총 고객 수가 계산됩니다.
-
측정값에 총 고객 수라는 레이블을 지정합니다.
-
숫자 서식 지정을 숫자로 설정하고 값을 1,000 서식 지정으로 표시합니다(소수 또는 백분율 값 제외).
-
다른 빈 KPI 차트를 만듭니다. 다음 측정값을 추가합니다.
=Count({<Churned_predicted={"yes"}>}(Churned_predicted))
Churned_predicted 필드에 yes 값이 표시된 횟수를 계산하는 집합식입니다.
-
측정값에 이탈 예측이라는 레이블을 지정합니다.
-
첫 번째 KPI와 동일한 설정으로 차트의 숫자 서식 지정을 구성합니다.
-
세 번째 빈 KPI 차트를 만듭니다. 다음 측정값을 추가합니다.
=Count({<Churned_predicted={"no"}>}(Churned_predicted))
Churned_predicted 필드에 no 값이 표시된 횟수를 계산합니다.
-
측정값에 유지 예측이라는 레이블을 지정합니다.
히스토그램
히스토그램을 사용하여 예측 확률 값의 분포를 시각화할 수 있습니다.
히스토그램을 시트로 끌어서 제목을 지정합니다. Churned_yes를 차원으로 추가합니다.
누적 막대형 차트
계획 유형과 같은 범주형 필드별로 예측을 분석하기 위해 개별 집합 분석이 서로 쌓인 막대형 차트를 만들 수 있습니다.
다음과 같이 하십시오.
-
막대형 차트를 시트로 끌어서 제목을 계획 유형별 이탈 예측으로 지정합니다.
-
PlanType을 차원으로 추가합니다. 계획 유형이라는 레이블을 지정합니다.
-
다음 측정값을 추가합니다.
=Count({<Churned_predicted={"no"}>}(Churned_predicted))
측정값에 유지 예측이라는 레이블을 지정합니다.
-
다음 측정값을 추가합니다.
=Count({<Churned_predicted={"yes"}>}(Churned_predicted))
측정값에 이탈 예측이라는 레이블을 지정합니다.
-
모양 > 프레젠테이션, 레이아웃을 그룹화에서 누적으로 변경합니다.
-
스크롤바를 제거하고 값 레이블을 켜기로 설정합니다.
-
세그먼트 레이블 및 전체 레이블을 자동으로 구성합니다.
완료되면 동일한 두 측정값을 사용하지만 NumberOfPenalties와 같은 다른 범주형 차원을 사용하여 유사한 막대형 차트를 만들 수 있습니다.
개별 숫자 필드 값을 분석하기 위한 분포도
분포도는 다양한 숫자 값을 가진 측정값으로 예측 데이터를 표시하는 데 사용할 수 있습니다. 이 섹션에서는 고객의 서비스 등급에 대한 고유한 그룹화를 사용하여 기본 요금별로 이탈 예측을 표시하는 차트를 만듭니다.
다음과 같이 하십시오.
-
분포도를 시트로 끌어서 제목을 기본 요금 및 서비스 등급별로 이탈 예측으로 지정합니다.
-
포인트의 크기로 AccountID를 추가합니다.
-
x축에 다음 측정값을 추가합니다.
=Avg(BaseFee)
-
y축에 다음 계산 차원을 추가합니다.
=Round(ServiceRating,2)
그러면 대략적인 ServiceRating 값에 대한 y축을 따라 그룹화가 만들어집니다. 값이 높을수록 고객이 서비스 품질을 높게 평가한 것입니다.
-
모양 > 프레젠테이션, 거품 크기를 20으로 줄이고 지터 포인트를 켭니다.
-
색 및 범례에서 색을 사용자 지정으로 설정합니다.
-
다음 차원을 기준으로 데이터 색을 지정하는 옵션을 선택합니다.
=Churned_predicted
그러면 Churned_predicted 필드의 각 값에 하나의 색이 할당됩니다. 이 경우 두 가지 색이 표시됩니다.
-
차원 및 측정값에 레이블을 추가하고 사용자 지정 색 설정에 이탈 예측 레이블을 추가합니다.
BaseFee 측정값 대신 다른 필드 집계를 대체하여 다양한 숫자 필드 분석을 위해 유사한 차트를 만들 수 있습니다.
아래 이미지와 유사하게 보이도록 시트의 시각화를 구성합니다.
두 번째 시트: 집계된 SHAP 대시보드
다음으로, 집계된 SHAP 값 분석 전용 시트를 만듭니다.
다음과 같이 하십시오.
-
새 시트를 만들고 고급 편집 모드를 엽니다.
-
시트에 제목을 지정합니다(예: 집계된 SHAP).
SHAP importance 순위
이 유형의 차트는 실험 버전을 구성할 때 볼 수 있는 자동 생성 차트와 유사합니다. 여기에서는 예측 데이터 집합에 대해 하나를 만듭니다.
이 유형의 차트의 목적은 Churned 열에 표시되는 결과에 가장 많이 기여하는 기능을 표시하는 것입니다. 절대값을 사용하므로 SHAP 결과는 양수(yes 값) 또는 음수(no 값)일 수 있습니다. 원하는 경우 절대값을 계산하지 않는 표현식을 사용할 수도 있습니다.
다음과 같이 하십시오.
-
막대형 차트를 빈 시트로 끕니다.
-
기능별 SHAP importance 차트의 제목을 지정합니다.
-
automl_feature를 차원으로 추가하고 기능 레이블을 지정합니다.
이를 통해 포함된 모든 기능에 대해 집계된 데이터를 표시할 수 있습니다.
-
다음 계산된 측정값을 추가합니다.
=fabs(Avg(SHAP_value))
-
레이블 아래에 평균 절대 SHAP를 입력합니다.
-
속성 패널에서 모양 > 프레젠테이션, 스크롤바가 있는 경우 제거하고 차트 방향을 세로에서 가로로 설정합니다.
-
아직 수행하지 않은 경우 정렬에서 차원 위로 측정값을 끕니다. 각 입력란의 정렬은 자동으로 둡니다.
내림차순 패턴으로 측정값을 기준으로 차트를 정렬합니다.
격자 울타리 컨테이너
격자 울타리 컨테이너를 만들어 차원 내의 특정 필드 값에 대한 데이터를 필터링할 수 있습니다. 이 경우 고객에게 제공되는 4가지 계획 유형 각각에 대해 SHAP 값을 분류할 수 있습니다.
격자 개체를 만들려면 차원 및 마스터 시각화를 지정해야 합니다. 방금 만든 SHAP importance 순위를 마스터 시각화로 변환합니다.
다음과 같이 하십시오.
- 시트에서 평균 절대 SHAP 차트를 마우스 오른쪽 버튼으로 클릭한 후 마스터 항목에 추가를 선택합니다.
- 기본 이름을 유지하고 추가를 클릭합니다.
-
사용자 지정 개체 > 자산 패널의 Qlik 시각화 번들에서 격자 울타리 컨테이너를 시트로 끕니다.
-
PlanType을 차원으로 추가합니다.
-
차트 내에서 마스터 시각화 추가를 클릭한 다음 평균 절대 SHAP 차트를 추가합니다.
-
모양 > 속성 패널의 일반에서 제목 표시를 켜고 차트 제목을 계획 유형별 SHAP importance로 지정합니다.
-
격자 울타리 컨테이너의 크기를 조정하여 차트에 기능 이름을 표시할 수 있을 만큼 충분히 넓습니다. 모든 레이블이 표시되지 않으면 브라우저 창에서 확대/축소를 조정합니다.
또는 분석하려는 각 차원 값에 대해 설정된 표현식을 사용하여 개별 차트를 만들어 이 데이터를 표시할 수 있습니다. 이 경우 네 가지 계획 유형 각각에 대해 별도의 차트를 만들 수 있습니다.
필터 창 재사용
첫 번째 시트에서 만든 필터 창을 이 시트에서 다시 사용할 수 있습니다. 고급 편집 모드에서 필터 창을 마우스 오른쪽 버튼으로 클릭하고 복사합니다. 이를 집계된 SHAP 시트에 붙여넣습니다.
트리 맵
트리 맵을 사용하여 SHAP 값의 분할을 시각화할 수도 있습니다. 트리 맵을 시트로 끌어서 SHAP importance 순위에 사용한 것과 동일한 차원 및 측정값을 추가합니다.
아래 이미지와 유사하게 보이도록 시트의 시각화를 구성합니다.
앱 사용
앱 구축이 완료되면 데이터 분석에 사용할 수 있습니다.
분석 모드로 전환하려면 시트 편집을 클릭하십시오. 이 보기에서는 필터 창이나 시트의 다른 위치에서 항목을 선택하여 데이터 하위 집합에 대한 특정 분석을 위해 데이터를 필터링할 수 있습니다. 예를 들어, 특정 고객 계획 유형이나 지역을 분석하고 결과를 다른 데이터 하위 집합과 비교할 수 있습니다.
감사합니다.
이 자습서의 끝에 도달하였습니다. 자동화된 기계 학습이 예측 모델을 생성하는 빠르고 쉬운 방법임을 깨닫고 몇 가지 사항을 배웠기를 바랍니다. Qlik Sense는 예측 데이터를 쉽게 시각화하고 데이터에 의미 있는 통찰력을 제공하는 강력한 도구입니다.