Qlik Sense 앱에서 예측 데이터 시각화

프로세스의 마지막 단계는 만든 예측 데이터를 시각화하기 위해 Qlik Sense 분석 앱을 만드는 것입니다.

대체 워크플로: 사전 구성된 앱 업로드

이 항목의 나머지 단계를 따르기보다는 이 자습서 시작 부분에서 다운로드한 Customer churn predictions.qvf 앱을 분석 활동 센터에 업로드할 수 있습니다.

이 페이지의 나머지 섹션에서는 유사한 앱을 만드는 과정을 안내합니다. 앱의 예측 데이터와 사용자의 예측 데이터 간에는 약간의 차이가 있습니다.

다운로드할 수 있는 앱에는 조건부 표현식을 사용하여 한 번에 단일 고객 계정에 대한 세부적인 분석을 장려하는 Individual Customer Analysis이라는 추가 시트가 포함되어 있습니다.

시작하기

분석 활동 센터에서 만들기 페이지로 이동하고 분석 앱을 클릭합니다. 앱 공간을 선택하고 이름을 Customer churn predictions로 지정합니다.

만들기를 클릭합니다.

터치 스크린 장치를 사용하거나 터치 지원이 켜져 있는 경우 앱과 상호 작용하는 방식이 다릅니다. 자세한 내용은 터치 장치의 길게 누름 메뉴를 참조하십시오.

데이터 모델 만들기

데이터 선택

앱에 필요한 데이터를 추가해야 합니다. 이는 적용 데이터 집합(자습서 시작 시 업로드됨)과 예측에서 생성된 두 개의 데이터 집합으로 구성됩니다.

다음과 같이 하십시오.

새 앱에서 클릭하여 데이터 카탈로그의 데이터를 추가합니다.
데이터 카탈로그에서 다음 세 가지 데이터 집합 옆에 있는 확인란을 클릭합니다.
- 데이터 집합 적용: ML - Churn data - apply.csv 또는 ML - Churn data - apply.qvd
- 예측 데이터 집합: ML - Prediction output.parquet
- 좌표 SHAP 데이터 집합: ML - Prediction output_Coordinate_SHAP.parquet
다음을 클릭합니다.
요약 패널이 나타납니다. ML - Churn data - apply 데이터 집합을 클릭하여 로드할 수 있는 필드를 확장합니다.
모델 교육 중에 선택 취소된 기능 옆에 있는 아이콘을 클릭합니다. AccountID는 키 필드이므로 목록에 유지해야 합니다. 참고로, 만든 예측 구성으로 돌아가서 모델을 비교하고 데이터 집합 스키마를 적용합니다(일반적인 도움말은 예측 구성 편집을 참조하십시오).
앱에 로드를 클릭합니다.

데이터 연결

이 시점에서 앱에 데이터를 추가했지만 데이터 집합을 서로 연결할 때까지 연결된 데이터 모델이 구성되지 않습니다. 이 경우 AccountID 필드는 데이터 집합을 서로 연결하는 인덱스가 됩니다.

이제 앱에서 데이터 관리자가 열립니다. 세 개의 데이터 집합이 표시되지만 연결되지 않은 별도의 엔터티로 표시됩니다.

다음과 같이 하십시오.

이제 앱에서 데이터 관리자가 열립니다. 세 개의 데이터 집합이 표시되지만 연결되지 않은 별도의 엔터티로 표시됩니다.
데이터 관리자의 오른쪽 창에서 AccountID 연결 제안을 찾습니다.
적용을 클릭합니다. 이제 테이블이 서로 연결되어야 합니다.
데이터 로드를 클릭합니다.

데이터 모델 뷰어에서 연관성 확인

앱에서 시각화를 구축하기 전에 데이터가 올바르게 연결되었는지 확인해야 합니다.

다음과 같이 하십시오.

인터페이스 상단의 탐색 막대에서 앱 탐색 메뉴를 열고 데이터 모델 뷰어를 선택합니다.
세 개의 데이터 집합이 제대로 연결되었는지 확인합니다. AccountID 필드는 세 가지 데이터 집합 모두에서 키 역할을 해야 합니다. 앱의 데이터 모델은 다음 이미지와 같아야 합니다.

예측 앱의 데이터 모델을 보여 주는 데이터 모델 뷰어

이제 분석 콘텐츠 구축을 시작할 준비가 되었습니다. 탐색 막대의 분석 탭에서 시트를 클릭합니다.

첫 번째 시트: 집계된 예측 대시보드

첫 번째 시트에서는 집계된 형태의 예측 분석에 중점을 둡니다.

다음과 같이 하십시오.

이제 시트 편집 모드에 있어야 합니다. 고급 옵션을 클릭합니다.
시트의 기존 시각화를 마우스 오른쪽 버튼으로 클릭하고 삭제합니다. 이는 이 자습서에서는 사용하지 않을 차트 제안 기능입니다.
시트에 집계된 예측과 같은 제목을 지정합니다. 이렇게 하려면 빈 시트의 아무 곳이나 클릭하여 인터페이스 오른쪽에 있는 시트 속성을 엽니다. 제목 아래에 시트 이름을 입력합니다.

원형 차트

원형 차트를 사용하면 데이터의 비례 분할을 쉽게 시각화할 수 있습니다. 이 경우 예측된 결과(yes 또는 no)로 데이터를 분류하는 것이 합리적입니다.

다음과 같이 하십시오.

원형 차트를 시트로 끌어옵니다.
Churned_predicted을 차원으로 추가합니다.
다음 측정값을 추가합니다.
```
Count(AccountID)
```
원하는 경우 속성 패널의 모양 > 프레젠테이션에서 차원 레이블을 끕니다.
속성 패널의 데이터 아래에서 차원을 확장하고 차원의 레이블을 이탈 예측으로 수정합니다.

범례에서 레이블이 업데이트됩니다.

필터 창

이 대시보드에서 전체 데이터 모델을 광범위하게 분석할 수 있습니다. 그러나 특정 집단을 분석하려면 다양한 차원에서 데이터를 신속하게 필터링할 수 있는 것이 거의 확실히 중요합니다.

여러 목록 상자가 있는 필터 창을 만듭니다. 각 목록 상자에서는 단일 차원 내에서 값을 선택할 수 있습니다.

다음과 같이 하십시오.

필터 창을 시트로 끕니다.
필터 창에 필드를 추가합니다. 이는 예측된 결과에 중요할 것으로 예측되는 차원일 수 있습니다.
속성 패널의 데이터 아래에 있는 필드를 클릭하여 필요에 따라 각 목록 상자를 수정합니다. 목록 상자 속성이 열립니다.

예를 들어, 필드 레이블을 변경하고 목록 상자 축소를 항상으로 설정하여 시트 공간을 절약할 수 있습니다.

시트의 한쪽 면에 패널로 표시되도록 필터 창의 크기를 조정합니다.

KPI 개체

KPI는 특히 중요한 데이터 분석에 대한 단일 값을 표시하는 좋은 방법입니다. 여기서는 3개의 KPI 차트를 만듭니다.

다음과 같이 하십시오.

빈 KPI 차트를 만듭니다. 다음 측정값을 추가합니다.
```
=Count(Churned_predicted)
```
이렇게 하면 이탈 예측을 생성한 총 고객 수가 계산됩니다.
측정값에 총 고객 수라는 레이블을 지정합니다.
숫자 서식 지정을 숫자로 설정하고 값을 1,000 서식 지정으로 표시합니다(소수 또는 백분율 값 제외).
다른 빈 KPI 차트를 만듭니다. 다음 측정값을 추가합니다.
```
=Count({<Churned_predicted={"yes"}>}(Churned_predicted))
```
Churned_predicted 필드에 yes 값이 표시된 횟수를 계산하는 집합식입니다.
측정값에 이탈 예측이라는 레이블을 지정합니다.
첫 번째 KPI와 동일한 설정으로 차트의 숫자 서식 지정을 구성합니다.
세 번째 빈 KPI 차트를 만듭니다. 다음 측정값을 추가합니다.
```
=Count({<Churned_predicted={"no"}>}(Churned_predicted))
```
Churned_predicted 필드에 no 값이 표시된 횟수를 계산합니다.
측정값에 유지 예측이라는 레이블을 지정합니다.

히스토그램

히스토그램을 사용하여 예측 확률 값의 분포를 시각화할 수 있습니다.

히스토그램을 시트로 끌어서 제목을 지정합니다. Churned_yes를 차원으로 추가합니다.

누적 막대형 차트

계획 유형과 같은 범주형 필드별로 예측을 분석하기 위해 개별 집합 분석이 서로 쌓인 막대형 차트를 만들 수 있습니다.

다음과 같이 하십시오.

막대형 차트를 시트로 끌어서 제목을 계획 유형별 이탈 예측으로 지정합니다.
PlanType을 차원으로 추가합니다. 계획 유형이라는 레이블을 지정합니다.
다음 측정값을 추가합니다.
```
=Count({<Churned_predicted={"no"}>}(Churned_predicted))
```
측정값에 유지 예측이라는 레이블을 지정합니다.
다음 측정값을 추가합니다.
```
=Count({<Churned_predicted={"yes"}>}(Churned_predicted))
```
측정값에 이탈 예측이라는 레이블을 지정합니다.
모양 > 프레젠테이션, 레이아웃을 그룹화에서 누적으로 변경합니다.
스크롤바를 제거하고 값 레이블을 켜기로 설정합니다.
세그먼트 레이블 및 전체 레이블을 자동으로 구성합니다.

완료되면 동일한 두 측정값을 사용하지만 NumberOfPenalties와 같은 다른 범주형 차원을 사용하여 유사한 막대형 차트를 만들 수 있습니다.

개별 숫자 필드 값을 분석하기 위한 분포도

분포도는 다양한 숫자 값을 가진 측정값으로 예측 데이터를 표시하는 데 사용할 수 있습니다. 이 섹션에서는 고객의 서비스 등급에 대한 고유한 그룹화를 사용하여 기본 요금별로 이탈 예측을 표시하는 차트를 만듭니다.

다음과 같이 하십시오.

분포도를 시트로 끌어서 제목을 기본 요금 및 서비스 등급별로 이탈 예측으로 지정합니다.
포인트의 크기로 AccountID를 추가합니다.
x축에 다음 측정값을 추가합니다.
```
=Avg(BaseFee)
```
y축에 다음 계산 차원을 추가합니다.
```
=Round(ServiceRating,2)
```
그러면 대략적인 ServiceRating 값에 대한 y축을 따라 그룹화가 만들어집니다. 값이 높을수록 고객이 서비스 품질을 높게 평가한 것입니다.
모양 > 프레젠테이션, 거품 크기를 20으로 줄이고 지터 포인트를 켭니다.
색 및 범례에서 색을 사용자 지정으로 설정합니다.
다음 차원을 기준으로 데이터 색을 지정하는 옵션을 선택합니다.
```
=Churned_predicted
```
그러면 Churned_predicted 필드의 각 값에 하나의 색이 할당됩니다. 이 경우 두 가지 색이 표시됩니다.
차원 및 측정값에 레이블을 추가하고 사용자 지정 색 설정에 이탈 예측 레이블을 추가합니다.

BaseFee 측정값 대신 다른 필드 집계를 대체하여 다양한 숫자 필드 분석을 위해 유사한 차트를 만들 수 있습니다.

아래 이미지와 유사하게 보이도록 시트의 시각화를 구성합니다.

예측 데이터 분석을 위한 차트 개체가 있는 예측 대시보드입니다. — 예측 분석 시트

두 번째 시트: 집계된 SHAP 대시보드

다음으로, 집계된 SHAP 값 분석 전용 시트를 만듭니다.

다음과 같이 하십시오.

새 시트를 만들고 고급 편집 모드를 엽니다.
시트에 제목을 지정합니다(예: 집계된 SHAP).

SHAP importance 순위

이 유형의 차트는 실험 버전을 구성할 때 볼 수 있는 자동 생성 차트와 유사합니다. 여기에서는 예측 데이터 집합에 대해 하나를 만듭니다.

이 유형의 차트의 목적은 Churned 열에 표시되는 결과에 가장 많이 기여하는 기능을 표시하는 것입니다. 절대값을 사용하므로 SHAP 결과는 양수(yes 값) 또는 음수(no 값)일 수 있습니다. 원하는 경우 절대값을 계산하지 않는 표현식을 사용할 수도 있습니다.

다음과 같이 하십시오.

막대형 차트를 빈 시트로 끕니다.
기능별 SHAP importance 차트의 제목을 지정합니다.
automl_feature를 차원으로 추가하고 기능 레이블을 지정합니다.

이를 통해 포함된 모든 기능에 대해 집계된 데이터를 표시할 수 있습니다.
다음 계산된 측정값을 추가합니다.
```
=fabs(Avg(SHAP_value))
```
레이블 아래에 평균 절대 SHAP를 입력합니다.
속성 패널에서 모양 > 프레젠테이션, 스크롤바가 있는 경우 제거하고 차트 방향을 세로에서 가로로 설정합니다.
아직 수행하지 않은 경우 정렬에서 차원 위로 측정값을 끕니다. 각 입력란의 정렬은 자동으로 둡니다.

내림차순 패턴으로 측정값을 기준으로 차트를 정렬합니다.

격자 울타리 컨테이너

격자 울타리 컨테이너를 만들어 차원 내의 특정 필드 값에 대한 데이터를 필터링할 수 있습니다. 이 경우 고객에게 제공되는 4가지 계획 유형 각각에 대해 SHAP 값을 분류할 수 있습니다.

격자 개체를 만들려면 차원 및 마스터 시각화를 지정해야 합니다. 방금 만든 SHAP importance 순위를 마스터 시각화로 변환합니다.

다음과 같이 하십시오.

시트에서 평균 절대 SHAP 차트를 마우스 오른쪽 버튼으로 클릭한 후 마스터 항목에 추가를 선택합니다.
기본 이름을 유지하고 추가를 클릭합니다.
자산 패널의 사용자 지정 개체 > Qlik Visualization bundle에서 격자 울타리 컨테이너를 시트로 끌어서 놓습니다.
PlanType을 차원으로 추가합니다.
차트 내에서 마스터 시각화 추가를 클릭한 다음 평균 절대 SHAP 차트를 추가합니다.
모양 > 속성 패널의 일반에서 제목 표시를 켜고 차트 제목을 계획 유형별 SHAP importance로 지정합니다.
격자 울타리 컨테이너의 크기를 조정하여 차트에 기능 이름을 표시할 수 있을 만큼 충분히 넓습니다. 모든 레이블이 표시되지 않으면 브라우저 창에서 확대/축소를 조정합니다.

또는 분석하려는 각 차원 값에 대해 설정된 표현식을 사용하여 개별 차트를 만들어 이 데이터를 표시할 수 있습니다. 이 경우 네 가지 계획 유형 각각에 대해 별도의 차트를 만들 수 있습니다.

필터 창 재사용

첫 번째 시트에서 만든 필터 창을 이 시트에서 다시 사용할 수 있습니다. 고급 편집 모드에서 필터 창을 마우스 오른쪽 버튼으로 클릭하고 복사합니다. 이를 집계된 SHAP 시트에 붙여넣습니다.

트리 맵

트리 맵을 사용하여 SHAP 값의 분할을 시각화할 수도 있습니다. 트리 맵을 시트로 끌어서 SHAP importance 순위에 사용한 것과 동일한 차원 및 측정값을 추가합니다.

아래 이미지와 유사하게 보이도록 시트의 시각화를 구성합니다.

다양한 SHAP 기반 시각화를 보여 주는 소비 모드의 전체 시트입니다. — 분석 모드의 집계된 SHAP 시트

앱 사용

앱 구축이 완료되면 데이터 분석에 사용할 수 있습니다.

분석 모드로 전환하려면 시트 편집을 클릭하십시오. 이 보기에서는 필터 창이나 시트의 다른 위치에서 항목을 선택하여 데이터 하위 집합에 대한 특정 분석을 위해 데이터를 필터링할 수 있습니다. 예를 들어, 특정 고객 계획 유형이나 지역을 분석하고 결과를 다른 데이터 하위 집합과 비교할 수 있습니다.

감사합니다.

이 자습서의 끝에 도달하였습니다. 자동화된 기계 학습이 예측 모델을 생성하는 빠르고 쉬운 방법임을 깨닫고 몇 가지 사항을 배웠기를 바랍니다. Qlik Sense는 예측 데이터를 쉽게 시각화하고 데이터에 의미 있는 통찰력을 제공하는 강력한 도구입니다.

이 페이지가 도움이 되었습니까?

이 페이지 또는 해당 콘텐츠에서 오타, 누락된 단계 또는 기술적 오류와 같은 문제를 발견하면 알려 주십시오!

여기에 피드백을 남겨주십시오.