Qlik Sense 앱에서 예측 데이터 시각화하기 | Qlik Cloud 도움말
기본 콘텐츠로 건너뛰기 보완적인 콘텐츠로 건너뛰기

Qlik Sense 앱에서 예측 데이터 시각화하기

이 과정의 마지막 단계는 생성한 예측 데이터를 시각화하기 위해 Qlik Sense 분석 앱을 만드는 것입니다.

대체 워크플로우: 사전 구성된 앱 업로드

이 항목의 나머지 단계를 따르는 대신, 이 튜토리얼 시작 부분에서 다운로드한 Customer churn predictions.qvf 앱을 분석 활동 센터에 업로드할 수 있습니다.

이 페이지의 나머지 섹션에서는 유사한 앱을 만드는 과정을 안내합니다. 앱의 예측 데이터와 사용자의 예측 데이터 간에는 약간의 차이가 있을 수 있습니다.

다운로드 가능한 앱에는 Individual Customer Analysis라는 추가 시트가 포함되어 있으며, 이 시트는 조건식을 사용하여 한 번에 하나의 고객 계정에 대한 세분화된 분석을 수행하도록 합니다.

시작하기

분석 활동 센터에서 만들기 페이지로 이동하여 을 클릭합니다. 앱을 위한 공간을 선택하고 이름을 Customer churn predictions로 지정합니다.

만들기를 클릭합니다.

정보 메모터치스크린 장치를 사용하거나 터치 지원이 켜져 있는 경우 앱과 상호 작용하는 방식이 다릅니다. 자세한 내용은 터치 장치의 길게 누름 메뉴를 참조하십시오.

데이터 모델 만들기

데이터 선택

앱에 필요한 데이터를 추가해야 합니다. 여기에는 적용 데이터 세트(튜토리얼 시작 시 업로드됨)와 예측에서 생성된 두 개의 데이터 세트가 포함됩니다.

  1. 새 앱에서 클릭하여 데이터 카탈로그에서 데이터를 추가합니다.

  2. 데이터 카탈로그에서 다음 세 가지 데이터 세트 옆의 확인란을 클릭합니다:

    • 적용 데이터 세트: ML - Churn data - apply.csv 또는 ML - Churn data - apply.qvd

    • 예측 데이터 세트: ML - Prediction output.parquet

    • 좌표 SHAP 데이터 세트: ML - Prediction output_Coordinate_SHAP.parquet

  3. 다음을 클릭합니다.

  4. 요약 패널이 나타납니다. ML - Churn data - apply 데이터 세트를 클릭하여 로드할 수 있는 필드를 확장합니다.

  5. 모델 학습 중에 선택 취소된 기능 옆의 십자 표시 아이콘을 클릭합니다. AccountID는 키 필드이므로 목록에 유지해야 합니다. 참조를 위해 생성한 예측 구성으로 돌아가서 모델과 적용 데이터 세트 스키마를 비교하십시오(일반적인 도움말은 예측 구성 편집을 참조하십시오.).

  6. 앱에 로드를 클릭합니다.

데이터 연결

이 시점에서 앱에 데이터를 추가했지만 데이터 세트를 함께 연결할 때까지 연결된 데이터 모델은 구성되지 않습니다. 이 경우 AccountID 필드가 데이터 세트를 연결하는 인덱스가 됩니다.

앱에서 데이터 관리자가 열립니다. 세 개의 데이터 세트가 보이지만 연결되지 않은 별도의 엔터티로 표시됩니다.

  1. 앱에서 데이터 관리자가 열립니다. 세 개의 데이터 세트가 보이지만 연결되지 않은 별도의 엔터티로 표시됩니다.

  2. 데이터 관리자의 오른쪽 창에서 AccountID 연결 제안을 찾습니다.

  3. 적용을 클릭합니다. 이제 테이블이 서로 연결되어야 합니다.

  4. 데이터 로드를 클릭합니다.

데이터 모델 뷰어에서 연결 확인

앱에서 시각화를 만들기 전에 데이터가 제대로 연결되었는지 확인해야 합니다.

  1. 인터페이스 상단의 탐색 모음에서 앱 탐색 메뉴를 열고 데이터 모델 뷰어를 선택합니다.

  2. 세 개의 데이터 세트가 제대로 연결되었는지 확인합니다. AccountID 필드가 세 데이터 세트 모두에서 키 역할을 해야 합니다. 앱의 데이터 모델은 다음 이미지와 같아야 합니다.

    예측 앱의 데이터 모델을 보여주는 데이터 모델 뷰어

    새로 만든 예측 앱의 데이터 모델이 올바르게 구성되었는지 확인합니다. 이 경우 세 개의 데이터 세트는 AccountID 필드를 사용하여 연결되어야 합니다.

이제 분석 콘텐츠를 만들 준비가 되었습니다. 탐색 모음의 분석 탭 내에서 시트를 클릭합니다.

첫 번째 시트: 집계된 예측 대시보드

첫 번째 시트는 집계된 형태의 예측 분석에 중점을 둡니다.

  1. 이제 시트 편집 모드에 있어야 합니다.

  2. 시트에서 기존 시각화를 마우스 오른쪽 버튼으로 클릭하고 삭제합니다. 이것은 이 튜토리얼에서 사용하지 않을 차트 제안 기능입니다.

  3. 시트에 제목을 지정합니다(예: Aggregated Predictions). 이렇게 하려면 빈 시트의 아무 곳이나 클릭하여 인터페이스 오른쪽에 시트 속성을 엽니다. 제목 아래에 시트 이름을 입력합니다.

원형 차트

원형 차트를 사용하면 데이터의 비례 분할을 쉽게 시각화할 수 있습니다. 이 경우 예측된 결과(yes 또는 no)별로 데이터를 분할하는 것이 좋습니다.

  1. 원형 차트를 시트로 드래그합니다.

  2. Churned_predicted를 차원으로 추가합니다.

  3. 다음 측정값을 추가합니다:

    Count(AccountID)
  4. 원하는 경우 속성 패널의 모양 > 프레젠테이션 아래에서 차원 레이블을 끕니다.

  5. 속성 패널의 데이터 아래에서 차원을 확장하고 차원의 레이블Predicted to Churn으로 수정합니다.

    범례에서 레이블이 업데이트됩니다.

필터 창

이 대시보드는 전체 데이터 모델에 대한 광범위한 분석을 위한 것입니다. 그러나 특정 코호트를 분석하기 위해 다양한 차원에서 데이터를 빠르게 필터링할 수 있는 기능은 거의 확실히 중요할 것입니다.

여러 목록 상자가 있는 필터 창을 만듭니다. 각 목록 상자를 사용하면 단일 차원 내에서 값을 선택할 수 있습니다.

  1. 필터 창을 시트로 드래그합니다.

  2. 필터 창에 필드를 추가합니다. 이는 예측 결과에 중요할 것으로 예상되는 차원일 수 있습니다.

  3. 속성 패널의 데이터 아래에서 필드를 클릭하여 필요에 따라 각 목록 상자를 수정합니다. 그러면 목록 상자 속성이 열립니다.

    예를 들어 필드 레이블을 변경하고 시트 공간을 절약하기 위해 목록 상자 축소항상으로 설정할 수 있습니다.

필터 창이 시트의 한쪽에 패널로 나타나도록 크기를 조정합니다.

KPI 개체

KPI는 데이터의 특히 중요한 분석을 위해 단일 값을 표시하는 좋은 방법입니다. 여기서는 세 개의 KPI 차트를 만듭니다.

  1. 빈 KPI 차트를 만듭니다. 다음 측정값을 추가합니다:

    =Count(Churned_predicted)

    이것은 이탈 예측을 생성한 총 고객 수를 계산합니다.

  2. 측정값 레이블을 Total # of Customers로 지정합니다.

  3. 숫자 서식숫자로 설정하고 1,000 형식(소수점이나 백분율 값 없음)으로 값을 표시합니다.

  4. 다른 빈 KPI 차트를 만듭니다. 다음 측정값을 추가합니다:

    =Count({<Churned_predicted={"yes"}>}(Churned_predicted))

    이것은 Churned_predicted 필드에 yes 값이 표시된 횟수를 계산하는 집합 식입니다.

  5. 측정값 레이블을 Predicted to Churn으로 지정합니다.

  6. 첫 번째 KPI와 동일한 설정으로 차트의 숫자 서식을 구성합니다.

  7. 세 번째 빈 KPI 차트를 만듭니다. 다음 측정값을 추가합니다:

    =Count({<Churned_predicted={"no"}>}(Churned_predicted))

    이것은 Churned_predicted 필드에 no 값이 표시된 횟수를 계산합니다.

  8. 측정값 레이블을 Predicted to Stay로 지정합니다.

히스토그램

히스토그램으로 예측 확률 값의 분포를 시각화할 수 있습니다.

히스토그램을 시트로 드래그하고 제목을 지정합니다. Churned_yes를 차원으로 추가합니다.

누적 막대형 차트

요금제 유형과 같은 범주형 필드별로 예측을 분석하려면 개별 집합 분석이 서로 위에 누적된 막대형 차트를 만들 수 있습니다.

  1. 막대형 차트를 시트로 드래그하고 제목을 Churn Predictions by Plan Type으로 지정합니다.

  2. PlanType을 차원으로 추가합니다. 레이블을 Plan Type으로 지정합니다.

  3. 다음 측정값을 추가합니다:

    =Count({<Churned_predicted={"no"}>}(Churned_predicted))

    측정값 레이블을 Predicted to Stay로 지정합니다.

  4. 다음 측정값을 추가합니다:

    =Count({<Churned_predicted={"yes"}>}(Churned_predicted))

    측정값 레이블을 Predicted to Churn으로 지정합니다.

  5. 모양 > 프레젠테이션 아래에서 레이아웃을 그룹화에서 누적으로 변경합니다.

  6. 스크롤 막대를 제거하고 값 레이블켜기로 설정합니다.

  7. 세그먼트 레이블합계 레이블자동으로 구성합니다.

완료되면 동일한 두 측정값을 사용하되 NumberOfPenalties와 같은 다른 범주형 차원을 사용하여 유사한 막대형 차트를 만들 수 있습니다.

개별 숫자 필드 값을 분석하기 위한 분포도

분포도를 사용하여 다양한 숫자 값이 있는 측정값별로 예측 데이터를 표시할 수 있습니다. 이 섹션에서는 고객의 서비스 등급에 대한 별도의 그룹화와 함께 기본 요금별 이탈 예측을 표시하는 차트를 만듭니다.

  1. 분포도를 시트로 드래그하고 제목을 Churn Predictions by Base Fee and Service Rating으로 지정합니다.

  2. AccountID를 포인트 차원으로 추가합니다.

  3. x축에 다음 측정값을 추가합니다:

    =Avg(BaseFee)
  4. y축에 다음 계산 차원을 추가합니다:

    =Round(ServiceRating,2)

    이것은 대략적인 ServiceRating 값에 대해 y축을 따라 그룹화를 만듭니다. 값이 높을수록 고객이 서비스 품질을 더 높게 평가한 것입니다.

  5. 모양 > 프레젠테이션 아래에서 버블 크기를 20으로 줄이고 지터 포인트를 켭니다.

  6. 색상 및 범례에서 색상사용자 지정으로 설정합니다.

  7. 다음 차원별로 데이터 색상을 지정하는 옵션을 선택합니다:

    =Churned_predicted

    이렇게 하면 Churned_predicted 필드의 각 값에 대해 하나의 색상이 할당됩니다. 이 경우 두 가지 색상이 표시됩니다.

  8. 차원과 측정값에 레이블을 추가하고 사용자 지정 색상 설정에 다음 레이블을 추가합니다: Predicted to Churn.

유사한 차트를 만들어 BaseFee 측정값 대신 다른 필드 집계를 사용하여 다양한 숫자 필드를 분석할 수 있습니다.

시트의 시각화를 아래 이미지와 비슷하게 구성합니다.

예측 분석 시트

예측 데이터를 분석하기 위한 차트 개체가 있는 예측 대시보드.

두 번째 시트: 집계된 SHAP 대시보드

다음으로 집계된 SHAP 값을 분석하기 위한 전용 시트를 만듭니다.

  1. 새 시트를 만듭니다.

  2. 시트에 제목을 지정합니다(예: Aggregated SHAP).

SHAP 중요도 순위

이 유형의 차트는 실험 버전을 구성할 때 보았을 수 있는 자동 생성된 차트와 유사합니다. 여기서는 예측된 데이터 세트에 대해 하나를 만듭니다.

이 유형의 차트 목적은 Churned 열에서 볼 수 있는 결과에 가장 많이 기여하는 기능을 보여주는 것입니다. 절대값을 사용할 것이므로 SHAP 결과는 양수(yes 값) 또는 음수(no 값)일 수 있음을 유의해야 합니다. 원하는 경우 절대값을 계산하지 않는 식을 사용할 수도 있습니다.

  1. 막대형 차트를 빈 시트로 드래그합니다.

  2. 차트 제목을 SHAP Importance by Feature로 지정합니다.

  3. automl_feature를 차원으로 추가하고 레이블을 Feature로 지정합니다.

    이를 통해 포함된 모든 기능에 걸쳐 집계된 데이터를 표시할 수 있습니다.

  4. 다음 계산 측정값을 추가합니다:

    =fabs(Avg(SHAP_value))
  5. 레이블 아래에 Average Absolute SHAP을 입력합니다.

  6. 속성 패널의 모양 > 프레젠테이션 아래에서 스크롤 막대가 있으면 제거하고 차트 방향을 세로에서 가로로 설정합니다.

  7. 정렬 아래에서 아직 수행하지 않았다면 측정값을 차원 위로 드래그합니다. 각 필드의 정렬은 자동으로 둡니다.

    이렇게 하면 측정값에 따라 내림차순으로 차트가 정렬됩니다.

격자 울타리 컨테이너

격자 울타리 컨테이너를 만들어 차원 내의 특정 필드 값에 대한 데이터를 필터링할 수 있습니다. 이 경우 고객에게 제공되는 4가지 요금제 유형 각각에 대한 SHAP 값을 분할할 수 있습니다.

격자 울타리 개체를 만들려면 차원과 마스터 시각화를 지정해야 합니다. 방금 만든 SHAP 중요도 순위를 마스터 시각화로 변환합니다.

  1. 시트에서 Average Absolute SHAP 차트를 마우스 오른쪽 버튼으로 클릭한 다음 연결된 개체 마스터 항목에 추가를 선택합니다.
  2. 기본 이름을 유지하고 추가를 클릭합니다.
  3. 자산 패널의 사용자 지정 개체 > Qlik Visualization bundle 아래에서 격자 울타리 컨테이너를 시트로 드래그합니다.

  4. PlanType을 차원으로 추가합니다.

  5. 차트 내부의 마스터 시각화 추가를 클릭한 다음 Average Absolute SHAP 차트를 추가합니다.

  6. 속성 패널의 모양 > 일반 아래에서 제목 표시를 켜고 차트 제목을 SHAP Importance by Plan Type으로 지정합니다.

  7. 차트의 기능 이름을 표시할 수 있을 만큼 넓게 격자 울타리 컨테이너의 크기를 조정합니다. 모든 레이블이 표시되지 않으면 브라우저 창에서 확대/축소를 조정합니다.

또는 분석하려는 각 차원 값에 대한 집합 식이 포함된 개별 차트를 만들어 이 데이터를 표시할 수도 있습니다. 이 경우 4가지 요금제 유형 각각에 대해 별도의 차트를 만들 수 있습니다.

필터 창 재사용

첫 번째 시트에서 만든 필터 창을 이 시트에서 재사용할 수 있습니다. 시트 편집 모드에서 필터 창을 마우스 오른쪽 버튼으로 클릭하고 복사합니다. Aggregated SHAP 시트에 붙여넣습니다.

트리맵

트리맵으로 SHAP 값의 분할을 시각화할 수도 있습니다. 트리맵을 시트로 드래그하고 SHAP 중요도 순위에서 사용한 것과 동일한 차원과 측정값을 추가합니다.

시트의 시각화를 아래 이미지와 비슷하게 구성합니다.

분석 모드의 Aggregated SHAP 시트

다양한 SHAP 기반 시각화를 보여주는 소비 모드의 전체 시트.

앱 사용

앱 빌드를 완료하면 데이터 분석에 사용할 준비가 된 것입니다.

시트 편집을 클릭하여 분석 모드로 전환합니다. 이 보기에서 선택 항목(필터 창 또는 시트의 다른 곳)을 만들어 데이터 하위 집합의 특정 분석을 위해 데이터를 필터링할 수 있습니다. 예를 들어 특정 고객 요금제 유형이나 지역을 분석하고 결과를 다른 데이터 하위 집합과 비교할 수 있습니다.

감사합니다!

이 튜토리얼의 끝에 도달했습니다. 몇 가지를 배우고 자동화된 머신 러닝이 예측 모델을 생성하는 빠르고 쉬운 방법임을 깨달으셨기를 바랍니다. Qlik Sense는 예측 데이터를 쉽게 시각화하고 데이터에 대한 의미 있는 통찰력을 제공하는 강력한 도구입니다.

이 페이지가 도움이 되었습니까?

이 페이지 또는 해당 콘텐츠에서 오타, 누락된 단계 또는 기술적 오류와 같은 문제를 발견하면 알려 주십시오!