기본 콘텐츠로 건너뛰기 보완적인 콘텐츠로 건너뛰기

Qlik Sense 예측 앱 설정

프로세스의 마지막 단계는 만든 예측 데이터를 시각화하기 위해 Qlik Sense 분석 앱을 만드는 것입니다.

Qlik Cloud 분석 허브에서 새로 추가 > 분석 앱을 클릭합니다. 앱 공간을 선택하고 이름을 Customer churn predictions로 지정합니다.

만들기를 클릭합니다.

정보 메모터치 스크린 장치를 사용하거나 터치 지원이 켜져 있는 경우 앱과 상호 작용하는 방식이 다릅니다. 자세한 내용은 터치 장치의 길게 누름 메뉴을 참조하십시오.

데이터 가져오기

새 앱에서 클릭하여 데이터 카탈로그의 데이터를 추가합니다.

다음 데이터 집합을 앱으로 가져옵니다.

  • 데이터 집합 적용: Customer churn data - apply.csv

  • 예측 데이터 집합: Customer churn data - apply_Prediction.csv

  • SHAP 데이터 집합 조정: Customer churn data - apply_Prediction_Coordinate_SHAP.csv

적용 데이터 집합은 자습서 시작 시 업로드되었습니다. 다른 두 데이터 집합은 예측 실행 중에 만들어졌습니다.

메시지가 표시되면 권장 연결을 사용하여 앱의 데이터를 연결합니다. 이 경우 AccountID 필드는 데이터 집합을 함께 연결하는 인덱스가 됩니다.

이 작업이 완료되면 데이터를 앱에 추가할 준비가 된 것입니다.

데이터 로드를 클릭합니다.

데이터 모델 검토

앱에서 시각화를 구축하기 전에 데이터 모델 뷰어를 열고 세 개의 데이터 집합이 제대로 연결되었는지 확인합니다. AccountID 필드는 세 데이터 집합 모두에서 키 역할을 해야 합니다. 앱의 데이터 모델은 아래 이미지와 같아야 합니다.

예측 앱의 데이터 모델을 보여 주는 데이터 모델 뷰어

새로 만든 예측 앱의 데이터 모델이 올바르게 구성되었는지 확인합니다.

데이터 시각화

예측 앱을 구성하는 방법에는 여러 가지가 있습니다. 여기에서는 SHAP 값(예측 영향 요인)을 표시하는 시트 하나와 예측을 표시하는 시트를 하나 만듭니다.

첫 번째 시트: SHAP 기능 중요성 차트

먼저 SHAP 값을 다양한 배열로 분석하는 전용 시트를 만듭니다.

  1. 새 시트를 만들고 시트 편집을 클릭합니다.

  2. 예를 들어, SHAP Analysis와 같이 시트에 제목을 지정합니다.
  3. 고급 옵션을 켜고 시트 캔버스에서 빈 제안 차트 개체를 삭제합니다.

이제 시각화 만들기를 시작할 준비가 되었습니다.

SHAP importance 순위

이 유형의 차트는 실험 버전을 구성할 때 볼 수 있는 자동 생성 차트와 유사합니다. 여기에서는 예측 데이터 집합에 대해 하나를 만듭니다.

이 유형의 차트의 목적은 Churned 열에 표시되는 결과에 가장 많이 기여하는 기능을 표시하는 것입니다. 절대값을 사용하므로 SHAP 결과는 양수( 값) 또는 음수(아니요 값)일 수 있습니다.

  1. 시트의 자산 패널에서 막대형 차트를 빈 시트로 끕니다.

  2. 차트 제목을 SHAP importance 순위로 지정합니다.

  3. automl_feature를 차원으로 추가하고 Feature라는 레이블을 지정합니다.

    이를 통해 포함된 모든 기능에 대해 집계된 데이터를 표시할 수 있습니다.

  4. 다음 계산된 측정값을 추가합니다.

    =fabs(Avg(SHAP_value))

  5. 레이블 아래에 Average SHAP Value를 입력합니다.

  6. 속성 패널에서 모양 > 프레젠테이션, 스크롤바가 있는 경우 제거하고 차트 방향을 세로에서 가로로 설정합니다.

  7. 아직 수행하지 않은 경우 정렬에서 차원 위로 측정값을 끕니다. 각 입력란의 정렬은 자동으로 둡니다.

    내림차순 패턴으로 측정값을 기준으로 차트를 정렬합니다.

이탈 결과에 가장 중요한 영향을 미치는 요소를 표시하는 차트

SHAP 값은 막대형 차트에서 순위가 지정됩니다.

격자 울타리 컨테이너

격자 울타리 컨테이너를 만들어 차원 내의 특정 필드 값에 대한 데이터를 필터링할 수 있습니다. 이 경우 고객에게 제공되는 4가지 계획 유형 각각에 대해 SHAP 값을 분류할 수 있습니다.

격자 개체를 만들려면 차원 및 마스터 시각화를 지정해야 합니다. 방금 만든 SHAP importance 순위를 마스터 시각화로 변환합니다.

  1. 시트에서 SHAP importance 순위 차트를 마우스 오른쪽 버튼으로 클릭한 다음 연결된 개체 마스터 항목에 추가를 선택합니다.
  2. 기본 이름을 유지하고 추가를 클릭합니다.
  3. 사용자 지정 개체 > 자산 패널의 Qlik 시각화 번들에서 격자 울타리 컨테이너를 시트로 끕니다.

  4. PlanType을 차원으로 추가합니다.

  5. 차트 내에서 마스터 시각화 추가를 클릭한 다음 SHAP importance 순위 차트를 추가합니다.

  6. 모양 > 속성 패널의 일반에서 제목 표시를 켜고 차트 제목을 계획 유형별 SHAP importance로 지정합니다.

  7. 격자 울타리 컨테이너의 크기를 조정하여 차트에 기능 이름을 표시할 수 있을 만큼 충분히 넓습니다. 모든 레이블이 표시되지 않으면 브라우저 창에서 확대/축소를 조정합니다.

계획 유형별로 이탈 결과에 가장 중요한 영향을 미치는 요소를 표시하는 차트

각 고객 계획 유형에 대해 순위가 매겨진 SHAP 값을 보여 주는 격자 울타리 컨테이너입니다.

또는 분석하려는 각 차원 값에 대해 설정된 표현식을 사용하여 개별 차트를 만들어 이 데이터를 표시할 수 있습니다. 이 경우 네 가지 계획 유형 각각에 대해 별도의 차트를 만들 수 있습니다.

개별 고객 SHAP 분석

집합 분석을 사용하여 특정 계정 ID에 대한 기능 중요성 순위를 만들 수 있습니다. 이 예에서는 이탈할 것으로 예상되는 고객에 대한 차트 하나와 이탈하지 않을 것으로 예상되는 고객에 대한 차트 하나를 만듭니다.

이 연습에서는 이탈할 것으로 예측되는 고객 한 명과 이탈하지 않을 것으로 예측되는 고객 한 명에 대한 계정 ID 예가 필요합니다.

  1. 탐색 메뉴의 준비에서 데이터 관리자로 전환합니다.

  2. 페이지 하단의 데이터 미리 보기 테이블의 Customer churn data - apply_Prediction.AccountID 필드에서 Churned_predicted 필드의 '예' 값에 해당하는 값을 찾습니다. . 별도의 텍스트 편집기에서 값을 기록해 둡니다.

  3. Customer churn data - apply_Prediction.AccountID 필드에서 Churned_predicted 필드의 '아니요' 값과 일치하는 값을 찾습니다. 별도의 텍스트 편집기에서 값을 기록해 둡니다.

먼저 예측 데이터 집합의 Churned 필드에 예 값이 할당된 고객에 대한 차트를 만듭니다.

  1. 자산 패널에서 막대형 차트를 시트로 끕니다.

  2. 차트 제목을 이탈할 것으로 예측되는 고객에 대한 SHAP importance로 지정합니다.

  3. automl_feature를 차원으로 추가하고 Feature라는 레이블을 지정합니다.

  4. 다음 계산된 측정값을 추가합니다.

    =Sum({<AccountID={""}>}(SHAP_value))

    괄호 사이에 이전 절차에서 이탈할 것으로 예측되는 고객의 계정 ID 값을 붙여넣습니다.

    이 집합 표현식은 분석을 필터링하여 지정된 계정 ID를 가진 고객의 예측 영향 요인만 표시합니다.

  5. 측정값에 평균 SHAP 값이라는 레이블을 지정합니다.

  6. 속성 패널에서 모양 > 프레젠테이션, 스크롤바가 있으면 제거하고 차트 방향을 세로에서 가로로 설정합니다.

  7. 모양 > 색 및 범례, 색 슬라이더를 자동에서 사용자 지정으로 조정합니다. 차트 측정값 기준에 색을 지정합니다.

    색 패턴을 선택하여 예측 결과에 양성 영향과 음성 영향을 미치는 기능 간의 대비를 명확하게 표시합니다.

  8. 범례 표시끄기로 설정합니다.

  9. 아직 수행하지 않은 경우 정렬에서 차원 위로 측정값을 끕니다. 각 입력란의 정렬은 자동으로 둡니다.

    내림차순 패턴으로 측정값을 기준으로 차트를 정렬합니다.

이탈할 것으로 예측되는 고객에 대해 이탈 결과에 가장 중요한 요인을 표시하는 차트

SHAP 값은 서비스를 취소할 것으로 예상되는 개별 고객에 대한 막대형 차트에 순위가 지정됩니다.

다음으로 예측 데이터 집합의 Churned 필드에 아니요 값이 할당된 고객에 대한 차트를 만듭니다.

  1. 자산 패널에서 막대형 차트를 시트로 끕니다.

  2. 차트 제목을 이탈하지 않을 것으로 예측되는 고객에 대한 SHAP importance로 지정합니다.

  3. automl_feature를 차원으로 추가하고 Feature라는 레이블을 지정합니다.

  4. 다음 계산된 측정값을 추가합니다.

    =Sum({<AccountID={""}>}(SHAP_value))

    괄호 사이에 이전 절차에서 이탈하지 않을 것으로 예측된 고객의 계정 ID 값을 붙여넣습니다.

    이 집합 표현식은 분석을 필터링하여 지정된 계정 ID를 가진 고객의 예측 영향 요인만 표시합니다.

  5. 측정값에 평균 SHAP 값이라는 레이블을 지정합니다.

  6. 속성 패널의 모양에서 스크롤바를 제거하고 차트 방향을 세로에서 가로로 설정합니다.

  7. 모양 > 색 및 범례, 사용자 지정측정값 기준으로 설정합니다.

    색 패턴을 선택하여 예측 결과에 양성 영향과 음성 영향을 미치는 기능 간의 대비를 명확하게 표시합니다.

  8. 범례 표시끄기로 설정합니다.

  9. 아직 수행하지 않은 경우 정렬에서 차원 위로 측정값을 끕니다. 각 입력란의 정렬은 자동으로 둡니다.

    내림차순 패턴으로 측정값을 기준으로 차트를 정렬합니다.

차트는 아래와 유사해야 합니다.

이탈하지 않을 것으로 예측되는 고객에 대해 이탈 결과에 가장 중요한 요인을 표시하는 차트

SHAP 값은 서비스를 유지할 것으로 예상되는 개별 고객에 대한 막대형 차트에 순위가 지정됩니다.

완성된 시트는 아래와 유사해야 합니다.

분석 모드의 SHAP 분석 시트

다양한 SHAP 기반 시각화를 보여 주는 소비 모드의 전체 시트입니다.

개별 고객에 대한 집합 분석의 또 다른 유용한 응용 프로그램은 개별 고객에 대한 예측의 빠른 필터링을 허용하는 변수 입력 컨트롤과 함께 표현식에 변수를 사용하는 것입니다.

두 번째 시트: 예측 대시보드

두 번째 시트는 각 고객의 실제 예측 값에 더 중점을 둡니다.

  1. 새 시트를 만들고 시트 편집을 클릭합니다.

  2. 예를 들어, 예측과 같이 시트에 제목을 지정합니다.

테이블

다음 두 차원을 사용하여 계정별 예측이라는 테이블을 만듭니다.

  • 계정 ID

  • Churned_predicted

각 열 헤더를 클릭하여 열의 제목을 계정 ID이탈 예측으로 변경합니다. 아래 이미지와 일치하도록 테이블 크기를 조정합니다.

계정 ID 조회를 위한 예측 테이블

계정 ID별 예측을 표시하는 테이블입니다.

이 테이블을 사용하면 개별 계정 ID에 대한 빠른 검색을 수행하고 선택한 고객이 이탈할 것으로 예상되는지 여부를 즉시 확인할 수 있습니다. 이 기능은 필터 창을 사용하여 만들 수도 있습니다.

KPI 개체

KPI는 특히 중요한 데이터 분석에 대한 단일 값을 표시하는 좋은 방법입니다. 여기서는 3개의 KPI 차트를 만듭니다.

  1. 빈 KPI 차트를 만듭니다. 다음 측정값을 추가합니다.

    =Count(Churned_predicted)

    이렇게 하면 이탈 예측을 생성한 총 고객 수가 계산됩니다.

  2. 측정값에 총 고객 수라는 레이블을 지정합니다.

  3. 숫자 서식 지정숫자로 설정하고 값을 1,000 서식 지정으로 표시합니다(소수 또는 백분율 값 제외).

  4. 다른 빈 KPI 차트를 만듭니다. 다음 측정값을 추가합니다.

    =Count({<Churned_predicted={"yes"}>}(Churned_predicted))

    Churned_predicted 필드에 값이 표시된 횟수를 계산하는 집합 표현식입니다.

  5. 측정값에 이탈 예측이라는 레이블을 지정합니다.

  6. 첫 번째 KPI와 동일한 설정으로 차트의 숫자 서식 지정을 구성합니다.

  7. 세 번째 빈 KPI 차트를 만듭니다. 다음 측정값을 추가합니다.

    =Count({<Churned_predicted={"no"}>}(Churned_predicted))

    Churned_predicted 필드에 아니요 값이 표시된 횟수를 계산합니다.

  8. 측정값에 유지 예측이라는 레이블을 지정합니다.

아래 이미지와 같이 보이도록 KPI의 크기를 조정하고 정렬합니다.

예측 메트릭을 표시하는 KPI 개체

예측 데이터를 표시하는 KPI 개체입니다.

계획 유형별 예측에 대한 누적 막대형 차트

계획 유형과 같은 범주형 필드별로 예측을 분석하기 위해 개별 집합 분석이 서로 쌓인 막대형 차트를 만들 수 있습니다.

  1. 막대형 차트를 시트로 드래그하고 제목을 계획 유형별 예측으로 지정합니다.

  2. PlanType을 차원으로 추가합니다. 계획 유형이라고 표시합니다.

  3. 다음 측정값을 추가합니다.

    =Count({<Churned_predicted={"no"}>}(Churned_predicted))

    측정값에 변동하지 않을 것으로 예측됨이라는 레이블을 지정합니다.

  4. 다음 측정값을 추가합니다.

    =Count({<Churned_predicted={"yes"}>}(Churned_predicted))

    측정값에 이탈 예측이라는 레이블을 지정합니다.

  5. 모양 > 프레젠테이션, 레이아웃을 그룹화에서 누적으로 변경합니다.

  6. 스크롤바를 제거하고 값 레이블켜기로 설정합니다.

  7. 세그먼트 레이블전체 레이블자동으로 구성합니다.

막대형 차트는 다음 이미지와 유사해야 합니다.

계획 유형별 예측에 대한 누적 막대형 차트

계획 유형별 예측에 대한 누적 막대형 차트입니다.

개별 숫자 필드 값을 분석하기 위한 분포도

분포도는 다양한 숫자 값을 가진 측정값으로 예측 데이터를 표시하는 데 사용할 수 있습니다. 이 섹션에서는 고객 재임 기간에 대한 고유한 그룹화와 함께 기본 요금별로 이탈 예측을 표시하는 차트를 만듭니다.

실험에서 CustomerTenure 필드를 제거했지만(따라서 예측 데이터에 포함되지 않음) 이 필드는 여전히 데이터 모델에 있으므로 차트에서 데이터를 정렬하는 데 사용할 수 있습니다.

  1. 분포도를 시트로 드래그하고 제목을 기본 요금 및 기간별 변동 예측으로 지정합니다.

  2. 포인트의 차원으로 AccountID를 추가합니다.

  3. x축에 다음 측정값을 추가합니다.

    =Avg(BaseFee)

  4. y축에 다음 계산 차원을 추가합니다.

    =Round(CustomerTenure,10)

    이렇게 하면 각 대략적인 고객 재임 기간 수준에 대해 y축을 따라 그룹화가 만들어집니다. 값이 높을수록 고객이 서비스를 시작한 이후의 시간이 길어집니다.

  5. 모양프레젠테이션, 거품 크기를 20으로 줄이고 지터 포인트를 켭니다.

  6. 색 및 범례에서 사용자 지정으로 설정합니다.

  7. 다음 차원을 기준으로 데이터 색을 지정하는 옵션을 선택합니다.

    =Churned_predicted

    이렇게 하면 Churned_predicted 필드의 각 값에 대해 하나의 색이 할당됩니다. 이 경우 두 가지 색이 표시됩니다.

  8. 사용자 지정 색 설정에 다음 레이블을 추가합니다. 이탈 예측.

분포도는 아래 이미지와 비슷합니다.

BaseFee 및 CustomerTenure에 의한 이탈 예측에 대한 분포도

BaseFee 및 CustomerTenure에 의한 이탈 예측에 대한 분포도입니다.

BaseFee 측정값 대신 다른 필드 집계를 대체하여 다양한 숫자 필드 분석을 위해 유사한 차트를 만들 수 있습니다.

아래 이미지와 유사하게 보이도록 시트의 시각화를 구성합니다.

예측 분석 시트

예측 데이터 분석을 위한 6개의 차트 개체가 있는 예측 대시보드입니다.

감사합니다.

이 자습서의 끝에 도달하였습니다. 자동화된 기계 학습이 예측 모델을 생성하는 빠르고 쉬운 방법임을 깨닫고 몇 가지 사항을 배웠기를 바랍니다. Qlik Sense는 예측 데이터를 쉽게 시각화하고 데이터에 의미 있는 통찰력을 제공하는 강력한 도구입니다.

이 페이지가 도움이 되었습니까?

이 페이지 또는 해당 콘텐츠에서 오타, 누락된 단계 또는 기술적 오류와 같은 문제를 발견하면 개선 방법을 알려 주십시오!