자습서 – 예측 데이터 생성 및 시각화
이 자습서에서는 Qlik AutoML을 사용하여 예측을 위한 기계 학습 모델을 학습하고 배포하는 방법을 설명합니다. 또한 Qlik Sense 앱에서 예측 데이터를 시각화하는 방법도 알려 줍니다.
이진 분류 문제의 전형적인 예인 고객 이탈 시나리오를 고려할 것입니다. 목표는 고객이 구독을 취소할지 아니면 서비스 구독자로 남을지를 안정적으로 예측할 수 있도록 하는 것입니다. 이 유형의 문제에는 두 가지 결과만 있습니다. true 또는 false(이동 또는 이동되지 않음).
이 기계 학습 문제에 접근하기 위해 이미 결과를 알고 있는 일련의 데이터를 처리하여 시작한 다음 해당 데이터에서 만들어진 통계 모델링을 새로운 데이터 결과 예측에 적용합니다.
실험을 만들어 이 자습서를 시작합니다. 여기에서 모델을 교육하고 그 중 하나를 ML 배포에 배포합니다. 이 ML 배포는 Qlik Sense 앱에서 시각화할 수 있는 예측을 만드는 데 사용됩니다.
학습 내용
이 자습서를 완료하면 실험 만들기 및 구성과 관련된 다양한 단계를 이해할 수 있습니다. 또한 모델 점수를 해석하는 방법도 알아봅니다. 마지막으로 기계 학습 모델을 배포할 수 있으며 예측 데이터를 사용하여 Qlik Cloud 분석에서 인상적인 Qlik Sense 시각화를 생성하는 방법을 이해할 수 있습니다.
이 자습서에서는 데이터 집합 및 교육 결과의 일반적인 문제를 식별하여 모델을 수동으로 반복하는 방법을 보여 줍니다. 기본적으로 Qlik AutoML은 지능형 모델 최적화를 통해 모델을 교육합니다. 지능형 최적화를 통해 교육 중에 자동적으로 구체화됩니다. 이렇게 하면 추가 반복을 최소화하면서 단일 버전 후에 모델을 배포할 준비가 될 가능성이 높아집니다. 지능형 최적화로 모델을 교육시키는 방법을 보여 주는 예는 예 – 자동화된 기계 학습을 사용한 학습 모델을 참조하십시오.
이 자습서의 대상
이 자습서는 Qlik Cloud 분석의 자동화된 기계 학습 및 데이터 시각화에 대한 소개를 원하는 사용자를 위해 제작되었습니다. 기계 학습과 Qlik Sense에 대한 기본 지식이 있으면 도움이 되지만 필수는 아닙니다.
이 자습서를 완료하려면 다음이 필요합니다.
-
전문가 또는 Full User 권한
-
Qlik Cloud 테넌트의 Automl Experiment Contributor 및 Automl Deployment Contributor 보안 역할
-
배포된 모델을 승인하기 위한 권한. 구체적으로 다음 중 하나가 필요합니다.
-
AutoML 모델 승인 또는 거부(사용자 권한)
-
AutoML 모델 승인 또는 거부(관리자 권한)
-
-
작업할 공간에서 필요한 공간 역할입니다. 참조: 공유 공간에서 권한 관리 및 관리되는 공간에서 권한 관리가 있는 차트의 속성 패널
ML 리소스를 보거나 만들 수 없다면 필요한 역할, 권한 또는 권한이 없다는 의미일 가능성이 높습니다. 자세한 내용은 테넌트 관리자에게 문의하십시오.
자세한 내용은 Qlik AutoML을 사용할 수 있는 사용자를 참조하십시오.
준비 사항
먼저, 아래 링크된 자습서 자료를 다운로드해야 합니다. CSV와 QVD 워크플로 중에서 선택합니다. 사전 구성된 앱을 다운로드하는 것은 선택 사항입니다.
원하는 자료를 다운로드한 후 데스크톱에 압축을 해제합니다.
-
AutoMLTutorialDatasetsCSV: Contains tutorial data in CSV format. This option is easier for getting started quickly.
-
AutoMLTutorialDatasetsQVF: QVD를 만들기 위해 실행할 수 있는 .qvf 스크립트 형식의 자습서 데이터가 포함되어 있습니다. 이 옵션은 CSV보다 시간이 조금 더 걸리지만 Qlik 데이터 형식 및 스크립트 작업을 소개하는 데 도움이 됩니다.
-
AutoMLTutorialPreConfiguredApp: 이 항목은 선택 사항입니다. 이는 자습서 중에 빌드할 Qlik Sense 앱의 샘플 복사본입니다. 이를 통해 교육 및 배포 단계를 건너뛰고 예측 앱 개발에 대한 더 빠른 실습 환경을 얻을 수 있습니다.
자세한 내용은 대체 워크플로: 사전 구성된 앱 업로드을 참조하십시오.
교육 데이터 집합에는 갱신 기한이 지난 고객에 대한 정보가 포함되어 있으며, 서비스 구독을 취소하거나 유지하기로 결정했습니다.
적용 데이터 집합에는 갱신 날짜가 아직 지나지 않은 새로운 고객 집합에 대한 세부 정보가 포함되어 있습니다. 이 고객이 서비스를 취소할지 여부는 아직 확인되지 않았습니다. 이 자습서의 목표는 고객이 이탈할 가능성을 줄일 수 있다는 희망을 가지고 이 고객 집합이 무엇을 할지 예측하는 것입니다.
옵션 1: AutoML 자습서 데이터 집합(CSV)
다음과 같이 하십시오.
분석 활동 센터를 엽니다.
만들기 페이지로 이동하여 데이터 집합을 선택한 다음 데이터 파일 업로드를 선택합니다.
AutoML Tutorial - Churn data - training.csv 파일을 업로드 대화 상자로 끕니다.
다음으로 AutoML Tutorial - Churn data - apply.csv 파일을 업로드 대화 상자로 끕니다.
공간을 선택합니다. 다른 사용자가 이 데이터에 액세스할 수 있도록 하려면 개인 공간 또는 공유 공간이 될 수 있습니다.
업로드를 클릭합니다.
데이터 집합이 업로드되었으므로 이제 실험 만들기를 진행할 수 있습니다.
옵션 2: AutoML 자습서 데이터 집합(QVD)
다음과 같이 하십시오.
분석 활동 센터를 엽니다.
만들기 페이지로 이동하여 업로드를 선택한 다음 스크립트를 선택합니다.
다음 파일을 업로드 대화 상자로 끕니다.
AutoML Tutorial - Churn data - training.qvf
AutoML Tutorial - Churn data - apply.qvf
공간을 선택합니다. 다른 사용자가 이 데이터에 액세스할 수 있도록 하려면 개인 공간 또는 공유 공간이 될 수 있습니다.
업로드를 클릭합니다.
업로드된 각 스크립트에 대해 다음을 수행합니다.
스크립트를 열고 편집기 탭으로 전환합니다.
편집기에서 데이터 내보내기를 클릭합니다.
QVD 데이터 집합은 스크립트를 업로드한 동일한 공간에 만들어집니다.
이제 데이터 집합이 만들어졌으므로 실험 만들기를 진행할 수 있습니다.
이 자습서의 단원
이 자습서의 항목은 차례로 완료할 수 있도록 설계되었습니다. 그러나 중단했다가 언제든지 다시 돌아올 수 있습니다.
추가 자료 및 리소스
- Qlik에서는 보다 자세한 정보를 알아볼 수 있도록 다양한 리소스를 제공합니다.
- Qlik 온라인 도움말을 사용할 수 있습니다.
- Qlik Continuous Classroom에서 교육(무료 온라인 과정 포함)이 제공됩니다.
- Qlik Community에서 토론 포럼, 블로그 등을 찾을 수 있습니다.
사용자 의견
의견이 있으시면 피드백을 보내 주시기 바랍니다. 아래 섹션을 사용하시면 됩니다.