자습서 – Qlik AutoML을 사용하여 예측 앱 만들기
이 자습서에서는 Qlik AutoML을 사용하여 데이터를 분석하고 플랫폼에서 만들어진 예측 데이터를 시각화하는 앱을 만드는 방법을 알려 줍니다.
이진 분류 문제의 전형적인 예인 고객 이탈 시나리오를 고려할 것입니다. 목표는 고객이 구독을 취소할지 아니면 서비스 구독자로 남을지를 안정적으로 예측할 수 있도록 하는 것입니다. 이 유형의 문제에는 두 가지 결과만 있습니다. true 또는 false(이동 또는 이동되지 않음).
이 기계 학습 문제에 접근하기 위해 이미 결과를 알고 있는 일련의 데이터를 처리하여 시작한 다음 해당 데이터에서 만들어진 통계 모델링을 새로운 데이터 결과 예측에 적용합니다. 이것이 이 자습서에서 사용할 접근 방식입니다.
신뢰할 수 있고 정확한 모델을 만들려면 교육 데이터 집합에 유출 또는 "누설 기능"이 포함되어 있지 않은지 확인해야 합니다. 교육 데이터의 하나 이상의 기능을 사용하여 예측하려는 대상 변수를 파생시키거나 교육 데이터의 하나 이상의 기능에 예측 시 알려지지 않은 정보가 포함된 경우 데이터 유출이 발생합니다.
실험을 만들어 이 자습서를 시작합니다. 여기에서 실험을 구체화하고 기계 학습 모델로 배포합니다. 이 모델은 Qlik Sense 앱에서 시각화 형식으로 표시될 수 있는 예측을 만드는 데 사용됩니다.
학습 내용
이 자습서를 완료하면 실험 만들기 및 구성과 관련된 다양한 단계를 이해할 수 있습니다. 또한 모델 점수를 해석하는 방법도 알아봅니다. 마지막으로 기계 학습 모델을 배포할 수 있으며 예측 데이터를 사용하여 Qlik Cloud에서 인상적인 시각화를 생성하는 방법을 이해할 수 있습니다.
이 자습서의 대상
이 자습서는 Qlik Cloud에서 자동화된 기계 학습을 소개하려는 사용자를 위해 설계되었습니다.
준비 사항
다음 패키지를 다운로드하고 데스크톱에 패키지의 압축을 풉니다.
패키지에는 이 자습서를 완료하는 데 필요한 두 개의 데이터 파일이 포함되어 있습니다. 카탈로그에 데이터 파일을 업로드합니다.
'교육' 데이터 집합에는 갱신 기한이 지난 고객에 대한 정보가 포함되어 있으며, 서비스 구독을 취소하거나 유지하기로 결정했습니다.
'적용' 데이터 집합에는 갱신 날짜가 아직 지나지 않은 새로운 고객 집합에 대한 세부 정보가 포함되어 있습니다. 이 고객이 서비스를 취소할지 여부는 아직 확인되지 않았습니다. 이 자습서의 목표는 고객이 이탈할 가능성을 줄일 수 있다는 희망을 가지고 이 고객 집합이 무엇을 할지 예측하는 것입니다.
다음과 같이 하십시오.
-
Qlik Sense 허브를 엽니다.
-
새로 추가 > 데이터 집합을 클릭한 다음 데이터 파일 업로드를 선택합니다.
-
Customer churn data - training.csv 파일을 업로드 대화 상자로 끕니다.
-
그런 다음 Customer churn data - apply.csv 파일을 업로드 대화 상자로 끕니다.
-
공간을 선택합니다. 다른 사용자가 이 데이터에 액세스할 수 있도록 하려면 개인 공간 또는 공유 공간이 될 수 있습니다.
-
업로드를 클릭합니다.
데이터 집합이 업로드되었으므로 이제 실험 만들기를 진행할 수 있습니다.
이 자습서의 단원
이 자습서의 항목은 차례로 완료할 수 있도록 설계되었습니다. 그러나 중단했다가 언제든지 다시 돌아올 수 있습니다.
추가 자료 및 리소스
- Qlik에서는 보다 자세한 정보를 알아볼 수 있도록 다양한 리소스를 제공합니다.
- Qlik 온라인 도움말을 사용할 수 있습니다.
- Qlik Continuous Classroom에서 교육(무료 온라인 과정 포함)이 제공됩니다.
- Qlik Community에서 토론 포럼, 블로그 등을 찾을 수 있습니다.
사용자 의견
의견이 있으시면 피드백을 보내 주시기 바랍니다. 아래 섹션을 사용하시면 됩니다.