실험 만들기 및 구성
첫 번째 단계는 실험을 만들고 구성하는 것입니다. 예측을 위해 배포할 준비가 될 때까지 이전에 업로드한 교육 데이터 집합을 사용하여 모델을 교육합니다.
새 실험 만들기
다음과 같이 하십시오.
-
Qlik Cloud 분석 허브에서 새로 추가를 클릭한 다음 새 ML 실험을 선택합니다.
-
실험 이름을 입력합니다(예: 고객 이탈 자습서).
-
필요에 따라 설명과 태그를 추가합니다.
-
실험을 위한 공간을 선택합니다. 개인 공간이 될 수도 있고 공유 공간이 될 수도 있습니다.
-
만들기를 클릭합니다.
-
Customer churn data - training.csv 파일을 선택합니다.
데이터 검토
이제 실험 구성을 시작할 준비가 되었습니다. 시작하기 전에 데이터 집합을 살펴보겠습니다.
스키마 보기에서 시작합니다. 여기에서 각 행이 데이터 집합의 열을 나타내는 테이블을 볼 수 있습니다. 자동 데이터 준비에서 통계 및 통찰력이 생성되었습니다. 통찰력을 보려면 스키마의 오른쪽으로 스크롤해야 할 수도 있습니다.
집합 크기가 높아 AccountID가 제외된 것을 확인할 수 있습니다. 이는 열에 너무 많은 고유 값이 포함되어 있음을 의미합니다. 반대 이유로 기능 Country가 제외되었습니다. 값은 모든 행에 대해 동일합니다. 이 두 가지 기능은 기계 학습 모델에 어떤 값도 제공하지 않습니다.
범주형 기능 Territory가 impact encoded되었음을 확인할 수도 있습니다. 자세한 내용을 보려면 경고 및 정보 아이콘 위로 마우스를 이동합니다.
데이터 보기 아이콘을 클릭하여 데이터 보기로 변경합니다. 여기에서 샘플 데이터를 포함하여 각 열에 대한 자세한 정보를 볼 수 있습니다.
대상 선택
기계 학습 모델이 고객 이탈을 예측하기를 원하므로 데이터 집합의 마지막 열인 Churned를 대상으로 선택합니다.
다음과 같이 하십시오.
-
스키마 보기 아이콘을 클릭하면 스키마 보기로 다시 전환됩니다.
-
Churned 위로 마우스를 이동하고 표시되는 대상 아이콘을 클릭합니다.
이제 실험 구성 패널에서 Churned이 선택된 것을 확인할 수 있습니다. 어떤 기능이 자동으로 선택되고 제외되는지 확인할 수도 있습니다. Churned이 대상이므로 기능으로 사용하지 않습니다. 또한 이 실험이 이진 분류 문제로 처리되는 것을 볼 수 있습니다.
기능 선택
이번 실험의 첫 번째 실행에는 기본적으로 선택된 모든 기능과 알고리즘이 포함됩니다. 그러나 비즈니스 지식을 기반으로 특정 기능이 대상에 영향을 미치지 않는다는 것을 이미 알고 있는 경우 이 시점에서 해당 기능을 선택 취소하여 교육에서 제외할 수 있습니다.
실험 교육
구성이 완료되었으며 교육을 시작할 준비가 되었습니다.
다음과 같이 하십시오.
-
실험 창의 오른쪽 아래에서 실험 실행을 클릭합니다.
실험 실행이 완료되면 결과 모델 메트릭을 검토하는 다음 단계로 넘어갈 수 있습니다.