실험 만들기 및 구성
첫 번째 단계는 실험을 만들고 구성하는 것입니다. 예측을 위해 배포할 준비가 될 때까지 이전에 업로드한 교육 데이터 집합을 사용하여 모델을 교육합니다.
새 실험 만들기
다음과 같이 하십시오.
-
분석 활동 센터의 만들기 페이지로 이동하여 ML 실험을 선택합니다.
-
실험 이름을 입력합니다(예: 고객 이탈 자습서).
-
필요에 따라 설명과 태그를 추가합니다.
-
실험을 위한 공간을 선택합니다. 개인 공간이 될 수도 있고 공유 공간이 될 수도 있습니다.
-
만들기를 클릭합니다.
-
교육 데이터 집합 파일을 선택합니다. CSV 또는 QVD로 작업하는지에 따라 다음 중 하나가 됩니다.
-
ML - Churn data - training.qvd
-
ML - Churn data - apply.qvd
-
데이터 검토
이제 실험 구성을 시작할 준비가 되었습니다. 시작하기 전에 데이터 집합을 살펴보겠습니다.
데이터 탭에서 시작합니다. 기본 보기는 스키마 보기입니다. 여기에서 각 행이 데이터 집합의 열을 나타내는 테이블을 볼 수 있습니다. 자동 데이터 준비에서 통계 및 통찰력이 생성되었습니다. 통찰력을 보려면 스키마의 오른쪽으로 스크롤해야 할 수도 있습니다.
집합 크기가 높아 AccountID가 제외된 것을 확인할 수 있습니다. 이는 열에 너무 많은 고유 값이 포함되어 있음을 의미합니다. 반대 이유로 기능 Country가 제외되었습니다. 값은 모든 행에 대해 동일합니다. 이 두 가지 기능은 기계 학습 모델에 어떤 값도 제공하지 않습니다.
범주형 기능 Territory가 impact encoded되었음을 확인할 수도 있습니다. 자세한 내용을 보려면 경고 및 정보
아이콘 위로 마우스를 이동합니다.
Qlik 프로젝트의 교육 데이터 집합에 대한 스키마 보기

데이터 보기를 클릭합니다. 이 보기에서는 샘플 데이터를 포함하여 각 열에 대한 자세한 정보를 볼 수 있습니다.
데이터 보기

대상 선택
기계 학습 모델이 고객 이탈을 예측하기를 원하므로 데이터 집합의 마지막 열인 Churned를 대상으로 선택합니다.
다음과 같이 하십시오.
-
스키마 보기로 다시 전환합니다.
-
Churned 위로 마우스를 이동하고 표시되는 대상
아이콘을 클릭합니다.
스키마 보기의 행이 대상으로 선택됨

이제 실험 구성 패널에서 Churned이 선택되었음을 확인할 수 있습니다. 또한 어떤 기능이 자동으로 선택되고 제외되는지 확인할 수 있습니다. Churned은 대상이므로 기능으로 사용되지 않습니다. 또한 이 실험이 이진 분류 문제로 처리되는 것을 볼 수 있습니다.
실험 구성 패널에 표시되는 정보

기능 선택 및 모델 최적화
기본적으로 실험은 지능형 모델 최적화를 사용하도록 설정되어 있습니다. 확인하려면 실험 구성 패널에서 모델 최적화를 확장합니다. 지능형 옵션을 선택해야 합니다.
실험 구성 패널에서 지능형 모델 최적화 확인

기능 선택은 구성 패널의 기능 섹션에서 수동으로 구성할 수 있습니다. 지능형 모델 최적화를 통해 불필요한 기능을 제거하여 기능 선택을 자동으로 처리합니다. 이 설정을 켜면 사용할 수 있는 모든 기능을 교육에 포함할 수 있습니다.
실험 교육
구성이 완료되었으며 교육을 시작할 준비가 되었습니다.
다음과 같이 하십시오.
-
실험 창의 오른쪽 아래에서 실험 실행을 클릭합니다.
실험 실행이 완료되면 결과 모델 메트릭을 검토하는 다음 단계로 넘어갈 수 있습니다.