실험 생성 및 구성
첫 번째 단계는 실험을 생성하고 구성하는 것입니다. 이전에 업로드한 학습 데이터 세트를 사용하여 예측을 수행하기 위해 배포할 준비가 될 때까지 모델을 학습시킵니다.
새 실험 생성
다음과 같이 하십시오.
-
분석 활동 센터의 만들기 페이지로 이동하여 ML 실험을 선택합니다.
-
실험 이름을 입력합니다(예: Customer churn tutorial).
-
선택 사항으로 설명 및 태그를 추가합니다.
-
실험을 위한 공간을 선택합니다. 개인 공간 또는 공유 공간일 수 있습니다.
-
만들기를 클릭합니다.
-
학습 데이터 세트 파일을 선택합니다. CSV 또는 QVD 작업 여부에 따라 다음 중 하나가 됩니다.
-
ML - Churn data - training.csv
-
ML - Churn data - training.qvd
-
데이터 검토
이제 실험 구성을 시작할 준비가 되었지만, 시작하기 전에 데이터 세트를 살펴보겠습니다.
구성 요소는 구성 탭에서 시작합니다. 기본 보기는 스키마 보기입니다. 여기에서 데이터 세트의 각 열을 나타내는 행이 있는 테이블을 볼 수 있습니다. 자동 데이터 준비에서 통계 및 인사이트가 생성되었습니다. 인사이트를 보려면 스키마의 오른쪽으로 스크롤해야 할 수도 있습니다.
AccountID는 높은 카디널리티로 인해 제외되었음을 알 수 있습니다. 이는 열에 고유한 값이 너무 많이 포함되어 있음을 의미합니다. Country 기능은 반대 이유로 제외되었습니다. 즉, 모든 행에 대해 값이 동일합니다. 이 두 기능은 기계 학습 모델에 아무런 가치도 제공하지 않습니다.
범주형 기능인 Territory가 영향 인코딩되었음을 볼 수도 있습니다. 자세한 내용을 보려면 경고 및 정보
아이콘 위에 마우스를 올려 놓으십시오.
Qlik 프로젝트의 학습 데이터 세트에 대한 스키마 보기
데이터 보기를 클릭합니다. 이 보기에서는 샘플 데이터를 포함하여 각 열에 대한 자세한 정보를 볼 수 있습니다.
데이터 보기
대상 선택
기계 학습 모델이 고객 이탈을 예측하기를 원하므로 데이터 세트의 마지막 열인 Churned를 대상으로 선택합니다.
다음과 같이 하십시오.
-
스키마 보기로 다시 전환합니다.
-
Churned 위에 마우스를 올려 놓고 나타나는 대상
아이콘을 클릭합니다.
스키마 보기의 행이 대상으로 선택됨
실험 구성 패널에서 실험 설정을 확장합니다. Churned가 대상으로 선택되었음을 알 수 있습니다. 대상 및 사용 가능한 기능 데이터를 기반으로 실험 유형은 이진 분류입니다.
어떤 기능이 자동으로 선택되고 제외되는지도 확인할 수 있습니다. Churned는 대상이므로 기능으로 사용되지 않습니다.
구성 패널에 표시되는 정보
기능 선택 및 모델 최적화
기본적으로 실험은 지능형 모델 최적화를 사용하도록 설정되어 있습니다. 확인하려면 실험 구성 패널에서 모델 최적화를 확장합니다. 지능형 옵션이 선택되어 있어야 합니다.
구성 패널에서 지능형 모델 최적화 확인

기능 선택은 구성 패널의 기능 섹션에서 수동으로 구성할 수 있습니다. 지능형 모델 최적화를 사용하면 도움이 되지 않는 기능을 제거하여 기능 선택이 자동으로 처리됩니다. 이 설정을 켜면 사용 가능한 모든 기능을 학습에 포함할 수 있습니다.
실험 학습
구성이 완료되었으며 학습을 시작할 준비가 되었습니다.
다음과 같이 하십시오.
-
실험 실행을 클릭합니다.
실험 실행이 완료되면 다음 단계인 결과 모델 메트릭 검토로 이동할 수 있습니다.