실험 만들기 및 구성
첫 번째 단계는 실험을 만들고 구성하는 것입니다. 예측을 위해 배포할 준비가 될 때까지 이전에 업로드한 교육 데이터 집합을 사용하여 모델을 교육합니다.
새 실험 만들기
다음과 같이 하십시오.
-
분석 활동 센터의 만들기 페이지로 이동하여 ML 실험을 선택합니다.
-
실험 이름을 입력합니다(예: 고객 이탈 자습서).
-
필요에 따라 설명과 태그를 추가합니다.
-
실험을 위한 공간을 선택합니다. 개인 공간이 될 수도 있고 공유 공간이 될 수도 있습니다.
-
만들기를 클릭합니다.
-
교육 데이터 집합 파일을 선택합니다. CSV 또는 QVD로 작업하는지에 따라 다음 중 하나가 됩니다.
-
AutoML Tutorial - Churn data - train.csv
-
AutoML Tutorial - Churn data - train.qvd
-
데이터 검토
이제 실험 구성을 시작할 준비가 되었습니다. 시작하기 전에 데이터 집합을 살펴보겠습니다.
데이터 탭에서 시작합니다. 기본 보기는 스키마 보기입니다. 여기에서 각 행이 데이터 집합의 열을 나타내는 테이블을 볼 수 있습니다. 자동 데이터 준비에서 통계 및 통찰력이 생성되었습니다. 통찰력을 보려면 스키마의 오른쪽으로 스크롤해야 할 수도 있습니다.
집합 크기가 높아 AccountID가 제외된 것을 확인할 수 있습니다. 이는 열에 너무 많은 고유 값이 포함되어 있음을 의미합니다. 반대 이유로 기능 Country가 제외되었습니다. 값은 모든 행에 대해 동일합니다. 이 두 가지 기능은 기계 학습 모델에 어떤 값도 제공하지 않습니다.
범주형 기능 Territory가 impact encoded되었음을 확인할 수도 있습니다. 자세한 내용을 보려면 경고 및 정보 아이콘 위로 마우스를 이동합니다.
데이터 보기를 클릭합니다. 이 보기에서는 샘플 데이터를 포함하여 각 열에 대한 자세한 정보를 볼 수 있습니다.
대상 선택
기계 학습 모델이 고객 이탈을 예측하기를 원하므로 데이터 집합의 마지막 열인 Churned를 대상으로 선택합니다.
다음과 같이 하십시오.
-
스키마 보기로 다시 전환합니다.
-
Churned 위로 마우스를 이동하고 표시되는 대상 아이콘을 클릭합니다.
이제 실험 구성 패널에서 Churned이 선택되었음을 확인할 수 있습니다. 어떤 기능이 자동으로 선택되고 제외되는지 확인할 수도 있습니다. Churned이 대상이므로 기능으로 사용하지 않습니다. 또한 이 실험이 이진 분류 문제로 처리되는 것을 볼 수 있습니다.
기능 선택
이번 실험의 첫 번째 실행에는 기본적으로 선택된 모든 기능과 알고리즘이 포함됩니다. 그러나 비즈니스 지식을 기반으로 특정 기능이 대상에 영향을 미치지 않는다는 것을 이미 알고 있는 경우 이 시점에서 해당 기능을 선택 취소하여 교육에서 제외할 수 있습니다.
최적화 설정 변경
지능형 모델 최적화는 기본적으로 켜져 있습니다. AutoML은 지능형 모델 최적화를 통해 모델 교육을 자동으로 구체화합니다. 하지만 이 자습서의 목표는 기능 데이터와 교육 결과에서 특정 문제를 수동으로 식별하는 방법을 보여 주는 것입니다.
지능형 모델 최적화로 모델을 교육시키는 방법의 예는 예 – 자동화된 기계 학습을 사용한 학습 모델을 참조하십시오.
수동 구체화를 보여 주기 위해 지능형 모델 최적화를 끄겠습니다.
다음과 같이 하십시오.
-
실험 구성 패널에서 모델 최적화 섹션을 확장합니다.
-
지능형에서 수동으로 전환합니다.
실험 교육
구성이 완료되었으며 교육을 시작할 준비가 되었습니다.
다음과 같이 하십시오.
-
실험 창의 오른쪽 아래에서 실험 실행을 클릭합니다.
실험 실행이 완료되면 결과 모델 메트릭을 검토하는 다음 단계로 넘어갈 수 있습니다.