예측 데이터 만들기
모델을 배포하고 승인한 후에는 새 데이터에 대한 예측을 만들 수 있습니다. 이 자습서에서는 ML 배포 내에서 예측 구성을 만들고 이를 사용하여 배치 예측을 실행합니다.
지금까지 기존 고객 데이터를 사용하여 기계 학습 모델을 만들었습니다. 이 프로세스의 목표는 기계 학습을 통해 패턴을 인식하고 이를 새로운 데이터에 적용하는 것이었습니다.
교육 데이터에서 SHAP 값만 분석하는 사용 사례도 있습니다. 이 정보는 그 자체로도 매우 가치가 있습니다.
Qlik 프로젝트의 배치 예측에 대한 자세한 내용은 데이터 집합에 대한 예측 만들기를 참조하십시오.
프로세스의 첫 번째 단계는 모델을 적용하여 예측을 생성할 데이터 집합을 선택하는 것입니다. 그런 다음 원하는 출력 속성을 구성하고 파일을 생성합니다.
다음과 같이 하십시오.
-
카탈로그에서 새로운 ML 배포를 엽니다.
-
오른쪽 아래 모서리에서 예측 만들기를 클릭합니다.
-
오른쪽에 있는 예측 구성 창에서 데이터 적용 아래에 있는 적용 데이터 집합 선택을 클릭합니다.
-
데이터 집합 적용 파일을 선택합니다. CSV 또는 QVD로 작업하는지에 따라 다음 중 하나가 됩니다.
-
ML - Churn data - apply.csv
-
ML - Churn data - apply.qvf
-
-
교육의 스키마를 비교하고 데이터 집합을 적용합니다. 교육 중에 기능을 선택 취소했기 때문에 적용 데이터 집합에는 교육 데이터 집합보다 더 많은 필드가 포함됩니다. 이는 걱정할 필요가 없습니다. 예측을 생성할 때 Qlik 프로젝트은 교육 데이터 집합에 존재하지 않는 적용 데이터 집합의 필드를 무시합니다.
-
예측 구성 창에서 예측 데이터 집합 이름 지정을 클릭합니다. 다음 이름을 입력합니다. ML - Prediction output. 기본 Parquet 포맷을 사용할 예정입니다.
-
공간을 선택하고 확인을 클릭합니다.
-
예측 옵션에서 이 예측을 통해 생성하려는 추가 데이터 집합을 구성합니다. 이 경우, 좌표 SHAP만 선택된 옵션인지 확인합니다. AccountID를 인덱스 열로 사용하도록 허용합니다.
저장 및 닫기 옆에 있는 아이콘을 클릭합니다. 지금 저장 및 예측을 선택합니다.
프로세스는 데이터 집합 예측에서 모니터링할 수 있습니다. 팝업이 나타나면 열기를 클릭하여 카탈로그에서 출력을 검토할 수 있습니다.
예측 실행이 완료되면 새로운 데이터 집합을 사용하여 앱을 빌드할 수 있습니다. 다음 항목으로 이동합니다.