기본 콘텐츠로 건너뛰기 보완적인 콘텐츠로 건너뛰기

예 – 자동화된 기계 학습을 사용한 학습 모델

이 예에서는 지능형 모델 최적화를 사용하여 기계 학습 모델을 교육합니다. 지능형 모델 최적화를 통해 AutoML은 모델을 반복하고 구체화하는 프로세스를 처리합니다.

지능형 모델 최적화에 대한 자세한 내용은 지능형 모델 최적화를 참조하십시오.

학습 내용

이 예에서는 다음을 학습합니다.

  • ML 실험을 만들고 구성하는 방법

  • 지능형 최적화가 자동 모델 구체화를 제공하는 방법

  • 교육 결과를 보고 분석하는 방법

기타 고려 사항

지능적인 모델 최적화는 잘 준비된 데이터 집합을 바탕으로 모델을 구체화하는 데 큰 도움이 됩니다. 실제 사용 사례에서 모델의 고품질을 보장하려면 먼저 구조화된 프레임워크를 따르고 관련 기능과 데이터가 포함된 교육 데이터 집합을 준비해야 합니다. 자세한 내용은 다음을 참조하십시오.

각 실험 버전에 대해 지능형 모델 최적화를 선택적으로 끌 수 있습니다. 이 설정을 끄면 모델이 수동으로 최적화됩니다. 실험 구성을 구체적으로 조정하려는 경우 수동 최적화가 도움이 될 수 있습니다. 지능형 모델 최적화 기능이 포함된 버전을 실행한 다음 이를 꺼서 수동으로 작은 조정을 수행하는 동시에 제공되는 자동 구체화 기능의 이점을 활용할 수 있습니다.

이 예에서는 지능형 최적화를 통한 실험 교육을 다룹니다. 수동 최적화 사용 방법을 보여 주는 전체 자습서를 보려면 자습서 – 예측 데이터 생성 및 시각화를 참조하십시오. 이 자습서에서는 대화형 Qlik Sense 앱을 사용하여 모델 배포, 예측 수행 및 예측 데이터 시각화에 대한 종단 간 지침도 제공합니다.

이 예를 완료해야 하는 사람

지능형 모델 최적화를 사용하여 기계 학습 모델을 구체화하는 방법을 알아보려면 이 예를 완료해야 합니다.

이 예를 완료하려면 다음이 필요합니다.

  • 전문가 또는 Full User 권한

  • 테넌트의 Automl Experiment Contributor 보안 역할

  • 공동 작업 공간에서 작업하는 경우 작업할 공간에서 필요한 공간 역할이 필요합니다. 참고: 공유 공간에서 권한 관리

ML 리소스를 보거나 만들 수 없다면 필요한 역할, 권한 또는 권한이 없다는 의미일 가능성이 높습니다. 자세한 내용은 테넌트 관리자에게 문의하십시오.

자세한 내용은 Qlik AutoML을 사용할 수 있는 사용자를 참조하십시오.

준비 사항

다음 패키지를 다운로드하고 데스크톱에 패키지의 압축을 풉니다.

AutoML 예 - 지능형 모델 최적화

패키지에는 모델 교육에 사용할 교육 데이터 집합이 포함되어 있습니다. 데이터 집합에는 갱신 기한이 지났고 서비스 구독을 중단하거나 유지하기로 결정한 고객에 대한 정보가 포함되어 있습니다.

  1. 분석 활동 센터를 엽니다.

  2. 만들기 페이지로 이동하여 데이터 집합을 선택한 다음 데이터 파일 업로드를 선택합니다.

  3. AutoML Example - Churn data - training.csv 파일을 업로드 대화 상자로 끕니다.

  4. 공간을 선택합니다. 다른 사용자가 이 데이터에 액세스할 수 있도록 하려면 개인 공간 또는 공유 공간이 될 수 있습니다.

  5. 업로드를 클릭합니다.

이제 데이터 집합이 업로드되었으므로 실험 만들기를 진행할 수 있습니다.

1부: 실험 만들기

  1. 분석 활동 센터의 만들기 페이지로 이동하여 ML 실험을 선택합니다.

  2. 실험 이름을 입력합니다(예: 지능형 최적화 예).

  3. 필요에 따라 설명과 태그를 추가합니다.

  4. 실험을 위한 공간을 선택합니다. 개인 공간이 될 수도 있고 공유 공간이 될 수도 있습니다.

  5. 만들기를 클릭합니다.

  6. AutoML Example - Churn data - training.csv 파일을 선택합니다.

2부: 실험 구성

다음으로 실험을 구성할 수 있습니다.

지능형 모델 최적화는 수동 최적화보다 초기 구성이 덜 필요합니다. 이 경우 대상을 선택하고 기본적으로 포함된 모든 기능을 사용하겠습니다.

대상 선택

기계 학습 모델이 고객 이탈을 예측하기를 원하므로 데이터 집합의 마지막 열인 Churned대상으로 선택합니다.

실험에서는 데이터 탭만 표시되어야 합니다. 여러 가지 방법으로 대상을 선택할 수 있지만 여기서는 기본적으로 열리는 테이블 행 스키마 보기를 사용합니다.

  • 스키마에서 Churned 위로 마우스를 가져간 다음 표시되는 대상 대상 아이콘을 클릭합니다.

스키마 보기에서 대상 선택

대상 기호가 있는 데이터 집합 열입니다.

기능 선택 확인

대상을 선택하면 기본적으로 사용할 수 있는 기능과 권장 기능이 모두 포함됩니다. 테이블 행 스키마 보기에서 두 가지 기능을 제외한 모든 기능이 포함되어 있는지 확인합니다. 포함된 각 기능 옆에는 채워진 확인란이 있어야 합니다. Country를 사용할 수 없습니다. AccountID는 높은 집합 크기로 인해 사용이 권장되지 않으므로 선택하지 않은 상태로 둡니다.

기본 기능 선택을 보여 주는 스키마

실험 버전에 포함된 모든 사용 가능 및 권장 기능을 보여 주는 스키마 보기

지능형 최적화 확인

추가 설정을 구성하려면 페이지 오른쪽에 패널이 열려야 합니다. 지능형 모델 최적화가 켜져 있는지 확인하고 싶습니다.

  1. 실험 구성 패널이 열려 있지 않으면 컨트롤 구성 보기를 클릭하여 엽니다.

  2. 패널에서 모델 최적화를 확장합니다.

  3. 선택한 최적화 옵션은 지능형이어야 합니다.

지능형 최적화 옵션을 사용하여 실험 버전이 실행 중인지 확인

'지능형'으로 설정된 '모델 최적화' 설정을 보여 주는 실험 구성 패널

교육 실행

모델 교육을 시작하려면 페이지 오른쪽 아래에 있는 실험 실행을 클릭합니다.

3부: 결과 보기

교육이 완료되면 모델 탭이 나타나고 열립니다. 여기서는 교육 중에 어떤 최적화가 수행되었는지 확인할 수 있습니다. 트로피 아이콘으로 표시된 최상위 모델이 자동으로 선택됩니다. 이 모델을 분석해 보겠습니다.

모델 교육 요약을 살펴보십시오. 이는 이 모델에 대한 지능형 최적화 결과를 보여 줍니다. 이 경우 다음 기능이 제거된 것을 확인할 수 있으며 해당 기능이 제거된 이유가 제공됩니다.

  • 대상 유출이 의심되어 DaysSinceLastService가 삭제되었습니다.이 경우 해당 열에는 논리가 잘못된 데이터가 포함되어 있습니다. 서비스를 취소한 고객(경우에 따라 몇 년 전)에 대해서는 마지막 서비스 티켓 이후의 일수가 여전히 활발하게 계산되었습니다. 이 기능은 모델에 잘못된 성능 점수를 부여하고 배포 시 모델 성능이 매우 저하될 수 있으므로 제거해야 했습니다. 데이터 유출 참조

  • PriorPeriodUsagePriorPeriodUsage-Rounded는 다른 기능과의 상관 관계가 너무 높기 때문에 삭제되었습니다. 상관 관계가 있는 기능은 여전히 교육에 포함되었습니다. 상관 관계을 참조하십시오.

  • CurrentPeriodUsage, CustomerTenure, StartMonth, Territory, DeviceType, 및 StartWeek은 permutation importance가 낮아 모두 삭제되었습니다. 모델에 미치는 영향이 낮은 기능은 통계적 노이즈로 표시되며 성능 향상을 위해 제거될 수 있습니다. permutation importance 이해을 참조하십시오.

지능형 최적화를 통해 삭제된 기능을 보여 주는 모델 교육 요약 차트

대상 유출, 높은 상관 관계 및 낮은 permutation importance로 인해 삭제된 기능을 보여 주는 최고 성능 모델에 대한 교육 요약 차트

이제 이러한 기능이 제거되었으므로 가장 영향력 있는 기능과 모델의 예측 성능에 대한 일부 표시기를 보여 주는 시각화를 볼 수 있습니다. 이 차트에 표시되는 내용은 기능 집합에 누락된 부분이 있는지 또는 결과가 왜곡되었는지 평가하는 데 도움이 될 수 있습니다.

이러한 시각화를 사용한 모델 분석에 대한 자세한 내용은 빠른 모델 분석 수행을 참조하십시오.

분석에 대해 자세히 알아보기

모델 메트릭을 더 자세히 살펴보려면 실험에서 비교분석 탭으로 전환합니다. 이 탭에서는 메트릭을 보다 세부적으로 대화형으로 볼 수 있습니다.

자세한 내용은 모델 비교세부 모델 분석 수행를 참조하십시오.

다음 단계

고품질 데이터 집합을 사용하는 지능형 최적화는 추가 반복이 거의 또는 전혀 필요하지 않은 즉시 배포 가능한 모델을 만듭니다. 이 시점에서는 최고 성능의 모델을 배포하는 것이 좋습니다. 그렇지 않으면 계속해서 모델을 수동으로 구체화하거나, 교육 데이터를 업데이트하고 지능형 모델 최적화를 다시 실행할 수 있습니다.

다음 단계에 대한 자세한 내용은 다음을 참조하십시오.

감사합니다.

이 예를 완료했습니다. 지능형 모델 최적화를 사용하여 즉시 배포 가능한 기계 학습 모델을 쉽게 교육하는 방법을 학습했기를 바랍니다.

추가 자료 및 리소스

사용자 의견

의견이 있으시면 피드백을 보내 주시기 바랍니다. 아래 섹션을 사용하시면 됩니다.

이 페이지가 도움이 되었습니까?

이 페이지 또는 해당 콘텐츠에서 오타, 누락된 단계 또는 기술적 오류와 같은 문제를 발견하면 개선 방법을 알려 주십시오!