하이퍼파라미터 최적화

머신 러닝 모델은 다양한 데이터 패턴을 일반화하기 위해 서로 다른 제약 조건, 가중치 또는 학습률이 필요합니다. 이러한 측정값을 하이퍼파라미터라고 하며 학습 프로세스를 제어하는 데 사용됩니다. 모델이 머신 러닝 문제를 최적으로 해결할 수 있도록 하이퍼파라미터를 튜닝해야 합니다.

기본적으로 Qlik 프로젝트는 모델 학습에 사용되는 각 알고리즘에 대해 미리 정의된 하이퍼파라미터 값 세트를 사용합니다. 이는 데이터 과학 커뮤니티에서 일반적으로 인정되는 표준 최적화 값입니다. 가장 성능이 좋은 하이퍼파라미터 값 조합이 자동으로 선택됩니다.

그러나 경우에 따라 최적의 예측 결과를 얻기 위해 모델을 미세 조정하고 싶을 수 있습니다. 이는 하이퍼파라미터 최적화(HPO)를 사용하여 수행할 수 있습니다.

Qlik 프로젝트는 실험 구성에서 선택한 세트 중 가장 우수한 알고리즘에 대해서만 하이퍼파라미터 최적화를 실행합니다. 먼저 무작위 검색(random search)을 실행한 다음, 알고리즘에 대한 최적의 하이퍼파라미터를 찾기 위해 그리드 검색(grid search)을 실행합니다.

하이퍼파라미터 최적화를 사용하기 전에 고려해야 할 몇 가지 중요한 사항이 있습니다.

모델을 처음 학습시킬 때는 하이퍼파라미터 최적화를 사용하지 마십시오. 이는 모델을 학습시키고 결과에 만족한 후에 사용하도록 설계되었습니다. 이 프로세스에는 종종 반복적인 미세 조정 및 재학습이 필요합니다.
하이퍼파라미터 최적화는 상당한 시간을 추가합니다. 표준으로 미리 정의된 하이퍼파라미터 값을 사용하여 모델을 학습시키는 프로세스에 5분이 걸린다면, 하이퍼파라미터 최적화를 활성화하여 동일한 모델을 학습시키는 데는 몇 시간이 걸릴 수 있습니다.

하이퍼파라미터 최적화에 사용되는 알고리즘

하이퍼파라미터 최적화는 특정 알고리즘 및 모델 유형으로 제한됩니다. 이는 다음과 같은 모델 유형 및 알고리즘과 작동하도록 특별히 설계되었습니다.

이진 분류(Binary Classification) 모델
- CatBoost Classification
- Elastic Net Regression
- Lasso Regression
- LightGBM Classification
- Logistic Regression
- Random Forest Classification
- XGBoost Classification
회귀(Regression) 모델
- CatBoost Regression
- LightGBM Regression
- Random Forest Regression
- XGBoost Regression

시계열 실험에는 하이퍼파라미터 최적화를 사용할 수 없습니다.

하이퍼파라미터 최적화 활성화

다음과 같이 하십시오.

실험에서 구성 보기를 클릭합니다.

실험 구성 패널이 열립니다.
필요한 경우 새 버전 만들기를 클릭하여 다음 버전을 구성합니다.
패널에서 모델 최적화를 확장합니다.
지능형에서 수동으로 전환합니다.

지능형 모델 최적화에서는 하이퍼파라미터 최적화를 사용할 수 없습니다.
하이퍼파라미터 최적화 확인란을 선택합니다.

하이퍼파라미터 값 보기

상세 모델 분석 중에 비교 탭에서 하이퍼파라미터 값을 확인합니다. 자세한 내용은 세부 모델 분석 수행를 참조하십시오.

모델 알고리즘 이해

이 페이지가 도움이 되었습니까?

이 페이지 또는 해당 콘텐츠에서 오타, 누락된 단계 또는 기술적 오류와 같은 문제를 발견하면 알려 주십시오!

여기에 피드백을 남겨주십시오.