하이퍼파라미터 최적화
머신 러닝 모델은 다양한 데이터 패턴을 일반화하기 위해 서로 다른 제약 조건, 가중치 또는 학습률이 필요합니다. 이러한 측정값을 하이퍼파라미터라고 하며 학습 프로세스를 제어하는 데 사용됩니다. 모델이 머신 러닝 문제를 최적으로 해결할 수 있도록 하이퍼파라미터를 튜닝해야 합니다.
기본적으로 Qlik 프로젝트는 모델 학습에 사용되는 각 알고리즘에 대해 미리 정의된 하이퍼파라미터 값 세트를 사용합니다. 이는 데이터 과학 커뮤니티에서 일반적으로 인정되는 표준 최적화 값입니다. 가장 성능이 좋은 하이퍼파라미터 값 조합이 자동으로 선택됩니다.
그러나 경우에 따라 최적의 예측 결과를 얻기 위해 모델을 미세 조정하고 싶을 수 있습니다. 이는 하이퍼파라미터 최적화(HPO)를 사용하여 수행할 수 있습니다.
Qlik 프로젝트는 실험 구성에서 선택한 세트 중 가장 우수한 알고리즘에 대해서만 하이퍼파라미터 최적화를 실행합니다. 먼저 무작위 검색(random search)을 실행한 다음, 알고리즘에 대한 최적의 하이퍼파라미터를 찾기 위해 그리드 검색(grid search)을 실행합니다.
하이퍼파라미터 최적화를 사용하기 전에 고려해야 할 몇 가지 중요한 사항이 있습니다.
-
모델을 처음 학습시킬 때는 하이퍼파라미터 최적화를 사용하지 마십시오. 이는 모델을 학습시키고 결과에 만족한 후에 사용하도록 설계되었습니다. 이 프로세스에는 종종 반복적인 미세 조정 및 재학습이 필요합니다.
-
하이퍼파라미터 최적화는 상당한 시간을 추가합니다. 표준으로 미리 정의된 하이퍼파라미터 값을 사용하여 모델을 학습시키는 프로세스에 5분이 걸린다면, 하이퍼파라미터 최적화를 활성화하여 동일한 모델을 학습시키는 데는 몇 시간이 걸릴 수 있습니다.
하이퍼파라미터 최적화에 사용되는 알고리즘
하이퍼파라미터 최적화는 특정 알고리즘 및 모델 유형으로 제한됩니다. 이는 다음과 같은 모델 유형 및 알고리즘과 작동하도록 특별히 설계되었습니다.
-
이진 분류(Binary Classification) 모델
-
CatBoost Classification
-
Elastic Net Regression
-
Lasso Regression
-
LightGBM Classification
-
Logistic Regression
-
Random Forest Classification
-
XGBoost Classification
-
-
회귀(Regression) 모델
-
CatBoost Regression
-
LightGBM Regression
-
Random Forest Regression
-
XGBoost Regression
-
하이퍼파라미터 최적화 활성화
다음과 같이 하십시오.
-
실험에서 구성 보기를 클릭합니다.
실험 구성 패널이 열립니다.
-
필요한 경우 새 버전 만들기를 클릭하여 다음 버전을 구성합니다.
-
패널에서 모델 최적화를 확장합니다.
-
지능형에서 수동으로 전환합니다.
지능형 모델 최적화에서는 하이퍼파라미터 최적화를 사용할 수 없습니다.
-
하이퍼파라미터 최적화 확인란을 선택합니다.
하이퍼파라미터 값 보기
상세 모델 분석 중에 비교 탭에서 하이퍼파라미터 값을 확인합니다. 자세한 내용은 세부 모델 분석 수행를 참조하십시오.