모델 정제
초기 모델을 생성한 후에는 모델의 효과와 잠재적 정확도를 높이기 위해 모델을 정제하는 것이 중요합니다. 모델 점수는 이러한 성능의 다양한 측정값을 나타냅니다. 모델을 정제하는 목표는 이러한 점수를 높이는 것이지만, 점수가 높다고 해서 항상 더 나은 모델을 의미하는 것은 아닙니다.
기능을 제외하거나 포함하고, 학습 데이터를 변경하고, 기타 구성 매개변수를 수정하여 모델을 정제할 수 있습니다. 그렇게 함으로써 서로 다른 버전을 비교하여 변경 사항이 어떤 영향을 미치는지 확인할 수 있습니다.
점수를 해석함으로써 모델을 정제하는 방법을 배울 수 있습니다. 다양한 메트릭의 값은 결과를 개선하기 위해 어떤 조치를 취해야 하는지에 대한 인사이트를 제공할 수 있습니다.
요구 사항 및 권한
ML 실험 작업에 대한 사용자 요구 사항에 대해 자세히 알아보려면 Working with experiments을 참조하십시오.
새 버전 구성
실험 버전을 실행한 후 필요한 경우 새 버전을 만들어 모델을 정제할 수 있습니다.
다음과 같이 하십시오.
-
학습 데이터, 모델 또는 분석 탭에서 다음 버전의 기준으로 사용할 모델을 선택합니다.
-
구성 보기를 클릭합니다.
실험 구성 패널이 열립니다.
-
새 버전 만들기를 클릭합니다.
새 버전을 만든 후에는 다음과 같이 구성을 변경할 수 있습니다.
-
기존 기능 제외
-
이전에 제외된 기능 포함
-
데이터 세트 변경 또는 새로 고침
-
알고리즘 선택 또는 선택 해제
이러한 옵션에 대한 자세한 내용은 아래 섹션에서 제공됩니다.
새 버전을 초안으로 작성할 때 실험 구성 패널의 기능 아래에 있는 필터 아이콘을 클릭합니다. 필터링을 사용하면 학습 데이터 세트를 변경한 이후 도입된 기능을 더 쉽게 시각화할 수 있습니다. 또한 어떤 기능이 자동 엔지니어링되고 엔지니어링되지 않았는지 확인할 수 있습니다.
데이터 세트 개선
모델의 점수가 좋지 않은 경우 데이터 세트를 검토하여 문제를 해결할 수 있습니다. 데이터 세트를 개선하는 방법에 대한 자세한 내용은 학습을 위한 데이터 세트 준비을 참조하십시오.
기능 제외
기능이 더 많다고 해서 반드시 더 나은 모델이 만들어지는 것은 아닙니다. 모델을 정제하려면 다음과 같이 신뢰할 수 없고 관련성이 없는 기능을 제외해야 합니다.
-
상관 관계가 너무 높은 기능. 상관 관계가 있는 두 기능 중 기능 중요도가 낮은 기능을 제외합니다.
-
기능 중요도가 너무 낮은 기능. 이러한 기능은 학습하려는 내용에 아무런 영향을 미치지 않습니다.
-
기능 중요도가 너무 높은 기능. 이는 데이터 누출로 인한 것일 수 있습니다.
학습 데이터에서 기능을 제거하는 테스트를 수행한 다음 학습을 다시 실행하고 이것이 모델을 개선하는지 확인합니다. 모델 점수에 큰 차이가 있습니까, 아니면 차이가 없습니까?
다음과 같이 하십시오.
-
카탈로그에서 실험을 엽니다.
-
학습 데이터, 모델 또는 분석 탭에서 다음 버전의 기준으로 사용할 모델을 선택합니다.
-
구성 보기를 클릭합니다.
실험 구성 패널이 열립니다.
-
새 버전 만들기를 클릭하여 새 실험 버전을 구성합니다.
-
기능 아래에서 학습에 사용하지 않으려는 기능의 확인란을 선택 해제합니다.
기능 추가
모델의 점수가 여전히 좋지 않은 경우 대상과 관계가 있는 기능이 아직 데이터 세트에 캡처되지 않았기 때문일 수 있습니다. 데이터 세트를 재처리하고 재용도화하여 데이터 품질을 최적화하고 새로운 기능과 정보를 추가할 수 있습니다. 준비가 되면 새 데이터 세트를 향후 실험 버전에 추가할 수 있습니다. 데이터 세트 변경 및 새로 고침을 참조하십시오.
새로운 기능을 캡처하거나 엔지니어링하는 방법에 대한 자세한 내용은 새 기능 열 만들기을 참조하십시오.
편향 감지 설정 변경
편향 감지가 실행되도록 설정된 기능을 변경할 수 있습니다. 예를 들어 데이터 세트에 새로운 기능을 추가한 경우 이러한 기능에 대해 편향 감지를 켤 수.
다음과 같이 하십시오.
-
카탈로그에서 실험을 엽니다.
-
학습 데이터, 모델 또는 분석 탭에서 다음 버전의 기준으로 사용할 모델을 선택합니다.
-
구성 보기를 클릭합니다.
실험 구성 패널이 열립니다.
-
새 버전 만들기를 클릭하여 새 실험 버전을 구성합니다.
-
편향 패널을 확장합니다.
-
선택적으로 추천 받기를 클릭하여 생성형 AI를 사용하여 편향된 데이터가 포함될 수 있는 기능을 제안합니다. 편향 감지를 위한 기능 권장을 위해 생성형 AI 사용을 참조하십시오.
-
편향 감지를 실행할 기능을 선택하거나 선택 해제합니다.
또는 스키마 보기에서 편향 감지 설정을 지정합니다.
편향 감지에 대한 자세한 내용은 머신러닝 모델에서 편향 감지을 참조하십시오.
알고리즘 선택
대상 열의 데이터 유형에 따라 적절한 알고리즘이 학습을 위해 자동으로 선택됩니다. 성능이 좋지 않거나 속도가 느린 알고리즘은 제외할 수 있습니다. 이렇게 하면 학습을 위해 이러한 알고리즘에 시간을 낭비하지 않아도 됩니다.
알고리즘을 선택하는 방법에 대한 자세한 내용은 모델 알고리즘 이해을 참조하십시오.
다음과 같이 하십시오.
-
카탈로그에서 실험을 엽니다.
-
데이터, 모델 또는 분석 탭에서 다음 버전의 기준으로 사용할 모델을 선택합니다.
-
구성 보기를 클릭합니다.
실험 구성 패널이 열립니다.
-
새 버전 만들기를 클릭하여 새 실험 버전을 구성합니다.
-
알고리즘 아래에서 학습에 사용하지 않으려는 알고리즘의 확인란을 선택 해제합니다.
데이터 세트 변경 및 새로 고침
마지막 실험 버전 이후 학습 데이터가 변경된 경우 향후 실험 버전을 위해 데이터 세트를 변경하거나 새로 고칠 수 있습니다.
이는 동일한 실험 내에서 서로 다른 데이터 세트에 대한 모델 메트릭 및 성능을 비교하려는 경우에 유용할 수 있습니다. 예를 들어 다음과 같은 경우에 유용합니다.
-
새로운 데이터 레코드 세트를 사용할 수 있거나 기존 데이터 레코드 세트가 업데이트되었습니다. 예를 들어 최근 한 달간의 트랜잭션을 학습에 사용할 수 있게 되었거나 데이터 수집 문제가 식별되어 해결되었을 수 있습니다.
-
모델 학습을 개선할 목적으로 원래 학습 데이터 세트가 재처리되거나 재용도화되었습니다. 예를 들어 기능 열 값을 정의하는 논리를 개선했거나 새로운 기능 열을 추가했을 수 있습니다.
데이터 세트를 변경하거나 새로 고쳐도 이전 실험 버전에서 이미 학습된 기존 모델은 변경되지 않습니다. 실험 버전 내에서 모델은 해당 특정 버전 내에 정의된 학습 데이터에 대해서만 학습됩니다.
요구 사항
새 실험 버전에 대해 데이터 세트를 변경하거나 새로 고칠 때 새 데이터 세트는 다음 요구 사항을 충족해야 합니다.
-
대상 열의 이름과 기능 유형은 원래 학습 데이터 세트의 대상과 동일해야 합니다.
- 대상 열의 고유 값 수는 지정된 실험 유형에 필요한 범위 내에 있어야 합니다. 예를 들어 다중 클래스 분류 실험의 경우 새 데이터 세트의 대상 열에는 여전히 3개에서 10개 사이의 고유 값이 있어야 합니다. 특정 범위는 실험 구성을 참조하십시오.
다른 기능 열은 완전히 새로울 수 있고, 다른 이름을 가질 수 있으며, 다른 데이터를 포함할 수 있습니다.
데이터 세트 변경
다음과 같이 하십시오.
-
학습 데이터, 모델 또는 분석 탭에서 다음 버전의 기준으로 사용할 모델을 선택합니다.
-
구성 보기를 클릭합니다.
실험 구성 패널이 열립니다.
-
새 버전 만들기를 클릭하여 새 실험 버전을 구성합니다.
-
학습 데이터 > 데이터 세트 검토 아래에서 데이터 세트 변경을 클릭합니다.
-
새 데이터 세트를 선택하거나 업로드합니다. 다음 중에서 선택할 수 있습니다.
-
데이터 세트: 액세스할 수 있는 모든 공간에서 데이터 세트를 선택합니다. 데이터 세트 업로드 및 선택에 대한 팁 및 지침을 참조하십시오.
-
데이터 제품: 액세스할 수 있는 활성 데이터 제품에서 데이터 세트를 선택합니다. 데이터 제품에 대한 자세한 내용은 Creating data products을 참조하십시오.
-
데이터 세트 새로 고침
다음과 같이 하십시오.
-
학습 데이터, 모델 또는 분석 탭에서 다음 버전의 기준으로 사용할 모델을 선택합니다.
-
구성 보기를 클릭합니다.
실험 구성 패널이 열립니다.
-
새 버전 만들기를 클릭하여 새 실험 버전을 구성합니다.
-
학습 데이터 아래에서 데이터 세트 새로 고침을 클릭합니다.
데이터 세트 새로 고침을 사용할 수 있는 경우 알림을 받습니다. 데이터 세트는 일반적으로 기존 데이터 파일이 동일한 이름의 새 파일 생성으로 덮어써질 때 새로 고쳐집니다.
데이터 세트 업로드 및 선택에 대한 팁 및 지침
-
데이터 집합은 분석 활동 센터의 만들기 페이지를 통해 업로드할 수 있으며 카탈로그에서 볼 수 있습니다. 실험의 데이터 집합 선택 페이지에서 새 데이터 집합을 카탈로그에 직접 업로드할 수도 있습니다. 이렇게 하려면 파일 업로드를 클릭하고 업로드할 파일을 선택합니다.
-
Qlik Cloud에서 업로드 및 프로파일링할 수 있는 모든 플랫 파일은 Qlik 프로젝트에서 사용할 수 있도록 지원됩니다.
시트가 여러 개인 Microsoft Excel 파일과 같은 다중 테이블 파일의 경우 첫 번째 테이블만 가져옵니다. 테이블에 대한 데이터 프로파일링이 실패하면(예: 테이블이 비어 있는 경우) 파일이 지원되지 않습니다.
정제된 버전 실행
버전 구성을 완료하면 실행할 수 있습니다.
다음과 같이 하십시오.
-
화면 오른쪽 하단에서 v2 실행을 클릭합니다.
(버튼의 텍스트는 실행한 버전 수에 따라 다릅니다.)
실험 버전 비교
새 버전의 학습이 완료되면 새 버전을 이전 버전과 비교하여 변경 사항의 영향을 확인합니다. 실험 버전 간에 모델을 비교하기 위한 여러 옵션이 있습니다.
빠른 분석
실험의 모델 및 학습 데이터 탭을 사용하여 해당 버전을 이전 버전과 비교합니다. 모델 탭에서 다음을 수행할 수 있습니다.
-
모델 메트릭 테이블에서 결과를 확인합니다.
-
정확도 및 예측 속도를 포함하여 일반적인 예측 분석 요구 사항을 기반으로 추천 모델을 확인합니다.
-
모델 간에 전환하여 모델 학습 요약 및 기타 자동으로 생성된 차트의 차이점을 확인합니다.
빠른 모델 분석에 대한 자세한 내용은 신속한 모델 분석 수행을 참조하십시오.
심층 분석
실험의 비교 및 분석 탭으로 전환하여 모델 분석을 더 자세히 수행할 수 있습니다. 이러한 탭은 보다 세부적인 수준에서 대화형으로 모델을 평가할 수 있는 내장된 분석 환경을 제공합니다.
비교 탭은 모든 모델에서 모델 점수 및 하이퍼파라미터 비교를 제공합니다. 분석 탭을 사용하면 특정 모델에 집중하여 예측 정확도, 기능 중요도 및 기타 세부 정보를 평가할 수 있습니다.
자세한 내용은 모델 비교 및 세부 모델 분석 수행을 참조하십시오.
모델 최적화 설정 변경
지능형 최적화가 활성화된 버전을 실행한 후 지능형 최적화를 끌 수 있습니다. 이를 통해 지능형 최적화에서 제공하는 인사이트를 활용하는 동시에 사소하고 최소한의 미세 조정을 수행하는 데 필요한 제어 권한을 가질 수 있습니다. 또는 설정을 끈 상태에서 하나 이상의 버전을 실행한 후 지능형 모델 최적화를 켤 수 있습니다.
하이퍼파라미터 최적화는 모델 정제 프로세스 중에 켜두면 유용한 설정입니다. 일반적으로 실험의 첫 번째 버전에서는 이 설정을 켜는 것이 권장되지 않습니다.
시간 인식 학습 사용 여부를 변경하거나 날짜 인덱스로 사용되는 열을 변경할 수도 있습니다.
다음과 같이 하십시오.
-
구성 보기를 클릭합니다.
-
필요한 경우 새 버전 만들기를 클릭하여 새 실험 버전을 구성합니다.
-
패널에서 모델 최적화를 확장합니다.
-
지능형 및 수동 설정 간에 전환하여 지능형 모델 최적화를 켜거나 끕니다.
-
하이퍼파라미터 최적화를 활성화하려면 하이퍼파라미터 최적화 확인란을 클릭하고 최대 학습 시간을 설정합니다.
-
시간 기반 테스트-학습 분할 아래에서 시간 인식 학습 설정을 변경할 수 있습니다.
-
시간 인식 학습을 켜려면 데이터 세트에서 특정 날짜 인덱스 열을 선택하여 기본값인 없음을 변경합니다.
-
시간 인식 학습을 끄려면 날짜 인덱스를 없음 값으로 설정합니다.
-
선택한 날짜 인덱스 열을 다른 열로 변경합니다.
-
실험 버전 삭제
유지하지 않으려는 실험 버전을 삭제할 수 있습니다. 실험 버전의 모든 모델도 삭제되며 복구할 수 없습니다.
다음과 같이 하십시오.
-
모델 탭으로 전환합니다.
-
모델 메트릭 테이블에서 삭제하려는 실험 버전의 모델을 선택합니다.
팁 메모도구 모음의 드롭다운 메뉴를 사용하여 학습 데이터 또는 분석 탭에 있을 때 모델을 선택할 수도 있습니다. -
오른쪽 하단에서 <버전 번호> 삭제를 클릭합니다.
-
확인 대화 상자에서 삭제를 클릭합니다.