기본 콘텐츠로 건너뛰기 보완적인 콘텐츠로 건너뛰기

모델 구체화

일부 초기 모델을 만든 후에는 효율성과 잠재적 정확도를 높이기 위해 모델을 개선해야 합니다. 모델 점수는 이 성능에 대한 다양한 측정값을 나타냅니다. 모델 개선의 목표는 이러한 점수를 높이는 것이지만 점수가 높다고 해서 항상 모델이 우수한 것은 아닙니다.

기능을 제외하거나 포함하고, 교육 데이터를 변경하고, 기타 구성 매개 변수를 수정하여 모델을 구체화할 수 있습니다. 이렇게 하면 여러 버전을 비교하여 변경 내용이 어떤 영향을 미치는지 확인할 수 있습니다.

점수를 해석하여 모델을 구체화하는 방법을 배우게 됩니다. 다양한 지표의 값을 통해 결과를 개선하기 위해 수행해야 할 작업에 대한 통찰력을 얻을 수 있습니다.

요구 사항 및 권한

ML 실험 작업을 위한 사용자 요구 사항에 대해 자세히 알아보려면 실험 작업을 참조하십시오.

새 버전 구성

실험 버전을 실행한 후 필요한 경우 새 버전을 만들어 모델을 구체화할 수 있습니다.

  1. 데이터, 모델 또는 분석 탭에서 다음 버전의 기초로 사용할 모델을 선택합니다.

  2. 구성 보기를 클릭합니다.

    실험 구성 패널이 열립니다.

  3. 새 버전을 클릭합니다.

새 버전을 만든 후 다음과 같이 구성을 변경할 수 있습니다.

  • 기존 기능 제외

  • 이전에 제외된 기능 포함

  • 데이터 집합 변경 또는 새로 고침

  • 알고리즘 선택 또는 선택 취소

이러한 옵션에 대한 자세한 내용은 아래 섹션에서 제공됩니다.

새 버전 초안을 작성할 때 실험 구성 패널의 기능 아래에서 필터 필터 아이콘을 클릭합니다. 필터링하면 교육 데이터 집합을 변경한 이후 도입된 기능을 더 쉽게 시각화할 수 있습니다. 또한 자동 엔지니어링된 기능과 엔지니어링되지 않은 기능을 확인할 수도 있습니다.

데이터 집합 개선

모델의 점수가 좋지 않은 경우 데이터 집합을 검토하여 문제를 해결할 수 있습니다. 교육을 위해 데이터 집합 준비하기에서 데이터 집합을 개선하는 방법에 대해 자세히 읽어보십시오.

기능 제외

기능이 많다고 해서 반드시 우수한 모델을 만드는 것은 아닙니다. 모델을 구체화하기 위해 다음과 같이 신뢰할 수 없고 관련이 없는 기능을 제외하려고 합니다.

  • 상관 관계가 너무 높은 기능. 상관 관계가 있는 두 기능에서 기능 중요도가 낮은 기능을 제외합니다.

  • 기능 중요도가 너무 낮은 기능. 이러한 기능은 알아보려는 내용에 영향을 주지 않습니다.

  • 기능 중요도가 너무 높은 기능. 데이터 유출 때문일 수 있습니다.

교육 데이터에서 기능을 제거하기 위해 테스트한 다음 교육을 다시 실행하고 이것이 모델을 개선하는지 확인합니다. 모델 점수에 큰 차이가 있습니까, 아니면 전혀 없습니까?

  1. 카탈로그에서 실험을 엽니다.

  2. 데이터, 모델 또는 분석 탭에서 다음 버전의 기초로 사용할 모델을 선택합니다.

  3. 구성 보기를 클릭합니다.

    실험 구성 패널이 열립니다.

  4. 새 실험 버전을 구성하려면 새 버전을 클릭합니다.

  5. 기능 아래에서 교육에 사용하지 않으려는 기능의 확인란을 선택 해제합니다.

팁 메모또는 스키마 또는 데이터 보기에서 기능을 선택 취소할 수 있습니다. 실험에서 데이터 탭으로 전환한 다음 스키마 보기 스키마 보기 또는 데이터 보기 데이터 보기를 클릭합니다.

기능 추가

모델의 점수가 여전히 좋지 않은 경우 대상과 관계가 있는 기능이 아직 데이터 집합에 캡처되지 않았기 때문일 수 있습니다. 데이터 집합을 다시 처리하고 용도를 변경하여 데이터 품질을 최적화하고 새로운 기능과 정보를 추가할 수 있습니다. 준비가 되면 새 데이터 집합을 향후 실험 버전에 추가할 수 있습니다. 데이터 집합 변경 및 새로 고침을 참조하십시오.

새 기능 열 만들기에서 새 기능을 캡처하거나 엔지니어링하는 방법에 대해 자세히 알아봅니다.

알고리즘 선택

대상 열의 데이터 유형에 따라 교육에 적합한 알고리즘이 자동으로 선택됩니다. 잘 수행되지 않거나 더 느린 알고리즘을 제외할 수 있습니다. 이렇게 하면 교육을 위해 시간을 낭비할 필요가 없습니다.

알고리즘 선택 방법에 대한 자세한 내용은 모델 알고리즘 이해을 참조하십시오.

  1. 카탈로그에서 실험을 엽니다.

  2. 데이터, 모델 또는 분석 탭에서 다음 버전의 기초로 사용할 모델을 선택합니다.

  3. 구성 보기를 클릭합니다.

    실험 구성 패널이 열립니다.

  4. 새 실험 버전을 구성하려면 새 버전을 클릭합니다.

  5. 알고리즘 아래에서 교육에 사용하지 않으려는 알고리즘의 확인란을 선택 해제합니다.

데이터 집합 변경 및 새로 고침

마지막 실험 버전 이후 교육 데이터가 변경된 경우 향후 버전의 실험을 위해 데이터 집합을 변경하거나 새로 고칠 수 있습니다.

이는 동일한 실험 내에서 다양한 데이터 집합에 대한 모델 메트릭과 성능을 비교하려는 경우 도움이 될 수 있습니다. 예를 들어, 다음과 같은 경우에 유용합니다.

  • 새로운 데이터 레코드 집합을 사용할 수 있거나 원본 데이터 레코드 집합이 업데이트되었습니다. 예를 들어, 최근 달의 트랜잭션이 교육에 사용 가능하고 적절해졌을 수도 있고, 데이터 컬렉션 문제가 식별되어 해결되었을 수도 있습니다.

  • 원본 교육 데이터 집합은 아마도 모델 교육을 개선하려는 의도로 다시 처리되거나 용도가 변경되었습니다. 예를 들어, 기능 열 값을 정의하는 논리를 개선했거나 새 기능 열을 추가했을 수도 있습니다.

데이터 집합을 변경하거나 새로 고쳐도 이전 실험 버전에서 이미 교육된 기존 모델은 변경되지 않습니다. 실험 버전 내에서 모델은 해당 특정 버전 내에 정의된 교육 데이터에 대해서만 교육됩니다.

요구 사항

새 실험 버전의 데이터 집합을 변경하거나 새로 고치는 경우 새 데이터 집합은 다음 요구 사항을 충족해야 합니다.

  • 대상 열의 이름과 기능 유형은 원본 교육 데이터 집합의 대상과 동일해야 합니다.

  • 대상 열의 고유 값 개수는 해당 실험 유형에 필요한 것과 동일한 범위 내에 있어야 합니다. 예를 들어, 다중 클래스 분류 실험의 경우 새 데이터 집합의 대상 열에는 여전히 3~10개의 고유 값이 있어야 합니다. 구체적인 범위는 만들어진 모델 유형 결정을 참조하십시오.

다른 기능 열은 완전히 새로운 것일 수 있고, 다른 이름을 가지며, 다른 데이터를 포함할 수 있습니다.

데이터 집합 변경

  1. 데이터, 모델 또는 분석 탭에서 다음 버전의 기초로 사용할 모델을 선택합니다.

  2. 구성 보기를 클릭합니다.

    실험 구성 패널이 열립니다.

  3. 새 실험 버전을 구성하려면 새 버전을 클릭합니다.

  4. 교육 데이터에서 데이터 집합 변경을 클릭합니다.

  5. 새 데이터 집합을 선택하거나 업로드합니다.

데이터 집합 새로 고침

  1. 데이터, 모델 또는 분석 탭에서 다음 버전의 기초로 사용할 모델을 선택합니다.

  2. 구성 보기를 클릭합니다.

    실험 구성 패널이 열립니다.

  3. 새 실험 버전을 구성하려면 새 버전을 클릭합니다.

  4. 교육 데이터에서 데이터 집합 새로 고침을 클릭합니다.

    데이터 집합 새로 고침을 사용할 수 있으면 알림이 표시됩니다. 데이터 집합은 일반적으로 동일한 이름을 가진 새 파일을 만들어 기존 데이터 파일을 덮어쓸 때 새로 고쳐집니다.

구체화된 버전 실행

버전 구성이 완료되면 실행할 수 있습니다.

  • 화면 오른쪽 아래에서 v2 실행을 클릭합니다.

    (버튼의 텍스트는 실행한 버전 수에 따라 다릅니다.)

실험 버전 비교

새 버전의 교육이 완료된 후 새 버전을 이전 버전과 비교하여 변경 내용의 효과를 확인합니다. 실험 버전 간에 모델을 비교할 수 있는 다양한 옵션이 있습니다.

빠른 분석

버전을 이전 버전과 비교하려면 실험에서 모델데이터 탭을 사용합니다. 모델 탭에서는 다음을 수행할 수 있습니다.

  • 모델 메트릭 테이블에서 결과를 확인합니다.

  • 모델 간에 전환하여 모델 교육 요약과 기타 자동 생성 차트의 차이점을 확인합니다.

빠른 모델 분석에 대한 자세한 내용은 빠른 모델 분석 수행을 참조하십시오.

심층 분석

실험에서 비교분석 탭으로 전환하면 모델 분석에 대해 더 자세히 알아볼 수 있습니다. 이러한 탭은 보다 세부적인 수준에서 모델을 대화형으로 평가할 수 있는 포함된 분석 환경을 제공합니다.

비교 탭에서는 모든 모델의 모델 점수와 하이퍼 매개 변수를 비교할 수 있습니다. 분석 탭을 사용하면 특정 모델에 집중하여 예측 정확도, 기능 중요성 및 기타 세부 정보를 평가할 수 있습니다.

자세한 내용은 모델 비교세부 모델 분석 수행를 참조하십시오.

모델 최적화 설정 변경

활성화된 버전을 실행한 후 지능형 최적화를 끌 수 있습니다. 이를 통해 지능형 최적화에서 제공되는 통찰력을 사용하는 동시에 사소하고 최소한의 조정을 수행하는 데 필요한 제어 기능을 제공할 수 있습니다. 또는 설정이 꺼진 상태에서 하나 이상의 버전을 실행한 후 지능형 모델 최적화를 켤 수 있습니다.

하이퍼 매개 변수 최적화는 모델 구체화 프로세스 중에 활성화하는 데 도움이 될 수 있는 설정입니다. 일반적으로 실험의 첫 번째 버전에서는 이 설정을 켜는 것이 권장되지 않습니다.

또한 시간 인식 교육을 사용할지 여부를 변경하거나 날짜 인덱스로 사용되는 열을 변경할 수도 있습니다.

  1. 구성 보기를 클릭합니다.

  2. 필요한 경우 새 버전을 클릭하여 새 실험 버전을 구성합니다.

  3. 패널에서 모델 최적화를 확장합니다.

  4. 지능형 모델 최적화를 켜거나 끄려면 지능형수동 설정 사이를 전환합니다.

  5. 하이퍼 매개 변수 최적화를 활성화하려면 하이퍼 매개 변수 최적화 확인란을 클릭하고 최대 교육 시간을 설정합니다.

  6. 시간 기반 테스트 교육 분할에서 시간 인식 트레이닝에 대한 설정을 변경할 수 있습니다.

    1. 시간 인식 교육을 켜려면 데이터 집합에서 특정 날짜 인덱스 열을 선택하여 기본값인 없음을 변경합니다.

    2. 시간 인식 교육을 끄려면 날짜 인덱스없음 값으로 설정합니다.

    3. 선택한 날짜 인덱스 열을 다른 열로 변경합니다.

실험 버전 삭제

유지하지 않으려는 실험 버전을 삭제할 수 있습니다. 실험 버전의 모든 모델도 삭제되며 복구할 수 없습니다.

  1. 모델 탭으로 전환합니다.

  2. 모델 메트릭 표에서 삭제할 실험 버전의 모델을 선택합니다.

    팁 메모데이터 또는 분석 탭에서 도구 모음의 드롭다운 메뉴를 사용하여 모델을 선택할 수도 있습니다.
  3. 오른쪽 아래에서 <버전 번호> 삭제를 클릭합니다.

  4. 확인 대화 상자에서 삭제를 클릭합니다.

자세한 정보

이 페이지가 도움이 되었습니까?

이 페이지 또는 해당 콘텐츠에서 오타, 누락된 단계 또는 기술적 오류와 같은 문제를 발견하면 개선 방법을 알려 주십시오!