기본 콘텐츠로 건너뛰기 보완적인 콘텐츠로 건너뛰기

모델 구체화

일부 초기 모델을 만든 후에는 효율성과 잠재적 정확도를 높이기 위해 모델을 개선해야 합니다. 모델 점수는 이 성능에 대한 다양한 측정값을 나타냅니다. 모델 개선의 목표는 이러한 점수를 높이는 것이지만 점수가 높다고 해서 항상 모델이 우수한 것은 아닙니다.

기능을 제외하거나 포함하고, 교육 데이터를 변경하고, 기타 구성 매개 변수를 수정하여 모델을 구체화할 수 있습니다. 이렇게 하면 여러 버전을 비교하여 변경 내용이 어떤 영향을 미치는지 확인할 수 있습니다.

점수를 해석하여 모델을 구체화하는 방법을 배우게 됩니다. 다양한 지표의 값을 통해 결과를 개선하기 위해 수행해야 할 작업에 대한 통찰력을 얻을 수 있습니다.

요구 사항 및 권한

ML 실험 작업을 위한 사용자 요구 사항에 대해 자세히 알아보려면 실험 작업을 참조하십시오.

새 버전 구성

실험 버전을 실행한 후 필요한 경우 새 버전을 만들어 모델을 구체화할 수 있습니다.

  1. 모델 메트릭 표에서 구체화하려는 모델을 선택합니다.

  2. 오른쪽 아래에서 구성 보기를 클릭하여 실험 구성 창을 엽니다.

  3. 새 버전을 클릭합니다.

새 버전을 만든 후 다음과 같이 구성을 변경할 수 있습니다.

  • 기존 기능 제외

  • 이전에 제외된 기능 포함

  • 데이터 집합 변경 또는 새로 고침

  • 알고리즘 선택 또는 선택 취소

이러한 옵션에 대한 자세한 내용은 아래 섹션에서 제공됩니다.

새 버전 초안을 작성할 때 실험 구성 창의 기능 아래에 있는 필터 필터 아이콘을 클릭합니다. 필터링하면 교육 데이터 집합을 변경한 이후 도입된 기능을 더 쉽게 시각화할 수 있습니다. 또한 자동 엔지니어링된 기능과 엔지니어링되지 않은 기능을 확인할 수도 있습니다.

데이터 집합 개선

모델의 점수가 좋지 않은 경우 데이터 집합을 검토하여 문제를 해결할 수 있습니다. 교육을 위해 데이터 집합 준비하기에서 데이터 집합을 개선하는 방법에 대해 자세히 읽어보십시오.

기능 제외

기능이 많다고 해서 반드시 우수한 모델을 만드는 것은 아닙니다. 모델을 구체화하기 위해 다음과 같이 신뢰할 수 없고 관련이 없는 기능을 제외하려고 합니다.

  • 상관 관계가 너무 높은 기능. 상관 관계가 있는 두 기능에서 기능 중요도가 낮은 기능을 제외합니다.

  • 기능 중요도가 너무 낮은 기능. 이러한 기능은 알아보려는 내용에 영향을 주지 않습니다.

  • 기능 중요도가 너무 높은 기능. 데이터 유출 때문일 수 있습니다.

교육 데이터에서 기능을 제거하기 위해 테스트한 다음 교육을 다시 실행하고 이것이 모델을 개선하는지 확인합니다. 모델 점수에 큰 차이가 있습니까, 아니면 전혀 없습니까?

  1. 카탈로그에서 실험을 엽니다.

  2. 구체화할 모델을 선택합니다.

  3. 오른쪽 아래에서 구성 보기를 클릭하여 실험 구성 창을 엽니다.

  4. 새 실험 버전을 구성하려면 새 버전을 클릭합니다.

  5. 기능 아래에서 교육에 사용하지 않으려는 기능의 확인란을 선택 해제합니다.

팁 메모또는 스키마 및 데이터 보기에서 기능을 선택 취소할 수 있습니다. 스키마 보기로 전환하려면 스키마 보기을 클릭합니다. 데이터 보기을 클릭하여 데이터 보기로 전환합니다. 모델 보기을 클릭하여 모델 보기로 돌아갑니다.

기능 추가

모델의 점수가 여전히 좋지 않은 경우 대상과 관계가 있는 기능이 아직 데이터 집합에 캡처되지 않았기 때문일 수 있습니다. 데이터 집합을 다시 처리하고 용도를 변경하여 데이터 품질을 최적화하고 새로운 기능과 정보를 추가할 수 있습니다. 준비가 되면 새 데이터 집합을 향후 실험 버전에 추가할 수 있습니다. 데이터 집합 변경 및 새로 고침를 참조하십시오.

새 기능 열 만들기에서 새 기능을 캡처하거나 엔지니어링하는 방법에 대해 자세히 알아봅니다.

알고리즘 선택

대상 열의 데이터 유형에 따라 교육에 적합한 알고리즘이 자동으로 선택됩니다. 잘 수행되지 않거나 더 느린 알고리즘을 제외할 수 있습니다. 이렇게 하면 교육을 위해 시간을 낭비할 필요가 없습니다.

알고리즘 선택 방법에 대한 자세한 내용은 알고리즘을 참조하십시오.

  1. 카탈로그에서 실험을 엽니다.

  2. 구체화할 모델을 선택합니다.

  3. 오른쪽 아래에서 구성 보기를 클릭하여 실험 구성 창을 엽니다.

  4. 새 실험 버전을 구성하려면 새 버전을 클릭합니다.

  5. 알고리즘 아래에서 교육에 사용하지 않으려는 알고리즘의 확인란을 선택 해제합니다.

데이터 집합 변경 및 새로 고침

마지막 실험 버전 이후 교육 데이터가 변경된 경우 향후 버전의 실험을 위해 데이터 집합을 변경하거나 새로 고칠 수 있습니다.

이는 동일한 실험 내에서 다양한 데이터 집합에 대한 모델 메트릭과 성능을 비교하려는 경우 도움이 될 수 있습니다. 예를 들어, 다음과 같은 경우에 유용합니다.

  • 새로운 데이터 레코드 집합을 사용할 수 있거나 원본 데이터 레코드 집합이 업데이트되었습니다. 예를 들어, 최근 달의 트랜잭션이 교육에 사용 가능하고 적절해졌을 수도 있고, 데이터 컬렉션 문제가 식별되어 해결되었을 수도 있습니다.

  • 원본 교육 데이터 집합은 아마도 모델 교육을 개선하려는 의도로 다시 처리되거나 용도가 변경되었습니다. 예를 들어, 기능 열 값을 정의하는 논리를 개선했거나 새 기능 열을 추가했을 수도 있습니다.

데이터 집합을 변경하거나 새로 고쳐도 이전 실험 버전에서 이미 교육된 기존 모델은 변경되지 않습니다. 실험 버전 내에서 모델은 해당 특정 버전 내에 정의된 교육 데이터에 대해서만 교육됩니다.

요구 사항

새 실험 버전의 데이터 집합을 변경하거나 새로 고치는 경우 새 데이터 집합은 다음 요구 사항을 충족해야 합니다.

  • 대상 열의 이름과 기능 유형은 원본 교육 데이터 집합의 대상과 동일해야 합니다.

  • 대상 열의 고유 값 개수는 해당 실험 유형에 필요한 것과 동일한 범위 내에 있어야 합니다. 예를 들어, 다중 클래스 분류 실험의 경우 새 데이터 집합의 대상 열에는 여전히 3~10개의 고유 값이 있어야 합니다. 구체적인 범위는 만들어진 모델 유형 결정을 참조하십시오.

다른 기능 열은 완전히 새로운 것일 수 있고, 다른 이름을 가지며, 다른 데이터를 포함할 수 있습니다.

데이터 집합 변경

  1. 실험의 모델 메트릭 표에서 모델을 선택합니다.

  2. 오른쪽 아래에서 구성 보기를 클릭하여 실험 구성 창을 엽니다.

  3. 새 실험 버전을 구성하려면 새 버전을 클릭합니다.

  4. 교육 데이터에서 데이터 집합 변경을 클릭합니다.

  5. 새 데이터 집합을 선택하거나 업로드합니다.

데이터 집합 새로 고침

  1. 실험의 모델 메트릭 표에서 모델을 선택합니다.

  2. 오른쪽 아래에서 구성 보기를 클릭하여 실험 구성 창을 엽니다.

  3. 새 실험 버전을 구성하려면 새 버전을 클릭합니다.

  4. 교육 데이터에서 데이터 집합 새로 고침을 클릭합니다.

    데이터 집합 새로 고침을 사용할 수 있으면 알림이 표시됩니다. 데이터 집합은 일반적으로 동일한 이름을 가진 새 파일을 만들어 기존 데이터 파일을 덮어쓸 때 새로 고쳐집니다.

실험 버전 비교

변경한 후에는 교육을 다시 실행하고 새 버전을 이전 버전과 비교하여 변경 내용의 효과를 확인합니다.

  1. 다른 실험 버전을 교육하려면 화면 오른쪽 아래의 v2 실행을 클릭합니다.

    (버튼의 텍스트는 실행한 버전 수에 따라 다릅니다.)

  2. 모델 메트릭 테이블에서 알고리즘, 버전 및 기타 속성에 대한 드롭다운 메뉴를 사용하여 모델을 필터링할 수 있습니다. 표는 개별 메트릭 열을 기준으로 정렬할 수도 있습니다.

모델 버전 비교

여러 실험 버전의 모델 메트릭 비교를 보여 주는 모델 메트릭 테이블

실험 버전 삭제

유지하지 않으려는 실험 버전을 삭제할 수 있습니다. 실험 버전의 모든 모델도 삭제되며 복구할 수 없습니다.

  1. 모델 메트릭 표에서 삭제할 실험 버전의 모델을 선택합니다.

  2. 오른쪽 아래에서 <버전 번호> 삭제를 클릭합니다.

  3. 확인 대화 상자에서 삭제를 클릭합니다.

자세한 정보

이 페이지가 도움이 되었습니까?

이 페이지 또는 해당 콘텐츠에서 오타, 누락된 단계 또는 기술적 오류와 같은 문제를 발견하면 개선 방법을 알려 주십시오!