기본 콘텐츠로 건너뛰기 보완적인 콘텐츠로 건너뛰기

실험 구성

실험 구성은 대상 선택과 모델이 대상을 예측하는 데 사용할 기능으로 구성됩니다. 여러 옵션 설정을 구성할 수도 있습니다.

대상 선택을 지원하기 위해 기록 데이터 집합이 분석되고 데이터 집합의 각 열에 대한 요약 통계가 표시됩니다. 적절한 데이터만 포함되도록 여러 자동 전처리 단계가 데이터 집합에 적용됩니다. 데이터 전처리에 대한 자세한 내용은 자동 데이터 준비 및 변환을 참조하십시오.

보기

기본 보기는 데이터 집합의 각 열이 정보 및 통계가 있는 스키마의 행으로 표시되는 스키마 보기입니다. 각 열에 대한 자세한 정보와 샘플 데이터를 가져오려면 데이터 보기도 있습니다. 열데이터 보기을 클릭하여 보기 간의 차이를 변경합니다.

스키마 보기에 표시된 데이터 집합의 미리 보기

AutoML 스키마 보기.

데이터 보기에 표시된 데이터 집합의 미리 보기

AutoML 데이터 보기.

구성 창을 클릭하여 실험 구성 측면 창을 열거나 닫습니다. 여기에서 실험 및 현재 구성에 대한 정보를 찾을 수 있습니다.

측면 창에는 현재 버전의 실험 구성이 표시됩니다.

AutoML 실험 구성 측면 창

대상 선택

대상 열에는 기계 학습 모델이 예측할 값이 포함됩니다. 첫 번째 교육을 시작할 때까지 대상 열을 변경할 수 있으며 그 후에는 편집을 위해 잠겨 있습니다.

  • 열 위에 마우스를 놓고 표시되는 대상 아이콘을 클릭합니다.

    대상 열은 이제 대상으로 표시되고 사용할 수 있는 다른 열은 기능으로 자동 선택됩니다.

대상 선택

대상 기호가 있는 데이터 집합 열입니다.

대상이 선택되면 실험의 첫 번째 버전 실행을 시작할 수 있습니다. 교육 실험에서 더 읽어보십시오. 이 시점에서 아래에 설명된 추가 구성을 수행하거나 교육 결과를 검토한 후 구성을 조정할 수 있습니다.

데이터 집합의 특정 열은 실험 대상으로 선택하지 못하거나 특정 처리가 적용될 수 있습니다. 교육 데이터에서 감지된 공통 특성에 대한 설명은 실험 구성을 참조하십시오.

기능 열 선택

대상이 설정되면 모델 교육에 포함할 다른 사용할 수 있는 열을 선택할 수 있습니다. 모델에 포함하고 싶지 않은 모든 기능을 제외합니다. 열은 데이터 집합에 남아 있지만 교육 알고리즘에서는 사용되지 않습니다.

실험 구성 창 상단에서 데이터 집합의 셀 수를 볼 수 있습니다. 이 수가 데이터 집합 제한을 초과하는 경우 기능을 제외하여 제한 미만이 되도록 할 수 있습니다.

다양한 방법으로 기능 열을 선택할 수 있습니다.

  • 포함하지 않으려는 기능의 확인란을 수동으로 선택 해제합니다.

  • 모든 기능 제외를 클릭한 다음 포함할 기능만 선택합니다.

  • 검색을 수행하고 필터링된 검색 결과에서 모든 기능을 제외하거나 포함합니다.

  • 실험의 첫 번째 버전을 실행한 후 포함할 상위 기능 수를 정의할 수 있습니다.

실험 구성의 기능 섹션

AutoML 실험 구성 측면 창의 기능 섹션.

데이터 집합의 특정 열은 실험의 기능으로 선택하지 못하거나 특정 처리가 적용될 수 있습니다. 교육 데이터에서 감지된 공통 특성에 대한 설명은 실험 구성을 참조하십시오.

알고리즘 선택

사용할 수 있는 모든 알고리즘이 기본적으로 포함되며 사용하지 않으려는 알고리즘을 제외할 수 있습니다. 일반적으로 첫 번째 교육 결과를 보았을 때 모델 개선의 일부로 이 작업을 수행합니다. 모델 구체화에서 더 읽어보십시오.

실험 구성의 알고리즘 섹션

AutoML 실험 구성 측면 창의 알고리즘 섹션.

기능 데이터 유형 변경

데이터 집합이 로드되면 열은 데이터 유형에 따라 범주 또는 숫자로 처리됩니다. 경우에 따라 이 설정을 변경해야 할 수도 있습니다.

예를 들어, 요일이 1~7의 숫자로 표시되는 경우 각 숫자는 범주 값을 나타냅니다. 기본적으로 연속 순위 숫자 값으로 처리되므로 범주로 처리하도록 구성을 수동으로 변경해야 합니다.

  1. 기능 유형 열에서 을 클릭합니다.

  2. 목록에서 값을 선택합니다.

데이터 처리 아래의 실험 구성 창에서 기능 유형이 변경된 모든 열을 볼 수 있습니다.

데이터 집합 변경

첫 번째 실험 교육을 실행하기 전에 데이터 집합을 변경할 수 있습니다. 그런 다음 다른 데이터 집합을 사용하려면 새 실험을 만들어야 합니다. 데이터 집합을 변경하면 수행한 모든 구성이 손실된다는 점에 유의합니다.

  1. 교육 데이터 아래의 실험 구성 창에서 데이터 집합 변경을 클릭합니다.

  2. 새 데이터 집합을 선택합니다.

하이퍼 매개 변수 최적화 구성

하이퍼 매개 변수 최적화를 사용하여 모델을 최적화할 수 있습니다. 이는 교육 시간을 크게 늘릴 수 있는 고급 옵션입니다. 자세한 내용은 하이퍼 매개 변수 최적화을 참조하십시오.

실험 구성의 모델 최적화 섹션

AutoML 실험 구성 측면 창의 모델 최적화 섹션.
  1. 실험 구성 창에서 모델 최적화 섹션을 확장합니다.

  2. 하이퍼 매개 변수 최적화 확인란을 선택합니다.

  3. 선택적으로 최적화에 대한 시간 제한을 설정합니다. 기본 시간 제한은 1시간입니다.

교육 데이터에서 발견되는 공통 통찰력

데이터 집합의 품질에 따라 실험 구성에서 데이터의 특정 부분을 사용하는 방법에 제한이 있을 수 있습니다. 스키마 보기의 통찰력 열은 데이터 필드의 특정 특성과 기계 학습 알고리즘에 의해 처리되는 방식을 식별하는 데 유용합니다.

다음 표는 스키마에 표시될 수 있는 가능한 통찰력을 보여 줍니다.

스키마 보기의 데이터 집합 통찰력
통찰력 의미 구성에 미치는 영향
상수 열은 모든 행에 대해 동일한 값을 가집니다. 열을 대상 또는 포함된 기능으로 사용할 수 없습니다.
One-hot encoded 기능 유형이 범주형이고 열의 고유 값이 14개 미만입니다. 구성에 영향을 미치지 않습니다.
Impact encoded 기능 유형이 범주형이고 열에 14개 이상의 고유한 값이 있습니다. 구성에 영향을 미치지 않습니다.
높은 집합 크기 열에 고유한 값이 너무 많아 기능으로 사용할 경우 모델 성능에 부정적인 영향을 미칠 수 있습니다. 열을 대상으로 사용할 수 없습니다.
스파스 데이터 열에 null 값이 너무 많습니다. 열을 대상 또는 포함된 기능으로 사용할 수 없습니다.
불충분하게 표시된 클래스 열에 행이 10개 미만인 클래스가 있습니다. 열을 대상으로 사용할 수 없지만 기능으로 포함할 수 있습니다.

자세한 정보

이 페이지가 도움이 되었습니까?

이 페이지 또는 해당 콘텐츠에서 오타, 누락된 단계 또는 기술적 오류와 같은 문제를 발견하면 개선 방법을 알려 주십시오!