기본 콘텐츠로 건너뛰기 보완적인 콘텐츠로 건너뛰기

실험 구성

실험 구성은 대상 선택과 모델이 대상을 예측하는 데 사용할 기능으로 구성됩니다. 여러 옵션 설정을 구성할 수도 있습니다.

대상 선택을 지원하기 위해 기록 데이터 집합이 분석되고 데이터 집합의 각 열에 대한 요약 통계가 표시됩니다. 적절한 데이터만 포함되도록 여러 자동 전처리 단계가 데이터 집합에 적용됩니다. 데이터 전처리에 대한 자세한 내용은 자동 데이터 준비 및 변환을 참조하십시오.

v1을 실행한 후 필요한 경우 모델 교육을 더욱 구체화하기 위해 새 실험 버전을 만들 수 있습니다. 자세한 내용은 모델 구체화을 참조하십시오.

요구 사항 및 권한

ML 실험 작업을 위한 사용자 요구 사항에 대해 자세히 알아보려면 실험 작업을 참조하십시오.

보기

기본 보기는 데이터 집합의 각 열이 정보 및 통계가 있는 스키마의 행으로 표시되는 스키마 보기입니다. 각 열에 대한 자세한 정보와 샘플 데이터를 가져오려면 데이터 보기도 있습니다. 열데이터 보기을 클릭하여 보기 간의 차이를 변경합니다.

스키마 보기에 표시된 데이터 집합의 미리 보기

AutoML 스키마 보기.

데이터 보기에 표시된 데이터 집합의 미리 보기

AutoML 데이터 보기.

구성 창을 클릭하여 실험 구성 측면 창을 열거나 닫습니다. 여기에서 실험 및 현재 구성에 대한 정보를 찾을 수 있습니다.

측면 창에는 현재 버전의 실험 구성이 표시됩니다.

AutoML 실험 구성 측면 창

대상 선택

대상 열에는 기계 학습 모델이 예측할 값이 포함됩니다. 첫 번째 교육을 시작할 때까지 대상 열을 변경할 수 있습니다. 그 후에는 편집을 위해 잠깁니다.

  • 열 위에 마우스를 놓고 표시되는 대상 아이콘을 클릭합니다.

    대상 열은 이제 대상으로 표시되고 사용할 수 있는 다른 열은 기능으로 자동 선택됩니다.

대상 선택

대상 기호가 있는 데이터 집합 열입니다.

대상이 선택되면 실험의 첫 번째 버전 실행을 시작할 수 있습니다. 교육 실험에서 더 읽어보십시오. 이 시점에서 아래에 설명된 추가 구성을 수행하거나 교육 결과를 검토한 후 구성을 조정할 수 있습니다.

실험 교육을 진행하는 동안 데이터가 어떻게 해석되고 처리되는지에 대한 설명이 표시됩니다. 자세한 내용은 교육 데이터에서 발견되는 공통 통찰력를 참조하십시오.

만들어진 모델 유형 결정

대상으로 선택한 열에 따라 실험에서 만들어지는 모델 유형이 결정됩니다. 이는 결국 모델을 교육하는 데 어떤 알고리즘이 사용되는지 결정하는 데 중요한 역할을 합니다. 데이터 집합의 특정 열은 실험 대상으로 선택하지 못하거나 특정 처리가 적용될 수 있습니다.

모델 유형은 다음과 같습니다.

  • 이진 분류 모델

  • 다중 클래스 분류 모델

  • 회귀 모델

아래 표에는 사용되는 모델 유형을 결정하는 대상의 요소가 요약되어 있습니다.

모델 유형을 결정하는 대상 열의 특성
모델 유형 열의 고유 값 수 기능 유형 필요 추가 정보
이진 분류 2 Any -
다중 클래스 분류 3-10 Any 숫자가 아닌 고유 클래스가 10개를 초과하는 열은 대상으로 선택할 수 없습니다.
회귀 10개 이상 숫자 -

기능 열 선택

대상이 설정되면 모델 교육에 포함할 다른 사용할 수 있는 열을 선택할 수 있습니다. 모델에 포함하고 싶지 않은 모든 기능을 제외합니다. 열은 데이터 집합에 남아 있지만 교육 알고리즘에서는 사용되지 않습니다.

실험 구성 창 상단에서 데이터 집합의 셀 수를 볼 수 있습니다. 이 수가 데이터 집합 제한을 초과하는 경우 기능을 제외하여 제한 미만이 되도록 할 수 있습니다.

다양한 방법으로 기능 열을 선택할 수 있습니다.

  • 포함하지 않으려는 기능의 확인란을 수동으로 선택 해제합니다.

  • 모든 기능 제외를 클릭한 다음 포함할 기능만 선택합니다.

  • 검색을 수행하고 필터링된 검색 결과에서 모든 기능을 제외하거나 포함합니다.

  • 실험의 첫 번째 버전을 실행한 후 포함할 상위 기능 수를 정의할 수 있습니다.

실험 구성의 기능 섹션

AutoML 실험 구성 측면 창의 기능 섹션.

기능을 선택하면 기능 유형이 자동으로 할당됩니다. 가능한 기능 유형은 다음과 같습니다.

  • 범주

  • 숫자

  • 날짜

  • 무료 문자

기능 유형은 기능 열에 포함된 데이터를 기반으로 할당됩니다. 기능이 특정 기준을 충족하면 자동 엔지니어링 기능의 기초가 되도록 준비될 수 있습니다. 원하는 경우 자동 기능 엔지니어링에 기능을 사용할지 여부를 변경할 수 있습니다. 자동 기능 엔지니어링에 대한 자세한 내용은 자동 기능 엔지니어링을 참조하십시오.

데이터 집합의 특정 열은 실험의 기능으로 선택하지 못하거나 특정 처리가 적용될 수 있습니다. 실험 교육을 진행하는 동안 데이터가 어떻게 해석되고 처리되는지에 대한 설명이 표시됩니다. 자세한 내용은 교육 데이터에서 발견되는 공통 통찰력를 참조하십시오.

알고리즘 선택

사용할 수 있는 모든 알고리즘이 기본적으로 포함되며 사용하지 않으려는 알고리즘을 제외할 수 있습니다. 일반적으로 첫 번째 교육 결과를 보았을 때 모델 개선의 일부로 이 작업을 수행합니다. 모델 구체화에서 더 읽어보십시오.

실험 구성의 알고리즘 섹션

AutoML 실험 구성 측면 창의 알고리즘 섹션.

기능 유형 변경

데이터 집합이 로드되면 열은 데이터 유형 및 기타 특성에 따라 범주형, 숫자, 날짜 또는 무료 문자로 처리됩니다. 경우에 따라 이 설정을 변경해야 할 수도 있습니다.

예를 들어, 요일이 1~7의 숫자로 표시되는 경우 각 숫자는 범주 값을 나타냅니다. 기본적으로 연속 순위 숫자 값으로 처리되므로 범주로 처리하도록 구성을 수동으로 변경해야 합니다. 범주형 기능 유형을 숫자 기능 유형으로 변환하는 기능도 있습니다.

열이 날짜 및 시간 정보를 포함하는 것으로 식별되면 새로 생성된 자동 엔지니어링 기능의 기초로 사용됩니다. 이 경우 원본 열(상위 기능)은 날짜 기능 유형을 갖는 것으로 간주됩니다. 상위 기능을 날짜 기능 유형에서 범주형 기능 유형으로 변경할 수 있습니다.그러나 이렇게 하면 실험 교육에서 자동 엔지니어링 기능을 더 이상 사용할 수 없습니다.

  1. 기능 유형 열에서 을 클릭합니다.

  2. 목록에서 값을 선택합니다.

데이터 처리 아래의 실험 구성 창에서 기능 유형이 변경된 모든 열을 볼 수 있습니다.

데이터 집합 변경

첫 번째 실험 버전을 실행하기 전과 버전을 실행한 후에 교육 데이터 집합을 변경할 수 있습니다.

첫 번째 버전을 실행하기 전에 데이터 집합을 변경하면 데이터 집합을 변경하기 전에 수행한 모든 구성이 손실됩니다.

  1. 교육 데이터 아래의 실험 구성 창에서 데이터 집합 변경을 클릭합니다.

  2. 새 데이터 집합을 선택합니다.

모델 구체화 중(실험 버전 실행 후) 데이터 집합 변경 및 새로 고침에 대한 자세한 내용은 데이터 집합 변경 및 새로 고침을 참조하십시오.

하이퍼 매개 변수 최적화 구성

하이퍼 매개 변수 최적화를 사용하여 모델을 최적화할 수 있습니다. 이는 교육 시간을 크게 늘릴 수 있는 고급 옵션입니다. 자세한 내용은 하이퍼 매개 변수 최적화을 참조하십시오.

실험 구성의 모델 최적화 섹션

AutoML 실험 구성 측면 창의 모델 최적화 섹션.
  1. 실험 구성 창에서 모델 최적화 섹션을 확장합니다.

  2. 하이퍼 매개 변수 최적화 확인란을 선택합니다.

  3. 선택적으로 최적화에 대한 시간 제한을 설정합니다. 기본 시간 제한은 1시간입니다.

교육 데이터에서 발견되는 공통 통찰력

데이터 집합의 품질에 따라 실험 구성에서 데이터의 특정 부분을 사용하는 방법에 제한이 있을 수 있습니다. 스키마 보기의 통찰력 열은 데이터 필드의 특정 특성과 기계 학습 알고리즘에 의해 처리되는 방식을 식별하는 데 유용합니다.

다음 표는 스키마에 표시될 수 있는 가능한 통찰력을 보여 줍니다.

스키마 보기의 데이터 집합 통찰력
통찰력의미구성에 미치는 영향
상수열은 모든 행에 대해 동일한 값을 가집니다.열을 대상 또는 포함된 기능으로 사용할 수 없습니다.
One-hot encoded기능 유형이 범주형이고 열의 고유 값이 14개 미만입니다.구성에 영향을 미치지 않습니다.
영향 인코딩기능 유형이 범주형이고 열에 14개 이상의 고유한 값이 있습니다.구성에 영향을 미치지 않습니다.
높은 집합 크기열에 고유한 값이 너무 많아 기능으로 사용할 경우 모델 성능에 부정적인 영향을 미칠 수 있습니다.열을 대상으로 사용할 수 없습니다. 기능으로 자동 제외되지만 필요한 경우 계속 포함될 수 있습니다.
스파스 데이터열에 null 값이 너무 많습니다.열을 대상 또는 포함된 기능으로 사용할 수 없습니다.
불충분하게 표시된 클래스열에 행이 10개 미만인 클래스가 있습니다.열을 대상으로 사용할 수 없지만 기능으로 포함할 수 있습니다.
<number of>개의 자동 엔지니어링 기능열은 자동 엔지니어링 기능을 생성하는 데 사용할 수 있는 상위 기능입니다.이 상위 기능이 날짜 기능으로 해석되면 구성에서 자동으로 제거됩니다. 대신 생성될 수 있는 자동 엔지니어링 날짜 기능을 사용하는 것이 좋습니다. 이 설정을 재정의하고 자동 엔지니어링 기능 대신 기능을 포함할 수 있습니다.
자동 엔지니어링 기능열은 상위 날짜 기능에서 생성될 수 있거나 생성된 자동 엔지니어링 기능입니다. 원본 데이터 집합에는 나타나지 않았습니다.실험 교육 중에 이러한 자동 엔지니어링 기능 중 하나 이상을 제거할 수 있습니다. 상위 기능의 기능 유형을 범주형으로 전환하면 모든 자동 엔지니어링 기능이 제거됩니다.
날짜로 처리할 수 없음열에 날짜 및 시간 정보가 포함될 수 있지만 자동 엔지니어링 날짜 기능을 만드는 데 사용할 수는 없습니다.해당 기능이 구성에서 삭제되었습니다. 자동 엔지니어링 기능이 이전에 이 상위 기능에서 생성된 경우 향후 실험 버전에서는 제거됩니다. 실험에서 해당 기능을 계속 사용할 수 있지만 해당 기능 유형을 범주형으로 전환해야 합니다.
가능한 무료 문자해당 열을 무료 문자 기능으로 사용할 수 있습니다.무료 문자 기능 유형이 열에 할당됩니다. 기능을 무료 문자로 처리할 수 있는지 확인하려면 실험 버전을 실행해야 합니다.
무료 문자해당 열에 무료 문자가 포함되어 있는 것으로 확인되었습니다. 무료 문자로 처리 가능합니다.이 기능에는 추가 구성이 필요하지 않습니다.
무료 문자로 처리할 수 없음추가 분석 결과 해당 열을 무료 문자로 처리할 수 없습니다.다음 실험 버전의 구성에서 해당 기능을 선택 취소해야 합니다. 기능의 집합 크기가 높지 않은 경우 기능 유형을 범주형으로 변경할 수도 있습니다.

자세한 정보

이 페이지가 도움이 되었습니까?

이 페이지 또는 해당 콘텐츠에서 오타, 누락된 단계 또는 기술적 오류와 같은 문제를 발견하면 개선 방법을 알려 주십시오!