실험 구성
실험 구성은 대상 선택과 모델이 대상을 예측하는 데 사용할 기능으로 구성됩니다. 여러 옵션 설정을 구성할 수도 있습니다.
대상 선택을 지원하기 위해 기록 데이터 집합이 분석되고 데이터 집합의 각 열에 대한 요약 통계가 표시됩니다. 적절한 데이터만 포함되도록 여러 자동 전처리 단계가 데이터 집합에 적용됩니다. 데이터 전처리에 대한 자세한 내용은 자동 데이터 준비 및 변환을 참조하십시오.
v1을 실행한 후 필요한 경우 모델 교육을 더욱 구체화하기 위해 새 실험 버전을 만들 수 있습니다. 자세한 내용은 모델 구체화을 참조하십시오.
요구 사항 및 권한
ML 실험 작업을 위한 사용자 요구 사항에 대해 자세히 알아보려면 실험 작업을 참조하십시오.
인터페이스
다음 섹션에서는 실험 인터페이스를 탐색하여 실험을 구성하는 방법을 간략하게 설명합니다. 인터페이스에 대한 자세한 내용은 실험 인터페이스 탐색를 참조하십시오.
탭 탐색
실험을 만들면 데이터 탭이 열립니다. 여기서는 실험의 대상과 기능을 구성할 수 있습니다.
하나 이상의 실험 버전을 실행한 후에는 다른 탭을 사용할 수 있게 됩니다. 이러한 다른 탭을 사용하면 해당 버전에서 방금 교육한 모델을 분석할 수 있습니다. 다양한 기능을 선택하여 후속 버전을 구성해야 하는 경우 데이터 탭으로 돌아갈 수 있습니다.
스키마 보기 및 데이터 보기
데이터 탭에서는 다음 보기를 번갈아 반복하여 볼 수 있습니다.
-
스키마 보기: 기본 보기입니다. 이 보기에서는 데이터 집합의 각 열이 정보와 통계가 포함된 스키마의 행으로 표시됩니다.
-
데이터 보기: 각 항목에 대한 추가 정보와 샘플 데이터에 액세스하는 데 사용할 수 있는 대체 보기입니다.
실험 구성 패널
구성 보기를 클릭하면 실험 교육을 추가로 사용자 지정할 수 있는 패널이 열립니다. 현재 보고 있는 탭에 관계없이 패널을 열 수 있습니다. 이 패널은 다양한 추가 구성 옵션을 제공합니다.
실험 구성 패널을 사용하면 다음을 수행할 수 있습니다.
-
첫 번째 버전을 교육하기 전에 대상을 선택합니다.
-
기능 추가 또는 제거
-
새 버전의 실험 구성
-
교육 데이터 집합을 변경하거나 새로 고치려면 선택
-
알고리즘 추가 또는 제거
-
모델 최적화 설정 변경
대상 선택
대상 열에는 기계 학습 모델이 예측할 값이 포함됩니다. 첫 번째 교육을 시작할 때까지 대상 열을 변경할 수 있습니다. 그 후에는 편집을 위해 잠깁니다.
다음과 같이 하십시오.
스키마 보기 또는 데이터 보기에서 열 위로 마우스를 가져갑니다.
표시되는 아이콘을 클릭합니다.
대상 열은 이제 으로 표시되고 사용할 수 있는 다른 열은 기능으로 자동 선택됩니다.
또는 교육 구성 패널에서 대상을 선택할 수도 있습니다.
대상이 선택되면 실험의 첫 번째 버전 실행을 시작할 수 있습니다. 교육 실험에서 더 읽어보십시오. 이 시점에서 아래에 설명된 추가 구성을 수행하거나 교육 결과를 검토한 후 구성을 조정할 수 있습니다.
실험 교육이 계속되는 동안 데이터가 어떻게 해석되고 처리되는지에 대한 설명이 표시됩니다. 자세한 내용은 데이터 집합 통찰력 해석을 참조하십시오.
만들어진 모델 유형 결정
대상으로 선택한 열에 따라 실험에서 만들어지는 모델 유형이 결정됩니다. 이는 결국 모델을 교육하는 데 어떤 알고리즘이 사용되는지 결정하는 데 중요한 역할을 합니다. 데이터 집합의 특정 열은 실험 대상으로 선택하지 못하거나 특정 처리가 적용될 수 있습니다.
모델 유형은 다음과 같습니다.
이진 분류 모델
다중 클래스 분류 모델
회귀 모델
아래 표에는 사용되는 모델 유형을 결정하는 대상의 요소가 요약되어 있습니다.
모델 유형 | 열의 고유 값 수 | 기능 유형 필요 | 추가 정보 |
---|---|---|---|
이진 분류 | 2 | Any | - |
다중 클래스 분류 | 3-10 | Any | 숫자가 아닌 고유 클래스가 10개를 초과하는 열은 대상으로 선택할 수 없습니다. |
회귀 | 10개 이상 | 숫자 | - |
실험에서 교육하는 모델 유형을 확인하려면 구성 보기를 클릭하고 알고리즘을 확장합니다. 모델 유형은 섹션 제목에 표시됩니다.
기능 열 선택
대상이 설정되면 모델 교육에 포함할 다른 사용할 수 있는 열을 선택할 수 있습니다. 모델에 포함하고 싶지 않은 모든 기능을 제외합니다. 열은 데이터 집합에 남아 있지만 교육 알고리즘에서는 사용되지 않습니다.
실험 구성 창 상단에서 데이터 집합의 셀 수를 볼 수 있습니다. 이 수가 데이터 집합 제한을 초과하는 경우 기능을 제외하여 제한 미만이 되도록 할 수 있습니다.
다양한 방법으로 기능 열을 선택할 수 있습니다.
스키마 보기 및 데이터 보기에서
기본 보기에서는 다음을 수행할 수 있습니다.
사용할 수 있는 모든 기능 포함을 선택 취소한 다음 포함하려는 기능만 선택합니다.
포함하지 않으려는 기능의 확인란을 수동으로 선택 해제합니다.
검색을 수행하고 필터링된 검색 결과에서 모든 기능을 제외하거나 포함합니다.
교육 사용자 지정 패널에서
실험 구성 패널을 확장하면 다음을 수행할 수 있습니다.
포함하지 않으려는 기능의 확인란을 수동으로 선택 해제합니다.
실험의 첫 번째 버전을 실행한 후 포함할 상위 기능 수를 정의할 수 있습니다.
기능을 선택하면 기능 유형이 자동으로 할당됩니다. 가능한 기능 유형은 다음과 같습니다.
범주
숫자
날짜
무료 문자
기능 유형은 기능 열에 포함된 데이터를 기반으로 할당됩니다. 기능이 특정 기준을 충족하면 자동 엔지니어링 기능의 기초가 되도록 준비될 수 있습니다. 원하는 경우 자동 기능 엔지니어링에 기능을 사용할지 여부를 변경할 수 있습니다. 자동 기능 엔지니어링에 대한 자세한 내용은 자동 기능 엔지니어링을 참조하십시오.
데이터 집합의 특정 열은 실험의 기능으로 선택하지 못하거나 특정 처리가 적용될 수 있습니다. 실험 교육을 진행하는 동안 데이터가 어떻게 해석되고 처리되는지에 대한 설명이 표시됩니다. 자세한 내용은 데이터 집합 통찰력 해석를 참조하십시오.
알고리즘 선택
사용할 수 있는 모든 알고리즘이 기본적으로 포함되며 사용하지 않으려는 알고리즘을 제외할 수 있습니다. 일반적으로 첫 번째 교육 결과를 보았을 때 모델 개선의 일부로 이 작업을 수행합니다. 모델 구체화에서 더 읽어보십시오.
기능 유형 변경
데이터 집합이 로드되면 열은 데이터 유형 및 기타 특성에 따라 범주형, 숫자형, 날짜 또는 자유 텍스트로 처리됩니다. 경우에 따라 이 설정을 변경해야 할 수도 있습니다.
예를 들어, 요일이 1~7의 숫자로 표시되는 경우 각 숫자는 범주 값을 나타냅니다. 기본적으로 연속 순위 숫자 값으로 처리되므로 범주로 처리하도록 구성을 수동으로 변경해야 합니다.
열이 날짜 및 시간 정보를 포함하는 것으로 식별되면 새로 생성된 자동 엔지니어링 기능의 기초로 사용됩니다. 이 경우 원본 열(상위 기능)은 날짜 기능 유형을 갖는 것으로 간주됩니다. 상위 기능을 날짜 기능 유형에서 범주형 기능 유형으로 변경할 수 있습니다.그러나 이렇게 하면 실험 교육에서 자동 엔지니어링 기능을 더 이상 사용할 수 없습니다.
다음과 같이 하십시오.
스키마 보기에서 기능을 찾습니다.
이 기능에 대한 기능 유형 열에서 을 클릭합니다.
목록에서 값을 선택합니다.
또는 데이터 보기에서 기능 유형을 변경할 수도 있습니다. 기능을 찾은 다음 현재 기능 유형 옆에 있는 을 클릭합니다. 목록에서 값을 선택합니다.
데이터 처리 아래의 실험 구성 패널에서 변경된 기능 유형이 있는 모든 항목을 볼 수 있습니다.
데이터 집합 변경
첫 번째 실험 버전을 실행하기 전과 버전을 실행한 후에 교육 데이터 집합을 변경할 수 있습니다.
첫 번째 버전을 실행하기 전에 데이터 집합을 변경하면 데이터 집합을 변경하기 전에 수행한 모든 구성이 손실됩니다.
다음과 같이 하십시오.
교육 데이터 아래의 실험 구성 패널에서 데이터 집합 변경을 클릭합니다.
새 데이터 집합을 선택합니다.
모델 구체화 중(실험 버전 실행 후) 데이터 집합 변경 및 새로 고침에 대한 자세한 내용은 데이터 집합 변경 및 새로 고침을 참조하십시오.
모델 최적화 구성
모델 최적화를 위해 다음 설정을 사용자 지정할 수 있습니다.
지능형 모델 최적화 켜기 또는 끄기
하이퍼 매개 변수 최적화 켜기 또는 끄기
시간 인식 교육 켜기 또는 끄기
실행하는 실험의 각 버전에 대해 이러한 옵션을 켜거나 끌 수 있습니다.
지능형 최적화 구성
기본적으로 실험에서는 지능형 모델 최적화를 사용합니다. AutoML은 지능형 모델 최적화를 통해 기능 선택을 반복하고 데이터에 고급 변환을 적용하여 모델 구체화 프로세스를 처리합니다.
지능형 최적화에 대한 자세한 내용은 지능형 모델 최적화를 참조하십시오.
이 설정을 꺼서 교육하는 모델을 수동으로 구체화할 수 있습니다. 예를 들어, 지능형 모델 최적화로 모델 교육을 시작한 다음 v2의 수동 구체화로 전환하여 구성을 추가로 조정할 수 있습니다.
다음과 같이 하십시오.
구성 보기를 클릭합니다.
이미 하나 이상의 실험 버전을 실행한 경우 새 버전을 클릭합니다.
패널에서 모델 최적화를 확장합니다.
지능형에서 수동으로 전환합니다.
슬라이더를 사용하여 교육의 최대 실행 기간을 설정합니다.
하이퍼 매개 변수 최적화 구성
하이퍼 매개 변수 최적화를 사용하여 모델을 최적화할 수 있습니다. 이는 교육 시간을 크게 늘릴 수 있는 고급 옵션입니다. 지능형 최적화를 끄면 하이퍼 매개 변수 최적화를 사용할 수 있습니다.
자세한 내용은 하이퍼 매개 변수 최적화을 참조하십시오.
다음과 같이 하십시오.
구성 보기를 클릭합니다.
이미 하나 이상의 실험 버전을 실행한 경우 새 버전을 클릭합니다.
패널에서 모델 최적화를 확장합니다.
지능형에서 수동으로 전환합니다.
하이퍼 매개 변수 최적화 확인란을 선택합니다.
선택적으로 최적화에 대한 시간 제한을 설정합니다. 기본 시간 제한은 1시간입니다.
시간 인식 교육 구성
시계열 차원을 고려하여 모델을 교육시키려면 실험 버전에 대해 시간 인식 교육을 활성화합니다. 이 옵션을 사용하려면 관련 시계열 정보가 포함된 열이 데이터 집합에 있어야 합니다.
시간 인식 교육이 켜지면 AutoML은 특수 교차 유효성 검사 및 null 대체 프로세스를 사용하여 모델을 교육합니다.
자세한 내용은 시간 인식 모델 만들기 및 시간 기반 교차 유효성 검사를 참조하십시오.
다음과 같이 하십시오.
구성 보기를 클릭합니다.
이미 하나 이상의 실험 버전을 실행한 경우 새 버전을 클릭합니다.
패널에서 모델 최적화를 확장합니다.
시간 기반 테스트 교육 분할에서 데이터 정렬에 사용할 날짜 인덱스를 선택합니다.
교육 데이터에 대한 통찰력 보기
실험의 데이터 탭에서 교육 데이터 처리에 대한 통찰력을 볼 수 있습니다. 이 정보는 스키마 보기의 통찰력 열에서 확인할 수 있습니다. 표시되는 정보는 현재 교육 데이터가 포함된 버전을 실행했는지 여부에 따라 달라집니다. 통찰력 열의 변경 내용은 기능을 사용할 수 없는 이유 또는 해당 기능이 자동으로 삭제된 이유를 식별하는 데 도움이 됩니다.
각 통찰력의 의미에 대한 자세한 내용은 데이터 집합 통찰력 해석을 참조하십시오.