교육 데이터에 대한 통찰력 보기
교육 데이터를 추가하고 교육 버전을 실행하면 데이터가 처리되는 방식에 대한 통찰력에 액세스할 수 있습니다. 통찰력은 삭제되었거나 사용할 수 없거나 특수 처리를 통해 인코딩될 기능 등 실험의 대상 및 기능에 대한 정보를 제공합니다.
통찰력 열은 스키마 보기에 있는 경우 데이터 탭에 있습니다. 간략한 통찰력은
데이터 보기에서도 확인할 수 있습니다. 통찰력은 실험 내에서 교육된 각 모델에 대해 개별적으로 만들어집니다.
스키마 보기의 통찰력 열

통찰력이 생성됨:
-
교육 데이터를 추가하거나 변경했지만 아직 실험 버전을 실행하지 않은 경우.
-
각 실험 버전이 실행된 후. 교육된 각 모델에 대해 별도의 통찰력 집합이 만들어집니다.
버전을 실행하기 전과 후에 통찰력이 다를 수 있습니다. 교육이 시작되면 AutoML이 데이터를 사전 처리하고 데이터 관련 문제를 추가로 진단할 수 있기 때문입니다. 자세한 내용은 자동 데이터 준비 및 변환을 참조하십시오.
교육 전 통찰력 보기
실험 버전을 실행하기 전에 통찰력을 분석하여 현재 교육 데이터가 어떻게 해석되고 있는지 확인할 수 있습니다.이러한 정보는 버전을 실행한 후에 변경될 수 있습니다.
다음과 같이 하십시오.
-
실험에서 실험 버전에 사용하려는 교육 데이터를 추가했는지 확인합니다.
-
데이터 탭을 엽니다.
-
현재 상태가
스키마 보기인지 확인합니다.
-
통찰력 항목을 분석합니다. 도구 설명은 통찰력 뒤에 추가 컨텍스트를 제공합니다. 각 통찰력의 의미에 대한 자세한 설명은 데이터 집합 통찰력 해석을 참조하십시오.
모델에 대한 통찰력 보기
모델이 실험 버전에 대한 교육을 마친 후 모델을 선택하고 데이터가 어떻게 처리되었는지 검사합니다.
다음과 같이 하십시오.
-
실험 버전을 실행한 다음 데이터 탭을 엽니다.
-
도구 모음의 드롭다운 목록에서 모델을 선택합니다.
-
현재 상태가
스키마 보기인지 확인합니다.
-
통찰력 항목을 분석합니다. 도구 설명은 통찰력 뒤에 추가 컨텍스트를 제공합니다. 각 통찰력의 의미에 대한 자세한 설명은 데이터 집합 통찰력 해석을 참조하십시오.
데이터 집합 통찰력 해석
다음 테이블에서는 스키마에 표시될 수 있는 가능한 통찰력에 대한 자세한 내용을 제공합니다.
통찰력 | 의미 | 구성에 미치는 영향 | 통찰력이 결정된 경우 | 추가 참고자료 |
---|---|---|---|---|
상수 | 열은 모든 행에 대해 동일한 값을 가집니다. | 열을 대상 또는 포함된 기능으로 사용할 수 없습니다. | 버전 실행 전과 후 | 집합 크기 |
One-hot encoded | 기능 유형이 범주형이고 열의 고유 값이 14개 미만입니다. | 구성에 영향을 미치지 않습니다. | 버전 실행 전과 후 | 범주 인코딩 |
영향 인코딩 | 기능 유형이 범주형이고 열에 14개 이상의 고유한 값이 있습니다. | 구성에 영향을 미치지 않습니다. | 버전 실행 전과 후 | 범주 인코딩 |
높은 집합 크기 | 열에 고유한 값이 너무 많아 기능으로 사용할 경우 모델 성능에 부정적인 영향을 미칠 수 있습니다. | 열을 대상으로 사용할 수 없습니다. 기능으로 자동 제외되지만 필요한 경우 계속 포함될 수 있습니다. | 버전 실행 전과 후 | 집합 크기 |
스파스 데이터 | 열에 null 값이 너무 많습니다. | 열을 대상 또는 포함된 기능으로 사용할 수 없습니다. | 버전 실행 전과 후 | null의 대체 |
불충분하게 표시된 클래스 | 열에 행이 10개 미만인 클래스가 있습니다. | 열을 대상으로 사용할 수 없지만 기능으로 포함할 수 있습니다. | 버전 실행 전과 후 | - |
<number of>개의 자동 엔지니어링 기능 | 열은 자동 엔지니어링 기능을 생성하는 데 사용할 수 있는 상위 기능입니다. | 이 상위 기능이 날짜 기능으로 해석되면 구성에서 자동으로 제거됩니다. 대신 생성될 수 있는 자동 엔지니어링 날짜 기능을 사용하는 것이 좋습니다. 이 설정을 재정의하고 자동 엔지니어링 기능 대신 기능을 포함할 수 있습니다. | 버전 실행 전과 후 | 자동 기능 엔지니어링 |
자동 엔지니어링 기능 | 열은 상위 날짜 기능에서 생성될 수 있거나 생성된 자동 엔지니어링 기능입니다. 원본 데이터 집합에는 나타나지 않았습니다. | 실험 교육 중에 이러한 자동 엔지니어링 기능 중 하나 이상을 제거할 수 있습니다. 상위 기능의 기능 유형을 범주형으로 전환하면 모든 자동 엔지니어링 기능이 제거됩니다. | 버전 실행 전과 후 | 자동 기능 엔지니어링 |
날짜로 처리할 수 없음 | 열에 날짜 및 시간 정보가 포함될 수 있지만 자동 엔지니어링 날짜 기능을 만드는 데 사용할 수는 없습니다. | 해당 기능이 구성에서 삭제되었습니다. 자동 엔지니어링 기능이 이전에 이 상위 기능에서 생성된 경우 향후 실험 버전에서는 제거됩니다. 실험에서 해당 기능을 계속 사용할 수 있지만 해당 기능 유형을 범주형으로 전환해야 합니다. | 버전을 실행한 후 | 날짜 기능 엔지니어링 |
가능한 무료 문자 | 해당 열을 무료 문자 기능으로 사용할 수 있습니다. | 무료 문자 기능 유형이 열에 할당됩니다. 기능을 무료 문자로 처리할 수 있는지 확인하려면 실험 버전을 실행해야 합니다. | 버전을 실행하기 전에 | 무료 문자 데이터의 처리 |
무료 문자 | 해당 열에 무료 문자가 포함되어 있는 것으로 확인되었습니다. 무료 문자로 처리 가능합니다. | 이 기능에는 추가 구성이 필요하지 않습니다. | 버전을 실행한 후 | 무료 문자 데이터의 처리 |
무료 문자로 처리할 수 없음 | 추가 분석 결과 해당 열을 무료 문자로 처리할 수 없습니다. | 다음 실험 버전의 구성에서 해당 기능을 선택 취소해야 합니다. 기능의 집합 크기가 높지 않은 경우 기능 유형을 범주형으로 변경할 수도 있습니다. | 버전을 실행한 후 | 무료 문자 데이터의 처리 |
대상 유출 | 이 기능은 대상 유출의 영향을 가져오는 것으로 의심됩니다. 그렇다면 예측하려는 대상 열에 대한 정보가 포함됩니다. 대상 유출이 있는 기능은 모델 성능에 대한 잘못된 확신을 줄 수 있습니다. 실제 예측에서는 모델의 성능이 매우 저하됩니다. | 이 기능은 모델을 교육하는 데 사용되지 않았습니다. | 버전을 실행한 후 | 데이터 유출 |
낮은 permutation importance | 이 기능은 모델 예측에 큰 영향을 미치지 않습니다. 이러한 기능을 제거하면 통계적 노이즈가 줄어들어 모델 성능이 향상됩니다. | 이 기능은 모델을 교육하는 데 사용되지 않았습니다. | 버전을 실행한 후 | permutation importance 이해 |
상관 관계가 높음 | 이 기능은 실험의 하나 이상의 다른 기능과 높은 상관 관계가 있습니다. 서로 높은 상관 관계가 있는 기능이 있으면 모델 성능이 저하됩니다. | 이 기능은 모델을 교육하는 데 사용되지 않았습니다. 상관 관계가 높은 기능은 높은 상관 관계로 인해 삭제되지 않았지만 낮은 permutation importance와 같은 다른 이유로 삭제되었을 수 있습니다. | 버전을 실행한 후 | 상관 관계 |