교육 데이터에 대한 통찰력 보기
교육 데이터를 추가하고 교육 버전을 실행하면 데이터가 처리되는 방식에 대한 통찰력에 액세스할 수 있습니다. 통찰력은 삭제되었거나 사용할 수 없거나 특수 처리를 통해 인코딩될 기능 등 실험의 대상 및 기능에 대한 정보를 제공합니다.
통찰력 열은 스키마 보기에 있는 경우 데이터 탭에 있습니다. 간략한 통찰력은 데이터 보기에서도 확인할 수 있습니다. 통찰력은 실험 내에서 교육된 각 모델에 대해 개별적으로 만들어집니다.
통찰력이 생성됨:
-
교육 데이터를 추가하거나 변경했지만 아직 실험 버전을 실행하지 않은 경우.
-
각 실험 버전이 실행된 후. 교육된 각 모델에 대해 별도의 통찰력 집합이 만들어집니다.
버전을 실행하기 전과 후에 통찰력이 다를 수 있습니다. 교육이 시작되면 AutoML이 데이터를 사전 처리하고 데이터 관련 문제를 추가로 진단할 수 있기 때문입니다. 자세한 내용은 자동 데이터 준비 및 변환을 참조하십시오.
교육 전 통찰력 보기
실험 버전을 실행하기 전에 통찰력을 분석하여 현재 교육 데이터가 어떻게 해석되고 있는지 확인할 수 있습니다.이러한 정보는 버전을 실행한 후에 변경될 수 있습니다.
다음과 같이 하십시오.
실험에서 실험 버전에 사용하려는 교육 데이터를 추가했는지 확인합니다.
데이터 탭을 엽니다.
현재 상태가 스키마 보기인지 확인합니다.
통찰력 항목을 분석합니다. 도구 설명은 통찰력 뒤에 추가 컨텍스트를 제공합니다. 각 통찰력의 의미에 대한 자세한 설명은 데이터 집합 통찰력 해석을 참조하십시오.
모델에 대한 통찰력 보기
모델이 실험 버전에 대한 교육을 마친 후 모델을 선택하고 데이터가 어떻게 처리되었는지 검사합니다.
다음과 같이 하십시오.
실험 버전을 실행한 다음 데이터 탭을 엽니다.
도구 모음의 드롭다운 목록에서 모델을 선택합니다.
현재 상태가 스키마 보기인지 확인합니다.
통찰력 항목을 분석합니다. 도구 설명은 통찰력 뒤에 추가 컨텍스트를 제공합니다. 각 통찰력의 의미에 대한 자세한 설명은 데이터 집합 통찰력 해석을 참조하십시오.
데이터 집합 통찰력 해석
다음 테이블에서는 스키마에 표시될 수 있는 가능한 통찰력에 대한 자세한 내용을 제공합니다.
통찰력 | 의미 | 구성에 미치는 영향 | 통찰력이 결정된 경우 | 추가 참고자료 |
---|---|---|---|---|
상수 | 열은 모든 행에 대해 동일한 값을 가집니다. | 열을 대상 또는 포함된 기능으로 사용할 수 없습니다. | 버전 실행 전과 후 | 집합 크기 |
One-hot encoded | 기능 유형이 범주형이고 열의 고유 값이 14개 미만입니다. | 구성에 영향을 미치지 않습니다. | 버전 실행 전과 후 | 범주 인코딩 |
영향 인코딩 | 기능 유형이 범주형이고 열에 14개 이상의 고유한 값이 있습니다. | 구성에 영향을 미치지 않습니다. | 버전 실행 전과 후 | 범주 인코딩 |
높은 집합 크기 | 열에 고유한 값이 너무 많아 기능으로 사용할 경우 모델 성능에 부정적인 영향을 미칠 수 있습니다. | 열을 대상으로 사용할 수 없습니다. 기능으로 자동 제외되지만 필요한 경우 계속 포함될 수 있습니다. | 버전 실행 전과 후 | 집합 크기 |
스파스 데이터 | 열에 null 값이 너무 많습니다. | 열을 대상 또는 포함된 기능으로 사용할 수 없습니다. | 버전 실행 전과 후 | null의 대체 |
불충분하게 표시된 클래스 | 열에 행이 10개 미만인 클래스가 있습니다. | 열을 대상으로 사용할 수 없지만 기능으로 포함할 수 있습니다. | 버전 실행 전과 후 | - |
<number of>개의 자동 엔지니어링 기능 | 열은 자동 엔지니어링 기능을 생성하는 데 사용할 수 있는 상위 기능입니다. | 이 상위 기능이 날짜 기능으로 해석되면 구성에서 자동으로 제거됩니다. 대신 생성될 수 있는 자동 엔지니어링 날짜 기능을 사용하는 것이 좋습니다. 이 설정을 재정의하고 자동 엔지니어링 기능 대신 기능을 포함할 수 있습니다. | 버전 실행 전과 후 | 자동 기능 엔지니어링 |
자동 엔지니어링 기능 | 열은 상위 날짜 기능에서 생성될 수 있거나 생성된 자동 엔지니어링 기능입니다. 원본 데이터 집합에는 나타나지 않았습니다. | 실험 교육 중에 이러한 자동 엔지니어링 기능 중 하나 이상을 제거할 수 있습니다. 상위 기능의 기능 유형을 범주형으로 전환하면 모든 자동 엔지니어링 기능이 제거됩니다. | 버전 실행 전과 후 | 자동 기능 엔지니어링 |
날짜로 처리할 수 없음 | 열에 날짜 및 시간 정보가 포함될 수 있지만 자동 엔지니어링 날짜 기능을 만드는 데 사용할 수는 없습니다. | 해당 기능이 구성에서 삭제되었습니다. 자동 엔지니어링 기능이 이전에 이 상위 기능에서 생성된 경우 향후 실험 버전에서는 제거됩니다. 실험에서 해당 기능을 계속 사용할 수 있지만 해당 기능 유형을 범주형으로 전환해야 합니다. | 버전을 실행한 후 | 날짜 기능 엔지니어링 |
가능한 무료 문자 | 해당 열을 무료 문자 기능으로 사용할 수 있습니다. | 무료 문자 기능 유형이 열에 할당됩니다. 기능을 무료 문자로 처리할 수 있는지 확인하려면 실험 버전을 실행해야 합니다. | 버전을 실행하기 전에 | 무료 문자 데이터의 처리 |
무료 문자 | 해당 열에 무료 문자가 포함되어 있는 것으로 확인되었습니다. 무료 문자로 처리 가능합니다. | 이 기능에는 추가 구성이 필요하지 않습니다. | 버전을 실행한 후 | 무료 문자 데이터의 처리 |
무료 문자로 처리할 수 없음 | 추가 분석 결과 해당 열을 무료 문자로 처리할 수 없습니다. | 다음 실험 버전의 구성에서 해당 기능을 선택 취소해야 합니다. 기능의 집합 크기가 높지 않은 경우 기능 유형을 범주형으로 변경할 수도 있습니다. | 버전을 실행한 후 | 무료 문자 데이터의 처리 |
대상 유출 | 이 기능은 대상 유출의 영향을 가져오는 것으로 의심됩니다. 그렇다면 예측하려는 대상 열에 대한 정보가 포함됩니다. 대상 유출이 있는 기능은 모델 성능에 대한 잘못된 확신을 줄 수 있습니다. 실제 예측에서는 모델의 성능이 매우 저하됩니다. | 이 기능은 모델을 교육하는 데 사용되지 않았습니다. | 버전을 실행한 후 | 데이터 유출 |
낮은 permutation importance | 이 기능은 모델 예측에 큰 영향을 미치지 않습니다. 이러한 기능을 제거하면 통계적 노이즈가 줄어들어 모델 성능이 향상됩니다. | 이 기능은 모델을 교육하는 데 사용되지 않았습니다. | 버전을 실행한 후 | permutation importance 이해 |
상관 관계가 높음 | 이 기능은 실험의 하나 이상의 다른 기능과 높은 상관 관계가 있습니다. 서로 높은 상관 관계가 있는 기능이 있으면 모델 성능이 저하됩니다. | 이 기능은 모델을 교육하는 데 사용되지 않았습니다. 상관 관계가 높은 기능은 높은 상관 관계로 인해 삭제되지 않았지만 낮은 permutation importance와 같은 다른 이유로 삭제되었을 수 있습니다. | 버전을 실행한 후 | 상관 관계 |