학습 데이터에 대한 인사이트 보기
학습 데이터를 추가하고 학습 버전을 실행하면 데이터가 처리되는 방식에 대한 인사이트에 액세스할 수 있습니다. 인사이트는 제외되었거나 사용할 수 없거나 특별한 처리를 통해 인코딩될 기능과 같이 실험의 대상 및 기능에 대한 정보를 제공합니다.
구성/학습 데이터 탭에 있을 때 스키마 보기에서 인사이트 열을 찾을 수 있습니다. 요약된 인사이트는
데이터 보기에서도 제공됩니다. 인사이트는 실험 내에서 학습된 각 모델에 대해 개별적으로 생성됩니다.
스키마 보기의 인사이트 열
인사이트가 생성되는 시점:
-
학습 데이터를 추가하거나 변경했지만 아직 실험 버전을 실행하지 않은 경우.
-
각 실험 버전이 실행된 후. 학습된 각 모델에 대해 별도의 인사이트 세트가 생성됩니다.
버전을 실행하기 전과 실행한 후의 인사이트가 다를 수 있습니다. 이는 학습이 시작됨에 따라 Qlik 프로젝트가 데이터를 전처리하고 데이터의 문제를 추가로 진단할 수 있기 때문입니다. 자세한 내용은 자동 데이터 준비 및 변환을 참조하십시오.
학습 전 인사이트 보기
실험 버전을 실행하기 전에 인사이트를 분석하여 현재 학습 데이터가 어떻게 해석되고 있는지 확인할 수 있습니다. 이러한 인사이트는 버전을 실행한 후에 변경될 수 있습니다.
다음과 같이 하십시오.
-
실험에서 실험 버전에 사용할 학습 데이터를 추가했는지 확인합니다.
-
구성/학습 데이터 탭을 엽니다.
-
스키마 보기에 있는지 확인합니다.
-
인사이트 열을 분석합니다. 도구 설명은 인사이트에 대한 추가 컨텍스트를 제공합니다. 각 인사이트의 의미에 대한 자세한 설명은 데이터 세트 인사이트 해석을 참조하십시오.
모델에 대한 인사이트 보기
실험 버전에 대한 모델 학습이 완료되면 모델을 선택하고 데이터가 어떻게 처리되었는지 검사합니다.
다음과 같이 하십시오.
-
실험 버전을 실행한 다음 구성/학습 데이터 탭을 엽니다.
-
도구 모음의 드롭다운 목록에서 모델을 선택합니다.
-
스키마 보기에 있는지 확인합니다.
-
인사이트 열을 분석합니다. 도구 설명은 인사이트에 대한 추가 컨텍스트를 제공합니다. 각 인사이트의 의미에 대한 자세한 설명은 데이터 세트 인사이트 해석을 참조하십시오.
데이터 세트 인사이트 해석
다음 테이블은 스키마에 표시될 수 있는 가능한 인사이트에 대한 자세한 정보를 제공합니다.
일반 인사이트
| 인사이트 | 의미 | 구성에 미치는 영향 | 인사이트 결정 시점 | 추가 참조 |
|---|---|---|---|---|
| Constant | 열의 모든 행에 동일한 값이 있습니다. | 해당 열은 대상 또는 포함된 기능으로 사용할 수 없습니다. | 버전 실행 전 및 실행 후 | 카디널리티 |
| One-hot encoded | 기능 유형이 범주형이고 열에 고유 값이 14개 미만입니다. | 구성에 영향이 없습니다. | 버전 실행 전 및 실행 후 | 범주 인코딩 |
| Impact encoded | 기능 유형이 범주형이고 열에 고유 값이 14개 이상입니다. | 구성에 영향이 없습니다. | 버전 실행 전 및 실행 후 | 범주 인코딩 |
| High cardinality | 열에 고유 값이 너무 많아 기능으로 사용할 경우 모델 성능에 부정적인 영향을 미칠 수 있습니다. | 해당 열은 대상으로 사용할 수 없습니다. 기능에서 자동으로 제외되지만 필요한 경우 여전히 포함할 수 있습니다. | 버전 실행 전 및 실행 후 | 카디널리티 |
| Sparse data | 열에 null 값이 너무 많습니다. | 해당 열은 대상 또는 포함된 기능으로 사용할 수 없습니다. | 버전 실행 전 및 실행 후 | null의 대체 |
| Underrepresented class | 열에 행이 10개 미만인 클래스가 있습니다. | 해당 열은 대상으로 사용할 수 없지만 기능으로 포함할 수는 있습니다. | 버전 실행 전 및 실행 후 | - |
| Feature transform failed | 기능의 기능 유형이 기본 유형에서 수동으로 변경되었습니다. 이 구성에서 오류가 발생했습니다. | 이 기능 변환을 사용하면 실험 버전을 성공적으로 실행할 수 없습니다. 기능의 기능 유형을 이전 값으로 되돌리거나 학습에서 해당 기능을 제외하십시오. | 버전 실행 후 | 기능 유형 변경 |
자동 기능 엔지니어링 인사이트
| 인사이트 | 의미 | 구성에 미치는 영향 | 인사이트 결정 시점 | 추가 참조 |
|---|---|---|---|---|
| <number of> auto-engineered features | 해당 열은 자동 엔지니어링된 기능을 생성하는 데 사용할 수 있는 상위 기능입니다. | 이 상위 기능이 날짜 기능으로 해석되면 구성에서 자동으로 제거됩니다. 대신 이 기능에서 생성할 수 있는 자동 엔지니어링된 날짜 기능을 사용하는 것이 좋습니다. 이 설정을 재정의하고 자동 엔지니어링된 기능 대신 해당 기능을 포함할 수 있습니다. | 버전 실행 전 및 실행 후 | 자동 기능 엔지니어링 |
| Auto-engineered feature | 해당 열은 상위 날짜 기능에서 생성될 수 있거나 생성된 자동 엔지니어링된 기능입니다. 원래 데이터 세트에는 나타나지 않았습니다. | 실험 학습 중에 이러한 자동 엔지니어링된 기능 중 하나 이상을 제거할 수 있습니다. 상위 기능의 기능 유형을 범주형으로 전환하면 모든 자동 엔지니어링된 기능이 제거됩니다. | 버전 실행 전 및 실행 후 | 자동 기능 엔지니어링 |
| Could not process as date | 열에 날짜 및 시간 정보가 포함되어 있을 수 있지만 자동 엔지니어링된 날짜 기능을 만드는 데 사용할 수 없습니다. | 해당 기능이 구성에서 제외됩니다. 이전에 이 상위 기능에서 자동 엔지니어링된 기능이 생성된 경우 향후 실험 버전에서 제거됩니다. 실험에서 해당 기능을 계속 사용할 수 있지만 기능 유형을 범주형으로 전환해야 합니다. | 버전 실행 후 | 자동 기능 엔지니어링 |
| Possible free text | 해당 열을 자유 텍스트 기능으로 사용할 수 있습니다. | 자유 텍스트 기능 유형이 열에 할당됩니다. 기능이 자유 텍스트로 처리될 수 있는지 확인하려면 실험 버전을 실행해야 합니다. | 버전 실행 전 | 자동 기능 엔지니어링 |
| Free text | 열에 자유 텍스트가 포함되어 있는 것으로 확인되었습니다. 자유 텍스트로 처리할 수 있습니다. | 기능에 대한 추가 구성은 필요하지 않습니다. | 버전 실행 후 | 자동 기능 엔지니어링 |
| Could not process as free text | 추가 분석 결과, 해당 열은 자유 텍스트로 처리할 수 없습니다. | 다음 실험 버전의 구성에서 해당 기능을 선택 취소해야 합니다. 기능에 높은 카디널리티가 없는 경우 대체 가능 값으로 기능 유형을 범주형으로 변경할 수 있습니다. | 버전 실행 후 | 자동 기능 엔지니어링 |
지능형 모델 최적화 인사이트
| 인사이트 | 의미 | 구성에 미치는 영향 | 인사이트 결정 시점 | 추가 참조 |
|---|---|---|---|---|
| Target leakage | 해당 기능은 대상 누출의 영향을 받는 것으로 의심됩니다. 그런 경우 예측하려는 대상 열에 대한 정보가 포함됩니다. 대상 누출이 있는 기능은 모델 성능에 대해 잘못된 확신을 줄 수 있습니다. 실제 예측에서 이러한 기능은 모델 성능을 매우 저하시킵니다. | 해당 기능은 모델을 학습시키는 데 사용되지 않았습니다. | 버전 실행 후 | 데이터 유출 |
| Low permutation importance | 해당 기능은 모델 예측에 거의 또는 전혀 영향을 미치지 않습니다. 이러한 기능을 제거하면 통계적 노이즈가 줄어들어 모델 성능이 향상됩니다. | 해당 기능은 모델을 학습시키는 데 사용되지 않았습니다. | 버전 실행 후 | permutation importance 이해 |
| Highly correlated | 해당 기능은 실험의 하나 이상의 다른 기능과 높은 상관 관계가 있습니다. 서로 높은 상관 관계가 있는 기능을 사용하면 모델 성능이 저하됩니다. | 해당 기능은 모델을 학습시키는 데 사용되지 않았습니다. 이 기능과 높은 상관 관계가 있는 기능은 높은 상관 관계로 인해 제외되지 않았지만, 낮은 순열 중요도와 같은 다른 이유로 제외되었을 수 있습니다. | 버전 실행 후 | 상관 관계 |
시계열 예측 인사이트
편향 감지 인사이트
| 인사이트 | 의미 | 구성에 미치는 영향 | 인사이트 결정 시점 | 추가 참조 |
|---|---|---|---|---|
| Data bias detected | 대상 열의 값과 관련하여 일부 그룹(값)이 다른 그룹에 비해 과소 표현됩니다. | 편향 감지 결과를 분석하여 다음 단계를 결정합니다. 여기에는 기능 제외, 데이터 세트 변경 또는 수정된 프레임워크로 새 실험 만들기가 포함될 수 있습니다. | 버전 실행 후 | 머신러닝 모델에서 편향 감지 |
| Representation bias detected | 학습된 모델이 예측을 생성하기 위해 기능의 데이터를 사용하는 방식에서 편향이 감지되었습니다. | 편향 감지 결과를 분석하여 다음 단계를 결정합니다. 여기에는 기능 제외, 데이터 세트 변경 또는 수정된 프레임워크로 새 실험 만들기가 포함될 수 있습니다. | 버전 실행 후 | 머신러닝 모델에서 편향 감지 |