학습 데이터에 대한 인사이트 보기

학습 데이터를 추가하고 학습 버전을 실행하면 데이터가 처리되는 방식에 대한 인사이트에 액세스할 수 있습니다. 인사이트는 제외되었거나 사용할 수 없거나 특별한 처리를 통해 인코딩될 기능과 같이 실험의 대상 및 기능에 대한 정보를 제공합니다.

구성/학습 데이터 탭에 있을 때 스키마 보기에서 인사이트 열을 찾을 수 있습니다. 요약된 인사이트는 테이블 데이터 보기에서도 제공됩니다. 인사이트는 실험 내에서 학습된 각 모델에 대해 개별적으로 생성됩니다.

학습 데이터 세트의 각 기능 열에 대해 표시된 인사이트 — 스키마 보기의 인사이트 열

인사이트가 생성되는 시점:

학습 데이터를 추가하거나 변경했지만 아직 실험 버전을 실행하지 않은 경우.
각 실험 버전이 실행된 후. 학습된 각 모델에 대해 별도의 인사이트 세트가 생성됩니다.

버전을 실행하기 전과 실행한 후의 인사이트가 다를 수 있습니다. 이는 학습이 시작됨에 따라 Qlik 프로젝트가 데이터를 전처리하고 데이터의 문제를 추가로 진단할 수 있기 때문입니다. 자세한 내용은 자동 데이터 준비 및 변환을 참조하십시오.

학습 전 인사이트 보기

실험 버전을 실행하기 전에 인사이트를 분석하여 현재 학습 데이터가 어떻게 해석되고 있는지 확인할 수 있습니다. 이러한 인사이트는 버전을 실행한 후에 변경될 수 있습니다.

다음과 같이 하십시오.

실험에서 실험 버전에 사용할 학습 데이터를 추가했는지 확인합니다.
구성/학습 데이터 탭을 엽니다.
스키마 보기에 있는지 확인합니다.
인사이트 열을 분석합니다. 도구 설명은 인사이트에 대한 추가 컨텍스트를 제공합니다. 각 인사이트의 의미에 대한 자세한 설명은 데이터 세트 인사이트 해석을 참조하십시오.

모델에 대한 인사이트 보기

실험 버전에 대한 모델 학습이 완료되면 모델을 선택하고 데이터가 어떻게 처리되었는지 검사합니다.

다음과 같이 하십시오.

실험 버전을 실행한 다음 구성/학습 데이터 탭을 엽니다.
도구 모음의 드롭다운 목록에서 모델을 선택합니다.
스키마 보기에 있는지 확인합니다.
인사이트 열을 분석합니다. 도구 설명은 인사이트에 대한 추가 컨텍스트를 제공합니다. 각 인사이트의 의미에 대한 자세한 설명은 데이터 세트 인사이트 해석을 참조하십시오.

데이터 세트 인사이트 해석

다음 테이블은 스키마에 표시될 수 있는 가능한 인사이트에 대한 자세한 정보를 제공합니다.

일반 인사이트

데이터 세트 인사이트 — 일반
인사이트	의미	구성에 미치는 영향	인사이트 결정 시점	추가 참조
Constant	열의 모든 행에 동일한 값이 있습니다.	해당 열은 대상 또는 포함된 기능으로 사용할 수 없습니다.	버전 실행 전 및 실행 후	카디널리티
One-hot encoded	기능 유형이 범주형이고 열에 고유 값이 14개 미만입니다.	구성에 영향이 없습니다.	버전 실행 전 및 실행 후	범주 인코딩
Impact encoded	기능 유형이 범주형이고 열에 고유 값이 14개 이상입니다.	구성에 영향이 없습니다.	버전 실행 전 및 실행 후	범주 인코딩
High cardinality	열에 고유 값이 너무 많아 기능으로 사용할 경우 모델 성능에 부정적인 영향을 미칠 수 있습니다.	해당 열은 대상으로 사용할 수 없습니다. 기능에서 자동으로 제외되지만 필요한 경우 여전히 포함할 수 있습니다.	버전 실행 전 및 실행 후	카디널리티
Sparse data	열에 null 값이 너무 많습니다.	해당 열은 대상 또는 포함된 기능으로 사용할 수 없습니다.	버전 실행 전 및 실행 후	null의 대체
Underrepresented class	열에 행이 10개 미만인 클래스가 있습니다.	해당 열은 대상으로 사용할 수 없지만 기능으로 포함할 수는 있습니다.	버전 실행 전 및 실행 후	-
Feature transform failed	기능의 기능 유형이 기본 유형에서 수동으로 변경되었습니다. 이 구성에서 오류가 발생했습니다.	이 기능 변환을 사용하면 실험 버전을 성공적으로 실행할 수 없습니다. 기능의 기능 유형을 이전 값으로 되돌리거나 학습에서 해당 기능을 제외하십시오.	버전 실행 후	기능 유형 변경

자동 기능 엔지니어링 인사이트

데이터 세트 인사이트 — 자동 기능 엔지니어링
인사이트	의미	구성에 미치는 영향	인사이트 결정 시점	추가 참조
<number of> auto-engineered features	해당 열은 자동 엔지니어링된 기능을 생성하는 데 사용할 수 있는 상위 기능입니다.	이 상위 기능이 날짜 기능으로 해석되면 구성에서 자동으로 제거됩니다. 대신 이 기능에서 생성할 수 있는 자동 엔지니어링된 날짜 기능을 사용하는 것이 좋습니다. 이 설정을 재정의하고 자동 엔지니어링된 기능 대신 해당 기능을 포함할 수 있습니다.	버전 실행 전 및 실행 후	자동 기능 엔지니어링
Auto-engineered feature	해당 열은 상위 날짜 기능에서 생성될 수 있거나 생성된 자동 엔지니어링된 기능입니다. 원래 데이터 세트에는 나타나지 않았습니다.	실험 학습 중에 이러한 자동 엔지니어링된 기능 중 하나 이상을 제거할 수 있습니다. 상위 기능의 기능 유형을 범주형으로 전환하면 모든 자동 엔지니어링된 기능이 제거됩니다.	버전 실행 전 및 실행 후	자동 기능 엔지니어링
Could not process as date	열에 날짜 및 시간 정보가 포함되어 있을 수 있지만 자동 엔지니어링된 날짜 기능을 만드는 데 사용할 수 없습니다.	해당 기능이 구성에서 제외됩니다. 이전에 이 상위 기능에서 자동 엔지니어링된 기능이 생성된 경우 향후 실험 버전에서 제거됩니다. 실험에서 해당 기능을 계속 사용할 수 있지만 기능 유형을 범주형으로 전환해야 합니다.	버전 실행 후	자동 기능 엔지니어링
Possible free text	해당 열을 자유 텍스트 기능으로 사용할 수 있습니다.	자유 텍스트 기능 유형이 열에 할당됩니다. 기능이 자유 텍스트로 처리될 수 있는지 확인하려면 실험 버전을 실행해야 합니다.	버전 실행 전	자동 기능 엔지니어링
Free text	열에 자유 텍스트가 포함되어 있는 것으로 확인되었습니다. 자유 텍스트로 처리할 수 있습니다.	기능에 대한 추가 구성은 필요하지 않습니다.	버전 실행 후	자동 기능 엔지니어링
Could not process as free text	추가 분석 결과, 해당 열은 자유 텍스트로 처리할 수 없습니다.	다음 실험 버전의 구성에서 해당 기능을 선택 취소해야 합니다. 기능에 높은 카디널리티가 없는 경우 대체 가능 값으로 기능 유형을 범주형으로 변경할 수 있습니다.	버전 실행 후	자동 기능 엔지니어링

지능형 모델 최적화 인사이트

데이터 세트 인사이트 — 지능형 모델 최적화
인사이트	의미	구성에 미치는 영향	인사이트 결정 시점	추가 참조
Target leakage	해당 기능은 대상 누출의 영향을 받는 것으로 의심됩니다. 그런 경우 예측하려는 대상 열에 대한 정보가 포함됩니다. 대상 누출이 있는 기능은 모델 성능에 대해 잘못된 확신을 줄 수 있습니다. 실제 예측에서 이러한 기능은 모델 성능을 매우 저하시킵니다.	해당 기능은 모델을 학습시키는 데 사용되지 않았습니다.	버전 실행 후	데이터 유출
Low permutation importance	해당 기능은 모델 예측에 거의 또는 전혀 영향을 미치지 않습니다. 이러한 기능을 제거하면 통계적 노이즈가 줄어들어 모델 성능이 향상됩니다.	해당 기능은 모델을 학습시키는 데 사용되지 않았습니다.	버전 실행 후	permutation importance 이해
Highly correlated	해당 기능은 실험의 하나 이상의 다른 기능과 높은 상관 관계가 있습니다. 서로 높은 상관 관계가 있는 기능을 사용하면 모델 성능이 저하됩니다.	해당 기능은 모델을 학습시키는 데 사용되지 않았습니다. 이 기능과 높은 상관 관계가 있는 기능은 높은 상관 관계로 인해 제외되지 않았지만, 낮은 순열 중요도와 같은 다른 이유로 제외되었을 수 있습니다.	버전 실행 후	상관 관계

시계열 예측 인사이트

데이터 세트 인사이트 — 시계열 예측
인사이트	의미	구성에 미치는 영향	인사이트 결정 시점	추가 참조
Possible date index	해당 기능은 시계열 실험의 날짜 인덱스로 사용할 수 있습니다.	시계열 날짜 인덱스로 사용되는 경우 열의 데이터는 미래를 예측할 수 있는 기간과 같은 시계열 구성의 측면에 영향을 미칠 수 있습니다. 날짜 인덱스의 값은 고정된 시간 간격으로 각 행 또는 고유 그룹 값에 따라 증가해야 합니다.	버전 실행 전	시계열 실험 작업 날짜 인덱스

편향 감지 인사이트

데이터 세트 인사이트 — 편향 감지
인사이트	의미	구성에 미치는 영향	인사이트 결정 시점	추가 참조
Data bias detected	대상 열의 값과 관련하여 일부 그룹(값)이 다른 그룹에 비해 과소 표현됩니다.	편향 감지 결과를 분석하여 다음 단계를 결정합니다. 여기에는 기능 제외, 데이터 세트 변경 또는 수정된 프레임워크로 새 실험 만들기가 포함될 수 있습니다.	버전 실행 후	머신러닝 모델에서 편향 감지
Representation bias detected	학습된 모델이 예측을 생성하기 위해 기능의 데이터를 사용하는 방식에서 편향이 감지되었습니다.	편향 감지 결과를 분석하여 다음 단계를 결정합니다. 여기에는 기능 제외, 데이터 세트 변경 또는 수정된 프레임워크로 새 실험 만들기가 포함될 수 있습니다.	버전 실행 후	머신러닝 모델에서 편향 감지

이 페이지가 도움이 되었습니까?

이 페이지 또는 해당 콘텐츠에서 오타, 누락된 단계 또는 기술적 오류와 같은 문제를 발견하면 알려 주십시오!

여기에 피드백을 남겨주십시오.