기본 콘텐츠로 건너뛰기 보완적인 콘텐츠로 건너뛰기

기능 중요성 이해

기능 중요도는 각 기능이 대상에 미치는 영향을 측정합니다. 데이터 집합 문제를 식별하고 모델을 개선하는 데 도움이 될 수 있습니다. 기능 중요도는 permutation importance와 SHAP importance라는 두 가지 고유한 시각화로 구성됩니다.

기능 중요도에 대한 단순한 해석은 가장 중요한 기능 변수를 변경하면 다른 변수를 변경하는 것보다 대상 변수가 더 많이 변경된다는 것입니다. 가장 중요한 기능 변수 중 두 가지를 변경하면 하나만 변경하는 것보다 더 큰 영향을 미칠 수 있지만 원칙적으로 기능 중요도가 매우 낮은 변수는 예측력이 크지 않을 수 있습니다. 제어하거나 변경해도 차이가 없을 수 있습니다.

기능 중요도 사용

기능 중요도는 모델 교육에 사용되는 데이터의 문제를 식별하는 데 도움이 될 수 있습니다. 예를 들어, 판매 기회가 종료될지 여부를 예측하려고 하는데 판매 종료 날짜가 포함된 열을 제외하는 것을 잊었다고 가정해 보겠습니다. 아마도 가장 예측 가능성이 높은 열이므로 기능 중요도가 가장 높을 것입니다. 판매 종료 여부에 대한 이진 결과를 예측하려고 할 때 종료 날짜에 액세스할 수 없기 때문에 이를 포함하면 모델이 실제보다 우수한 성능을 발휘할 수 있습니다.

기능 중요도는 모델을 반복적으로 개선하는 방법을 찾는 데 도움이 될 수도 있습니다. 가장 중요한 기능 값은 경우에 따라 분류할 수 있는 좋은 기반이 될 수 있습니다. 예를 들어, 자동 지불 플래그의 경우 기능이 매우 중요할 수 있습니다. 이 기능을 사용하여 데이터를 분류하고 자동 결제가 설정된 고객에 대해 하나의 모델을 교육하고 자동 결제가 없는 고객에 대해 다른 모델을 교육할 수 있습니다. 두 모델은 첫 번째 모델보다 우수한 작업을 수행할 수 있습니다.

다른 경우에는 중복성을 추가하지 않고도 보다 중요한 기능 변수가 설명하는 기능을 더 잘 나타내는 기능을 캡처하거나 엔지니어링할 수 있습니다. 예를 들어, 매우 중요한 변수는 비즈니스에서 생산하는 제품군일 수 있습니다. 제품군을 제품에 대한 몇 가지 설명 기능으로 나누는 것이 더 중요할 수 있습니다.

permutation importance와 SHAP importance 비교

permutation importance 및 SHAP importance는 기능 중요도를 측정하는 대체 방법입니다. 주요 차이점은 permutation importance는 모델 성능의 감소를 기반으로 하는 반면 SHAP importance는 특성 속성의 크기를 기반으로 한다는 것입니다.

값을 사용하는 방법

permutation importance는 다음과 같이 사용할 수 있습니다.

  • 유지할 기능과 제외할 기능을 파악합니다.

  • 데이터 유출을 확인하십시오.

  • 모델 정확도에 가장 중요한 기능이 무엇인지 파악합니다.

  • 추가 기능 엔지니어링을 안내합니다.

SHAP importance는 다음 용도로 사용할 수 있습니다.

  • 어떤 기능이 예측 결과에 가장 큰 영향을 미치는지 파악합니다.

  • 기능을 자세히 살펴보고 해당 기능의 다양한 값이 예측에 어떤 영향을 미치는지 파악합니다.

  • 데이터 내의 개별 행 또는 하위 집합에 가장 큰 영향을 미치는 요소를 파악합니다.

데이터 수준

permutation importance는 전체 데이터 집합에서 계산됩니다. 특히 기능을 제거하면 전체 데이터 집합의 정확도가 얼마나 변경되는지 파악합니다. 개별 행에 미치는 영향을 파악하는 데 사용할 수 없습니다.

SHAP importance는 행 수준에서 계산되며 특정 행에 중요한 사항을 이해하는 데 사용할 수 있습니다. 값은 기능이 데이터 집합의 평균 결과와 관련된 단일 행의 예측에 미치는 영향을 나타냅니다.

기능 값의 영향

permutation importance는 기능 내에서 가장 중요한 값을 이해하는 데 사용할 수 없습니다.

SHAP importance 값은 특정 기능 내의 값이 결과에 미치는 영향을 이해하는 데 사용할 수 있습니다.

방향

permutation importance에는 방향이 포함되지 않습니다.

SHAP importance 값에는 방향이 있습니다. 예측 결과에 영향을 미친 방향에 따라 긍정적일 수도 있고 부정적일 수도 있습니다.

크기

permutation importance의 크기는 기능이 모델의 전체 예측에 얼마나 중요한지를 측정합니다.

SHAP importance의 크기는 특정 기능이 데이터 집합의 평균 예측과 다른 행의 예측에 영향을 미치는 정도입니다.

자세한 정보

이 페이지가 도움이 되었습니까?

이 페이지 또는 해당 콘텐츠에서 오타, 누락된 단계 또는 기술적 오류와 같은 문제를 발견하면 개선 방법을 알려 주십시오!