새 기능 열 만들기
기능 엔지니어링은 현재 기능 열에서 새 기능 열을 만드는 프로세스입니다. 이를 통해 비즈니스 질문에 답하기 위해 수집한 소스 데이터에서 추가 예측력을 얻을 수 있습니다.
예를 들어, 고객의 주소는 집합 크기가 높기 때문에 교육 데이터에서 제외됩니다. 주소를 사용하지 않고 거리 열을 기능 엔지니어링할 수 있습니다. 다양한 매장 위치와 함께 고객 주소를 알면 매장까지의 거리를 계산할 수 있습니다. 새 열에는 데이터에서 측정 가능한 패턴을 발견하는 데 사용할 수 있는 숫자 값이 있습니다.
AutoML에서 사용할 준비를 하기 위해 데이터 집합에 대한 기능 추출을 수행할 수 있습니다. 또한 AutoML은 기존 기능에서 자동으로 생성될 수 있는 새로운 기능을 제안합니다.
데이터 집합의 기능을 검토하여 발생할 수 있는 문제 또는 개선할 수 있는 사항을 확인합니다. 좋은 기능을 엔지니어링하려면 기술과 비즈니스 환경이 필요합니다. 대상 열에 직접 연결되는 방식으로 표현된 기능을 원합니다.
고려해야 할 사항:
-
시간이 기능에 영향을 미쳐야 합니까?
-
변경률이 중요합니까?
-
데이터 하위 집합 간의 차이를 설명하기 위해 기능을 정규화해야 합니까?
-
null 값이 의미가 있습니까?
자동 엔지니어링 기능
자동 기능 엔지니어링을 사용하면 기존 기능에서 새로운 기능이 자동으로 만들어집니다.
AutoML은 날짜 및 시간 정보가 포함된 열에서 자동 엔지니어링 기능을 생성합니다. 이러한 새로운 기능은 열 값의 각 구성 요소를 고유한 기능으로 분리합니다.
또한 무료 문자가 포함된 열에는 특수 처리가 적용될 수 있습니다. 원본 무료 문자 기능은 모델 교육을 개선하기 위해 새로운 기능으로 변환됩니다.
자동 엔지니어링 기능은 모델을 교육할 때 모델의 예측 및 분석 가치를 향상시킵니다. 자세한 내용은 자동 기능 엔지니어링을 참조하십시오.
예: 엔지니어링 기능
다음 예를 사용하여 데이터의 예측 특성을 향상시킬 수 있는 기능을 엔지니어링하는 방법에 대한 브레인스토밍을 시작합니다.
판매 기회가 닫힙니까?
대상 열은 판매 기회가 종료되었는지 여부(예 또는 아니오)입니다.
-
원래 기능: 회의 수
-
대체 기능: 월간 회의 또는 특정 단계의 회의 횟수
측정값을 회의 빈도로 변환하면 변경 내용을 더 잘 설명할 수 있습니다. 판매 프로세스의 특정 단계에서 회의를 측정하면 판매 모멘텀을 더 잘 표현하고 주기를 설명할 수 있습니다.
미래 트랜잭션 금액 예측
대상 열은 다음 트랜잭션의 금액입니다.
-
원래 기능: 마지막 주문 금액
-
대체 기능: 평균 주문 금액 또는 주문 금액의 백분율 변경 내용
평균 금액은 주문 행동에 대한 더 광범위한 설명을 제공합니다. 구매 패턴의 변경 내용은 정규화된 가치를 제공합니다.
고객이 이탈할까요?
대상 열은 고객이 이탈할지 여부(예 또는 아니오)입니다.
-
원래 기능: 고객 감정
-
대체 기능: 고객 감정의 변화 또는 현재 감정과 일치하는 일수
감정의 변경 내용을 측정하면 행동으로 이어질 가능성이 높아집니다. 일 수는 현재 상태의 기간을 나타냅니다.
직원이 자발적으로 퇴사합니까?
대상 열은 직원이 퇴직할지 여부(예 또는 아니요)입니다.
-
원래 기능: 급여
-
대체 기능: 동료와 비교한 급여 또는 업계 평균과 비교한 급여
급여를 동료와의 비교는 직원의 환경이나 감정에 영향을 미칩니다. 업계 평균 급여와의 비교는 직원의 기회 비용에 영향을 미칩니다.
리드가 기회로 변환됩니까?
대상 열은 리드가 변환되었는지 여부입니다(예 또는 아니요).
-
원래 기능: 찾은 방법
-
대체 기능: 답변됨(예 또는 아니요)
여기서 중요한 것은 행동이지 답변이 무엇인지가 아닙니다. 이 경우 null은 다음을 의미합니다.
날짜
AutoML의 자동 기능 엔지니어링 기능을 사용하면 날짜 및 타임스탬프 구성 요소가 자동으로 별도의 열로 구문 분석됩니다.
날짜는 다음과 같이 하나의 데이터 집합에 여러 기능을 만들기 위해 다양한 방법으로 조작될 수도 있습니다.
-
날짜를 계절, 분기 또는 학기별로 집계합니다.
-
날짜 차이(예: 마지막 구매 이후 일 수)를 계산합니다.