예측에서 날짜 기능 작업
자동 엔지니어링된 날짜 기능으로 학습된 ML 배포에서 예측을 실행할 때, 적용 데이터에서 날짜와 시간을 지정하는 방법에 대한 요구 사항이 있습니다. 이러한 요구 사항 및 고려 사항은 일괄 예측, 실시간 예측을 실행하는지 또는 Qlik 프로젝트 분석 커넥터를 사용하는지에 따라 약간 다릅니다.
자동 날짜 기능 엔지니어링
자동 기능 엔지니어링은 모델 학습 중에 ML 실험에서 수행되는 데이터 준비 단계입니다. 이 프로세스를 통해 훈련 데이터 세트에서 새로운 기능이 생성된 다음 모델을 훈련하는 데 사용됩니다. 날짜 기능 열의 경우 이 프로세스는 기본적으로 자동으로 수행됩니다. 사용자는 날짜 기능 엔지니어링을 선택 해제할 수 있습니다. 하지만 대부분의 경우 이 기능을 사용하는 것이 좋습니다.
자세한 내용은 날짜 기능 엔지니어링을 참조하십시오.
일괄 예측을 위한 요구 사항
교육 데이터 집합을 사용하여 모델을 만들 때 자동 엔지니어링된 날짜 기능이 생성됩니다. 이 모델은 새로운 데이터에 대한 예측을 위해 ML 배포로 배포 및 사용됩니다(일괄 예측의 경우, 이는 적용 데이터 집합입니다).
자동 엔지니어링 날짜 기능으로 교육된 모델이 예측을 위해 배포되는 경우 예측을 생성하는 적용 데이터 집합에는 자동 엔지니어링 날짜 기능이 포함될 필요가 없습니다. Qlik 프로젝트은 예측하기 전에 적용 데이터 집합에 대한 자동 엔지니어링 기능을 생성합니다. 그러나 적용 데이터 집합에는 상위 날짜 기능(날짜 부분이 파생된)이 포함되어야 하며, 사용 중인 열은 날짜, 날짜/시간, 타임스탬프 또는 시간 데이터 유형이어야 합니다.
SHAP 및 적용 데이터 집합을 포함하여 ML 배포로 만들어진 예측 데이터 집합에는 자동 엔지니어링 날짜 기능이 포함됩니다.
실시간 및 커넥터 기반 예측에 대한 요구 사항
실시간 예측 및 Qlik 프로젝트 분석 커넥터에서 예측을 실행할 때, Qlik 프로젝트에 제공하는 적용 데이터의 날짜 기능에 대한 요구 사항이 있습니다. 이러한 유형의 예측의 경우, 적용 데이터는 적용 데이터 집합으로 지정되는 대신 작은 JSON 페이로드로 지정됩니다. 실시간 및 커넥터 기반 예측 모두에 대해 Machine Learning API의 실시간 예측 엔드포인트로 JSON 페이로드를 전송합니다.
기계 학습 API의 실시간 예측 종료 지점이 날짜 및 타임스탬프 필드를 처리할 수 있도록 종료 지점에 보내는 JSON 페이로드는 아래 요구 사항을 따라야 합니다.
-
날짜 및 날짜/시간 값은 ISO 8601 표준에 따라 형식이 지정된 문자열이어야 합니다. 예:
-
2020-01-14
-
2020-01-14T00:00:00.000Z
-
-
상위 날짜(날짜 부분이 파생된 기능)는 전체적으로 포함되어야 합니다. 예를 들어, 모델에서 연도 기능만 사용할 수 있지만 날짜는 ISO 8601 호환 형식으로 제공해야 합니다.
-
각 열 내의 데이터는 표준 시간대가 동일해야 합니다.
위의 요구 사항:
-
날짜 기능 엔지니어링으로 학습된 기능에만 적용됩니다. 기능 유형이 수동으로 범주형 기능 유형으로 변경된 경우, 이러한 요구 사항은 적용되지 않습니다. 기능 유형이 범주형으로 변경된 경우, 원래 학습에 사용된 날짜 형식으로 된 열을 적용 데이터에 제공하십시오.
-
시계열 모델에는 적용되지 않습니다.
실시간 예측 API는 사용 중지되었으며 기계 학습 API의 실시간 예측 종료 지점으로 바뀌었습니다. 기능 자체가 사용 중지된 것은 아닙니다. 향후 실시간 예측을 위해서는 기계 학습 API의 실시간 예측 종료 지점을 사용합니다. 실시간 예측 API에서 기계 학습 API로 마이그레이션하는 데 대한 도움말은 Qlik Cloud 개발자 포털의 마이그레이션 가이드를 참조하십시오.