시간 인식 모델 만들기
시간 인식 교육을 사용하면 교육 데이터에 있는 시간 기반 열을 따라 데이터를 예측하는 모델을 구축할 수 있습니다. 이 시간 기반 열의 영향을 가져오는 것으로 알려진 대상에 대한 예측을 해야 하는 경우 시간 인식 교육을 활성화합니다.
시간 인식 교육은 교육 데이터에 특수한 데이터 처리를 적용하여 데이터 유출을 줄이는 데 도움이 됩니다. 이러한 처리를 통해 기계 학습 알고리즘은 특정 날짜 또는 시간 차원에 따라 데이터와 예측 컨텍스트를 보다 정확하게 해석할 수 있습니다.
시간 인식 모델을 교육하려면 날짜 또는 타임스탬프 데이터가 포함된 교육 데이터 집합에 열이 필요합니다. 이 열은 교육 전에 데이터 집합을 정렬하는 데 사용되는 날짜 인덱스입니다. 날짜 인덱스에 대한 자세한 내용은 날짜 인덱스 요구 사항을 참조하십시오.
사용 시기
시간 인식 모델 교육은 교육에 이미 존재하는 시간 메트릭에 따른 변경 내용을 예측하는 모델에 이상적입니다. 예:
-
다음 달 판매를 예측하려고 하며 데이터 집합에 트랜잭션 날짜 열이 있습니다.
-
배송이 늦어지는 것과 관련된 메트릭을 예측하고 데이터 집합에 배송 날짜 열이 있는 경우
고려사항
사용 사례에 따라 시간 인식 모델 교육이 우수한 모델을 구축하는 데 도움이 될 수 있습니다. 다른 경우에는 AutoML이 제공하는 기본 교육 프로세스를 사용하면 우수한 결과를 얻을 수 있습니다. 일반적으로 데이터가 특정 시간 기반 열에 크게 의존하는 경우 시간 인식 모델 교육을 사용하는 것이 좋습니다.
Qlik AutoML에서 시간 인식 교육은 시계열 문제에 대해 지연된 기능을 생성하기 위해 자동화된 기능 엔지니어링을 수행하지 않습니다. 기능 엔지니어링이 필요한 시간 기반 사용 사례의 경우 데이터 집합 준비 단계에서 필요한 기능 엔지니어링을 수행하는 것이 좋습니다.
시간 인식 교육은 어떻게 작동합니까?
기계 학습의 일반 문제는 모델이 학습 시점에 사용할 수 있는 정보에 대해서만 학습되도록 하는 방법을 찾는 것입니다. 교육 데이터에 중요한 날짜 및 시간 정보가 포함되어 있는 경우 이 정보를 사용하여 데이터 유출을 방지할 수 있습니다.
날짜 인덱스 요구 사항
시간 인식 교육을 활성화하려면 모델 교육에 필요한 날짜 및 시간 정보가 포함된 열이 데이터 집합에 있어야 합니다. 교육을 위한 모델 최적화를 구성할 때 열을 선택합니다.
교육에서 열을 날짜 인덱스로 사용하려면 열에 다음 사항이 모두 있어야 합니다.
-
전체 날짜. 예를 들어, 월이나 일 값으로 구성된 열은 사용할 수 없습니다.
-
날짜 또는 타임스탬프 데이터 유형.
-
날짜 기능 유형.
홀드아웃 및 교차 유효성 검사
홀드아웃 및 교차 유효성 검사 과정에서 데이터를 분리하는 방법을 선택할 때, 임의 선택 방법을 통해 미래의 데이터를 모델 교육에 도입할 수 있습니다. 시간 인식 교육을 활성화하면 AutoML은 다음 프로세스를 사용합니다.
-
교육 데이터 집합은 교육 데이터와 홀드아웃 데이터로 분리되기 전에 선택한 인덱스 열에 따라 정렬됩니다.
-
각 교육 반복에서는 고정된 테스트 크기와 점차 커지는 교육 크기를 사용합니다. 반복이 이루어질 때마다 데이터는 점점 더 최신이 됩니다.
자세한 내용은 시간 기반 교차 유효성 검사을 참조하십시오.
기타 처리
시간 인식 모델 교육은 기본 교육 프로세스와 다른 여러 프로세스도 사용합니다. 예를 들어, 시간 인식 교육은 null 대체에 수정된 프로세스를 사용합니다. 자세한 내용은 null의 대체을 참조하십시오.
시간 인식 교육 켜기
시간 인식 모델 교육은 실험에서 실행하는 각 버전에 대해 켜거나 끌 수 있으며 재구성할 수 있습니다.
다음과 같이 하십시오.
-
실험에서 구성 보기를 클릭합니다.
-
이미 하나 이상의 실험 버전을 실행한 경우 새 버전을 클릭합니다.
-
패널에서 모델 최적화를 확장합니다.
-
시간 기반 테스트 교육 분할에서 데이터 정렬에 사용할 날짜 인덱스를 선택합니다.
모델 구체화 중에 시간 인식 교육을 변경할 수 있습니다. 예를 들어, 설정을 해제하거나 날짜 인덱스로 새 열을 선택할 수 있습니다. 자세한 내용은 모델 구체화을 참조하십시오.