시계열 실험 작업
시계열 실험을 통해 특정 미래 기간에 해당하는 메트릭(예: 다음 주 또는 다음 달의 매출)을 예측하도록 모델을 학습시킬 수 있습니다. Qlik 프로젝트에서 시계열 모델은 그룹화된 대상 및 미래 기능을 지원하는 다변량 예측을 생성합니다. 시계열 예측은 숫자형 대상이 포함된 실험에 사용할 수 있습니다.
시계열 실험 구성

사용 사례
Time series 예측은 숫자형 메트릭에 대해 날짜에 민감한 예측이 필요할 때마다 유용합니다. 시계열 예측이 유용한 시나리오는 다음과 같이 다양합니다.
-
매출 및 재무 예측
-
인벤토리 및 재고 예측
-
에너지 사용량 및 수요 예측
-
비용 예측
다변량 시계열 예측이란 무엇입니까?
다변량 시계열 예측은 둘 이상의 변수가 포함된 시나리오에 대한 미래 데이터의 예측입니다. 시계열 실험을 사용하면 여러 대상(그룹을 통해 도입됨)과 여러 기능 간의 시간별 패턴을 탐색할 수 있습니다. 분류 및 회귀 모델을 사용한 예측과 달리 시계열 예측은 특정 날짜 또는 시간에 국한됩니다. 예를 들어, 관련 날짜가 1월 1일에서 14일인 향후 2주 동안의 매출을 예측할 수 있습니다.
파트 1: 학습 데이터 세트 준비
우선 학습 데이터 세트를 준비합니다. 학습 데이터 세트에는 일정한 시간 간격으로 측정된 기록 데이터가 포함되어야 합니다. 자세한 내용은 Preparing a training dataset을 참조하십시오.
파트 2: 시계열 실험 만들기
ML 실험을 만든 다음 시계열을 실험 유형으로 선택하여 시계열 실험을 만듭니다.
실험을 시계열 실험으로 구성하려면 대상이 숫자형이어야 하고 고유 값이 11개보다 많아야 합니다(고품질 모델을 생성하려면 훨씬 더 많은 값이 필요함). 또한 데이터 세트에는 일정한 시간 간격으로 기록된 날짜 또는 날짜/시간 정보가 포함된 열이 있어야 합니다.
다음과 같이 하십시오.
-
분석 활동 센터에서 ML 실험을 만듭니다. 실험 만들기을 참조하십시오.
-
학습 데이터 세트를 선택한 후
구성 보기를 클릭하여 실험 구성 패널을 확장합니다.
-
실험 설정을 확장합니다.
-
드롭다운 메뉴를 사용하여 대상을 선택합니다.
-
실험 유형 아래에서 시계열을 선택합니다.
파트 3: 시계열 실험 구성
다음으로 시계열 모델로 수행하려는 예측에 특정한 매개 변수를 구성해야 합니다. 이러한 매개 변수는 시계열 실험에만 해당됩니다. 각 매개 변수의 의미에 대한 설명은 Working with multivariate time series forecasting을 참조하십시오.
다음과 같이 하십시오.
-
날짜 인덱스 아래에서 사용할 인덱스 열을 선택합니다.
-
데이터를 기반으로 함 섹션에서 원하는 예측 창 크기 및 원하는 예측 간격 크기를 타임스텝 단위로 설정합니다.
-
선택적으로 그룹 및 미래 기능에 대한 드롭다운 메뉴를 사용하여 모델 학습에 대상 그룹화 및 미래 기능을 추가합니다.
파트 4: 기타 실험 매개 변수 구성
다른 실험 유형과 마찬가지로, 시계열 실험에만 국한되지 않는 다른 속성을 실험 구성에서 조정해야 할 수도 있습니다. 여기에는 다음이 포함됩니다.
-
기능 선택
-
알고리즘 선택
-
기능 유형 변경
-
편향 감지 구성
자세한 내용은 실험 구성을 참조하십시오.
파트 5: 학습 실행
다음과 같이 하십시오.
-
실험 실행을 클릭합니다.
다음 단계
모델 분석
학습이 완료되면 모델을 분석하고 품질을 평가할 수 있습니다. 필요한 경우 결과를 세분화하기 위해 실험의 추가 반복을 만듭니다.
자세한 내용은 모델 검토을 참조하십시오.
모델 배포 및 승인
모델을 분석한 후 가장 적합한 모델을 ML 배포에 배포한 다음 예측을 수행하도록 활성화합니다.
자세한 내용은 모델 배포 및 배포된 모델 승인을 참조하십시오.
적용 데이터 세트 준비 및 예측 생성
모델을 배포한 후 예측을 생성하는 데 사용할 적용 데이터 세트에 대한 요구 사항을 파악합니다. Preparing an apply dataset을 참조하십시오.
적용 데이터 세트가 준비되면 시계열 모델을 사용하여 예측을 생성합니다. 다음을 생성할 수 있습니다.
-
배치 예측
-
실시간 예측
제한 사항 및 고려 사항
-
시계열 실험에 대해 최대 2개의 그룹을 선택할 수 있습니다. 그룹으로 선택하는 열은 범주형이어야 합니다. 이 열에는 숫자 데이터가 포함될 수 있지만 학습 중에는 열이 범주형으로 처리됩니다.
-
최대 예측 기간은 180 시간 단계까지 가능합니다. 자세한 내용은 Maximum forecast window을 참조하십시오.
-
지능형 모델 최적화는 시계열 실험에 적용할 수 없습니다.
-
시계열 실험은 수동 최적화를 지원하지 않습니다.
-
시계열 실험은 하이퍼파라미터 최적화를 지원하지 않습니다.
-
시계열 실험은 시간 인식 학습을 지원하지 않습니다.
-
시계열 실험에는 자동 자유 텍스트 기능 엔지니어링을 사용할 수 없습니다.
-
시계열 실험에 대한 날짜 인덱스 열을 선택하면 이 열에 날짜 기능 유형이 사용됩니다. 하지만 시계열 모델에서는 날짜 기능 엔지니어링이 지원되지 않습니다. 자동 엔지니어링된 날짜 기능은 열에서 파생될 수 없습니다.
-
시계열 실험은 딥 러닝 알고리즘으로 모델을 학습시킵니다. 따라서 데이터 크기 및 예측 창에 따라 시계열 모델은 일반적으로 회귀 및 분류 모델보다 학습하는 데 더 오래 걸립니다.
-
시계열 실험은 최대 1GiB 크기의 학습 데이터 세트를 지원합니다. 자세한 내용은 학습 데이터 세트 및 프로파일링 제한 사항을 참조하십시오.
시계열 모델을 사용하여 예측을 생성하는 것과 관련된 제한 사항은 제한 사항을 참조하십시오.
자습서
모델 학습부터 예측까지 시계열 예측을 보여 주는 전체 자습서는 자습서 – 다변수 시계열 예측을 통한 판매 예측을 참조하십시오.