시계열 실험 만들기 및 구성
첫 번째 단계는 시계열 실험을 만들고 구성하는 것입니다. 예측을 위해 배포할 준비가 될 때까지 이전에 업로드한 교육 데이터 집합을 사용하여 모델을 교육합니다.
새 실험 만들기
다음과 같이 하십시오.
-
분석 활동 센터의 만들기 페이지로 이동하여 ML 실험을 선택합니다.
-
실험 이름을 입력합니다(예: 판매 예측).
-
필요에 따라 설명과 태그를 추가합니다.
-
실험을 위한 공간을 선택합니다. 개인 공간이 될 수도 있고 공유 공간이 될 수도 있습니다.
-
만들기를 클릭합니다.
-
교육 데이터 집합 파일 ML - Multivariate forecasting - training.csv를 선택합니다.
시계열 교육 데이터 집합을 사용한 ML 실험이 선택되었습니다.

시계열 예측 매개 변수 구성
1단계: 대상 선택
먼저 대상 열을 정의합니다. 향후 판매량을 예측하려고 하므로 해당 열을 대상으로 선택합니다.
다음과 같이 하십시오.
-
스키마 보기에서 sales 옆에 있는 라디오 버튼을 클릭합니다. 버튼 대신 대상
아이콘이 표시됩니다.
시계열 실험의 대상 열을 선택합니다.

2단계: 실험을 시계열 실험으로 구성합니다.
다음과 같이 하십시오.
-
실험 구성 패널이 아직 열려 있지 않으면
구성 보기를 클릭하여 확장합니다.
-
대상 및 실험 유형을 확장합니다.
-
실험 유형에서 시계열을 선택합니다. 이 옵션은 높은 집합 크기 숫자 열을 선택한 후에만 나타납니다.
3단계: 날짜 인덱스 선택
다음으로, 사용할 시계열 인덱스 열을 선택해야 합니다.
다음과 같이 하십시오.
-
구성 패널의 대상 및 실험 유형 섹션에 있는 날짜 인덱스 아래에서 드롭다운 메뉴를 클릭하여 확장합니다.
-
date을 선택합니다.
실험 유형으로 시계열을 선택하고 날짜 인덱스 열로 date를 선택한 실험 구성 패널입니다.

날짜 인덱스를 선택하면 패널에 몇 가지 새로운 정보가 나타납니다. 이제 그룹 및 향후 기능을 구성하고 예측 설정을 조정할 수 있습니다.
4단계: 그룹 선택
이 자습서의 교육 데이터 집합은 다변량 예측을 위해 설계되었습니다. 다변량 예측의 대상은 대상과 직접적으로 관련된 다른 차원과 함께 대상 값을 예측하는 것입니다. 예를 들어, 이 자습서의 데이터에는 각 매장과 제품군별로 개별적으로 추적된 판매 메트릭이 포함되어 있습니다. 다변량 예측을 사용하면 이러한 각 차원을 단일 실험으로 결합할 수 있습니다. 이 경우 각 차원은 별도의 모델로 교육해야 할 수 있지만, 이를 통해 모델은 서로 다른 데이터 집단 간의 패턴과 상호 작용에 대해 더 많이 학습할 수 있습니다.
교육 데이터에서 최대 두 개의 열을 선택하여 그룹으로 사용하여 다변량 실험을 구성합니다.
이 자습서의 목표는 매장 수와 제품군과 함께 판매량을 학습하고 예측하는 모델을 학습하는 것이므로 이 두 열을 그룹으로 선택합니다.
다음과 같이 하십시오.
-
store_nbr 및 family를 그룹으로 선택합니다.
5단계: 공변량(기능) 구성
"공변량"과 "기능"이라는 용어는 기계 학습에서 종종 동의어로 사용되지만, Qlik 프로젝트의 시계열 예측에서는 "공변량"이라는 용어가 더 일반적으로 사용되고 설명적입니다. 다변량 시계열 모델에는 정적, 과거, 미래의 세 가지 유형의 공변량이 있습니다.
정적 공변량과 과거 공변량은 그룹, 날짜 인덱스, 미래 기능 외에 실험 교육에 포함하는 기능에 속합니다. 정적 공변량과 과거 공변량은 시스템에 의해 자동으로 식별됩니다. 이러한 기능을 기능으로 포함하는 것(그리고 향후 기능으로 구성하는 것을 피하는 것) 외에는 구성할 필요가 없습니다.
미래 공변량 또는 미래 기능은 교육에 포함하는 기능을 의미하기도 합니다. 미래 공변량은 미리 알 수 있는 미래 데이터가 있는 기능입니다. 특히, 선택한 예측 기간에 걸쳐 이 기능에 대한 미래 값에 액세스할 수 있습니다. 향후 기능을 위해서는 모델이 교육된 기록 시간 범위에 대한 데이터 값도 알아야 합니다.
교육 기능 목록에 미래 기능을 포함하는 것 외에도 교육 구성 패널에서 미래 기능으로 구성해야 합니다. 예측 시점에 모델은 정확한 예측을 생성하기 위해 예측 범위에 걸친 미래 기능 데이터를 예측합니다.
교육 데이터에서 onpromotion 기능은 지정된 날짜에 프로모션 가격으로 얼마나 많은 제품이 할인되었는지 추적합니다. 이는 미리 알려진 정보이며, 향후에 사용할 수 있는 데이터가 있으므로 향후 기능으로 활용할 수 있습니다.
다음과 같이 하십시오.
-
그룹 드롭다운 아래에서 향후 기능을 확장하고 onpromotion을 선택합니다.
요약:
-
onpromotion이 미래 기능으로 선택되었습니다.
-
날짜 인덱스 외에는 다른 공변량은 교육을 위해 선택되지 않았습니다.
6단계: 예측 창 및 간격 설정
날짜 인덱스를 선택하면 패널에 몇 가지 새로운 정보가 나타납니다.
데이터 기반 섹션으로 이동합니다. 이 섹션에서는 기록 데이터의 시간 범위를 간략하게 설명하고 예측을 원하는 미래 날짜 범위를 구성할 수 있도록 합니다.
예상 최대 예측은 180일입니다. 이 예측치는 사용할 수 있는 기록 데이터를 기반으로 하며, 예측 기간은 사용할 수 있는 전체 기록 데이터의 일부에 불과합니다. 이는 대상을 예측할 수 있을 것으로 예측되는 향후 시간 단계의 최대 수(이 경우 일 수)를 나타냅니다. 교육 버전을 실행한 후에는 더 많은 정보를 얻을 수 있으며, 이 예측치는 확정적인 최대 예측으로 바뀔 것입니다.
예측 창 크기는 미래에 예측하려는 시간 단계 수를 설정합니다. 예를 들어, 이 자습서에서 예측 창을 7로 설정하면 모델이 미래 대상 날짜의 일주일을 예측한다는 것을 나타냅니다.
예측 차이 크기는 교육 데이터가 끝난 직후에 예측을 원하지 않는 시간 단계의 수를 설정합니다. 예를 들어, 3일 이상 미래 날짜에 대한 판매량만 예측하려고 할 수 있습니다.
다음과 같이 하십시오.
-
데이터 기반 섹션에서 예측 창 크기를 7개의 시간 단계로 설정합니다.
-
예측 차이 크기를 3개의 시간 단계로 설정합니다.
구성된 그룹, 향후 기능, 선택한 모든 기능의 요약을 보여 주는 실험 구성 패널.

다음 다이어그램은 시계열 예측 개념과 그것이 실험 구성과 어떻게 관련되는지 보여 줍니다. 시계열 예측 개념에 대한 자세한 내용은 다변량 시계열 예측 작업을 참조하십시오.
Qlik 프로젝트의 시계열 예측 문제의 구성 요소를 간략하게 설명한 그림.

기타 설정 확인
이제 시계열 구성을 완료했으므로 구성 패널에서 나머지 교육 설정을 검토합니다.
-
기능에서 4개의 기능이 선택되어 있는 것을 볼 수 있습니다.
-
알고리즘에서 사용할 수 있는 모든 알고리즘이 선택되어 있는 것을 볼 수 있습니다.
실험 교육
구성이 완료되었으며 교육을 시작할 준비가 되었습니다.
다음과 같이 하십시오.
-
실험 창의 오른쪽 아래에서 실험 실행을 클릭합니다.
실험 실행이 완료되면 결과 모델 메트릭을 검토하는 다음 단계로 넘어갈 수 있습니다.