Работа с многомерным прогнозированием временных рядов

С помощью Qlik Predict вы можете обучать модели машинного обучения для прогнозирования показателей, зависящих от времени. Используя методы на основе нейронных сетей, модели изучают и прогнозируют сложные закономерности, включающие ассоциации, зависящие от времени, сгруппированные целевые данные, исторические характеристики и известные будущие переменные. Чтобы создать прогноз временного ряда, подготовьте набор данных для обучения, используйте его в эксперименте с временными рядами, разверните модель, а затем создайте наборы данных для применения, которые можно использовать для генерации прогнозов.

Компоненты задачи временных рядов

При прогнозировании временных рядов цель состоит в том, чтобы предсказать целевые значения для определенных дат в будущем. Например, вы можете захотеть спрогнозировать продажи на следующую неделю, месяц или квартал.

При разработке задачи временных рядов определите следующие компоненты:

Цель и группы
Индекс даты
Горизонт прогнозирования
Ковариаты

В этой структуре описывается, как определить вопрос машинного обучения для задач прогнозирования временных рядов. Чтобы определить вопросы машинного обучения для задач классификации и регрессии, см. Формулирование задач машинного обучения.

Нажмите для просмотра в полном размере — Упрощенная иллюстрация, описывающая компоненты задачи прогнозирования временных рядов в Qlik Predict.

Цель

Как и в других типах экспериментов, цель — это столбец, для которого модель должна предсказывать будущие значения. Для экспериментов с временными рядами цель должна содержать числовые данные, например, продажи или запасы.

Если вы используете группы в прогнозе временных рядов, модели будут предсказывать одно целевое значение для каждой группы на каждом временном шаге в окне прогнозирования. Если вы не используете группы, ваши обученные модели будут предсказывать одно целевое значение для каждого временного шага в окне прогнозирования.

Индекс даты

Индекс даты отслеживает показатели временного ряда на протяжении непрерывного временного интервала (временного шага). Вам необходимо определиться с временным шагом на раннем этапе: как часто вам нужно прогнозировать будущие значения?

В частности, индекс даты — это столбец, который появляется в ваших наборах данных для обучения и применения для задач временных рядов. Индекс даты определяет структуру обоих этих наборов данных для применения: каждая строка представляет собой шаг во времени (или, при наличии групп, шаг во времени для каждой уникальной группировки).

Когда вы добавляете набор данных для обучения в эксперимент с временными рядами, возможные столбцы индекса даты автоматически идентифицируются и представляются вам как Аналитика на уровне столбцов. Вы можете определить их с помощью аналитики Возможный индекс даты в представлении схемы.

Группы

Группы — это характеристики, содержащие категориальную информацию, для которой вы хотите генерировать прогнозы отдельно. Классические примеры групп включают номер магазина и продукт, которые могли использоваться для организации данных для такой цели, как продажи. Выбрав номер магазина и тип продукта в качестве групп, ваши модели временных рядов будут предоставлять прогнозы для каждого отдельного значения в этих столбцах. Например, если целью являются продажи, и у вас есть три номера магазинов (1, 2 и 3) и два типа продуктов (бакалея и свежие продукты), ваша модель сгенерирует прогнозы продаж для каждой уникальной комбинации этих значений.

Вам следует включить группы в задачу временных рядов, если у вас есть данные и вам нужны индивидуальные прогнозы по категориями. Еще одним преимуществом групп является то, что модели могут обучаться глобально, лучше понимая закономерности, существующие между различными определенными вами группировками.

Вы можете настроить группы для использования в каждой версии эксперимента. Если вы не укажете группы, но они будут идентифицированы в вашем наборе данных для обучения, при обучении будут использоваться группы.

Группы идентифицируются по дубликатам значений в столбце индекса даты: например, для даты 14.01.2025 у вас есть две записи: одна для магазина A, а другая для магазина B.

Каждая группа в эксперименте с временными рядами, включая саму цель, рассматривается как отдельный временной ряд в вашем наборе данных. См. Что такое временной ряд?.

Первичные и вторичные группы

Для задач временных рядов с двумя столбцами групп одна группа является первичной, а другая — вторичной. Примеры см. в разделах Подготовка набора данных для обучения, Пример набора данных для обучения — две группы и Пример набора данных применения — две группы.

Первичная группировка определяет независимые временные ряды. Например, каждый магазин становится отдельным временным рядом, что позволяет модели изучать различные модели поведения и закономерности в разных магазинах.

Вторичная группировка обрабатывается иначе. Вместо создания полностью отдельных рядов система преобразует эти значения в дополнительные характеристики (ковариаты), позволяя связанным подрядам предоставлять друг другу контекстную информацию.

Обычно вам не нужно знать, какая группа является первичной, а какая вторичной, хотя при желании вы можете выбрать первичную группу в своем эксперименте. При прогнозировании с использованием развернутых моделей временных рядов применяются определенные соображения — см. Подготовка набора данных для применения.

Все первичные группы должны иметь одни и те же вторичные группы. Например, если магазины являются первичными группами, а продукты — вторичными, каждый магазин должен содержать один и тот же набор продуктов. Отсутствие вторичных групп приведет к несогласованным измерениям характеристик в разных временных рядах.

Если вы ожидаете, что значения вторичной группы не будут совпадать со значениями первичной группы во время прогнозирования, одним из возможных подходов является объединение исходных значений первичной и вторичной групп в новый столбец группировки и использование его в качестве первичной группы при переобучении модели. В этой конфигурации модель больше не зависит от вторичных групп, но коррелированная информация между группами может быть уменьшена.

Горизонт прогнозирования

Горизонт прогнозирования определяет, насколько далеко в будущее вы хотите сделать прогноз. Горизонт прогнозирования состоит из окна прогнозирования (количества временных шагов, для которых вам нужны прогнозы) и разрыва прогнозирования (необязательного количества временных шагов после ваших исторических данных, для которых вам не нужны прогнозы).

Вы задаете окно прогнозирования и размер разрыва при настройке версии эксперимента. Эти значения используются как во время обучения модели, так и при генерации прогнозов из моделей, развернутых как развертывания машинного обучения.

Окно прогнозирования — это количество временных шагов, на которое вы хотите сделать прогноз в будущее. Например, если ваш временной шаг составляет один день, и вы хотите спрогнозировать продажи на следующие две недели, вы должны установить окно прогнозирования равным 14.

Разрыв прогнозирования — это количество времени в будущем, для которого вам не требуются прогнозы. Установка разрыва прогнозирования не является обязательной, поскольку он может вам понадобиться или нет. Разрыв прогнозирования начинается в конце предоставленных вами записанных исторических данных для обучения. Окно прогнозирования начинается там, где заканчивается разрыв прогнозирования.

Например, вы можете захотеть спрогнозировать будущие продажи, но вас интересуют только будущие продажи на даты, наступающие более чем через неделю после окончания ваших входных данных. В этом случае, при временном шаге в днях, вы можете установить размер разрыва прогнозирования равным семи временным шагам.

Выбранное вами окно прогнозирования, в дополнение к объему имеющихся у вас данных для обучения, ограничивает то, насколько далеко в будущее вы можете прогнозировать. Дополнительную информацию см. в разделе Максимальное окно прогнозирования.

Ковариаты

В задачах временных рядов характеристики часто называют ковариатами. Как и в других задачах машинного обучения, ковариаты — это другие переменные, которые, как вы подозреваете, оказывают влияние на результат цели. Каждая ковариата представлена в виде отдельного столбца в вашем наборе данных для обучения.

В прогнозировании временных рядов существует несколько типов ковариат, и они имеют некоторые важные отличия:

Статические ковариаты: столбцы, которые не изменяются в течение временного ряда. Статические ковариаты применимы в экспериментах с временными рядами, где используются группы. Например, предположим, что у вас есть группы для продукта и номера магазина, и есть характеристика «Скидка по умолчанию». Если продукт A в магазине 1 имеет скидку по умолчанию 10%, а продукт B в магазине 2 имеет скидку по умолчанию 20%, «Скидка по умолчанию» будет статической ковариатой. То есть она не изменяется в пределах данных для группы, в которой она появляется.

Статические ковариаты обнаруживаются автоматически из исторических характеристик, которые вы включаете в эксперимент. Вам не нужно указывать, какие характеристики являются статическими ковариатами.
Прошлые ковариаты: зависящие от времени переменные, которые доступны только в исторических данных и которые изменяются в этих данных. Прошлые ковариаты обнаруживаются автоматически из исторических характеристик, которые вы включаете в эксперимент. Вам не нужно явно указывать, какие характеристики являются прошлыми ковариатами.
Будущие ковариаты: будущие ковариаты, также известные как будущие характеристики, — это зависящие от времени переменные, для которых вы будете знать будущие значения в пределах горизонта прогнозирования. При использовании будущих ковариат в обучении вам необходимо указать их как будущие характеристики в конфигурации обучения.

Будущие характеристики

С помощью будущих характеристик вы можете предоставить своим моделям дополнительные данные о будущей информации, которую вы уже знаете или можете обоснованно ожидать. В частности, у вас есть доступ к будущим значениям для этой характеристики, охватывающим выбранный вами горизонт прогнозирования. При определении будущих характеристик вам необходимо предоставить как исторические, так и будущие данные.

Например, для модели, прогнозирующей показатели, на которые могут повлиять будущие скидки, предлагаемые магазином, вы можете включить исторически наблюдаемые скидки, а также скидки для будущих периодов времени в пределах окна прогнозирования. Другими примерами будущих характеристик может быть информация о погоде или календаре.

Другие важные концепции

В этом разделе описываются концепции, которые имеют отношение к вашей задаче временных рядов, но которые вы не настраиваете напрямую в эксперименте или развертывании машинного обучения. Это свойства, которые определяются вашими данными или другими свойствами, которые вы настраиваете для модели.

Временные шаги

Временной шаг определяется вашим набором данных для обучения и важен как для обучения, так и для прогнозов.

В вашем наборе данных для обучения временной шаг — это интервал, с которым записываются данные в вашем индексе даты. Например, временной шаг может быть ежедневным, ежечасным, ежеминутным или ежесекундным. Наименьший обнаруживаемый временной шаг — миллисекунды.

Важно знать временной шаг, используемый в ваших данных для обучения. Другие определяемые вами параметры эксперимента, такие как окно прогнозирования и размер разрыва прогнозирования, будут следовать этому интервалу временного шага.

После развертывания вашей модели данные для применения, для которых вы хотите создать прогнозы, должны будут следовать тому же временному шагу, который определен в наборе данных для обучения.

Качество

Когда вы выбираете набор данных для обучения, система определяет используемый временной шаг. Если в индексе даты есть некоторые пропущенные значения или пробелы, такие столбцы, как цель, группы и ковариаты, часто могут быть интерполированы системой автоматически. Повторяющиеся шаблоны пробелов, вызванные пропущенными значениями, обрабатываются автоматически и сами по себе не вводят новый временной шаг. Однако, если ваши данные содержат действительно смешанные интервалы записи до такой степени, что обнаруживаются разные собственные временные шаги, данные необходимо сначала исправить. Например, если у вас есть данные за несколько месяцев, записываемые один раз в день, но есть раздел, в котором данные постоянно записываются еженедельно, набор данных нельзя использовать, поскольку будет обнаружено несколько временных шагов.

Окно применения

Окно применения, или период ретроспективного анализа, — это часть данных для обучения, которую алгоритм может использовать для предоставления прогнозов для указанного вами окна прогнозирования.

Окно применения рассчитывается и устанавливается системой. Оно измеряется во временных шагах. Окно применения определяется тем, что вы установили в качестве окна прогнозирования и разрыва (горизонта прогнозирования). Размер вашего окна применения отображается на панели конфигурации эксперимента и в Сводке по обучению модели после запуска хотя бы одной версии эксперимента. Он также отображается в Схеме модели развертывания машинного обучения при создании или редактировании конфигурации пакетного прогнозирования.

Окно применения определяется автоматически из вашей конфигурации обучения. Чтобы сгенерировать прогнозы для заданного окна прогнозирования, вам необходимо предоставить исторические данные, охватывающие как минимум ваше окно применения. Это предоставляется в вашем наборе данных для применения. См. Подготовка набора данных для применения.

Максимальное окно прогнозирования

Максимальное окно прогнозирования оценивается при настройке эксперимента с временными рядами. После запуска версии обучения максимальное окно прогнозирования подтверждается с уверенностью. Максимальное окно прогнозирования отображается для вас как Расчетный максимальный прогноз или Максимальный прогноз в разделе На основе ваших данных, когда вы открываете Цель и тип эксперимента на панели конфигурации эксперимента. Максимальное окно прогнозирования — это максимальное количество временных шагов, для которых вы можете генерировать прогнозы, учитывая выбранное вами окно прогнозирования, объем предоставленных вами исторических данных и минимальный размер выборки, ожидаемый системой. Чем больше исторических данных вы предоставите, тем дальше во времени вы сможете прогнозировать. Однако для получения надежных прогнозов важно выбрать разумное окно прогнозирования.

Максимальное окно прогнозирования может составлять до 180 временных шагов.

Время отсечения прогноза

Время отсечения прогноза особенно важно при определении набора данных для применения во время прогнозирования. Время отсечения прогноза — это последняя дата в вашей выборке, для которой у вас есть целевое значение. По сути, даты после этого времени отсечения — это даты, для которых вы хотите сгенерировать прогнозы.

Что такое временной ряд?

В прогнозировании временных рядов Qlik Predict каждая группа, включая саму цель, рассматривается как отдельный временной ряд в наборе данных для обучения. Например, предположим, что ваш набор данных для обучения содержит показатели продаж. Эти показатели продаж определены для каждого магазина и типа продукта. Если столбцы «Магазин» и «Тип продукта» определены как группы, в наборе данных для обучения будет три временных ряда.

Подготовка набора данных для обучения

Для многомерных прогнозов временных рядов ваш набор данных для обучения должен содержать следующие столбцы:

Индекс даты
Целевой столбец
Столбцы групп (необязательно)
Столбцы характеристик (необязательно — без характеристик вы обучаете одномерную модель прогнозирования)

Столбец индекса даты

Вам нужен индекс даты, содержащий полные даты или метки времени. Этот столбец является хронологическим индексом, по которому отслеживаются целевые и ковариатные показатели. Столбец индекса даты последовательно организует измерения на основе времени вдоль согласованного временного интервала (временного шага).

Столбец индекса даты организован следующим образом, в зависимости от того, используете ли вы группы:

Без групп: одна запись для каждого временного шага. Например, при ежедневном прогнозе каждая строка представляет один день.
С группами: одна или несколько дублирующихся записей для каждого временного шага в зависимости от используемых групп.

В многомерном наборе данных для обучения будет одна или несколько дублирующихся записей для каждого временного шага в зависимости от используемых групп. Существует гибкость в используемом вами временном шаге: вы можете, например, записывать даты один или несколько раз ежедневно, еженедельно или ежемесячно и так далее.

Пропущенные или непоследовательно записанные значения в этом столбце иногда допустимы, если их можно интерполировать, а повторяющиеся шаблоны пробелов из-за пропущенных значений обрабатываются автоматически. Однако значения вашего индекса даты не могут содержать несколько разных собственных временных шагов. Например, если интервал определен как один раз в день, но в какой-то момент идентифицируется интервал два раза в день, во время обучения произойдет ошибка.

Целевой столбец и столбцы групп

В вашем наборе данных должен быть целевой столбец, содержащий числовой показатель, который вы хотите спрогнозировать. Распространенным примером являются продажи.

Если вы используете группы, вы предоставляете исторические целевые значения для каждого возможного значения в группах, которые вы добавляете. Например, если вашей целью являются продажи, и вы добавляете группу «Номер магазина», которая содержит данные для магазина A и магазина B, ваш набор данных должен включать две отдельные записи для каждого временного шага: одну со значением продаж для магазина A, а другую со значением продаж для магазина B.

Если у вас две группы, убедитесь, что все первичные группы имеют одни и те же вторичные группы. См. Первичные и вторичные группы.

Столбцы характеристик

Вы можете обучить модель временных рядов без каких-либо ковариат. Однако, если вы включаете ковариаты, предоставьте столбец в наборе данных для каждой характеристики. Данные характеристик, как правило, должны быть исторически записанными данными, если только вы не добавляете будущие характеристики. Столбцы будущих характеристик могут содержать как исторические, так и будущие данные. Вам следует включать данные будущих характеристик в набор данных для обучения только в том случае, если вы уверены, что будущие значения этих столбцов будут известны при создании прогнозов.

Следите за тем, какие характеристики вы будете использовать в качестве будущих характеристик, так как вам нужно будет выбрать их в качестве таковых в конфигурации обучения.

Объем данных

Ваш набор данных должен содержать достаточное количество записей: объем данных определяется временным диапазоном, общим для всех групп. Для обучения эксперимента используются только данные из этого перекрывающегося периода.

Объем ваших исторических данных играет роль в определении того, насколько далеко в будущее вы можете прогнозировать. Желаемое окно прогнозирования также влияет на то, сколько исторических данных вам нужно.

Как правило, больше исторических данных лучше, чем меньше. Однако данные должны быть хорошего качества и отражать желаемые тенденции. Если данные предоставляют нерелевантную информацию или содержат неточности, их наличие в модели не принесет пользы. Учитывайте баланс между оптимизацией объема и поддержанием качества и релевантности.

Примеры

В таблице ниже приведен усеченный пример набора данных для обучения, в котором не используются группы.

В этом примере:

Мы хотим спрогнозировать ежедневные продажи на две недели без разрыва. Обратите внимание, что этот желаемый горизонт прогнозирования и размер разрыва не указаны напрямую в данных для обучения, но мы предоставляем достаточно записей, чтобы этот горизонт прогнозирования можно было использовать в конфигурации.
Date — это индекс даты с временным шагом 1 день.
Sales — это цель, отслеживающая общие ежедневные продажи.
Transactions Per Hour отслеживает округленное среднее количество транзакций, совершенных за час. Это прошлая ковариата, содержащая только исторические данные. Эта информация не будет известна в будущем.
On Promotion отслеживает, на сколько продуктов предоставляется скидка по рекламным тарифам на указанную дату. Это можно использовать как будущую характеристику, поскольку в этом случае скидки известны и планируются заранее. В этом случае мы предоставляем только исторические (прошлые) данные.

Усеченный пример набора данных для обучения, который не содержит столбцов групп
ID	Date	On Promotion	Transactions per Hour	Sales
1	1/1/2024	0	301	90010.01
2	1/2/2024	100	291	19491.65
3	1/3/2024	0	163	70001.87
4	1/4/2024	14	499	50240.33
5	1/5/2024	55	211	106943.00
6	1/6/2024	2	309	131492.59
7	1/7/2024	1341	300	46349.49
8	1/8/2024	0	432	88203.08
9	1/9/2024	0	104	40254.95
10	1/10/2024	150	495	45964.44
11	1/11/2024	65	204	90185.50
12	1/12/2024	12	252	76340.25
13	1/13/2024	70	99	71311.11
14	1/14/2024	5	305	50396.70
...	...	...	...	...
610	9/1/2025	158	168	104205.33

В таблице ниже приведен усеченный пример набора данных для обучения, в котором используются два столбца групп.

В этом примере:

Мы хотим спрогнозировать ежедневные продажи на две недели без разрыва. Обратите внимание, что этот желаемый размер горизонта прогнозирования не указан напрямую в данных для обучения, но мы предоставляем достаточно записей, чтобы этот горизонт прогнозирования можно было использовать в конфигурации.
Date — это индекс даты с временным шагом 1 день.
Sales — это цель, отслеживающая общие ежедневные продажи.
Store и Product — это группы. Для каждого уникального временного шага в данных для обучения включены отдельные строки для каждого магазина и продукта.

В этом контексте Store является первичной группой, а Product — вторичной группой.
Transactions Per Hour отслеживает среднее количество транзакций, совершаемых за час, для каждого магазина и продукта. Это прошлая ковариата, содержащая только исторические данные. Эта информация не будет известна в будущем.
On Promotion отслеживает, на сколько продуктов предоставляется скидка по рекламным тарифам на указанную дату для каждого магазина и продукта. Это можно использовать как будущую характеристику, поскольку в этом случае скидки известны и планируются заранее. В этом случае мы предоставляем только исторические (прошлые) данные.

Усеченный пример набора данных для обучения, который содержит две группы
Date	Store	Product	On Promotion	Transactions per Hour	Sales
1/1/2024	Store 1	A	0	343	90010.01
1/1/2024	Store 2	A	100	545	19491.65
1/1/2024	Store 3	A	0	1004	70001.87
1/1/2024	Store 1	B	14	305	39522.11
1/1/2024	Store 2	B	55	700	91859.30
1/1/2024	Store 3	B	2	94	19583.55
1/1/2024	Store 1	C	1341	267	194863.00
1/1/2024	Store 2	C	0	630	140244.13
1/1/2024	Store 3	C	0	1143	76666.66
1/2/2024	Store 1	A	56	576	30593.55
1/2/2024	Store 2	A	3	403	10549.33
1/2/2024	Store 3	A	14	1303	100003.33
1/2/2024	Store 1	B	29	593	105893.99
1/2/2024	Store 2	B	100	305	80195.22
1/2/2024	Store 3	B	0	305	61051.13
1/2/2024	Store 1	C	5	105	55938.38
1/2/2024	Store 2	C	33	72	104823.33
1/2/2024	Store 3	C	15	1052	99105.99
1/3/2024	Store 1	A	5	521	130533.31
1/3/2024	Store 2	A	1	205	67676.73
1/3/2024	Store 3	A	36	302	52745.45
1/3/2024	Store 1	B	111	502	99642.10
1/3/2024	Store 2	B	350	693	34660.34
1/3/2024	Store 3	B	34	200	60345.44
1/3/2024	Store 1	C	93	205	44603.33
1/3/2024	Store 2	C	60	295	105844.44
1/3/2024	Store 3	C	10	76	150385.44
...	...	...	...	...	...
9/10/2025	Store 1	A	15	1058	159383.33
9/10/2025	Store 2	A	20	402	80119.11
9/10/2025	Store 3	A	20	191	106020.00
9/10/2025	Store 1	B	39	100	39581.34
9/10/2025	Store 2	B	109	190	76939.23
9/10/2025	Store 3	B	37	99	49548.42
9/10/2025	Store 1	C	75	1555	93150.77
9/10/2025	Store 2	C	190	1603	15923.49
9/10/2025	Store 3	C	0	403	159342.05

Подготовка набора данных для применения

После того как вы развернете модель временных рядов, вам необходимо разработать набор данных для применения, для которого будут делаться прогнозы.

Набор данных для применения — Требования и проверка

Для моделей временных рядов набору данных для применения требуется:

Столбцы и заголовки столбцов для всех столбцов, включенных в набор данных для обучения.
Тот же временной шаг, что и в наборе данных для обучения.
Все группы и значения групп, которые присутствовали в наборе данных для обучения.

Примечание к информацииЕсли в наборе данных для применения присутствуют новые значения групп (которых не было в данных для обучения), прогнозы для этих строк не генерируются. Если для этих новых значений групп требуются прогнозы, рекомендуется переобучить модель с использованием данных для обучения, которые их включают.
Примечание к информации
Во время прогнозирования или в наборе данных для применения отсутствующие значения групп обрабатываются следующим образом:
- Отсутствие значений основной группы, на которых обучается модель, допускается.
- Отсутствие значений вторичной группы не допускается. Прогнозирование завершается с ошибкой.
По возможности лучше всего собирать и предоставлять все данные вторичной группы во время прогнозирования. Однако, если ожидается, что вторичные группы будут отсутствовать в основном во время прогнозирования, одним из возможных решений является полный отказ от использования вторичных групп.

Вместо этого можно объединить исходные значения основной и вторичной групп в один новый столбец группировки, использовать его в качестве новой основной группы и переобучить модель на основе этой структуры. В этой конфигурации новая модель зависит только от недавно введенных основных групп.

Компромисс заключается в том, что вы можете потерять часть коррелированной информации между группами, поскольку теперь они будут рассматриваться как полностью отдельные временные ряды, а не как связанные подряды, предоставляющие друг другу контекстную информацию.
Столько же или больше записей исторических данных (для каждой цели и группы) до времени отсечения прогноза, сколько записей в окне применения для модели. Это должны быть полные записи, содержащие исторически наблюдаемую дату или метку времени, цель и значения ковариат. Окно применения определяется окном прогноза и интервалом, настроенными во время обучения: чем дальше в будущее нужно сделать прогноз, тем больше исторических данных требуется в наборе данных для применения для выполнения прогнозирования.
Записи для всех будущих временных шагов в горизонте прогноза. Для этих будущих записей включайте только значения для столбца индекса даты, а также любые будущие характеристики. Оставьте значения для остальных столбцов пустыми.

Большая часть требований к историческим данным для набора данных применения сводится к указанию минимально допустимых объемов данных. Всегда можно предоставить больше, чем требуется. Когда модель генерирует прогнозы, используются только те записи, которые необходимы для охвата окна применения.

Примеры

Предположим, у вас есть модель временных рядов, настроенная следующим образом:

Цель: Sales
Без групп
Индекс даты: Date
Временной шаг: 1 день
Окно прогноза 7 дней и разрыв прогноза 14 дней. Следовательно, горизонт прогноза составляет 21 день.
Время отсечения прогноза — 1 сентября 2025 года. Это последняя дата, для которой были предоставлены исторические данные.
Прошлая ковариата Transactions Per Hour, которая отслеживает среднее количество транзакций, совершенных за час.
Будущая ковариата On Promotion, которая отслеживает, сколько продуктов продается со скидкой по рекламным акциям на указанную дату.

В этом примере предполагается, что определенное системой окно применения составляет 63 дня. В дополнение к 63 дням исторических данных (с 1 июля 2025 года по 1 сентября 2025 года) набор данных предоставляет данные будущих ковариат для 21-дневного горизонта прогноза (со 2 по 22 сентября 2025 года).

Полный пример набора данных применения для модели, обученной без групп
ID	Date	On Promotion	Transactions per Hour	Sales
548	7/1/2025	0	343	90010.01
549	7/2/2025	100	545	19491.65
550	7/3/2025	0	1004	70001.87
551	7/4/2025	14	305	39522.11
552	7/5/2025	55	700	91859.30
553	7/6/2025	2	94	19583.55
554	7/7/2025	1341	267	194863.00
555	7/8/2025	0	630	140244.13
556	7/9/2025	0	1143	76666.66
557	7/10/2025	56	576	30593.55
558	7/11/2025	3	403	10549.33
559	7/12/2025	14	1303	100003.33
560	7/13/2025	29	593	105893.99
561	7/14/2025	100	305	80195.22
562	7/15/2025	0	305	61051.13
563	7/16/2025	5	105	55938.38
564	7/17/2025	33	72	104823.33
565	7/18/2025	15	1052	99105.99
566	7/19/2025	5	521	130533.31
567	7/20/2025	1	205	67676.73
568	7/21/2025	36	302	52745.45
569	7/22/2025	111	502	99642.10
570	7/23/2025	350	693	34660.34
571	7/24/2025	34	200	60345.44
572	7/25/2025	93	205	44603.33
573	7/26/2025	60	295	105844.44
574	7/27/2025	10	76	150385.44
575	7/28/2025	402	473	40963.10
576	7/29/2025	15	1058	159383.33
577	7/30/2025	20	402	80119.11
578	7/31/2025	20	191	106020.00
579	8/1/2025	39	100	39581.34
580	8/2/2025	109	190	76939.23
581	8/3/2025	37	99	49548.42
582	8/4/2025	75	1555	93150.77
583	8/5/2025	190	1603	15923.49
584	8/6/2025	0	403	159342.05
585	8/7/2025	32	430	20451.33
586	8/8/2025	436	1000	150314.44
587	8/9/2025	1	1532	15923.91
588	8/10/2025	40	99	15944.10
589	8/11/2025	42	1058	60000.01
590	8/12/2025	25	734	39583.55
591	8/13/2025	1	569	150333.65
592	8/14/2025	305	692	124594.13
593	8/15/2025	11	164	59303.13
594	8/16/2025	60	205	150333.31
595	8/17/2025	70	186	103483.53
596	8/18/2025	25	1483	105038.13
597	8/19/2025	30	999	201857.11
598	8/20/2025	30	1533	35439.33
599	8/21/2025	30	1583	51956.24
600	8/22/2025	0	350	55334.30
601	8/23/2025	33	1509	11111.12
602	8/24/2025	145	74	15493.33
603	8/25/2025	33	140	159334.14
604	8/26/2025	59	884	45603.39
605	8/27/2025	65	239	46593.34
606	8/28/2025	16	502	74747.74
607	8/29/2025	17	158	45491.34
608	8/30/2025	15	1693	34503.11
609	8/31/2025	36	1544	159334.13
610	9/1/2025	62	1999	193803.15
611	9/2/2025	45	-	-
612	9/3/2025	32	-	-
613	9/4/2025	52	-	-
614	9/5/2025	10	-	-
615	9/6/2025	0	-	-
616	9/7/2025	13	-	-
617	9/8/2025	99	-	-
618	9/9/2025	14	-	-
619	9/10/2025	56	-	-
620	9/11/2025	32	-	-
621	9/12/2025	13	-	-
622	9/13/2025	15	-	-
623	9/14/2025	70	-	-
624	9/15/2025	71	-	-
625	9/16/2025	17	-	-
626	9/17/2025	3	-	-
627	9/18/2025	0	-	-
628	9/19/2025	32	-	-
629	9/20/2025	4	-	-
630	9/21/2025	15	-	-
631	9/22/2025	0	-	-

Предположим, у вас есть модель временных рядов, настроенная следующим образом:

Цель: Sales
Индекс даты: Date
Временной шаг: 1 день
Store и Product являются группами. В этом контексте Store — это первичная группа, а Product — вторичная группа.
Окно прогноза 3 дня и разрыв прогноза 1 день. Следовательно, горизонт прогноза составляет 4 дня.
Время отсечения прогноза — 1 сентября 2025 года. Это последняя дата, для которой были предоставлены исторические данные.
Прошлая ковариата Transactions Per Hour, которая отслеживает среднее количество транзакций, совершаемых за час, для каждого магазина и продукта.
Будущая ковариата On Promotion, которая отслеживает, сколько продуктов продается со скидкой по рекламным акциям на указанную дату, для каждого магазина и продукта.

В этом примере предполагается, что определенное системой окно применения составляет 12 дней. В дополнение к 12 дням исторических данных (с 21 августа по 1 сентября 2025 года) набор данных предоставляет данные будущих ковариат для 4-дневного горизонта прогноза (со 2 по 5 сентября 2025 года).

Полный пример набора данных применения для модели, обученной с двумя группами
Date	Store	Product	On Promotion	Transactions per Hour	Sales
8/21/2025	Store 1	A	0	343	90010.01
8/21/2025	Store 2	A	100	545	19491.65
8/21/2025	Store 3	A	0	1004	70001.87
8/21/2025	Store 1	B	14	305	39522.11
8/21/2025	Store 2	B	55	700	91859.30
8/21/2025	Store 3	B	2	94	19583.55
8/21/2025	Store 1	C	1341	267	194863.00
8/21/2025	Store 2	C	0	630	140244.13
8/21/2025	Store 3	C	0	1143	76666.66
8/22/2025	Store 1	A	56	576	30593.55
8/22/2025	Store 2	A	3	403	10549.33
8/22/2025	Store 3	A	14	1303	100003.33
8/22/2025	Store 1	B	29	593	105893.99
8/22/2025	Store 2	B	100	305	80195.22
8/22/2025	Store 3	B	0	305	61051.13
8/22/2025	Store 1	C	5	105	55938.38
8/22/2025	Store 2	C	33	72	104823.33
8/22/2025	Store 3	C	15	1052	99105.99
8/23/2025	Store 1	A	5	521	130533.31
8/23/2025	Store 2	A	1	205	67676.73
8/23/2025	Store 3	A	36	302	52745.45
8/23/2025	Store 1	B	111	502	99642.10
8/23/2025	Store 2	B	350	693	34660.34
8/23/2025	Store 3	B	34	200	60345.44
8/23/2025	Store 1	C	93	205	44603.33
8/23/2025	Store 2	C	60	295	105844.44
8/23/2025	Store 3	C	10	76	150385.44
8/24/2025	Store 1	A	402	473	80195.22
8/24/2025	Store 2	A	15	1058	61051.13
8/24/2025	Store 3	A	20	402	55938.38
8/24/2025	Store 1	B	20	191	104823.33
8/24/2025	Store 2	B	39	100	11111.12
8/24/2025	Store 3	B	109	190	15493.33
8/24/2025	Store 1	C	37	99	159334.14
8/24/2025	Store 2	C	75	1555	45603.39
8/24/2025	Store 3	C	190	1603	19491.65
8/25/2025	Store 1	A	0	403	70001.87
8/25/2025	Store 2	A	32	430	45642.25
8/25/2025	Store 3	A	436	1000	25633.19
8/25/2025	Store 1	B	1	1532	19191.31
8/25/2025	Store 2	B	40	99	90010.01
8/25/2025	Store 3	B	42	1058	19491.65
8/25/2025	Store 1	C	25	734	70001.87
8/25/2025	Store 2	C	1	569	39522.11
8/25/2025	Store 3	C	305	692	91859.30
8/26/2025	Store 1	A	11	164	19583.55
8/26/2025	Store 2	A	60	205	194863.00
8/26/2025	Store 3	A	70	186	140244.13
8/26/2025	Store 1	B	25	1483	76666.66
8/26/2025	Store 2	B	30	999	30593.55
8/26/2025	Store 3	B	30	1533	10549.33
8/26/2025	Store 1	C	30	1583	100003.33
8/26/2025	Store 2	C	0	350	105893.99
8/26/2025	Store 3	C	33	1509	80195.22
8/27/2025	Store 1	A	145	74	61051.13
8/27/2025	Store 2	A	33	140	55938.38
8/27/2025	Store 3	A	59	884	104823.33
8/27/2025	Store 1	B	65	239	99105.99
8/27/2025	Store 2	B	16	502	130533.31
8/27/2025	Store 3	B	17	158	67676.73
8/27/2025	Store 1	C	15	1693	52745.45
8/27/2025	Store 2	C	36	1544	99642.10
8/27/2025	Store 3	C	62	1999	34660.34
8/28/2025	Store 1	A	45	343	60345.44
8/28/2025	Store 2	A	32	545	44603.33
8/28/2025	Store 3	A	52	1004	105844.44
8/28/2025	Store 1	B	10	305	150385.44
8/28/2025	Store 2	B	0	700	40963.10
8/28/2025	Store 3	B	13	94	159383.33
8/28/2025	Store 1	C	99	267	80119.11
8/28/2025	Store 2	C	14	630	106020.00
8/28/2025	Store 3	C	56	1143	39581.34
8/29/2025	Store 1	A	32	576	76939.23
8/29/2025	Store 2	A	13	403	49548.42
8/29/2025	Store 3	A	15	1303	93150.77
8/29/2025	Store 1	B	70	593	15923.49
8/29/2025	Store 2	B	71	305	159342.05
8/29/2025	Store 3	B	17	305	20451.33
8/29/2025	Store 1	C	3	105	150314.44
8/29/2025	Store 2	C	0	72	15923.91
8/29/2025	Store 3	C	32	1052	15944.10
8/30/2025	Store 1	A	4	521	60000.01
8/30/2025	Store 2	A	15	205	39583.55
8/30/2025	Store 3	A	0	302	150333.65
8/30/2025	Store 1	B	15	502	124594.13
8/30/2025	Store 2	B	20	693	59303.13
8/30/2025	Store 3	B	20	200	150333.31
8/30/2025	Store 1	C	39	205	103483.53
8/30/2025	Store 2	C	109	295	105038.13
8/30/2025	Store 3	C	37	76	201857.11
8/31/2025	Store 1	A	75	1058	35439.33
8/31/2025	Store 2	A	190	402	51956.24
8/31/2025	Store 3	A	0	191	55334.30
8/31/2025	Store 1	B	0	100	11111.12
8/31/2025	Store 2	B	100	190	15493.33
8/31/2025	Store 3	B	0	99	159334.14
8/31/2025	Store 1	C	14	1555	45603.39
8/31/2025	Store 2	C	55	1603	46593.34
8/31/2025	Store 3	C	2	403	74747.74
9/1/2025	Store 1	A	1341	158	45491.34
9/1/2025	Store 2	A	0	1693	34503.11
9/1/2025	Store 3	A	0	1544	159334.13
9/1/2025	Store 1	B	56	1999	193803.15
9/1/2025	Store 2	B	3	343	76666.66
9/1/2025	Store 3	B	14	545	30593.55
9/1/2025	Store 1	C	29	303	10549.33
9/1/2025	Store 2	C	100	154	100003.33
9/1/2025	Store 3	C	0	531	34351.42
9/2/2025	Store 1	A	5	-	-
9/2/2025	Store 2	A	33	-	-
9/2/2025	Store 3	A	15	-	-
9/2/2025	Store 1	B	5	-	-
9/2/2025	Store 2	B	1	-	-
9/2/2025	Store 3	B	36	-	-
9/2/2025	Store 1	C	111	-	-
9/2/2025	Store 2	C	350	-	-
9/2/2025	Store 3	C	34	-	-
9/3/2025	Store 1	A	93	-	-
9/3/2025	Store 2	A	60	-	-
9/3/2025	Store 3	A	10	-	-
9/3/2025	Store 1	B	465	-	-
9/3/2025	Store 2	B	22	-	-
9/3/2025	Store 3	B	249	-	-
9/3/2025	Store 1	C	50	-	-
9/3/2025	Store 2	C	15	-	-
9/3/2025	Store 3	C	25	-	-
9/4/2025	Store 1	A	1	-	-
9/4/2025	Store 2	A	0	-	-
9/4/2025	Store 3	A	112	-	-
9/4/2025	Store 1	B	50	-	-
9/4/2025	Store 2	B	75	-	-
9/4/2025	Store 3	B	130	-	-
9/4/2025	Store 1	C	139	-	-
9/4/2025	Store 2	C	136	-	-
9/4/2025	Store 3	C	168	-	-
9/5/2025	Store 1	A	155	-	-
9/5/2025	Store 2	A	73	-	-
9/5/2025	Store 3	A	19	-	-
9/5/2025	Store 1	B	103	-	-
9/5/2025	Store 2	B	54	-	-
9/5/2025	Store 3	B	23	-	-
9/5/2025	Store 1	C	24	-	-
9/5/2025	Store 2	C	134	-	-
9/5/2025	Store 3	C	193	-	-

Помогла ли вам эта страница?

Если вы обнаружили какую-либо проблему на этой странице или с ее содержанием — будь то опечатка, пропущенный шаг или техническая ошибка, сообщите нам об этом!

Оставьте свой отзыв здесь