Перейти к основному содержимому Перейти к дополнительному содержимому

Прогнозирование с развертыванием временных рядов

После того как вы развернули и утвердили модель временных рядов, можно генерировать прогнозы для конкретного времени. В этом руководстве мы создадим конфигурацию прогнозирования внутри развертывания машинного обучения и используем ее для создания пакетного прогнозирования.

До этого мы уже создали модель машинного обучения, использовав имеющиеся данные о ежедневных продажах. Целью этого процесса является распознавание шаблонов посредством машинного обучения для их применения к новым данным.

Понимание прогнозов, генерируемых с помощью моделей временных рядов

Важно понимать, как работает прогнозирование в моделях временных рядов, так как оно отличается от прогнозирования в моделях других типов. В частности, шаги, необходимые для подготовки набора данных для применения, отличны от аналогичных процессов в моделях других типов.

В моделях временных рядов новые прогнозы добавляются в виде новых строк, а не в виде отдельных столбцов.

Создание набора данных для применения

В этом разделе описано, как создать набор данных для применения в задаче временных рядов. Фактический процесс компиляции строк набора данных не показан, показана только схема процесса.

Линейная диаграмма, описывающая необходимые компоненты и временную шкалу в наборе данных для применения в модели прогнозирования временных рядов.

Структура столбцов

Набор данных для применения должен содержать ту же схему, что и развернутая модель временных рядов. Схема отображается, если открыть развертывание машинного обучения.

В любом случае набор данных для применения должен содержать те же столбцы, что и схема модели. Другими словами, по столбцу для каждого из следующих элементов:

  • Индекс даты

  • Цель

  • Группы

  • Признаки (ковариаты)

Структура строки

Набор данных должен содержать записи (строки), как показано ниже:

  • Столбцы и заголовки столбцов для всех столбцов, включенных в обучающий набор данных.

  • Тот же временной шаг, что и обучающий набор данных.

  • Столько же или больше записей исторических данных (на цель и группу) до времени отсечки прогноза, сколько записей в окне применения для модели. Это должны быть полные записи, содержащие исторически наблюдаемые дату или отметку времени, цель и значения ковариаты. Окно прогноза и разрыв, настроенные во время обучения, определяют окно применения — чем дальше в будущее вам нужно прогнозировать, тем больше исторических данных вам потребуется в наборе данных применения для выполнения прогнозов.

  • Записи для всех будущих временных шагов в вашем горизонте прогнозирования. Для этих будущих записей включите только значения для столбца индекса даты, а также любые будущие характеристики. Оставьте значения для других столбцов пустыми.

Другие изменения

Возможно, необходимо изменить набор данных, чтобы он соответствовал схеме модели. В частности, признаки, добавленные в группы во время обучения, автоматически преобразуются в категориальный тип, чтобы их можно было использовать в виде групп. Если в данных для применения есть признак, содержащий числовые данные, и он входит в группу, необходимо преобразовать его тип данных, чтобы его можно было идентифицировать как категориальный. Пример этого показан в разделе Подготовка набора данных.

Подготовка набора данных

В этом руководстве представлен набор данных для применения, у которого уже есть необходимые столбцы и записи. Однако, представленный набор данных для применения содержит числовой столбец store_nbr, который в модели задан как группа. Итак, нужно создать скрипт для преобразования этого столбца в строковый тип.

  1. Перейдите на страницу «Создать» центра активностиАналитика и выберите Скрипт.

  2. Введите имя скрипта, например, Transformed apply data.

  3. Выберите пространство для скрипта. Это должно быть то же самое пространство, где хранится исходный набор данных для применения.

  4. Нажмите Создать.

  5. В Скрипт переключитесь в Редактор.

  6. В Разделы нажмите Создайте новый раздел, чтобы добавить новый раздел.

  7. Вставьте скрипт загрузки ниже в редактор.

  8. Нажмите Экспортировать данные.

Запуск скрипта для экспорта в Qlik Cloud Analytics новой версии набора данных для применения.

Редактор скриптов со вставленным в редактор скриптом загрузки и выделенной кнопкой «Экспорт данных»

После выполнения скрипта новый набор данных для применения Final transformed apply dataset.qvd должен быть расположен в том же пространстве, что и исходный набор данных.

Создание прогнозирований

Теперь, когда набор данных для применения является совместимым, его можно использовать для прогнозов на основе развертывания машинного обучения.

  1. В каталоге откройте развертывание Sales forecasting deployment, созданный в разделе Развертывание модели временных рядов.

  2. В правом нижнем углу нажмите Создать прогноз.

  3. На панели Конфигурация прогнозирования справа в разделе Данные для применения щелкните Выбрать набор данных для применения.

  4. Выберите файл набора данных для применения: Final transformed apply dataset.qvd.

  5. Сравните схемы обучения и наборы данных для применения. Не должно быть ошибок, связанных с несоответствием схем.

  6. На панели Конфигурация прогнозирования нажмите Присвоить имя набору данных для прогнозирования. Введите следующее имя: ML - Sales predictions. Используйте формат Parquet, предлагаемый по умолчанию.

  7. Выберите место и нажмите Подтвердить.

Конфигурация предсказания, показывающая сравнение схем и панель конфигурации.

Развертывание машинного обучения с моделью временных рядов, показывающее конфигурацию прогнозирования со схемами

Или щелкните значок Стрелка вниз рядом с кнопкой Сохранить и закрыть. Выберите Сохранить и создать прогноз сейчас.

Процесс можно контролировать на экране Прогнозирования по набору данных. Можно проверить вывод в каталоге, щелкнув Открыть во всплывающем окне.

Когда прогнозирование будет завершено, создайте приложение для просмотра прогнозов. Перейдите к следующему разделу.

Помогла ли вам эта страница?

Если вы обнаружили какую-либо проблему на этой странице или с ее содержанием — будь то опечатка, пропущенный шаг или техническая ошибка, сообщите нам об этом!