Создание и настройка эксперимента с временными рядами | Qlik Cloud Справка
Перейти к основному содержимому Перейти к дополнительному содержимому

Создание и настройка эксперимента с временными рядами

Первый шаг — создать и настроить эксперимент с временными рядами. Вы будете использовать набор обучающих данных, загруженный ранее, для обучения модели, пока она не будет готова к тому, чтобы ее развернуть для создания прогнозов.

Создание нового эксперимента

  1. Перейдите на страницу создания Аналитика центра активности и выберите Эксперимент ML.

  2. Введите имя для вашего эксперимента, например, Прогнозы продаж.

  3. При желании добавьте описание и теги.

  4. Выберите пространство для вашего эксперимента. Это может быть ваше личное пространство или общее пространство.

  5. Нажмите Создать.

  6. Выберите файл набора обучающих данных ML - Multivariate forecasting - training.csv.

Эксперимент ML с выбранным набором обучающих данных временных рядов.

Представление схемы в новом эксперименте ML с выбранным набором обучающих данных временных рядов

Настройка параметров прогнозирования временных рядов

Шаг 1. Выбор цели

Начните с определения целевого столбца. Мы хотим спрогнозировать будущие продажи, поэтому выберите этот столбец в качестве цели.

  • В Строки таблицы Представление схемы нажмите переключатель рядом с sales. Значок цели Цель заменит кнопку.

Выбор целевого столбца для эксперимента с временными рядами.

Выбор целевого столбца для эксперимента с временными рядами

Шаг 2. Настройка эксперимента как эксперимента с временными рядами

  1. Нажмите Схема Просмотр конфигурации, чтобы развернуть панель конфигурации эксперимента, если она еще не открыта.

  2. Разверните Настройки эксперимента.

  3. В разделе Тип эксперимента выберите Временные ряды. Этот параметр появляется только после выбора числового столбца с высокой кардинальностью.

Шаг 3. Выбор индекса даты

Затем необходимо выбрать столбец индекса временных рядов для использования.

  1. На панели конфигурации появится новый раздел Настройки временных рядов. В разделе Индекс даты нажмите раскрывающееся меню, чтобы развернуть его.

  2. Выберите date.

Панель конфигурации эксперимента с выбранным типом эксперимента Временные ряды и выбранным столбцом индекса даты date.

Выбор типа эксперимента и индекса даты для эксперимента

Шаг 4. Настройка окна и интервала прогноза

После выбора индекса даты на панели появится новая информация.

Перейдите в раздел На основе ваших данных. В этом разделе указан временной диапазон ваших исторических данных и можно настроить диапазон будущих дат, для которых требуются прогнозы.

Расчетный максимальный прогноз составляет 180 дней. Эта оценка основана на доступных исторических данных, где окно прогноза является частью всех доступных исторических данных. Она представляет собой максимальное количество будущих временных шагов (в данном случае дней), на которые, по оценкам, можно спрогнозировать цель. После запуска версии обучения станет известно больше информации, и эта оценка будет заменена окончательным максимальным прогнозом.

Желаемый размер окна прогноза устанавливает, на сколько временных шагов в будущее вы хотите сделать прогноз. Например, в этом руководстве установка окна прогноза на 7 будет означать, что модель должна спрогнозировать неделю будущих целевых дат.

Размер интервала прогноза устанавливает количество временных шагов сразу после окончания ваших обучающих данных, для которых вам не нужны прогнозы. Например, вы можете захотеть прогнозировать продажи только для дат, наступающих через три или более дней в будущем.

  1. В разделе На основе ваших данных установите Желаемый размер окна прогноза на 7 временных шагов.

  2. Установите Желаемый размер интервала прогноза на 3 временных шага.

Примечание к информацииГоризонт прогноза — это окно прогноза плюс размер интервала прогноза, измеряемый во временных шагах. В данном случае горизонт прогноза равен 10, что означает, что во время прогнозирования вы делаете прогноз на 10 временных шагов вперед, даже если для этого интервала прогноза не было записано никаких фактических значений.

Шаг 4. Выбор групп

Набор обучающих данных для этого руководства предназначен для многомерного прогнозирования. При многомерном прогнозировании цель состоит в том, чтобы прогнозировать целевые значения наряду с другими измерениями, которые изменяются непосредственно вместе с целью. Например, в этом руководстве данные содержат показатели продаж, отслеживаемые индивидуально для каждого магазина и семейства продуктов. Многомерное прогнозирование позволяет объединить каждое из этих измерений (которые в противном случае пришлось бы обучать как отдельные модели) в один эксперимент, позволяя моделям узнавать больше о закономерностях и взаимодействиях между различными когортами данных.

Вы настраиваете многомерные эксперименты, выбирая до двух столбцов из обучающих данных для использования в качестве групп.

Цель этого руководства — обучить модели изучать и прогнозировать продажи наряду с номером магазина и семейством продуктов, поэтому выберите эти два столбца в качестве групп.

  • Выберите store_nbr и family в качестве Групп.

Примечание к информации Если группа не выбрана явно, модель автоматически выполнит поиск подходящей группировки, используя только категориальные характеристики. Как только допустимая группа будет определена, процесс перейдет к обучению. Поэтому, если мы хотим, чтобы система автоматически обнаружила store_nbr как допустимый столбец группы, он должен быть отмечен как категориальная характеристика.

Шаг 5. Настройка ковариат (характеристик)

Термины «ковариата» и «характеристика» часто используются как синонимы в машинном обучении, но при прогнозировании временных рядов в Qlik Predict термин «ковариата» используется чаще и является более описательным. В многомерной модели временных рядов существует три типа ковариат: статические, прошлые и будущие.

Статические и прошлые ковариаты входят в число Характеристик, которые вы включаете в обучение эксперимента, помимо групп, индекса даты и будущих характеристик. Статические и прошлые ковариаты определяются системой автоматически. Вам не нужно настраивать их, кроме как включать их в качестве характеристик (и избегать их настройки в качестве будущих характеристик).

Будущие ковариаты, или будущие характеристики, также относятся к Характеристикам, которые вы включаете в обучение. Будущие ковариаты — это характеристики, которые имеют будущие данные, которые вы будете знать заранее — в частности, у вас есть доступ к будущим значениям для этой характеристики, охватывающим выбранный вами горизонт прогноза. Для будущих характеристик вам также необходимо знать значения данных для исторического временного диапазона, на котором обучается модель.

Помимо включения будущей характеристики в список обучающих Характеристик, вам также необходимо настроить ее как будущую характеристику на панели конфигурации обучения. Во время прогнозирования модель будет ожидать данные будущих характеристик, охватывающие горизонт прогноза, для создания точных прогнозов.

В обучающих данных характеристика onpromotion отслеживает, сколько продуктов продается со скидкой по рекламным тарифам на указанную дату. Это информация, которая известна заранее, и для нее доступны будущие данные, поэтому ее можно использовать в качестве будущей характеристики.

  • Под раскрывающимся списком Группы разверните Будущие характеристики и выберите onpromotion.

Подводя итог:

  • onpromotion была выбрана в качестве будущей характеристики.

  • Кроме индекса даты, для обучения не были выбраны никакие другие ковариаты.

Панель конфигурации эксперимента, показывающая настроенные группы, будущую характеристику и сводку всех выбранных характеристик.

Панель конфигурации эксперимента, показывающая настроенные группы, будущую характеристику и сводку всех выбранных характеристик.

На следующей диаграмме проиллюстрированы концепции прогнозирования временных рядов и их связь с конфигурацией эксперимента. Для получения дополнительной информации о концепциях прогнозирования временных рядов см. Работа с многомерным прогнозированием временных рядов.

Упрощенная иллюстрация, описывающая компоненты задачи прогнозирования временных рядов в Qlik Predict.

Подтверждение других настроек

Теперь, когда вы завершили настройку временных рядов, просмотрите оставшиеся настройки обучения на панели конфигурации.

  • В разделе Характеристики вы можете видеть, что выбраны четыре характеристики.

  • В разделе Алгоритмы вы можете видеть, что выбраны все доступные алгоритмы.

Обучение эксперимента

Настройка завершена, и мы готовы начать обучение.

  • Нажмите Запустить эксперимент.

Когда выполнение эксперимента завершится, мы сможем перейти к следующему шагу, который заключается в просмотре полученных метрик модели.

Помогла ли вам эта страница?

Если вы обнаружили какую-либо проблему на этой странице или с ее содержанием — будь то опечатка, пропущенный шаг или техническая ошибка, сообщите нам об этом!