Перейти к основному содержимому Перейти к дополнительному содержимому

Создание и настройка эксперимента временных рядов

Первым шагом является создание и настройка эксперимента временных рядов. Будет использоваться набор данных для обучения, загруженный ранее, чтобы обучить модель, пока она не будет готова к развертыванию и прогнозированию.

Создание нового эксперимента

  1. Перейдите на страницу «Создать» центра активности Аналитика и выберите Эксперимент машинного обучения.

  2. Введите имя для вашего эксперимента, например, Прогнозы продаж.

  3. При необходимости добавьте описание и теги.

  4. Выберите пространство для эксперимента. Это может быть личное или общее пространство.

  5. Нажмите Создать.

  6. Выберите файл набора данных для обучения ML - Multivariate forecasting - training.csv.

ML-эксперимент с выбранным набором данных для обучения временных рядов.

Представление схемы в новом эксперименте машинного обучения с выбранным обучающим набором данных временных рядов

Настройка параметров прогнозирования временных рядов

Шаг 1: Выберите цель

Начните с определения целевого столбца. Мы хотим прогнозировать будущие продажи, поэтому выберите этот столбец в качестве цели.

  • В Строки таблицы Представлении схемы , нажмите переключатель рядом с sales. Значок целевого Цель заменяет кнопку.

Выбор целевого столбца для эксперимента временных рядов.

Выбор целевого столбца для эксперимента временных рядов

Шаг 2: Настройка эксперимента как эксперимента временных рядов

  1. Щелкните Схема Посмотреть конфигурацию, чтобы развернуть панель конфигурации эксперимента, если она еще не открыта.

  2. Разверните Цель и тип эксперимента.

  3. В разделе Тип эксперимента выберите Временные ряды. Этот параметр появляется только после выбора числового столбца с высокой мощностью.

Шаг 3: Выберите индекс даты

Далее необходимо выбрать столбец индекса временных рядов для использования.

  1. Оставаясь в разделе «Цель и тип эксперимента» панели конфигурации, в разделе «Индекс даты» нажмите раскрывающееся меню, чтобы развернуть его.

  2. Выберите date.

Панель конфигурации эксперимента с выбранным типом эксперимента «Временные ряды» и выбранным столбцом индекса даты date.

Выбор типа эксперимента и индекса даты для эксперимента

После того как вы выберете индекс даты, на панели появится новая информация.Теперь вы можете настроить Группы и Будущие функциональные возможности, а также скорректировать параметры прогнозирования.

Шаг 4: Выберите группы

Обучающий набор данных для этого руководства предназначен для многомерного прогнозирования. При многомерном прогнозировании цель состоит в том, чтобы прогнозировать целевые значения наряду с другими измерениями, которые изменяются непосредственно вместе с целевым значением. Например, в этом руководстве данные содержат показатели продаж, отслеживаемые индивидуально для каждого магазина и семейства продуктов. Многомерное прогнозирование позволяет объединить каждое из этих измерений — которые в противном случае могли бы потребовать обучения в виде отдельных моделей — в один эксперимент, позволяя моделям узнавать больше о закономерностях и взаимодействиях между различными когортами данных.

Вы настраиваете многомерные эксперименты, выбирая до двух столбцов из обучающих данных для использования в качестве групп.

Цель этого руководства — обучить модели изучать и прогнозировать продажи наряду с номером магазина и семейством продуктов, поэтому выберите эти два столбца в качестве групп.

  • Выберите store_nbr и family в качестве групп.

Примечание к информации Если группа не выбрана явно, модель автоматически найдет подходящую группировку, но при этом она будет использовать только категориальные признаки. Если соответствующая группа найдена, процесс перейдет к обучению. То есть, чтобы система автоматически распознавала store_nbr как столбец группы, необходимо, чтобы он был отмечен как категориальный признак.

Шаг 5. Конфигурирование ковариат (признаков)

Термины «ковариата» и «признак» в машинном обучении нередко являются синонимами, однако в прогнозировании с использованием временных рядов в Qlik Predict чаще используется более описательный термин «ковариата». В модели многомерных временных рядов поддерживается три типа ковариат: статические, прошлые и будущие.

Статические и прошлые ковариаты относятся к признакам, которые вы включаете в обучение эксперимента (помимо групп, индекса даты и будущих признаков). Статические и прошлые ковариаты определяются системой автоматически. Вам не нужно настраивать их, кроме как включать их в качестве характеристик (и избегать настройки их в качестве будущих характеристик).

Будущие ковариаты, или будущие характеристики, также относятся к характеристикам, которые вы включаете в обучение. Будущие ковариаты — это характеристики, для которых у вас будут будущие данные, известные заранее — в частности, у вас есть доступ к будущим значениям для этой характеристики, охватывающим выбранный вами горизонт прогнозирования. Для будущих характеристик вам также необходимо знать значения данных для исторического временного диапазона, на котором обучается модель.

Помимо включения будущей характеристики в список обучающих характеристик, вам также необходимо настроить ее как будущую характеристику на панели конфигурации обучения. Во время прогнозирования модель будет ожидать данные будущих характеристик, охватывающие горизонт прогнозирования, для генерации точных прогнозов.

В обучающих данных onpromotion характеристика отслеживает, сколько продуктов продается со скидкой по акционным ценам на указанную дату. Это информация, которая известна заранее, и для нее доступны будущие данные, поэтому ее можно использовать как будущую характеристику.

  • Под раскрывающимся списком Группы разверните Будущие функциональные возможности и выберите onpromotion.

Резюмируя:

  • onpromotion была выбрана в качестве будущей функциональной возможности.

  • Помимо индекса даты, никакие другие ковариаты не были выбраны для обучения.

Шаг 6: Установите окно прогноза и зазор

После того как вы выберете индекс даты, в панели появится новая информация.

Перейдите в раздел На основе ваших данных.В этом разделе описывается временной диапазон ваших исторических данных и позволяет настроить диапазон будущих дат, для которых вы хотите получить прогнозы.

Расчетный максимальный прогноз составляет 180 дней. Эта оценка основана на доступных исторических данных, где окно прогнозирования составляет долю от общего объема доступных исторических данных. Он представляет собой максимальное количество будущих временных шагов (в данном случае, дней), для которых, по оценкам, вы сможете предсказать цель. После запуска версии обучения будет получено больше информации, и эта оценка будет заменена окончательным максимальным прогнозом.

Параметр Размер окна прогноза определяет, сколько временных шагов в будущее вы хотите прогнозировать. Например, в этом руководстве установка окна прогноза на 7 будет означать, что модель должна прогнозировать неделю будущих целевых дат.

Параметр Размер интервала прогноза определяет количество временных шагов сразу после окончания ваших обучающих данных, для которых вы не хотите получать прогнозы. Например, вы можете захотеть прогнозировать продажи только на даты, отстоящие на три или более дней в будущем.

  1. В разделе На основе ваших данных задайте размер окна прогноза, равный 7 интервалам.

  2. Установите размер интервала прогноза на 3 временных шага.

Примечание к информацииГоризонт прогнозирования — это окно прогноза плюс размер интервала прогноза, измеряемые во временных шагах. В этом случае горизонт прогнозирования составляет 10, что означает, что во время прогнозирования вы прогнозируете на 10 временных шагов вперед, даже если для этого интервала прогнозирования не было записано никаких фактических значений.

Панель конфигурации эксперимента, показывающая настроенные группы, будущую функциональность и сводку всех выбранных функциональностей.

Панель конфигурации эксперимента, показывающая настроенные группы, будущую функциональность и сводку всех выбранных функциональностей.

На следующей диаграмме показаны концепции прогнозирования временных рядов и их связь с конфигурацией эксперимента. Дополнительные сведения о концепциях прогнозирования временных рядов см. в Прогнозирование с помощью многомерных временных рядов.

Упрощенная иллюстрация, описывающая компоненты проблемы прогнозирования временных рядов в Qlik Predict.

Подтверждение других настроек

Теперь, когда вы завершили настройку временных рядов, просмотрите оставшиеся параметры обучения на панели конфигурации.

  • В разделе Характеристики вы можете видеть, что выбраны четыре характеристики.

  • В разделе Алгоритмы вы можете видеть, что выбраны все доступные алгоритмы.

Обучение эксперимента

Настройка завершена, и теперь можно приступать к обучению.

  • Нажмите Запустить эксперимент в правом нижнем углу окна эксперимента.

Когда обучение эксперимента будет завершено, можно перейти к следующему шагу, который предполагает анализ полученных метрик модели.

Помогла ли вам эта страница?

Если вы обнаружили какую-либо проблему на этой странице или с ее содержанием — будь то опечатка, пропущенный шаг или техническая ошибка, сообщите нам об этом!