Прогнозирование временных рядов
Бизнес-пользователи и аналитики часто ведут мониторинг мер в качестве тренда на протяжении времени, а прогнозирование временных рядов позволяет оценить, как историческая последовательность наблюдений будет продолжаться в будущем. Возможность прогнозировать вероятное развитие линий трендов обеспечивает информированный подход к разработке стратегий и принятию решений. В Qlik Cloud функция прогнозирования временных рядов позволяет создавать визуализации, которые продлевают линии трендов на основе прогнозируемых значений, созданных и представленных на линейном графике. В зависимости от применяемого метода, в заштрихованной области отображаются возможные значения. Уровень уверенности можно настраивать. Для создания прогнозов временных рядов используются надежные функции прогнозирования; алгоритм SSA (анализ сингулярного спектра) служит для определения доверительного интервала, OLS (обычный метод наименьших квадратов) обеспечивает простой линейный график регрессии.
В прогнозе временных рядом прогнозируемые значения четко дифференцированы от исторических. В визуализации прогноз отображается в инкрементном порядке в соответствии с выбранными параметрами множителя Шаги прогноза и Размер шага в свойствах измерения. Когда для меры выбран метод SSA, отображается заштрихованная область, которая представляет доверительный интервал прогноза. Этот интервал настраивается с помощью свойств меры: Показать уверенность и Уровень уверенности. Заштрихованная область включает интервал правдоподобных значений (например, 95%), то есть ожидается, что будущие значения будут находиться в заштрихованной области с вероятностью 95%.
Поведение требований и свойств
В разделе расширенных параметров в свойствах меры появляется переключатель «Прогноз», когда удовлетворяются следующие требования:
- Числовое измерение или измерение времени
- Одна мера и одно измерение
- Ось измерения должна быть непрерывной.
Важно обратить внимание на то, что переключатель Прогноз отображается в свойствах меры, только когда мера является числовым измерением или измерением времени, а ось измерения непрерывна. Когда переключатель включен, свойства временных рядов прогноза отображаются на панелях измерения и меры. Свойства измерения определяют расстояние по горизонтали и настройки шага. Свойства меры задают метод, стиль линии и штриховки, а также параметр уверенности и степень уверенности.
Методы OLS и SSA
OLS (обычный метод наименьших квадратов) — это метод модели линейной регрессии, который рассчитывает линию тренда путем минимизации суммы квадратов разности между наблюдаемой зависимой переменной и прогнозируемой зависимой переменной. Этот вариант прогнозирования временных рядов подходит, когда требуется создать линейный тренд данных. Он не учитывает шум или выбросы, а просто использует все данных для создания графика линейной регрессии.
По сравнению с OLS метод SSA (анализ сингулярного спектра) представляет собой сложный алгоритм, способный помимо тренда идентифицировать шум и сезонность. Для SSA требуется обеспечить достаточно регулярную выборку данных. В случае превышения определенного предела возвращается ошибка о том, что данные слишком нерегулярные. SSA — это лучший вариант для прогнозирования трендов с цикличным или колебательным поведением.
Если SSA используется для прогнозирования, этот алгоритм оценивает середину диапазона возможных значений, принимаемых зависимой мерой. Линия продлевается за счет интервала прогнозирования, предоставляющего диапазон значений, который она может принимать. Интервал прогнозирования отображается не как многочисленные возможные значения, а как заштрихованная область.
Ограничения при прогнозировании временных рядов
Прогнозирование временных рядов имеет следующие ограничения:
- Для прогноза не поддерживаются детализированные измерения.
- Прогноз не поддерживается для диаграмм, содержащих больше одного измерения. Если диаграмма содержит одно измерение и несколько мер, прогноз поддерживается только для одной меры.
- Прогноз работает только при использовании сортировки по умолчанию. Для получения дополнительной информации см. Изменить сортировку визуализации.
- Минимальное количество точек диаграммы: OLS требует как минимум 2 точки диаграммы. SSA требует как минимум 6 точек диаграммы.
-
Максимальное количество точек диаграммы: не рекомендуется использовать алгоритмы для наборов данных, содержащих больше 5000 точек диаграммы. При запуске прогнозирования временных рядов для наборов данных, содержащих больше 5000 точек диаграммы, у пользователей начнутся проблемы с производительностью. Пользователям и разработчикам приложений следует выполнить необходимое условие расчета и уменьшить размер набора данных посредством выборки, чтобы сделать возможным отображение диаграммы. Выборки должны быть непрерывными, см. следующий пункт о нерегулярной временной выборке.
-
Прогноз будет работать с нерегулярной временной выборкой при определенных обстоятельствах: OLS будет работать в любых условиях, так как к этому методу не применяются ограничения по прогнозированию временных рядов или по регулярным данным. Для SSA требуется обеспечить достаточно регулярную выборку данных. В случае превышения установленного предела возвращается ошибка о том, что данные слишком нерегулярные.
-
Прогноз не будет работать в Qlik Cloud Mobile для SaaS в автономном режиме.
-
В случае экспорта прогноза из Qlik Cloud и его последующего импорта в QSEoW диаграмма прогноза на отображается. Прогноз не поддерживается в QSEoW.
-
Когда линейный график загружается в виде файла Microsoft Excel, в этот файл не включаются прогнозируемые значения.
-
Если щелкнуть линейный график правой кнопкой мыши и выбрать Просмотреть данные, прогнозируемые значения не отображаются.
-
Прогнозирование временных рядов недоступно, если для других измерений или мер в линейном графике используется условие отображения.