Работа с прогнозами для моделей временных рядов
После развертывания модели временных рядов вы можете использовать ее для создания прогнозов на новых данных. Чтобы создать прогнозы временных рядов, подготовьте набор данных для применения, содержащий необходимые данные и структуру. Полное описание приводится в разделе Подготовка набора данных для применения.
Механизм прогнозирования
Процесс прогнозирования для моделей временных рядов имеет некоторые отличия от моделей классификации и регрессии.
Модели классификации и регрессии прогнозируют будущие значения для всего столбца, который отсутствует или неизвестен в наборе данных для применения. Например, предположим, есть модель бинарной классификации, которая прогнозирует будущие значения столбца Churned. Набор данных для применения обычно не содержит столбец Churned, и если он присутствует, он игнорируется, и значения для этого столбца генерируются моделью в виде прогнозов.
С другой стороны, в модели временных рядов прогнозы создаются в виде строк, а не столбцов. Прогнозы по-прежнему генерируются для целевого столбца, но они представляют собой записи, соответствующие конкретным значениям в будущем времени. Структура столбцов не меняется между обучающим набором данных и набором для применения.
Кроме того, набор данных для применения в модели классификации или регрессии не должен содержать какие-либо целевые значения, для которого будут генерироваться прогнозы. С другой стороны, набор данных для применения в модели временных рядов должен содержать некоторые исторические данные и значения признаков, соответствующие окну применения модели. Эти требования более подробно описаны в Работа с прогнозами для моделей временных рядов.
Доступные инструменты для создания набора данных для применения
Следующие инструменты доступны в Qlik Cloud, чтобы помочь вам создавать и динамически генерировать наборы данных:
-
Qlik скриптинг, доступный в Редактор загрузки данных в приложениях, а также автономный редактор скриптов, доступный из центра активности Аналитика.
-
Рецепт таблицы, доступный как автономный инструмент из центра активности Аналитика. Рецепт таблицы предназначен для создания однотабличных наборов данных, таких как те, что используются в машинном обучении.
-
Поток данных, доступный как автономный инструмент из центра активности Аналитика.
-
Диспетчер данных в аналитических приложениях.
Загрузка данных и управление ими с помощью Диспетчера данных
Часто необходимые операции
Изменение типов признаков
Возможно, что при подготовке вашего набора данных для применения вам потребуется преобразовать столбцы, чтобы изменить их типы характеристик.
Наиболее распространенный пример — это если у вас есть числовой столбец, который вы настроили как группу в вашей модели. Когда вы выбираете характеристику в качестве группы в рамках вашего эксперимента, ее тип характеристики автоматически изменяется на категориальный, если он еще не такой, чтобы ее можно было обрабатывать как группу. Когда вы добавляете свой набор данных для применения для прогнозов, данные столбца, скорее всего, все еще содержат числовые данные характеристик, поэтому вам потребуется изменить столбец на строковые данные, чтобы он был идентифицирован как категориальная характеристика. Это преобразование легко выполнить с помощью Qlik скриптов — используя функцию text() — или с помощью других инструментов Qlik подготовки данных, таких как Рецепт таблицы и поток данных.
Пример использования Qlik скриптов см. в Подготовка набора данных.
Ограничения
-
Мониторинг дрейфа данных недоступен для моделей временных рядов.
-
Наборы данных SHAP не могут быть сгенерированы во время прогнозирования с моделями временных рядов.
-
Аналитический коннектор Qlik Predict не поддерживает модели временных рядов.
Ограничения, связанные с экспериментами временных рядов, см. в Ограничения и замечания.