跳到主要内容 跳到补充内容

时间序列问题

时间序列机器学习问题涉及利用历史数据来预测针对特定日期和时间的数值指标。

比较回归问题和时间序列问题

回归问题在目标变量以及它们所涉及的实际用例方面类似于时间序列问题。这两种问题类型之间也存在一些差异。

有关回归问题的更多信息,请参阅 回归问题

相似之处

  • 两者都涉及一个数值目标列。

  • 两者都常用于涉及销售和货币预测的金融用例中。

差异

  • 时间序列问题支持分组目标,而回归问题不支持(请参阅 时间序列问题的组成部分)。分组场景仍然可以通过训练多个不同的模型来解决回归问题,但代价是牺牲了跨组的全局学习。

  • 时间序列问题支持您提前知道某些功能, 特性变量的场景——例如,与天气相关的预测、计划的促销折扣以及日期是否落在工作日、周末和节假日。这些功能, 特性变量被称为未来特性

  • 对于时间序列问题,数据必须按固定时间间隔的日期或日期时间进行索引。此外,在训练和预测期间,预期并生成不同的数据内容(请参阅准备训练数据集准备应用数据集)。

  • 在时间序列问题中,预测值明确对应于特定的日期和时间。在回归问题中,预测值可能对应也可能不对应于特定的日期和时间,但如果它们对应,这种关联是隐含的,而不是在输出中明确表示的。

  • 使用了不同的算法(请参阅 理解模型算法)。

时间序列示例:未来销售额

此示例概述了您需要为时间序列问题收集和提供的数据。要详细了解如何开发时间序列问题的框架,请参阅 使用多元时间序列预测

在此示例中,目标是预测未来四天的每日销售额。此外,已要求预测每个区域和产品组的每日销售总额。鉴于需要按区域和产品组划分的销售额,已建立一个多元时间序列问题。

首先,收集并聚合数据以训练模型。要求是在特定时间范围内,每天呈现每个区域和产品组的总销售额。此外,还希望提供每个区域和产品组每天有多少产品可供促销。

收集的数据样本
日期 促销产品 区域 产品组 销售额
2025-01-01 100 北美 杂货 99642.10
2025-01-01 31 南美洲 产品 34660.34
2025-01-01 11 北美 德利 60345.44
2025-01-01 14 南美洲 杂货 44603.33
2025-01-01 76 北美 产品 105844.44
2025-01-01 133 南美洲 熟食 150385.44
2025-01-02 17 北美 杂货 80195.22
2025-01-02 35 南美洲 产品 61051.13
2025-01-02 24 北美 熟食 55938.38
2025-01-02 118 南美洲 杂货 104823.33
2025-01-02 40 北美 产品 11111.12
2025-01-02 73 南美洲 Deli 15493.33

假设可用历史数据的最后日期是 2025-10-09。理论上,在为此用例训练、部署和预测时间序列模型后,您可以预期以下预测。

预测数据样本
日期 促销产品 区域 产品组 销售额
2025-10-10 0 北美 杂货 193803.15
2025-10-10 14 南美洲 产品 76666.66
2025-10-10 55 北美 Deli 30593.55
2025-10-10 2 南美洲 杂货 10549.33
2025-10-10 1341 北美 产品 100003.33
2025-10-11 0 南美洲 熟食 70001.87
2025-10-11 0 北美 杂货 39522.11
2025-10-11 150 南美洲 产品 91859.30
2025-10-11 65 北美 熟食 19583.55
2025-10-11 12 南美洲 杂货 194863.00
2025-10-11 70 北美 产品 140244.13
2025-10-11 15 南美洲 熟食 76666.66
2025-10-12 20 北美 杂货 30593.55
2025-10-12 20 南美洲 产品 10549.33
2025-10-12 39 北美 熟食 100003.33
2025-10-12 109 南美洲 杂货 105893.99
2025-10-12 37 北美 产品 80195.22
2025-10-13 75 南美洲 Deli 61051.13
2025-10-13 190 北美 杂货 55938.38
2025-10-13 0 南美洲 产品 104823.33
2025-10-13 0 北美 熟食 99105.99
2025-10-13 100 南美洲 杂货 130533.31
2025-10-13 0 北美 产品 67676.73
2025-10-13 14 南美洲 Deli 100474.24

本页面有帮助吗?

如果您发现此页面或其内容有任何问题 – 打字错误、遗漏步骤或技术错误 – 请告诉我们!