Python如何实现时间序列预测的7种技术详解?
- 内容介绍
- 文章标签
- 相关推荐
本文共计3615个文字,预计阅读时间需要15分钟。
数据准备+数据集(JetRail高铁的乘客数量)下载。假设需要解决一个时间序列问题:根据过去两年的数据(2012年8月至2014年8月),使用这些数据预测接下来7个月的乘客数量。+import+pandas
数据准备
数据集(JetRail高铁的乘客数量)下载.
假设要解决一个时序问题:根据过往两年的数据(2012 年 8 月至 2014 年 8月),需要用这些数据预测接下来 7 个月的乘客数量。
import pandas as pd import numpy as np import matplotlib.pyplot as plt df = pd.read_csv('train.csv') df.head() df.shape
依照上面的代码,我们获得了 2012-2014 年两年每个小时的乘客数量。为了解释每种方法的不同之处,以每天为单位构造和聚合了一个数据集。
- 从 2012 年 8 月- 2013 年 12 月的数据中构造一个数据集。
- 创建 train and test 文件用于建模。前 14 个月( 2012 年 8 月- 2013 年 10 月)用作训练数据,后两个月(2013 年 11 月 – 2013 年 12 月)用作测试数据。
- 以每天为单位聚合数据集。
本文共计3615个文字,预计阅读时间需要15分钟。
数据准备+数据集(JetRail高铁的乘客数量)下载。假设需要解决一个时间序列问题:根据过去两年的数据(2012年8月至2014年8月),使用这些数据预测接下来7个月的乘客数量。+import+pandas
数据准备
数据集(JetRail高铁的乘客数量)下载.
假设要解决一个时序问题:根据过往两年的数据(2012 年 8 月至 2014 年 8月),需要用这些数据预测接下来 7 个月的乘客数量。
import pandas as pd import numpy as np import matplotlib.pyplot as plt df = pd.read_csv('train.csv') df.head() df.shape
依照上面的代码,我们获得了 2012-2014 年两年每个小时的乘客数量。为了解释每种方法的不同之处,以每天为单位构造和聚合了一个数据集。
- 从 2012 年 8 月- 2013 年 12 月的数据中构造一个数据集。
- 创建 train and test 文件用于建模。前 14 个月( 2012 年 8 月- 2013 年 10 月)用作训练数据,后两个月(2013 年 11 月 – 2013 年 12 月)用作测试数据。
- 以每天为单位聚合数据集。

