拓端数据tecdat：Python | ARIMA时间序列模型预测航空公司的乘客数量

时间序列被定义为一系列按时间顺序索引的数据点。时间顺序可以是每天，每月或每年。

以下是一个时间序列示例，该示例说明了从1949年到1960年每月航空公司的乘客数量。

拓端数据tecdat：Python | ARIMA时间序列模型预测航空公司的乘客数量

时间序列预测

时间序列预测是使用统计模型根据过去的结果预测时间序列的未来值的过程。

一些示例

预测未来的客户数量。
解释销售中的季节性模式。
检测异常事件并估计其影响的程度。
估计新推出的产品对已售出产品数量的影响。

时间序列的组成部分：

代码：航空公司乘客的ETS分解数据集：

1.  # 导入所需的库
2.   
3.  import numpy as np
4.   
5.   
6.   
7.   
8.  # 读取AirPassengers数据集
9.   
10.  airline = pd.read_csv('data.csv',
11.   
12.                         index_col ='Month',
13.   
14.                         parse_dates = True)
15.   
16.   
17.   
18.  # 输出数据集的前五行
19.   
20.  airline.head()
21.   
22.   
23.   
24.  # ETS分解
25.   
26.   
27.  # ETS图
28.   
29.  result.plot()

输出：

ARIMA时间序列预测模型

ARIMA代表自回归移动平均模型，由三个阶数参数（p，d，q）指定。

ARIMA模型的类型

自动ARIMA

“ auto_arima” 函数可帮助我们确定ARIMA模型的最佳参数，并返回拟合的ARIMA模型。

代码：ARIMA模型的参数分析

1.   
2.  # 忽略警告
3.   
4.  import warnings
5.   
6.  warnings.filterwarnings("ignore")
7.   
8.   
9.   
10.  # 将自动arima函数拟合到AirPassengers数据集
11.   
12.  autoarima(airline['# Passengers'], start_p = 1, start_q = 1,
13.   
14.                            max_p = 3, max_q = 3, m = 12,
15.   
16.   
17.   
18.                            stepwise = True          # 设置为逐步
19.   
20.   
21.   
22.  # 输出摘要
23.   
24.  stepwise_fit.summary()

输出：

代码：将ARIMA模型拟合到AirPassengers数据集

1.  # 将数据拆分为训练/测试集
2.   
3.   
4.  test = iloc[len(airline)-12:] # 设置一年（12个月）进行测试
5.   
6.   
7.   
8.  # 在训练集上拟合一个SARIMAX（0，1，1）x（2，1，1，12）
9.   
10.   
11.   
12.  SARIMAX(Passengers, 
13.   
14.                  order = (0, 1, 1), 
15.   
16.                  seasonal_order =(2, 1, 1, 12
17.   
18.   
19.   
20.  result.summary()

输出：

代码：ARIMA模型对测试集的预测

1.   
2.   
3.  # 针对测试集的一年预测
4.   
5.  predict(start, end,
6.   
7.   
8.   
9.   
10.  #绘图预测和实际值
11.   
12.  predictions.plot
13.

输出：

代码：使用MSE和RMSE评估模型

1.  # 加载特定的评估工具
2.  # 计算均方根误差
3.   
4.  rmse(test["# Passengers"], predictions)
5.   
6.   
7.   
8.  # 计算均方误差
9.   
10.  mean_squared_error(test["# Passengers"], predictions)

输出：

代码：使用ARIMA模型进行预测

1.   
2.  # 在完整数据集上训练模型
3.   
4.   
5.  result = model.fit()
6.   
7.   
8.   
9.  # 未来3年预测
10.  result.predict(start = len(airline), 
11.   
12.                            end = (len(airline)-1) + 3 * 12, 
13.   
14.   
15.   
16.   
17.  # 绘制预测值
18.  forecast.plot(legend = True)

输出：

趋势：趋势显示了长时间序列数据的总体方向。趋势可以是增加（向上），减少（向下）或水平（平稳）。
季节性：季节性成分在时间，方向和幅度方面表现出重复的趋势。一些例子包括由于炎热的天气导致夏季用水量增加，或每年假期期间航空公司乘客人数增加。
周期性成分：这些是在特定时间段内没有稳定重复的趋势。周期是指时间序列的起伏，通常在商业周期中观察到。这些周期没有季节性变化，但通常会在3到12年的时间范围内发生，具体取决于时间序列的性质。
不规则变化：这些是时间序列数据中的波动，当趋势和周期性变化被删除时，这些波动变得明显。这些变化是不可预测的，不稳定的，并且可能是随机的，也可能不是随机的。
ETS分解

ETS分解用于分解时间序列的不同部分。ETS一词代表误差、趋势和季节性。
AR（p）自回归 –一种回归模型，利用当前观测值与上一个期间的观测值之间的依存关系。自回归（AR（p））分量是指在时间序列的回归方程中使用过去的值。
I（d） –使用观测值的差分（从上一时间步长的观测值中减去观测值）使时间序列稳定。差分涉及将序列的当前值与其先前的值相减d次。
MA（q）移动平均值 –一种模型，该模型使用观测值与应用于滞后观测值的移动平均值模型中的残留误差之间的相关性。移动平均成分将模型的误差描述为先前误差项的组合。 q 表示要包含在模型中的项数。
ARIMA：非季节性自回归移动平均模型
SARIMA：季节性ARIMA
SARIMAX：具有外生变量的季节性ARIMA

拓端数据tecdat：Python | ARIMA时间序列模型预测航空公司的乘客数量

时间序列预测

时间序列的组成部分：

ARIMA时间序列预测模型

ARIMA模型的类型

继续阅读

mysql5.7的sql优化

线程通信和进程通信区别（线程进程区别）

Matlab随机波动率SV、GARCH用MCMC马尔可夫链蒙特卡罗方法分析汇率时间序列

Lagrange插值的R语言实现

微信小程序前端解密获取用户信息

Spring MVC 自学杂记（五） -- SpringMVC与前台的json数据交互

《MySQL技术内幕：InnoDB存储引擎》笔记

扩容TIKV节点遇到的坑

PHP辅导代做编程：CS353 Database System

自学Zabbix3.10.2-事件通知Notifications upon events-Actions报警配置点击返回：自学zabbix集锦

HDU 5678 ztr loves trees

R语言-相关性分析函数

拓端tecdat|R语言弹性网络Elastic Net正则化惩罚回归模型交叉验证可视化

MATLAB环境下计算时间同步平均信号的差分信号算法运行环境为MATLABR2021B，计算时间同步平均信号的差分信号。

二叉树及其应用--二叉树创建

详解STM32单片机的堆栈