8.3.1时间序列预测步骤
1.绘制时间序列图观察趋势
2.分析序列平稳性并进行平稳化
3.时间序列建模分析
4.模型评估与预测
平稳性
(平稳性,就是所有统计性质都不会随着时间的退役为发生变化)
特征:
1.均数和方差不会随时间变化
2.自相关系数至于时间间隔有关,与所处的时间无关
自相关系数
一个序列中不同时期的相关系数,也就是对时间序列计算其当前期和不同滞后期的一系列相关系数
时间序列平稳化的方法
差分;就是指序列中前后相邻的俩期数据之差,一般用“”
8.3.2时间序列分析操作
分析--时间序列预测--创建传统模型--【时间序列建模器】
--将销售数据移置【因变量】框中--确认中间的【方法】,在下拉列表中选择【专家建模器】项--单击右侧的【条件】按钮--弹出【时间序列建模器:专家建模器】--
【时间序列建模器:专家建模器条件】对话框的【模型】选项卡中--在【模型类型】框中选择【所有模型】项--并勾选【专家建模器考虑季节性模型】---继续
【时间序列建模器】--保存--预测值--【导出模型文件】框中【XML文件】后面的【浏览】按钮--设置导出的模型文件名及保存路径,设置完成后--【确定】按钮--spss就开始使用专家建模方法进行时间序列分析了。
8.3.3时间序列分析结果解读
1.模型描述:(该结果显示了经过分析得到的最有时间序列模型及其参数。本例中,最优的时间序列模型ARIMA(0,1,1)(0,1,1)
ARIMA模型是时间序列分析中常用的一种模型,其全程为求和自回归移动平均模型
模型形式:ARIMA(p,d,q)(P,D,Q)
该模型有6个参数前三个参数(p,d,q)针对移除季节性变化后的序列,后三个参数(P,D,Q)主要用来描述季节性变化,俩个序列是相乘的关系,因此该模型也称为符合的季节模型
其中:
p:是指移除季节性变化后的序列所之后的p期,取值通常为0或1,大于0或1,大于1的情况较少
d:是指移除季节性变化后的序列进行了d阶差分,取值通常为0,1,2;
q:是指移除季节性变化后的序列进行了q次移动平均,取值通常为0或1,很少会超过2
大写的P,D,Q的含义相同,只是应用在包含季节形变化的序列上。
本例中,该模型可解读为,对移除季节因素的序列和包含季节因素的序列分别进行一阶差分和一次平均移动平均,综合俩个模型而构建出的时间序列模型
第二个输出结果是“模型拟合度”如图所示,该结果主要通过R2或平稳的R2来评估模型拟合优度,以及在比较多个模型的情况下,通过比较统计两个从而找到最有的模型
本例中,由于原始序列就有季节变工因素,所以,平稳的R2则更具有参考意义,改值等于32.1%,所以该时间序列模型的拟合效果一般。
第三个输出结果是“模型统计”,该结果提供了更多的统计量用以 评估时间序列的数据拟合效果
本例中,虽然平稳的R2 值为32.1%,但是“杨-博克斯Q(18)”统计量的显著新(P值)=0.706,大于0.05(此处的显著性(p 值)>0.05是期望得到的结果),则接受原假设,认为这个序列的残差符合随机序列分布,同时也没有离群值的出现,这也都反映了数据的拟合效果还是可以接受的。
第四个输出结果是:“序列趋势图”显示了是指和预测值的趋势,蓝色的序列是原始值,如果在之前的【时间序列建模器】中设置了要预测的时间,则该图会显示出预测值。本例中,由于没有设置要预测的时间,故不会出现未来的预测值。
返回到数据文件,可以看到最后一列生成了新变量,“预测_销售数据_模型_1”其变量值是根据得到的时间序列模型所估计出的预测值,可以通过绘制序列图的方法比较原始的序列值以及其预测值之间的差异,从图形化的结果中直观感受数据拟合结果。
本例中,通过原时间序列值与其预测值的序列图4可以发现,蓝色的原始序列值和绿色的预测值基本重合,直观判断改时间序列的拟合效果是可以接受的。
8.3.4时间序列的预测应用
预测后一年的销量
步骤:
【分析】--【时间序列预测】---选择【应用传统模型】----弹出【应用时间序列模型】对话框
--单击【模型】--【浏览】刚才保存模型文件的文件下--选中文件后【打开】载入模型--在【预测期】框中选择【评估期结束后二第一个个案到指定日期之间的个案】--在【日期】下方的【年】【月】对应的框中输入要预测的指定日期和最后一个月份
本例中原始末期2015年12月--要预测未来的一年的得销量,即2016年12月,因此,在【年】框中输入“2016”【月】框中输入12
----切换成【保存】--勾选【预测值】(以保存生成的预测数,设置完成后)--确定
这里只是显示了一年的趋势,缺少全局观。
故应该同时比较原始值和这一年的预测值,从全局的角度来观察预测趋势,我们【序列图】画出来。
现在看起来比较清楚了,销量趋势是上升的,三月份到五月份的销量波动之前也平缓了-----》制定相应的销售策略
返回数据文件,可以到最后一列生成的变量就是小两个预测的具体数字