时间序列分析是一种动态数据处理的统计方法。该方法基于随机过程理论和数理统计学方法,研究随机数据序列所遵从的统计规律,以藉此解决实际问题。下面我们主要从下面四个方面来解说:
[if !supportLineBreakNewLine]
[endif]
实际应用
理论思想
建立模型
[if !supportLineBreakNewLine]
[endif]
分析结果
[if !supportLineBreakNewLine]
[endif]
一、实际应用
[if !supportLineBreakNewLine]
[endif]
在现实中,许多统计资料都是按照时间进行观测记录的,因此时间序列分析在实际分析中具有广泛的应用。时间序列是按随机过程的一次实现,具有随时间而变化、动态性和随机性数字序列等特点。
时间序列分析常用在国民经济宏观控制、区域综合发展规划、企业经营管理、市场潜量预测、气象预报、水文预报、地震前兆预报、农作物病虫灾害预报、环境污染控制、生态平衡、天文学和海洋学等方面。主要包括从以下几个方面入手进行研究分析。系统描述:根据对系统进行观测得到的时间序列数据,用曲线拟合方法对系统进行客观的描述。系统分析:当观测值取自两个以上变量时,可用一个时间序列中的变化去说明另一个时间序列中的变化,从而深入了解给定时间序列产生的机理。预测未来:一般用ARMA模型拟合时间序列,预测该时间序列未来值。决策和控制:根据时间序列模型可调整输入变量使系统发展过程保持在目标值上,即预测到过程要偏离目标时便可进行必要的控制。
[if !supportLineBreakNewLine]
[endif]
二、理论思想
时间序列数据的预处理:时间序列的预处理是指定义时间序列和对时间序列平稳化处理。它是进行时间序列分析前必须进行的一个环节,因为SPSS无法自动识别时间序列数据,而且在处理的过程中必须明确考虑时间序列的非平稳性,所以在进行时间序列分析前,我们必须对时间序列进行预处理。时间序列的特点是数据资料的先后顺序不能随意地改变,逐次的观测值通常是不独立的,而且分析时必须考虑观测资料的时间顺序,这同以前所介绍的观测资料有很大的区别。下面主要介绍时间序列分析研究中最常用的指数平滑、自回归集成移动平均及季节分解时间序列分析方法。
[if !supportLineBreakNewLine]
[endif]
指数平滑模型:
指数平滑模型可以对不规则的时间序列数据加以平滑,从而获得其变化规律和趋势,以此对未来的经济数据进行推断和预测。指数平滑模型的思想是对过去值和当前值进行加权平均以及对当前的权数进行调整,以期抵消统计数值的摇摆影响,得到平滑的时间序列。指数平滑法不舍弃过去的数据,但是对过去的数据给予逐渐减弱的影响程度(权重)。
[if !supportLineBreakNewLine]
[endif]
自回归集成移动平均模型(ARIMA):
自回归集成移动平均(ARIMA)模型也称为Box-Jenkins模型,是广泛应用于时间序列分析的常见模型,它可以用来处理包含季节趋势的时间序列。根据对时间序列特征的预先研究,可以指定三个参数用来分析时间序列,即自回归阶数(p)、差分次数(d)和移动平均阶数(q),通常模型被写作ARIMA(p, d, q)。该方法的第一步是对数据求差分直到它是平稳的,这可以通过检查各种差分序列的相关图(包括偏相关图)直到找出一个“急速”下降于零,并且从此任何季节效应已经大大消除的序列来完成分析时间序列的随机性、平稳性及季节性。
对于非季节数据,通常求一阶差分就足够了。
第二步是选定一个特定的模型拟合所分析的时间序列数据,模型识别是Box-Jenkins方法中很重要的一环,是否合适的比较标准是对一般ARMA模型中的一些特征,分析其理论特征,把这种特定模型的理论特征作为鉴别实际模型的标准,观测实际资料与理论特征的接近程度,最后根据这种分类比较分析的结果来判定实际模型的类型。
第三步是用时间序列的数据估计模型的参数并进行检验,以判定该模型是否恰当,如果不恰当,则返回第二步,重新选定模型。
[if !supportLineBreakNewLine]
[endif]
季节性分解模型:
季节变动趋势是时间序列的4种主要变动趋势之一,所谓季节性变动是指由于季节因素导致的时间序列的有规则变动。引起季节变动的除自然原因外,还有人为原因,如节假日、风俗习惯等。季节分解的主要方法包括按月(季)平均法和移动平均趋势剔除法。
[if !supportLineBreakNewLine]
[endif]
[if !supportLineBreakNewLine]
[endif]
三、建立模型
[if !supportLineBreakNewLine]
[endif]
SPSS时间定义步骤:
选择“数据”|“定义日期和时间”命令
在“个案是”列表框中选择时间格式
[if !supportLineBreakNewLine]
[endif]
SPSS时间序列平稳化处理:
选择“转换”|“创建时间序列”命令
选择变量。从源变量列表框中选择需要进行平稳化处理的变量,将选中的变量选入“变量->新名称”列表框中。进入“变量->新名称”列表框中的变量显示为“新变量名称=平稳函数(原变量名称顺序)”。
进行相应的设置。在“名称和函数”选项组中可以对平稳处理后生成的新变量重命名并选择平稳化处理的方法,设置完毕后单击“变化量”按钮就完成了新变量的命名和平稳化处理方法的选择。
ARIMA模型案例:
[if !supportLineBreakNewLine]
[endif]
题目:给出了从1960年~2008年某国的工业生产总值数据、某国10年期国库券利率与该国联邦基金利率差额。利用ARIMA模型对美国10年期国库券利率与联邦基金利率差额的走势进行分析与预测。
一、数据输入
[if !vml]
[endif]
二、操作步骤1、进入SPSS,打开相关数据文件,选择“分析”|“时间序列预测”|“创建传统模型”命令,打开“时间序列建模器”对话框。2、选择进行分析的变量。在“时间序列建模器”对话框的左侧列表框中,将“利差”变量选入“因变量”列表框中,在“方法”下拉列表中选择“ARIMA”选项。
[if !vml]
[endif]
3、设置ARIMA模型的形式。
单击“条件”按钮,打开“时间序列建模器:ARIMA条件”对话框,打开“模型”选项卡,在“自回归”的“季节性”列中输入“3”,在“差值”的“季节性”列中输入“1”,在“移动平均值”的“季节性”列中输入“2”,单击“继续”按钮,保存设置。
[if !vml]
[endif]
4、选择是否显示参数估计值。
打开“统计”选项卡,选中“参数估算值”和“显示预测值”复选框,然后单击“继续”按钮,保存设置。
[if !vml]
[endif]
5、其余设置采用系统默认值即可。单击“确定”按钮,等待输出结果。
[if !supportLineBreakNewLine]
[endif]
四、结果分析
1、模型描述表下表给出了模型的基本描述。从该表可以看出,所建立的ARIMA模型的因变量标签是“US spread”,模型名称为“模型_1”,模型的类型为ARIMA(3,1,2)。
[if !vml]
[endif]
2、模型拟合表下表给出了模型的8个拟合优度指标,包括这些指标的平均值、最小值、最大值以及百分位数。其中,平稳R方值为0.160,而R方值为0.573,由于因变量数据为季节性数据,因此平稳R方更具有代表性。从两个R方值来看,ARIMA(3,1,2)的拟合情况良好。
[if !vml]
[endif]
3
、模型参数估计值下表给出了ARIMA(3,1,2)模型参数估计值。ARIMA(3,1,2)中有两部分:AR和MA。其中AR自回归部分的三项的显著性水平分别为0.549、0.000和0.033,而MA移动平均部分的两项的显著性水平为0.607和0.160。因此,ARIMA(3,1,2)比较适合。
[if !vml]
[endif]
4、模型预测与拟合图下图给出了SPREAD的ARIMA(3,1,2)模型的拟合图和观测值。SPREAD序列整体上呈波动状态,拟合值和观测值曲线在整个区间的拟合情况良好,明显可以看出拟合值的波动性非常接近实际观察值的波动性。因此可以说明ARIMA(3,1,2)模型对SPREAD的拟合情况还是非常不错的。
[if !vml]
[endif]
分析结论:(获取更多知识,前往gz号程式解说)
[if !supportLineBreakNewLine]
[endif]
通过ARIMA模型分析,我们发现:
由结果分析(1)、(2)可知,从拟合的R方值来看,ARIMA(3,1,2)的拟合情况良好。
由结果分析(3)可知,从图像来看ARIMA(3,1,2)模型对SPREAD的拟合情况一般,需要进一步探索其他的ARIMA模型。
由结果分析(4)可知,ARIMA(3,1,2)模型对SPREAD的拟合值和观测值曲线在整个区间整体上的拟合情况差强人意。
[if !supportLineBreakNewLine]
[endif]
参考案例数据:
[if !supportLineBreakNewLine]
[endif]
【1】spss统计分析与行业应用案例详解(第四版) 杨维忠,张甜,王国平 清华大学出版社
原文来自https://mp.weixin.qq.com/s/reJM74sNLm8O8nAMEdK1-Q