最优回归预测模型
回归分析:是气候预测中应用最广泛的统计学方法。目的是建立方程:即,如何从众多备选自变量中进行筛选,建立最优回归方程。保证1、预报准确,包含尽可能多的自变量,不嫩个漏掉对因变量有显著作用的自变量,,会贵方程中包含的自变量越多,回归平方和就越大,剩余平方和就越小;2、应用更方便,预测中包含较少的变量。
最优回归筛选方法的方法包括:前向、后向、逐步筛选法。逐步筛选法:气候预测中最普遍的方法。从一个个自变脸刚开始,按照自变脸归队因变量作用的显著程度从小到大依次逐个引入回归方程。当先引入的变量由于后面的变量引入变得不显著时,则将其剔除,有点是计算量小。
逐步回归的优点是 计算量及内存需求小;缺点:很难保证理论上任何概率保证所筛选的自变量显著性。
逐步回归模型的确定是使用基于F检验的方法,对大型回归问题,F临界值不好确定,F值取得太大,方程中变量个数过少,F值取得太小,又使得大批变量进入方程,不符合要求。
一、多元线性回归的基本方法
1、最小二乘法
2、回归问题的统计检验:
(1)效果检验:方差分析以及F检验;复相关系数
(2)自变量作用检验:上述用方差分析和复相关系数检验回归方程的总体效果,并不能说明每个自变量都有效果。检验各个自变量对y的作用是否显著,需要逐一对自变量进行检验。
3、利用回归方程进行预测
二、最优子集回归(OSR)
常用预测识别准则:1、平均残差平方和;2、Cp-准则;3、预测残差平方和准则;4、CSC准则(是针对气候预测特点剔除的一种考虑数量和趋势预测效果的双评分准则)
三、主成分回归
多元线性回归模型厂采用最小二乘参数估计法估计参数,也称为最小二乘回归。当自变量之间存在近似线性关系(存在复共线性时),导致回归方程极不稳定。
主成分回归(PCR):利用主成分分析从多元随机变量的观测样本矩阵中提取主成分,他们是原变量的线性组合且相互正交,利用某种判断依据选取前几项方差较大的主成分,略去方差较小的一些主成分,不仅保留了大部分原有信息,又消除了复共线性,克服了最小二乘法回归的缺点。
四、特征根回归(LRR)
五、岭回归(RR)
是一种有偏估计,目的是克服自变量之间存在的复共线性。
关键在于岭参数k
常用的确定岭参数的方法:1、岭迹法,根据岭迹图确定k的取值;2、均方根误差最优法;3、预测残差平方和法。