线性回归是我们接触得最早的一种回归,只是当时他的名字不叫线性回归,当时可能说的是线性拟合。
Y=aX+b+e
没有看错,就是这货,一元线性回归。
这里Y是连续变量,a和b是参数,e是误差,X是自变量。
求解参数我们需要求得最小的e,这里我们采用的是最小化平方和误差,(y实际值-y估计值)^2。
多元线性回归如字面上的意思,有多个自变量(至少2个自变量)。
标准线性回归公式:
敲黑板,划重点
线性回归123:
- 自变量和因变量之间要有线性关系才能用线性回归
- 线性回归对异常值非常敏感,分析之前可以用箱线图看看或用其他途径剔除异常值。
- 多元线性回归存在多重共线性、自相关性和异方差性
- 多重共线性会增加系数估计值的方差,导致系数估计值不稳定