2019-05-17

作者：王乔 (中南财经政法大学)

Stata 连享会：知乎 | 简书 | 码云

1. GMM简介

广义矩估计 (Generalized Method of Moment, 简称 GMM) 是一种构造估计量的方法，类似于极大似然法 (MLE) 。MLE 通过假设随机变量服从特定的分布，进而将待估参数嵌入似然函数，通过极大化联合概率密度函数得到参数的估计值。GMM 则是以随机变量遵循特定矩的假设，而不是对整个分布的假设，这些假设被称为矩条件。这使得 GMM 比 MLE 更稳健，但会导致估计量的有效性有所降低 (估计出的标准误比较大)。

2. MM估计量

$E(\mathrm{y}-\mu)=0 \rightarrow \frac{1}{N} \sum_{i=1}^{N}\left(y_{i}-\hat{\mu}\right)=0 \rightarrow \hat{\mu}=\frac{1}{N} \sum_{i=1}^{N} y_{i}$

其中， N表示样本数， $y_{i}$ 表示y的第i个观察值。此处，估计量 $\hat{\mu}$ 被称为矩估计量(the method of moments estimator)，简称MM估计量。这是因为，该估计量的构造以母体矩条件(population moment condition)为基础，进而用其样本矩条件（依赖于我们使用的数据）做等价代换。因为我们从总体矩条件开始，然后运用类比原理得到一个依赖于观测数据的估计量。

2.1 PMC和SMC样本均值的估计

我们想要估计随机变量 $\mathcal{Y}$ 的均值，即 $\mu=E[\mathrm{y}]$ ，其中“母体矩条件(PMC)”为： $E[\mathrm{y}]-\mu=0$ ， $\left\{y_{1}, y_{2}, \dots, y_{n}\right\}$ 为从这个母体中随机抽取的一组样本观察值，则对应的“样本矩条件(SMC)”为 $\frac{1}{N} \sum_{i=1}^{N} y_{i}-\hat{\mu}=0$ 。因此，我们可知母体矩条件的样本均值估计为： $\mu=E[\mathrm{y}]$ ，样本矩条件的样本均值估计为： $\hat{\mu}=\frac{1}{N} \sum_{i=1}^{N} y_{i}$ 。

例子：自由度为k的 $\chi^{2}$ 随机变量的均值为k，方差为2k，因此两个母体矩条件(PMC)如下：
$E[Y-k]=0$ (1a)
$E\left[(Y-k)^{2}-2 k\right]=0$ (1b)

这个母体中随机抽取的一组样本观察值 $\left\{y_{1}, y_{2}, \ldots, y_{n}\right\}$ ，对应的样本矩条件(SMC)为：
$\frac{1}{N} \sum_{i=1}^{N}\left(y_{i}-\hat{k}\right)=0$ (1a)
$\frac{1}{N} \sum_{i=1}^{N}\left[\left(y_{i}-\hat{k}\right)^{2}-2 \hat{k}\right]=0$ (1b)

2.2 MM 估计的一般形式

矩估计法是用样本的k阶矩作为总体的k阶矩的估计量，建立含待估计参数的方程，从而可解出待估计参数。
一般地，不论总体服从什么分布，总体期望 $\mu$ 与方差 $\sigma^{2}$ 存在，则根据据估计法，它们的矩估计量分别为： $\hat{\mu}=\frac{1}{n} \sum_{i=1}^{n} X_{i}=\overline{X}$ $\hat{\sigma}^{2}=\frac{1}{n} \sum_{i=1}^{n}\left(X_{i}-\overline{X}\right)^{2}$

2.2.1 OLS 估计

OLS估计是矩估计的一种形式。OLS估计的公式为： $y_{i}=\beta x_{i}+\mu_{i}$ ，其中 $x_{i}$ 与 $\mu_{i}$ 不相关，则有 $E\left[\mu_{i} | x_{i}\right]=0$ 。

因此， $E\left[\mu_{i} | x_{i}\right]=0 \rightarrow E\left[y_{i}-\beta x_{i} | x_{i}\right]=0 \rightarrow E\left[x_{i}\left(y_{i}-\beta x_{i}\right)\right]=0$ ，其中 $E\left[x_{i}\left(y_{i}-\beta x_{i}\right)\right]=0$ 是母体矩条件，对应的样本矩条件为： $\frac{1}{N} \sum_{i=1}^{N}\left[x_{i}\left(y_{i}-\hat{\beta}^{M M} x_{i}\right)\right]=0$ ，求解即可得到OLS估计下的 $\hat{\beta}^{M M}$ 。

2.2.2 IV 估计

工具变量法（IV）是为了解决一个违反经典假设问题而设计的，假设条件是：解释变量与随机扰动项不相关。如果出现了违反该假设的问题，就需要找一个和解释变量高度相关的、同时和随机扰动项不相关的变量。要注意的问题是，工具变量的设定除了上述两个条件以外，工具变量的个数至少要大于或者等于解释变量的个数，常数项是默认的工具变量，和随机扰动项不相关的解释变量也可以作为工具变量。

工具变量是矩估计的一种形式。假设公式为： $y_{i}=\beta x_{i}+\mu_{i}$ ，根据公式可得： $\mu_{i}=y_{i}-\beta x_{i}$ ，取得工具变量为 $Z_{i}$ ，其中 $x_{i}, z_{i} \in R^{k}$ ，得到 $E\left[y_{i}-\beta x_{i} | z_{i}\right]=0$ ，则 $E\left[y_{i}-\beta x_{i} | z_{i}\right]=0 \rightarrow E\left[z_{i}\left(y_{i}-\beta x_{i}\right)\right]=0$ ， $E\left[Z_{i}\left(y_{i}-\beta x_{i}\right)\right]=0$ 为母体矩条件，对应的样本矩条件为： $\frac{1}{N} \sum_{i=1}^{N}\left[z_{i}\left(y_{i}-\hat{\beta}^{M M} x_{i}\right)\right]=0$ ，求解即可得到工具变量估计下的 $\hat{\beta}^{\text { MM }}$ 。

3. GMM

3.1 为何要使用GMM？

GMM估计中，假设待估参数的个数为k，矩条件的个数为l：
1.恰好识别（just or exactly identified）：当k=l时，即待估参数的个数等于矩条件的个数；
2.过度识别（overidentified）：当k<l时，即待估参数的个数小于矩条件的个数。

GMM 是矩估计（MM）的推广。在恰好识别情况下，目标函数的最小值等于 0 ，GMM 估计量与 MM 估计量等价；然而在过度识别情况下，MM 不再适用，GMM 可以有效地组合矩条件，使 GMM 比 MM 更有效。在GMM估计中，母体矩条件为： $E[y]-u=0$ ，样本矩条件为： $\frac{1}{N} \sum_{i=1}^{N} y_{i}-\hat{\mu}^{\operatorname{Gu} M}=0$ ，通过求解样本矩条件得到GMM均值估计： $\hat{\mu}^{G M M}=\frac{1}{N} \sum_{i=1}^{N} y_{i}$ 。

3.2 两阶段最小二乘法

两阶段最小二乘法其本质上是属于工具变量，回归分两个阶段进行，因此而得名。具体机理是：

第一步，将结构方程先转换为简化式模型（约简型方程），简化式模型里的每一个方程都不存在随机解释变量问题，可以直接采用普通最小二乘法进行估计。
第二步，由第一步得出的 $\hat{Y}$ 的估计量替换 $Y$ 。该方程中不存在随机解释变量问题，也可以直接用普通最小二乘法进行估计。

例子：一般IV回归模型为：
$Y_{i}=\beta_{0}+\beta_{1} X_{1 i}+\ldots+\beta_{k} X_{k i}+\beta_{k+1} W_{1 i}+\ldots+\beta_{k+r} W_{r i}+u_{i} (i=1,2, \ldots, n)$ (a)

其中：

$Y_{i}$ 为因变量；
$u_{i}$ 为误差项，表示测量误差和/或遗漏因素；
$X_{1 i}, X_{2 i}, \ldots, X_{k i}$ 表示k个内生回归变量，可能与 $u_{i}$ 相关；
$W_{1 i}, W_{2 i}, \ldots, W_{r i}$ 表示r个包含的外生变量，与 $u_{i}$ 不相关；
$\beta_{0}, \beta_{1}, \ldots, \beta_{k+r}$ 为未知回归系数；
$Z_{1 i}, Z_{2 i}, \ldots, Z_{m i}$ 为 $m$ 个工具变量。

以单内生回归变量的2SLS为例，当只有一个内生回归变量X和一些其他的包含的外省变量时，感兴趣的方程为： $Y_{i}=\beta_{0}+\beta_{1} X_{i}+\beta_{2} W_{1 i}+\ldots+\beta_{1+r} W_{r i}+u_{i}$ （b），其中同前 $X_{i}$ 可能与误差项相关，但 $W_{1 i}, W_{2 i}, \ldots, W_{r i}$ 与误差项不相关。

2SLS的总体第一阶段回归将X与外生变量W和工具变量（Z）联系在了一起：
$X_{i}=\pi_{0}+\pi_{1} Z_{1 i}+\ldots+\pi_{m} Z_{m i}+\pi_{m+1} W_{1 i}+\ldots+\pi_{m+r} W_{r i}+v_{i}$ (c)
其中 $\pi_{0}, \pi_{1}, \ldots, \pi_{m}$ 为未知回归系数， $v_{i}$ 为误差项。

在2SLS的第一阶段中，可用OLS估计（c）式中的未知系数，并记由该回归得到的预测值为 $\hat{X}_{1}, \hat{X}_{2}, \ldots, \hat{X}_{n}$ 。在2SLS的第二阶段中，用OLS估计 $X_{i}$ 用第一阶段的预测值替换后的（b）式。也就是用OLS估计 $Y_{i}$ 关于 $\hat{X}_{i}$ ， $W_{1 i}, W_{2 i}, \ldots, W_{r i}$ 的回归。得到的 $\beta_{0}, \beta_{1}, \ldots, \beta_{1+r}$ 估计量就是2SLS估计量。

当存在多个内生回归变量 $X_{1 i}, X_{2 i}, \dots, X_{k i}$ 时，除了每个内生回归变量都需要自己的第一阶段回归以外，2SLS的算法是类似的。其中每个内生回归变量的第一阶段回归形式同（c）式，即因变量是某个X，回归变量是所有工具变量（Z）和所有包含的外生变量（W）。所有这些第一阶段回归一起得到了每个内生回归变量的预测值。

在2SLS的第二阶段中，用OLS估计内生回归变量（ $X$ ）分别用其预测值（ $\hat{X}$ ）替换后的（a）式。得到的 $\beta_{0}, \beta_{1}, \beta_{2}, \dots, \beta_{k+r}$ 估计量即为2SLS估计量。

3.4 过度识别检验

上面提到了，只有恰好识别和过度识别才能用IV方法估计。假设待估参数的个数为k，矩条件的个数为l。当 $k=l$ 时，称为“恰好识别”，当 $k<l$ 时，称为 “过度识别”。

一个很重要的命题是：只有过度识别情况下才能检验工具变量的外生性，而恰好识别情况下无法检验。具体思路如下：工具变量的外生性意味着它们和 $\mathrm{u}_{\mathrm{i}}$ 不相关。这表明工具变量和 $\hat{\mathrm{u}}_{\mathrm{i}}^{2 \mathrm{SLS}}$ 近似不相关，其中 $\hat{\mathrm{u}}_{\mathrm{i}}^{2 S L S}=Y_{i}-\left(\hat{\beta}_{0}^{2 S L S}+\hat{\beta}_{1}^{2 S L S} X_{1 i}+\ldots+\hat{\beta}_{k+r}^{2 S L S} X_{r i}\right)$ 为基于所有工具变量的2SLS回归估计残差（由于抽样变异性因此是近似的而不是精确地，注意到这些残差是利用X值而不是用其第一阶段的预测值得到的。）于是，如果工具变量事实上是外生的，那么 $\hat{\mathrm{u}}_{\mathrm{i}}^{2 \mathrm{SLS}}$ 关于工具变量和包含的外生变量回归中工具变量的系数都应该等于零，而这个假设是可以检验的。

过度识别约束检验（J统计量），又称为Sargan统计量。令 $\hat{\mathrm{u}}_{\mathrm{i}}^{2 \mathrm{SLS}}$ 为来自（a）式2SLS估计的残差。利用OLS估计下面的回归系数：
$\hat{u}_{i}^{2 S L S}=\delta_{0}+\delta_{1} Z_{1 i}+\ldots+\delta_{m} Z_{m i}+\delta_{n t+1} W_{1 i}+\ldots+\delta_{m+r} W_{n}+e_{i}$ (d)

其中 $e_{i}$ 为回归误差项。令F表示检验假设 $\delta_{1}=\ldots=\delta_{m}=0$ 的同方差适用F统计量。则过度识别约束检验统计量为 $J=mF$ 。如果 $e_{i}$ 是同方差的，则在所有工具变量都是外生的原假设下， $J$ 服从 $\chi_{m-k}^{2}$ 分布，其中 $m-k$ 为“过度识别度”，也就是工具变量的个数减去内生回归变量的个数。

3.5 Euler 方程范例

在Hansen、Singleton（1982）的经典文章中，他们基于消费的资产资本定价模型分析了资产随时间的移动。在他们的非线性理性预期模型的一个稍微简单的版本中，代表性最大化的期望贴现寿命效用为: $E\left[\sum_{\tau=0}^{\infty} \beta^{\tau} U\left(C_{t+\tau}\right) | \Omega_{t}\right]$ ，其中受到的预算约束为： $c_{t}+p_{t} q_{t} \leq r_{t} q_{t-1}+w_{t}$ , $\forall t$ , 其中 $c_{t}$ 为 $t$ 时刻的阶段性消费， $p_{t}$ , $q_{t}$ , $r_{t}$ 是相应到期的价格、数量和资产收益， $w_{t}$ 是实际工资并且 $\Omega_{t}$ 是时刻t的代理信息集。Hansen和Singleton使用一个恒定的相对风险厌恶效用函数 $U(c)=\frac{c^{\gamma}-1}{\gamma}$ ，因此优化问题的一阶条件是 $E\left[\beta\left(\frac{c_{t+1}}{c_{t}}\right)^{\gamma} \frac{r_{t+1}}{p_{t}} | \Omega_{t}\right]=0$ ，这个看起来像一个母体矩条件但是目前的问题是我们有两个参数 $(\beta, \gamma)$ , 只有一个矩条件。但是，对任意向量 $z_{t} \in \Omega_{t}$ ，通过一个迭代的条件期望参数Euler方程变成 $E\left[\left(\beta\left(\frac{c_{t+1}}{c_{t}}\right)^{\gamma} \frac{r_{t+1}}{p_{t}}-1\right) z_{t}\right]=0$ 。

因此，从理论上讲，该模型是通过时刻t已知的任何代理变量来识别的，比如 $\frac{r_{t}}{p_{t-1}}$ 或者 $\frac{c_{t}}{c_{t-1}}$ ，并且能够利用GMM方法一致的估计。与此相反，该模型的极大似然估计需要精确地指定变量的条件分布和大量的数值积分，这些都是计算上的负担。

4. GMM过程的Stata简单实现

4.1 gmm命令

（1）在stata中，gmm的一般命令形式为：
gmm ([reqname1:]rexp_1) ([reqname2:]rexp_2)…[if] [in] [weight] [,options]
其中：
1.reqname_j代表第j个剩余方程的表达式
2.rexp_j是第j个残差方程的可替换表达式

（2）在stata中，gmm的矩估计命令形式为：
gmm moment_pro [if] [in] [weight],
{equations(namelist) | nequations(#)}
{parameters(namelist) | nparameters(#)} [options]
[program_options]
1.moment_prog是矩估计评估形式

(1)和(2)中的options选项为：
1.derivative([reqname|#]/name=dexp_jk)指定reqname（或#）对参数名的导数；可指定多于一次。

`twostep`使用两步GMM估计
`onestep`使用一步GMM估计    
`igmm`使用迭代GMM估计

2.Instruments

`instruments([reqlist:]varlist)[,noconstant])`是制定工具；可以被多次指定
`xtinstruments([reqlist:]varlist,lags(#_1/#_2))`是制定面板类工具变量；可以被多次指定

3.Weight matrix

`wmatrix(wmtype[,independent])`指定权重矩阵;`wmtype`可以是`robust`,`cluster` `clustvar`,`hac kernel [lags]`，或者`unadjusted`
`center`计算权重矩阵时的中心矩
`winitial(iwtype[, independent])`指定初始权重矩阵；`iwtype`可以是`unadjested`,`identity`,`xt xtspec`,或者stata矩阵的名字

4.SE/Robust

`vce(vcetype[,independent])`其中`vcetype`可以是`robust`,`cluster clustvar`,`bootstrap`,`jackknife`,`hac kernel lags`,或者`unadjusted`

5.Reporting

`level(#)`设置置信水平;默认是水平(95)
`title(string)`将字符串显示为参数估计表上方的标题
`title2(string)`显示字符串作为副标题
`display_options`控制列与列格式、行间距、行宽、显示省略的变量、基单元格与空单元格，以及因子-变量标记

6.Optimization

`from(initial_values)`参数的指定初始值
`igmmiterate(#)`指定迭代GMM估计的最大迭代次数
`igmmeps`迭代的GMM参数收敛准则指定为#；默认为igmmeps(1e-6)
`igmmweps(#)`迭代的GMM权重矩阵收敛准则指定为#;默认是igmmweps (1e-6)
`optimization_options`控制优化过程；很少使用
`coeflegend`显示图例而不是统计数据

4.2简单例子

在对gmm命令的一般形式有了解之后，此处举个简单的案例来进行gmm的分析。以stata自带的数据auto.dta为例，进行以下的GMM实验：

（1）简单线性回归的GMM

stata操作为：
sysuse auto,clear
gmm (mpg - {b1}*gear_ratio - {b2}*turn - {b0}),instruments(gear_ratio turn)

结果如下：

Iteration 0:   GMM criterion Q(b) =  471.67875  
Iteration 1:   GMM criterion Q(b) =  3.058e-21  
Iteration 2:   GMM criterion Q(b) =  2.545e-31  

Step 2
Iteration 0:   GMM criterion Q(b) =  1.691e-32  
Iteration 1:   GMM criterion Q(b) =  1.691e-32  (backed up)

note: model is exactly identified

GMM estimation 

Number of parameters =   3
Number of moments    =   3
Initial weight matrix: Unadjusted                 Number of obs   =         74
GMM weight matrix:     Robust

------------------------------------------------------------------------------
             |               Robust
             |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         /b1 |   3.032884   1.501664     2.02   0.043     .0896757    5.976092
         /b2 |  -.7330502    .117972    -6.21   0.000    -.9642711   -.5018293
         /b0 |   41.21801   8.396739     4.91   0.000     24.76071    57.67532
------------------------------------------------------------------------------
Instruments for equation 1: gear_ratio turn _cons

（2）利用线性组合的简单线性回归GMM

stata操作为：
gmm (mpg - {xb:gear_ratio turn} - {b0}), instruments(gear_ratio turn)

结果如下：

Iteration 0:   GMM criterion Q(b) =  471.67875  
Iteration 1:   GMM criterion Q(b) =  3.058e-21  
Iteration 2:   GMM criterion Q(b) =  4.073e-31  

Step 2
Iteration 0:   GMM criterion Q(b) =  3.566e-32  
Iteration 1:   GMM criterion Q(b) =  3.566e-32  (backed up)

note: model is exactly identified

GMM estimation 

Number of parameters =   3
Number of moments    =   3
Initial weight matrix: Unadjusted                 Number of obs   =         74
GMM weight matrix:     Robust

------------------------------------------------------------------------------
             |               Robust
             |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
  gear_ratio |   3.032884   1.501664     2.02   0.043     .0896757    5.976092
        turn |  -.7330502    .117972    -6.21   0.000    -.9642711   -.5018293
-------------+----------------------------------------------------------------
         /b0 |   41.21801   8.396739     4.91   0.000     24.76071    57.67532
------------------------------------------------------------------------------
Instruments for equation 1: gear_ratio turn _cons

(3)两阶段最小二乘(与ivregress 2sls相同)

最小二乘法的stata操作为：
ivregress 2sls mpg gear_ratio (turn = weight length headroom)
结果为：

                                                  Wald chi2(2)    =      90.94
                                                  Prob > chi2     =     0.0000
                                                  R-squared       =     0.4656
                                                  Root MSE        =     4.2007

------------------------------------------------------------------------------
         mpg |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
        turn |  -1.246426   .2012157    -6.19   0.000    -1.640801   -.8520502
  gear_ratio |  -.3146499   1.697806    -0.19   0.853    -3.642288    3.012988
       _cons |   71.66502    12.3775     5.79   0.000     47.40556    95.92447
------------------------------------------------------------------------------
Instrumented:  turn
Instruments:   gear_ratio weight length headroom

相应GMM的stata操作为：

gmm (mpg - {b1}*turn - {b2}*gear_ratio - {b0}), instruments(gear_ratio weight length headroom) onestep

结果如下：

Iteration 0:   GMM criterion Q(b) =  475.42283  
Iteration 1:   GMM criterion Q(b) =  .16100633  
Iteration 2:   GMM criterion Q(b) =  .16100633  

GMM estimation 

Number of parameters =   3
Number of moments    =   5
Initial weight matrix: Unadjusted                 Number of obs   =         74

------------------------------------------------------------------------------
             |               Robust
             |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         /b1 |  -1.246426   .1970566    -6.33   0.000    -1.632649   -.8602019
         /b2 |  -.3146499   1.863079    -0.17   0.866    -3.966217    3.336917
         /b0 |   71.66502   12.68722     5.65   0.000     46.79853    96.53151
------------------------------------------------------------------------------
Instruments for equation 1: gear_ratio weight length headroom _cons

(4)两步GMM估计(与ivregress GMM相同)

两步GMM估计的stata操作为：
ivregress gmm mpg gear_ratio (turn = weight length headroom)

                                                  Wald chi2(2)    =      97.83
                                                  Prob > chi2     =     0.0000
                                                  R-squared       =     0.4769
GMM weight matrix: Robust                         Root MSE        =     4.1559

------------------------------------------------------------------------------
             |               Robust
         mpg |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
        turn |  -1.208549   .1882903    -6.42   0.000    -1.577591   -.8395071
  gear_ratio |    .130328    1.75499     0.07   0.941     -3.30939    3.570046
       _cons |   68.89218   12.05955     5.71   0.000     45.25589    92.52847
------------------------------------------------------------------------------
Instrumented:  turn
Instruments:   gear_ratio weight length headroom

或者gmm (mpg - {b1}*turn - {b2}*gear_ratio - {b0}), instruments(gear_ratio weight length headroom) wmatrix(robust)

Iteration 0:   GMM criterion Q(b) =  475.42283  
Iteration 1:   GMM criterion Q(b) =  .16100633  
Iteration 2:   GMM criterion Q(b) =  .16100633  

Step 2
Iteration 0:   GMM criterion Q(b) =  .00863899  
Iteration 1:   GMM criterion Q(b) =  .00741189  
Iteration 2:   GMM criterion Q(b) =  .00741189  

GMM estimation 

Number of parameters =   3
Number of moments    =   5
Initial weight matrix: Unadjusted                 Number of obs   =         74
GMM weight matrix:     Robust

------------------------------------------------------------------------------
             |               Robust
             |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         /b1 |  -1.208549   .1882903    -6.42   0.000    -1.577591   -.8395071
         /b2 |    .130328    1.75499     0.07   0.941     -3.30939    3.570046
         /b0 |   68.89218   12.05955     5.71   0.000     45.25589    92.52847
------------------------------------------------------------------------------
Instruments for equation 1: gear_ratio weight length headroom _cons

4.3进阶例子

当然GMM更有名的应用是在动态面板的估计上，我们可以使用xtabond估计动态面板。以stata自带的数据abdate.dta为例，进行实验：
webuse abdata,clear
xtabond n L(0/1).w L(0/1).k, lags(1) noconstant vce(robust)

结果如下：

Group variable: id                              Number of groups  =        140
Time variable: year
                                                Obs per group:
                                                              min =          5
                                                              avg =   5.364286
                                                              max =          7

Number of instruments =     32                  Wald chi2(5)      =     658.83
                                                Prob > chi2       =     0.0000
One-step results
                                     (Std. Err. adjusted for clustering on id)
------------------------------------------------------------------------------
             |               Robust
           n |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
           n |
         L1. |   .8041712   .1199819     6.70   0.000     .5690111    1.039331
             |
           w |
         --. |  -.5600476   .1619472    -3.46   0.001    -.8774583    -.242637
         L1. |   .3946699   .1092229     3.61   0.000     .1805969    .6087429
             |
           k |
         --. |   .3520286   .0536546     6.56   0.000     .2468676    .4571897
         L1. |  -.2160435   .0679689    -3.18   0.001    -.3492601   -.0828269
------------------------------------------------------------------------------
Instruments for differenced equation
        GMM-type: L(2/.).n
        Standard: D.w LD.w D.k LD.k

用GMM的形式可以表示为：
gmm (D.n - {rho}*LD.n - {xb:D.w LD.w D.k LD.k}),
xtinstruments(n, lags(2/.)) instruments(D.w LD.w D.k LD.k, noconstant)
deriv(/rho = -1*LD.n) deriv(/xb = -1) winitial(xt D) onestep

结果如下：

Iteration 0:   GMM criterion Q(b) =   .0011455  
Iteration 1:   GMM criterion Q(b) =  .00009103  
Iteration 2:   GMM criterion Q(b) =  .00009103  

GMM estimation 

Number of parameters =   5
Number of moments    =  32
Initial weight matrix: XT D                       Number of obs   =        751

                                   (Std. Err. adjusted for 140 clusters in id)
------------------------------------------------------------------------------
             |               Robust
             |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
rho          |
       _cons |   .8041712   .1199819     6.70   0.000     .5690111    1.039331
-------------+----------------------------------------------------------------
xb           |
           w |
         D1. |  -.5600476   .1619472    -3.46   0.001    -.8774583    -.242637
         LD. |   .3946699   .1092229     3.61   0.000     .1805969    .6087429
             |
           k |
         D1. |   .3520286   .0536546     6.56   0.000     .2468676    .4571897
         LD. |  -.2160435   .0679689    -3.18   0.001    -.3492601   -.0828269
------------------------------------------------------------------------------
Instruments for equation 1:
        XT-style: L(2/.).n
        Standard: D.w LD.w D.k LD.k

4.4过度识别检验

在计量经济学方法研究以及应用中，一般需要恰好识别或者过度识别，虽然过度识别的情况比较多一些，另外这是进行工具变量法的必要条件；若是出现过度识别，则需要进行过度识别检验，也称为Sargen-Baseman检验。

该假设的条件为所有有效的工具变量的个数与内生解释变量一样多，或者说是这个所有的工具变量都是外生的。

GMM中过度识别的命令为estat overid 。

若是Sargen-Baseman检验的统计量对应的p值大于0.05，则认为所有的工具变量都是外生的，也就是有效的，反之则是无效的。（原假设是所有工具变量是外省的，若是p值小于0.05，则拒绝原假设）

此处用stata自带数据auto.dta来进行试验：
sysuse auto,clear
ivregress gmm mpg gear_ratio (turn = weight length headroom),wmatrix(robust) small
estat overid

结果如下：
回归时的结果为

                                                  F(  2,    71)   =      46.93
                                                  Prob > F        =     0.0000
                                                  R-squared       =     0.4769
                                                  Adj R-squared   =     0.4622
GMM weight matrix: Robust                         Root MSE        =     4.2428

------------------------------------------------------------------------------
             |               Robust
         mpg |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
        turn |  -1.208549   .1922271    -6.29   0.000    -1.591839   -.8252594
  gear_ratio |    .130328   1.791684     0.07   0.942    -3.442189    3.702845
       _cons |   68.89218    12.3117     5.60   0.000     44.34336    93.44101
------------------------------------------------------------------------------
Instrumented:  turn
Instruments:   gear_ratio weight length headroom

过度识别检验（Sargen-Baseman检验）的结果


  Hansen's J chi2(2) =  .54848 (p = 0.7601)

根据结果可知，Sargen-Baseman检验统计量对应的p值大于0.05，所有的工具变量都是外生有效的。

参考文献：Zsohar, P., 2010, Short introduction to the generalized method of moments, Hungarian statistical review, 16: 150-170. [PDF]

关于我们

【Stata 连享会(公众号：StataChina)】由中山大学连玉君老师团队创办，旨在定期与大家分享 Stata 应用的各种经验和技巧。
公众号推文同步发布于 CSDN-Stata连享会、简书-Stata连享会和知乎-连玉君Stata专栏。可以在上述网站中搜索关键词Stata或Stata连享会后关注我们。
点击推文底部【阅读原文】可以查看推文中的链接并下载相关资料。
Stata连享会精品专题 || 精彩推文

联系我们

欢迎赐稿： 欢迎将您的文章或笔记投稿至Stata连享会(公众号: StataChina)，我们会保留您的署名；录用稿件达五篇以上，即可免费获得 Stata 现场培训 (初级或高级选其一) 资格。
意见和资料： 欢迎您的宝贵意见，您也可以来信索取推文中提及的程序和数据。
招募英才： 欢迎加入我们的团队，一起学习 Stata。合作编辑或撰写稿件五篇以上，即可免费获得 Stata 现场培训 (初级或高级选其一) 资格。
联系邮件： StataChina@163.com

往期精彩推文

Stata连享会推文列表
Stata连享会精品专题 || 精彩推文

欢迎加入Stata连享会(公众号: StataChina)

最后编辑于：2019.06.04 09:04:41

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,547评论 6赞 477
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,399评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,428评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,599评论 1赞 274
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,612评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,577评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,941评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,603评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,852评论 1赞 297
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,605评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,693评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,375评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,955评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,936评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,172评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 43,970评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,414评论 2赞 342

2019-05-17

1. GMM简介

2. MM估计量

2.1 PMC和SMC样本均值的估计

2.2 MM 估计的一般形式

2.2.1 OLS 估计

2.2.2 IV 估计

3. GMM

3.1 为何要使用GMM？

3.2 两阶段最小二乘法

3.4 过度识别检验

3.5 Euler 方程范例

4. GMM过程的Stata简单实现

4.1 gmm命令

4.2简单例子

4.3进阶例子

4.4过度识别检验

关于我们

联系我们

往期精彩推文

推荐阅读更多精彩内容