二阶最小二乘回归2sls回归)是解决内在性问题的常用方法。上面基本介绍了两个阶段的最小二乘法，本文通过案例说明了具体的操作步骤。

1 背景

本案例引入Mincer1958 )工资和教育年限研究的数据。案例数据包含如下表所示的信息。

数据共有12个项目，其中编号为1、5、7、8、12的5个项目不在考虑范围内。

本案例研究探讨“教育年限”对“LN工资”的影响。很明显，理论上“双向因果关系”即“受教育年数”很可能是内生变量。那么，可以考虑将“母亲的教育年数”和“成绩”这两个数据作为工具变量使用。同时研究时，加入三个外部变量，分别为“结婚”、“是否为大城市”、“当前单位工作年限”。用两步最小二乘TSLS回归解决内在性问题。

在本案例研究中，由于工具变量有2个，内生变量有1个，因此会出现过度识别，从而能够正常进行TSLS回归。

2 理论

两阶段的最小二乘回归，从内部原理上分为两次回归。初次回归是对内生变量、工具变量、外生变量进行回归，得到回归预测值Prediction；第二次回归解释变量和Prediction、外生变量并回归，得到最终模型结果。最初的回归是中间过程值，SPSSAU没有输出。如果需要，可以使用线性回归或OLS回归。

内在性检验用于检验Durbin-Wu-Hausman检验，它是否真的是内在变量；如果验证不合格接受原假设)，则不存在内生变量，直接使用OLS回归即可。当然即使没有内生性，一般也可以使用TSLS回归，在没有内生性问题的情况下，OLS回归和TSLS回归的结论通常是一致的；

虽然SPSSAU针对过度识别检查提供了Sargan检查和Basmann检查可以使用任何一个)，但是原理上该过度识别检查仅在“过度识别”的情况下输出。也就是说，仅在工具变量个数内变量个数的情况下输出。

3 操作

在此情况下，将所说明的变量、内部变量、工具变量和外部变量存储在相应的模型框中，如下所示：

4 SPSSAU输出结果

SPSSAU共输出6种表，分别为研究变量类型表、2sls模型分析结果表、2sls模型分析结果-简化形式表、模型总结中间过程)表、Durbin-Wu-Hausman test外部自然检测)

上表显示了与此次研究相关的各变量的属性，包括被解释变量、内生变量、工具变量和外生变量的构成情况。

a3afc4fa9d3?from=pc”>

上表格列出TSLS两阶段最小二乘回归的最终结果（第二阶段结果），首先模型通过Wald 卡方检验Wald χ² =244.172，p=0.000<0.05)，意味着模型有效。同时R方值为0.342，意味着内生和外生变量对于工资的解释力度为34.2%。具体查看内生和外生变量对于被解释变量‘工资’的影响情况来看：

受教育年限的回归系数值为0.112p=0.000<0.01)，意味着受教育年限会对工资产生显著的正向影响关系。

婚姻已婚为1)的回归系数值为0.167p=0.000<0.01)，意味着相对未婚群体来讲，已婚群体的工资水平明显会更高。

是否大城市1为大城市)的回归系数值为0.145p=0.000<0.01)，意味着相对来讲，大城市样本群体，他们的工资水平明显会更高。

当前单位工作年限的回归系数值为0.036p=0.000<0.01)，意味着当前单位工作年限会对工资产生显著的正向影响关系。

总结分析可知：受教育年限, 婚姻，是否大城市, 当前单位工作年限全部均会对工资产生显著的正向影响关系。

上表格展示模型的基础指标值，包括模型有效检验wald卡方值（此处提供wald卡方非F检验），R值，Root MSE等指标值。

Durbin-Wu-Hausman test用于检验解释变量X（即内生外量）是否均为外生变量（即是否不存在内生变量）

从上表可知，本次研究纳入的内生变量为‘受教育年限’，Wu-Hausman检验显示拒绝原假设（p=0.047<0.05），意味着‘所有解释变量均外生’这一假设不成立。即意味着‘受教育年限’是内生变量。同时也可使用Durbin检验，一般情况下使用Durbin-Wu-Hausman检验较多。

特别提示：

如果无法拒绝原假设，那么说明研究的内生变量并不是真正意义上的内生变量，那么此时可考虑直接使用OLS回归结果即可，但多数时候也可直接使用TSLS两阶段最小二乘的结果，似研究者专业理论知识综合而定。

过度识别检验用于检验工具变量是否为外生变量，本次研究涉及工具变量为2个，分别是‘母亲受教育年限’和‘成绩’。从上表可知，过度识别Sargan检验显示接受原假设（p=0.874>0.05），同时Basmann检验也显示接受原假设（p=0.874>0.05）。同说明无法拒绝‘工具变量外生性’这一假定，模型良好。

特别提示：

过度识别检验用于判断‘工具变量的外生性’，SPSSAU提供Sargan和Basmann检验，使用其一即可

工具变量个数>内生变量个数，即过度识别时，才会有效；如果恰好识别（工具变量个数=内生变量个数），此时无法输出检验值。

5 剖析

涉及以下几个关键点，分别如下：

内生变量和外生变量，其二者均为解释变量，如果考虑内生性问题时才会将解释变量区分成内生变量和外生变量。

模型有效性检验上，SPSSAU默认使用wald卡方检验而非F检验。

间接最小二乘法步骤tsls回归

1 背景

2 理论

3 操作

4 SPSSAU输出结果

5 剖析

Published by

风君子

发表回复取消回复

1 背景

2 理论

3 操作

4 SPSSAU输出结果

5 剖析

Published by

风君子

发表回复 取消回复

发表回复取消回复