1. 弱工具变量检验结果怎么看
弱工具变量检验结果需具体问题具体分析。
1、工具变量与内生变量有着相关(如果相关性很低则称为弱工具变量),但是工具变量与被解释变量基本没有相关关系。工具变量法结果解读(IV)里弱IV检验,弱IV是指IV与内生解释变量的相关性不强,微弱相关,弱IV会导致用IV估计的结果与用OLS,FE估计的结果相差很大,甚至符号完全相反。如果有较多工具变量,可舍弃弱工具变量,因为多余的弱工具变量反而会降低第一阶段回归的F统计量。弱IV的判断有以下四个标准:偏R2,也就是Shea’spartialR2,不过xtivreg2不汇报这个统计量,得用命令estatfirststage,allforcenonrobust,汇报第一阶段的结果。
2、最小特征统计量,minimumeigenvaluestatistic,这是StockandYogo(2005)提出来的,stata会在ivreg2中给出临界值。StaigerandStock(1997)建议只要该值大于10就认为不存在弱IV。这个值用于iid的情况。
3、Cragg-DonaldWaldF统计量,由CraggandDonald(1993)提出,StockandYogo(2005)给出其临界值,Stata在回归时会给出临界值。CDW检验一般过15%,10%的临界值就可以,过了5%的临界值更好。名义显着性水平为5%的检验,其真实显着性水平不超过15%。也就是Stock-YogoweakIDtestcriticalvalues的15%相当于5%,也就是说要求CDW统计量大于15%的临界值就行。如果IV数量小于3则不会给出Stock-YogoweakIDtestcriticalvalues:5%/10%/15%/20%maximalIVrelativebias。如果假设扰动项为iid,则看CDW检验统计量。如果不对扰动项作iid的假设,则看KPWrkF统计量。所以加r选项时才有KPWrkF统计量,不加则没有。不管加不加r选项,CDW统计量总有。通常建议加上r选项。
4、Kleibergen-PaapWaldrkF统计量,StockandYogo(2005)给出其临界值,
2. twostepweakiv:弱工具变量有多弱
弱工具变量问题在估计模型时是一个重要的考虑因素。通常,工具变量是用于解决内生性问题的手段,同时需要满足相关性和外生性条件以确保估计量的一致性。然而,当工具变量与被解释变量之间的相关性较弱时,即称为“弱工具变量”问题。
尽管“弱工具变量”可以提供无偏估计结果,但其信息含量有限,这导致单次估计结果可能存在较大的偏差。具体来说,由于工具变量提供的信息不足,使得估计量的方差增大,从而影响到估计结果的精确度。
在处理弱工具变量问题时,通常需要采取一些补救措施。一种常见的方法是使用工具变量的多个版本,以增加工具变量的强度。另一种方法是采用替代估计技术,如两阶段最小二乘法或贝叶斯方法,这些技术可以在一定程度上降低弱工具变量的影响。
总之,弱工具变量问题在估计模型时是一个需要关注的问题。通过了解其性质和影响,以及采取适当的解决策略,可以提高估计结果的可靠性和精确度。在进行实际研究时,应充分考虑工具变量的质量,以确保研究结果的准确性。
3. 内生性处理:工具变量法
内生性问题是解释变量与扰动项相关导致的,具体的表现形式有遗漏变量、双向因果和测量误差。
OLS能够成立的最重要前提条件是解释变量与扰动项不相关。否则,OLS估计量将是有偏且不一致的。
无偏是指估计量的期望等于真实值。一致性是指,随着样本的增大,估计量无限接近于真实值。
固定效应模型在 一定程度上 可以缓解内生性。因为使用固定效应模型的原因是存在个体效应、时间效应与解释变量相关。此时如果不用固定效应模型,这些个体、时间影响就会溜到扰动项中,就产生了内生性问题。
解决内生性问题常见的做法是使用工具变量。
工具变量:与模型中内生变量(解释变量)高度相关,但却不与误差项相关,估计过程中被作为工具使用,以替代模型中与误差项相关的解释变量的变量。
“找好的工具变量好比寻找一个好的伴侣,ta应该强烈地爱着你(强相关),但不能爱着别人(外生性)。”
IV法可以视为2SLS的特例。 当内生变量个数=工具变量个数时,称为IV法;当内生变量个数<工具变量个数时,称为2SLS
2SLS思路如下:
y=α+βx1+γx2+u,其中x1是严格外生的,x2是内生的,则至少需要1个工具变量,z1为工具变量。
第一阶段回归:内生变量和工具变量
x2=a+bz1+cx1+e
第二阶段回归:内生变量的预测值和被解释变量
y=α+βx1+γx2'+v
2SLS背后逻辑:
将内生解释变量分为两部分,有工具变量造成的外生部分和与扰动项相关的内生部分。
第一阶段:通过外生变量的预测回归,得到这些变量的外生部分。
第二阶段:把被解释变量对解释变量中的外生部分进行回归,消除偏误得到一致估计。
注意:为了保证2SLS的一致性,必须把原方程中所有的外生解释变量都放入第一阶段回归。
2SLS的难点在于恰当的工具变量选择。若存在N个内生解释变量,则至少需要N个工具变量。
假设回归模型
stata命令如下:
以上命令ivregress 2sls 和 ivreg2是等价的,只是 ivreg2显示的内容更为丰富。xtivreg2 相较于ivreg2,就是OLS和FE/FD模型的差别,ivreg2 ... i.Year i.id等价于xtivreg2 ... i.Year, fe。
针对工具变量有三大检验:
以上三大检验,优先做相关性检验。这是由于弱工具变量会对估计结果以及外生性检验结果产生影响。
(1)相关性检验
a.不可识别检验
不可识别检验的原假设是秩条件不成立,即工具变量与解释变量不相关。不可识别检验在一定程度上可以验证是否存在弱工具变量,但不能取代对弱工具变量的检验。关于弱工具变量的检验,可以分为单个内生变量和多个内生变量。
b.弱工具变量检验
如果方程中有一个内生变量,一个经验规则是在第一阶段回归中,如果F统计量>10,则可拒绝“存在弱工具变量”的原假设,不必担心弱工具变量的问题。
如果方程中有多个内生变量,Stock & Yogo给出了检验规则:如果弱识别检验的最小特征值统计量>15% maximal IV size对应的临界值,就可以认为工具变量不存在弱相关问题。
如果发现是弱工具变量,解决的方法有:
(2)内生性检验
首先假定内生性进行2SLS回归,然后假定不存在内生性进行OLS回归,最后使用豪斯曼检验。
当p值<0.1时,表明两个回归的系数存在显着的系统性差异,及关注的核心变量有内生性。
(3)外生性检验
在恰好识别的情况下,即工具变量数=内生变量数,此时公认无法检验工具变量的外生性,即工具变量与扰动项不相关。在这种情况下,只能进行定性讨论或依赖于专家的意见。在过度识别的情况下,可以进行“过度识别检验”。当p>0.1,接受原假设,说明工具变量具有外生性。
注意,如果误差项存在异方差或自相关,那么2SLS的估计虽然是一致估计量,但不是有效估计量。更有效的方法是“广义矩估计”GMM。 某种意义上,GMM之于2SLS,正如GLS之于OLS,前者可以获得有效估计量,后者只能获得一致估计量。
该方法的前提条件是:工具变量数>内生变量数,且2SLS存在异方差或自相关
综上,在使用stata进行2SLS时,推荐使用ivreg2或xtivreg2。
对于面板数据,建议先对模型进行变换,然后对变换后的模型使用2SLS:
参考资料:
《高级计量经济学及stata应用》
面板数据分析与Stata应用
测量误差及其对统计分析的影响
有人能讲讲工具变量和2SLS之间的关系吗?
工具变量法(五): 为何第一阶段回归应包括所有外生解释变量
xtivreg2和它的山寨者