1. 弱工具變數檢驗結果怎麼看
弱工具變數檢驗結果需具體問題具體分析。
1、工具變數與內生變數有著相關(如果相關性很低則稱為弱工具變數),但是工具變數與被解釋變數基本沒有相關關系。工具變數法結果解讀(IV)里弱IV檢驗,弱IV是指IV與內生解釋變數的相關性不強,微弱相關,弱IV會導致用IV估計的結果與用OLS,FE估計的結果相差很大,甚至符號完全相反。如果有較多工具變數,可舍棄弱工具變數,因為多餘的弱工具變數反而會降低第一階段回歸的F統計量。弱IV的判斷有以下四個標准:偏R2,也就是Shea』spartialR2,不過xtivreg2不匯報這個統計量,得用命令estatfirststage,allforcenonrobust,匯報第一階段的結果。
2、最小特徵統計量,minimumeigenvaluestatistic,這是StockandYogo(2005)提出來的,stata會在ivreg2中給出臨界值。StaigerandStock(1997)建議只要該值大於10就認為不存在弱IV。這個值用於iid的情況。
3、Cragg-DonaldWaldF統計量,由CraggandDonald(1993)提出,StockandYogo(2005)給出其臨界值,Stata在回歸時會給出臨界值。CDW檢驗一般過15%,10%的臨界值就可以,過了5%的臨界值更好。名義顯著性水平為5%的檢驗,其真實顯著性水平不超過15%。也就是Stock-YogoweakIDtestcriticalvalues的15%相當於5%,也就是說要求CDW統計量大於15%的臨界值就行。如果IV數量小於3則不會給出Stock-YogoweakIDtestcriticalvalues:5%/10%/15%/20%maximalIVrelativebias。如果假設擾動項為iid,則看CDW檢驗統計量。如果不對擾動項作iid的假設,則看KPWrkF統計量。所以加r選項時才有KPWrkF統計量,不加則沒有。不管加不加r選項,CDW統計量總有。通常建議加上r選項。
4、Kleibergen-PaapWaldrkF統計量,StockandYogo(2005)給出其臨界值,
2. twostepweakiv:弱工具變數有多弱
弱工具變數問題在估計模型時是一個重要的考慮因素。通常,工具變數是用於解決內生性問題的手段,同時需要滿足相關性和外生性條件以確保估計量的一致性。然而,當工具變數與被解釋變數之間的相關性較弱時,即稱為「弱工具變數」問題。
盡管「弱工具變數」可以提供無偏估計結果,但其信息含量有限,這導致單次估計結果可能存在較大的偏差。具體來說,由於工具變數提供的信息不足,使得估計量的方差增大,從而影響到估計結果的精確度。
在處理弱工具變數問題時,通常需要採取一些補救措施。一種常見的方法是使用工具變數的多個版本,以增加工具變數的強度。另一種方法是採用替代估計技術,如兩階段最小二乘法或貝葉斯方法,這些技術可以在一定程度上降低弱工具變數的影響。
總之,弱工具變數問題在估計模型時是一個需要關注的問題。通過了解其性質和影響,以及採取適當的解決策略,可以提高估計結果的可靠性和精確度。在進行實際研究時,應充分考慮工具變數的質量,以確保研究結果的准確性。
3. 內生性處理:工具變數法
內生性問題是解釋變數與擾動項相關導致的,具體的表現形式有遺漏變數、雙向因果和測量誤差。
OLS能夠成立的最重要前提條件是解釋變數與擾動項不相關。否則,OLS估計量將是有偏且不一致的。
無偏是指估計量的期望等於真實值。一致性是指,隨著樣本的增大,估計量無限接近於真實值。
固定效應模型在 一定程度上 可以緩解內生性。因為使用固定效應模型的原因是存在個體效應、時間效應與解釋變數相關。此時如果不用固定效應模型,這些個體、時間影響就會溜到擾動項中,就產生了內生性問題。
解決內生性問題常見的做法是使用工具變數。
工具變數:與模型中內生變數(解釋變數)高度相關,但卻不與誤差項相關,估計過程中被作為工具使用,以替代模型中與誤差項相關的解釋變數的變數。
「找好的工具變數好比尋找一個好的伴侶,ta應該強烈地愛著你(強相關),但不能愛著別人(外生性)。」
IV法可以視為2SLS的特例。 當內生變數個數=工具變數個數時,稱為IV法;當內生變數個數<工具變數個數時,稱為2SLS
2SLS思路如下:
y=α+βx1+γx2+u,其中x1是嚴格外生的,x2是內生的,則至少需要1個工具變數,z1為工具變數。
第一階段回歸:內生變數和工具變數
x2=a+bz1+cx1+e
第二階段回歸:內生變數的預測值和被解釋變數
y=α+βx1+γx2'+v
2SLS背後邏輯:
將內生解釋變數分為兩部分,有工具變數造成的外生部分和與擾動項相關的內生部分。
第一階段:通過外生變數的預測回歸,得到這些變數的外生部分。
第二階段:把被解釋變數對解釋變數中的外生部分進行回歸,消除偏誤得到一致估計。
注意:為了保證2SLS的一致性,必須把原方程中所有的外生解釋變數都放入第一階段回歸。
2SLS的難點在於恰當的工具變數選擇。若存在N個內生解釋變數,則至少需要N個工具變數。
假設回歸模型
stata命令如下:
以上命令ivregress 2sls 和 ivreg2是等價的,只是 ivreg2顯示的內容更為豐富。xtivreg2 相較於ivreg2,就是OLS和FE/FD模型的差別,ivreg2 ... i.Year i.id等價於xtivreg2 ... i.Year, fe。
針對工具變數有三大檢驗:
以上三大檢驗,優先做相關性檢驗。這是由於弱工具變數會對估計結果以及外生性檢驗結果產生影響。
(1)相關性檢驗
a.不可識別檢驗
不可識別檢驗的原假設是秩條件不成立,即工具變數與解釋變數不相關。不可識別檢驗在一定程度上可以驗證是否存在弱工具變數,但不能取代對弱工具變數的檢驗。關於弱工具變數的檢驗,可以分為單個內生變數和多個內生變數。
b.弱工具變數檢驗
如果方程中有一個內生變數,一個經驗規則是在第一階段回歸中,如果F統計量>10,則可拒絕「存在弱工具變數」的原假設,不必擔心弱工具變數的問題。
如果方程中有多個內生變數,Stock & Yogo給出了檢驗規則:如果弱識別檢驗的最小特徵值統計量>15% maximal IV size對應的臨界值,就可以認為工具變數不存在弱相關問題。
如果發現是弱工具變數,解決的方法有:
(2)內生性檢驗
首先假定內生性進行2SLS回歸,然後假定不存在內生性進行OLS回歸,最後使用豪斯曼檢驗。
當p值<0.1時,表明兩個回歸的系數存在顯著的系統性差異,及關注的核心變數有內生性。
(3)外生性檢驗
在恰好識別的情況下,即工具變數數=內生變數數,此時公認無法檢驗工具變數的外生性,即工具變數與擾動項不相關。在這種情況下,只能進行定性討論或依賴於專家的意見。在過度識別的情況下,可以進行「過度識別檢驗」。當p>0.1,接受原假設,說明工具變數具有外生性。
注意,如果誤差項存在異方差或自相關,那麼2SLS的估計雖然是一致估計量,但不是有效估計量。更有效的方法是「廣義矩估計」GMM。 某種意義上,GMM之於2SLS,正如GLS之於OLS,前者可以獲得有效估計量,後者只能獲得一致估計量。
該方法的前提條件是:工具變數數>內生變數數,且2SLS存在異方差或自相關
綜上,在使用stata進行2SLS時,推薦使用ivreg2或xtivreg2。
對於面板數據,建議先對模型進行變換,然後對變換後的模型使用2SLS:
參考資料:
《高級計量經濟學及stata應用》
面板數據分析與Stata應用
測量誤差及其對統計分析的影響
有人能講講工具變數和2SLS之間的關系嗎?
工具變數法(五): 為何第一階段回歸應包括所有外生解釋變數
xtivreg2和它的山寨者