弱工具變數會帶來哪些估計問題_內生性處理：工具變數法

1. 弱工具變數檢驗結果怎麼看

弱工具變數檢驗結果需具體問題具體分析。
1、工具變數與內生變數有著相關(如果相關性很低則稱為弱工具變數)，但是工具變數與被解釋變數基本沒有相關關系。工具變數法結果解讀（IV）里弱IV檢驗，弱IV是指IV與內生解釋變數的相關性不強，微弱相關，弱IV會導致用IV估計的結果與用OLS，FE估計的結果相差很大，甚至符號完全相反。如果有較多工具變數，可舍棄弱工具變數，因為多餘的弱工具變數反而會降低第一階段回歸的F統計量。弱IV的判斷有以下四個標准：偏R2，也就是Shea』spartialR2，不過xtivreg2不匯報這個統計量，得用命令estatfirststage，allforcenonrobust，匯報第一階段的結果。
2、最小特徵統計量，minimumeigenvaluestatistic，這是StockandYogo（2005）提出來的，stata會在ivreg2中給出臨界值。StaigerandStock（1997）建議只要該值大於10就認為不存在弱IV。這個值用於iid的情況。
3、Cragg-DonaldWaldF統計量，由CraggandDonald（1993）提出，StockandYogo（2005）給出其臨界值，Stata在回歸時會給出臨界值。CDW檢驗一般過15%，10%的臨界值就可以，過了5%的臨界值更好。名義顯著性水平為5%的檢驗，其真實顯著性水平不超過15%。也就是Stock-YogoweakIDtestcriticalvalues的15%相當於5%，也就是說要求CDW統計量大於15%的臨界值就行。如果IV數量小於3則不會給出Stock-YogoweakIDtestcriticalvalues：5%/10%/15%/20%maximalIVrelativebias。如果假設擾動項為iid，則看CDW檢驗統計量。如果不對擾動項作iid的假設，則看KPWrkF統計量。所以加r選項時才有KPWrkF統計量，不加則沒有。不管加不加r選項，CDW統計量總有。通常建議加上r選項。
4、Kleibergen-PaapWaldrkF統計量，StockandYogo（2005）給出其臨界值，

2. twostepweakiv：弱工具變數有多弱

弱工具變數問題在估計模型時是一個重要的考慮因素。通常，工具變數是用於解決內生性問題的手段，同時需要滿足相關性和外生性條件以確保估計量的一致性。然而，當工具變數與被解釋變數之間的相關性較弱時，即稱為「弱工具變數」問題。

盡管「弱工具變數」可以提供無偏估計結果，但其信息含量有限，這導致單次估計結果可能存在較大的偏差。具體來說，由於工具變數提供的信息不足，使得估計量的方差增大，從而影響到估計結果的精確度。

在處理弱工具變數問題時，通常需要採取一些補救措施。一種常見的方法是使用工具變數的多個版本，以增加工具變數的強度。另一種方法是採用替代估計技術，如兩階段最小二乘法或貝葉斯方法，這些技術可以在一定程度上降低弱工具變數的影響。

總之，弱工具變數問題在估計模型時是一個需要關注的問題。通過了解其性質和影響，以及採取適當的解決策略，可以提高估計結果的可靠性和精確度。在進行實際研究時，應充分考慮工具變數的質量，以確保研究結果的准確性。

3. 內生性處理：工具變數法

內生性問題是解釋變數與擾動項相關導致的，具體的表現形式有遺漏變數、雙向因果和測量誤差。

OLS能夠成立的最重要前提條件是解釋變數與擾動項不相關。否則，OLS估計量將是有偏且不一致的。
無偏是指估計量的期望等於真實值。一致性是指，隨著樣本的增大，估計量無限接近於真實值。

固定效應模型在 一定程度上 可以緩解內生性。因為使用固定效應模型的原因是存在個體效應、時間效應與解釋變數相關。此時如果不用固定效應模型，這些個體、時間影響就會溜到擾動項中，就產生了內生性問題。

解決內生性問題常見的做法是使用工具變數。

工具變數：與模型中內生變數（解釋變數）高度相關，但卻不與誤差項相關，估計過程中被作為工具使用，以替代模型中與誤差項相關的解釋變數的變數。

「找好的工具變數好比尋找一個好的伴侶，ta應該強烈地愛著你（強相關），但不能愛著別人（外生性）。」

IV法可以視為2SLS的特例。 當內生變數個數=工具變數個數時，稱為IV法；當內生變數個數<工具變數個數時，稱為2SLS

2SLS思路如下：
y=α+βx1+γx2+u，其中x1是嚴格外生的，x2是內生的，則至少需要1個工具變數，z1為工具變數。
第一階段回歸：內生變數和工具變數
x2=a+bz1+cx1+e
第二階段回歸：內生變數的預測值和被解釋變數
y=α+βx1+γx2'+v

2SLS背後邏輯：
將內生解釋變數分為兩部分，有工具變數造成的外生部分和與擾動項相關的內生部分。
第一階段：通過外生變數的預測回歸，得到這些變數的外生部分。
第二階段：把被解釋變數對解釋變數中的外生部分進行回歸，消除偏誤得到一致估計。

注意：為了保證2SLS的一致性，必須把原方程中所有的外生解釋變數都放入第一階段回歸。

2SLS的難點在於恰當的工具變數選擇。若存在N個內生解釋變數，則至少需要N個工具變數。

假設回歸模型

stata命令如下：

以上命令ivregress 2sls 和 ivreg2是等價的，只是 ivreg2顯示的內容更為豐富。xtivreg2 相較於ivreg2，就是OLS和FE/FD模型的差別，ivreg2 ... i.Year i.id等價於xtivreg2 ... i.Year, fe。

針對工具變數有三大檢驗：

以上三大檢驗，優先做相關性檢驗。這是由於弱工具變數會對估計結果以及外生性檢驗結果產生影響。

（1）相關性檢驗

a.不可識別檢驗
不可識別檢驗的原假設是秩條件不成立，即工具變數與解釋變數不相關。不可識別檢驗在一定程度上可以驗證是否存在弱工具變數，但不能取代對弱工具變數的檢驗。關於弱工具變數的檢驗，可以分為單個內生變數和多個內生變數。

b.弱工具變數檢驗
如果方程中有一個內生變數，一個經驗規則是在第一階段回歸中，如果F統計量>10，則可拒絕「存在弱工具變數」的原假設，不必擔心弱工具變數的問題。

如果方程中有多個內生變數，Stock & Yogo給出了檢驗規則：如果弱識別檢驗的最小特徵值統計量>15% maximal IV size對應的臨界值，就可以認為工具變數不存在弱相關問題。

如果發現是弱工具變數，解決的方法有：

（2）內生性檢驗
首先假定內生性進行2SLS回歸，然後假定不存在內生性進行OLS回歸，最後使用豪斯曼檢驗。
當p值<0.1時，表明兩個回歸的系數存在顯著的系統性差異，及關注的核心變數有內生性。

（3）外生性檢驗
在恰好識別的情況下，即工具變數數=內生變數數，此時公認無法檢驗工具變數的外生性，即工具變數與擾動項不相關。在這種情況下，只能進行定性討論或依賴於專家的意見。在過度識別的情況下，可以進行「過度識別檢驗」。當p>0.1，接受原假設，說明工具變數具有外生性。

注意，如果誤差項存在異方差或自相關，那麼2SLS的估計雖然是一致估計量，但不是有效估計量。更有效的方法是「廣義矩估計」GMM。 某種意義上，GMM之於2SLS，正如GLS之於OLS，前者可以獲得有效估計量，後者只能獲得一致估計量。

該方法的前提條件是：工具變數數>內生變數數，且2SLS存在異方差或自相關

綜上，在使用stata進行2SLS時，推薦使用ivreg2或xtivreg2。

對於面板數據，建議先對模型進行變換，然後對變換後的模型使用2SLS：

參考資料：
《高級計量經濟學及stata應用》
面板數據分析與Stata應用
測量誤差及其對統計分析的影響
有人能講講工具變數和2SLS之間的關系嗎？
工具變數法（五）: 為何第一階段回歸應包括所有外生解釋變數
xtivreg2和它的山寨者

弱工具變數會帶來哪些估計問題

與弱工具變數會帶來哪些估計問題相關的內容