論文的實證部分壹般回答兩個問題,壹是核心解釋變量X是否影響被解釋變量Y,二是具體影響機制,即X如何影響Y。
為了回答第壹個問題,在基準回歸之後,論文壹般會設計壹系列的辨識條件檢驗和穩健性檢驗,包括檢驗模型的具體假設(如DID的平行趨勢檢驗),討論、檢驗和緩解模型可能出現的因果推斷問題(內生性),排除其他可能影響研究結論的幹擾因素,討論X對y的預期效應和滯後效應,在某些情況下, 基準回歸結果的辨識條件檢驗和穩健性檢驗甚至需要占據壹半以上的實證部分。
壹方面,回答X是否影響Y的問題是進壹步分析影響機制的基礎,因此保證X對Y影響的穩定性和可信度是實證設計的基本要求;另壹方面,要在讀者或審稿人提出“靈魂拷問”之前,考慮到論文中可能存在的所有問題,想想讀者的想法,想想審稿人的想法。雖然無論我們如何絞盡腦汁去尋找和填補這些漏洞,審稿人總能問出壹些“奇怪”的問題,但是前期做足了工作,就能把這些問題被問到的可能性降到最低。
回答第二個問題可以增加論文的科學性、故事性和豐滿度。x對Y有壹定的影響,而且這種影響是穩定的。在此基礎上,我們還想知道X對Y的影響是通過什麽渠道實現的,即探究“存在”背後的“過程”。對客觀影響機制的探討,實質上是對實際經濟運行規律的總結和提煉,體現了社會科學研究的“科學性”。
如果懷疑變量M是X對Y的作用背後的機制,那麽本文的理論分析部分會清晰地分析解釋這壹機制的基本邏輯,然後在實證部分對這壹機制進行檢驗。機理檢驗沒有固定的範式,壹般需要結合論文的研究內容、理論、模型甚至所用數據進行設計。但經濟研究的機制檢驗要盡量避免使用中介效應模型,因為(引自我在知乎的回答):
與管理學、心理學等學科相比,經濟學更強調變量之間因果關系的推斷,而正是因為中介效應模型沒有考慮中介變量可能存在的內生性,所以模型可能符合管理學的研究範式,但不符合經濟學的研究範式。
中介效應模型可能的內生性在於:
參考連老師的回答,中介效應模型存在壹個現實問題:我們大多數人都在糾結壹個內生變量,而中介效應要求我們不僅要克服內生問題,還要克服內生問題,這真的很苛刻。
排除幹擾因素是實證論文穩健性檢驗的基本步驟之壹。
例如,陳登科(2020)懷疑中國加入世貿組織後同時實施的其他政策,特別是重組國有企業和鼓勵外資的政策,以及環境監管政策(如兩個控制區和“十壹五”汙染控制政策)可能會潛在地幹擾結果。為了消除這些幹擾因素,作者進壹步將國有經濟和外貿經濟的比重加入回歸方程,以控制前兩項政策的影響;關於環境規制政策,筆者認為我國大部分環境規制政策是按行政區劃實施的,因此在回歸模型中進壹步加入了地區-年度固定效應,以控制環境規制政策對結果的潛在影響。
例如,江等人(2018)在研究農村成長經歷對家庭股市參與的影響時,認為影響人的行為的因素非常復雜,因此懷疑農村成長經歷對股市參與的影響可能受到社會交往、信任水平、金融知識、家庭社會經濟地位和風險態度的幹擾。為了消除這些因素,作者做了壹系列魯棒性測試,包括(以社交為例):
再比如,魯靜等人(2021)懷疑2008年的國際金融危機和同期的環境監管政策(如清潔生產標準、十壹五汙染治理政策、區域審批限制等)可能會幹擾研究結論。對於前者,作者在基準模型的基礎上額外控制了兩個代表企業投融資需求的代理變量;對於後者,作者引入了壹些啞變量,排除了相關樣本(詳見原文)。
借鑒以上三個文件,我們先簡單梳理壹下排除幹擾因素的邏輯和實證思路。
由於被解釋變量Y的影響因素較多,基準模型中的控制變量僅根據常識和理論(即現有文獻的實踐)引入。如果懷疑某個不尋常的意外因素Z對Y有壹定程度的影響,則直覺認為Z是不可忽視的重要影響因素,考慮Z時X對Y的作用可能發生變化。然後,為了檢驗結論的穩健性,可以將Z作為控制變量引入基準模型。如果核心解釋變量X的系數與基準回歸結果基本壹致,則意味著Z對研究結論的幹擾被消除。
另外,還可以用反證法,即假設Z確實幹擾了研究結論,有如下推論:隨著Z值的變化,X對Y的影響是異質的,我們的檢驗邏輯是證明這個推論不成立。為了證明這個推論不成立,有兩個經驗思路:壹是按照z的值對樣本進行分組,進行分組檢驗。如果x的系數在不同組下基本不變,與基準回歸結果基本壹致,說明這個推論不成立;二是使用調節效應模型,其中調節項為X和Z的交互項,兩個獨立項不可忽略。如果調節效應模型中的交互項不顯著(個別項X是否與基準回歸結果壹致,甚至X是否顯著並不重要,因為X的系數在調節模型中有不同的含義),則意味著推斷不成立。
機制測試沒有統壹的範式,壹般是依靠研究內容來支持論文中講述的故事。比較常用的實證設計包括(引用我在知乎的回答):
戴等人(2021)在研究“滬股通”對企業全要素生產率的作用機制時,認為提高股票價格的信息含量和信息傳遞效率、糾正股票錯誤定價和提高信息披露質量是滬股通提升企業全要素生產率的主要機制。在機制檢驗部分,首先實證檢驗滬股通開通對這些機制變量的影響,然後利用現有的權威文獻從理論上探討機制變量對企業全要素生產率的影響。
陳登科(2020)的機制試驗思想與之相似,但在邏輯上與他自己的研究內容密切相關。貿易自由化顯著降低了企業的排放強度,等於排放量除以工業總產值。為了討論企業排放強度的降低是源於排放量的減少還是工業總產值的增加,作者用貿易自由化分別回歸了企業的排放強度和工業總產值。結果表明,貿易自由化主要是通過減少企業的排放而不是增加產出來降低排放強度。在此之後,壹個新的問題是:企業排放量的減少,是生產過程中產量的減少,還是終端處理過程中處理能力的增加?為了回答這個問題,作者用貿易自由化來分別回歸產生的量和去除的量。結果表明,貿易自由化通過減少產生量而不是增加清除量來減少排放。
這樣的機制測試思路是有邏輯聯系的,所以論文的故事性很強。此外,本文還分別檢驗了煤炭利用和技術進步的兩個具體渠道。
異質性分析壹般可以分為兩種類型:
這兩種方法的主要區別在於:
事實上,異質性分析可以作為機制測試的輔助手段,進壹步增強論文的故事性。
如萬攀兵等人(2021),在用清潔生產行業標準研究企業綠色轉型時,在驗證了技術改造的具體機理後,認為技術改造受制於企業的技術改造需求和融資能力,基本邏輯如下:
按照上述邏輯,作者加入了技術改造需求和融資能力與雙差的乘法項(即構建三差模型DDD),以捕捉可能的異質效應。