一些計量方法的匯總(未完待續)

1. 如果僅僅使用可觀測信息推斷經濟現象的內在機理,結論未必可靠。為瞭揭示經濟現象的內在機理,必須增加樣本數據之外的信息。兩種途徑:經濟理論——結構計量經濟學(Structural Econometrics);模擬行為——基於主體的經濟學(Agent-based Economics)

2. 如果回歸模型的解釋變量中含有定性變量,則可以用虛擬變量處理之。在實際經濟問題 中,被解釋變量也可能是定性變量。Tobit(線性概率)模型,Probit(概率單位)模型和 Logit 模型。采用累積正態概率分佈函數的模型稱作Probit模型。采用logistic函數的模型稱作logit模型。 Probit曲線和logit曲線很相似。兩條曲線都是在pi = 0.5 處有拐點,但logit曲線在兩個尾部要比Probit曲線厚。Logit 模型常使用極大似然法估計參數。

3. 多重共線性的克服方法:直接合並解釋變量;利用已知信息合並解釋變量;增加樣本容量或重新抽取樣本;合並截面數據與時間序列數據;逐步回歸法。

4. 有時由於兩個變量之間存在雙向因果關系,用單一方程模型就不能完整的描述這兩個變 量之間的關系。有時為全面描述一項經濟活動隻用單一方程模型是不夠的。這時應該用多個方程的組合來描述整個經濟活動。聯立方程模型:結構模型,簡化型模型,遞歸模型。結構模型(structural model):把內生變量表述為其他內生變量、前定變量與隨機誤差項的方程體系。簡化型模型(reduced-form equations):把內生變量隻表示為前定變量與隨機誤差項函數的聯立模型。遞歸模型(recursive system):在結構方程體系中每個內生變量隻是前定變量和比其序號低的內生變量的函數。

5. 對於聯立方程模型常用的估計方法是單一方程估計法。常用的單一方程估計法有① 間接小二乘法(ILS),②工具變量法(IV),③兩段小二乘法(2SLS),④有限信息極 大似然法(LIML 。

6. 2SLS 估計的步驟是(1)用模型中每個內生變量對模型中全部外生變量進行小二乘回歸;(2)用得到的Q和P的估計值替代結構方程右側的相應內生變量,並進行小二乘估計。

7. DF > 臨界值,則接受H0,yt 非平穩; F < 臨界值,則拒絕H0,yt是平穩的。

8. 分佈滯後模型中的解釋變量存在高度相關,克服高度相關的一個方法是在等號右側加一個被解釋變量的滯後項。 動態模型(自回歸模型):如果在回歸模型的解釋變量中包括被解釋變量的一個或幾個滯後 值,則稱這種回歸模型為動態模型(或自回歸模型)。

9. 固定效應模型。 在面板數據散點圖中,如果對於不同的截面或不同的時間序列,模型的截距是不同的則,可以采用在模型中加虛擬變量的方法估計回歸參數,稱此種模型為固定效應模型(fixed effects regression model)。

10. 隨機效應模型:截距項分成兩個部分,一個是截面隨機誤差項(ui),一個是時間隨機誤差項(vt)。如果這兩個隨機誤差服從正態分佈,並且ui,vt,wit之間互不相關,各自分別不存在截面自相關、時間自相關和混和自相關。

11. 隨機效應模型的好處是節省自由度。對於從時間序列和截面兩方面上看都存在較大變化的數據,隨機效應模型能明確地描述出誤差來源的特征。固定效應模型的好處是很容易分析任意截面數據所對應的因變量與全部截面數據對應的因變量均值的差異程度。此外,固定效應模型不要求誤差項中的個體效應分量與模型中的解釋變量不相關。當然,這一假定不成立時,可能會引起模型參數估計的不一致性。

12. 內生性問題。1)內生性的來源:遺漏變量偏差、經典的測量誤差問題、聯立性(逆向因果);2)解決內生性問題的常見方法,主要包括工具變量( instrumental variable,簡稱IV) 、固定效應模型( fixed effects model,簡稱FE) 、傾向值匹配( propensity score matching,簡稱PSM) 、實驗以及準實驗( experimentsand quasi-experiments) 等等。3)一個合理的工具變量應該同時主要滿足兩個條件:強度條件,即工具變量應該與內生自變量具有較強的相關性,即該工具變量的應該能夠代替或者表達原內生變量的信息,數學表達式為:COV(Z,X)=/0;排除限制條件,即工具變量應該與誤差項不相關,也就是與因變量Y中不能被已有的自變量x所表達的部分無關(也是與誤差項無關)COV(Z,u)=/0。4)二階段最小二乘法的第一階段就是利用原模型的內生解釋變量對工具變量進行OLS,得到解釋變量的擬合值;第二步,利用得到解釋變量的擬合值對原模型進行最小二乘法,從而得到方程模型的估計值,這樣就可以消除內生性的影響。5)如果存在異方差,則可以使用比2SLS更有效率的GMM估計來進行估計。

13. 伴隨著微觀計量經濟學的發展,微觀數據的應用也產生瞭許多新的統計問題。尤其是,由於那些非實驗性數據(non-experimental data)本身所固有的限制,研究者通常隻能觀察某些變量的特定個體或傢庭,因此這一非隨機抽樣的樣本就不可能在總體中具有代表性。即使樣本有代表性,影響個體行為的一些特征仍然不能夠被觀察到,這使得解釋個體之間的某些差異變得非常困難,甚至根本不可能。赫克曼的主要貢獻之一,就是處理樣本偏差問題。在上面例子中,可以采取的一個修正辦法是,選擇一個不會被工資水平所影響的變量如年齡來替代工作資歷變量。或者,考慮被調查過的員工與未被調查的員工的情況大相徑庭時對結論的影響,如果能找出是哪些因素決定誰來回答問卷(比如也許隻有高工資的員工才有時間填寫問卷)得出的結論就會精確得多。到此為止我們談論的是控制數據收集之規則所帶來的選擇性樣本的結果。但問題不僅是這樣,選擇性樣本也有可能是經濟代理人自己行為的後果,這就是自選擇問題。提出處理自選擇問題的方法是赫克曼的主要貢獻之二。

14. PSM-DID模型:DID的第一個假設是linear additive,第二個假設是相同時間趨勢(因此暗含瞭面板數據的結構)。如果不是隨機試驗,還要假設控制組和實驗組的均質性類似於隨機分組。psm不要求linear additive,但是要求你知道propensity function 的function form和variables。psm不要求相同時間趨勢,但是要求如果有面板數據結構,需要在function form和variables上體現time trend或者其他時序結構。psm不嚴格要求隨機試驗,但是要求你知道所有影響實驗分組的variables,即沒有unobservable selection。這還沒完,即使你的ps是對的,consistency要求任意兩個比較的點的ps差距趨近於0,variance太大。variance,又不consistent瞭。

赞(0)