當前位置:律師網大全 - 專利申請 - 高級計量經濟學 14:二值選擇模型(基礎)

高級計量經濟學 14:二值選擇模型(基礎)

為了個人課題的進展,我會按照進度選擇自己需要優先學習的內容?不按照正常順序的話不好意思啦!

此文內容為《高級計量經濟學及STATA應用》的筆記,陳強老師著,高等教育出版社出版。

我只將個人會用到的知識作了筆記,並對教材較難理解的部分做了進壹步闡述。為了更易於理解,我還對教材上的壹些部分( 包括證明和正文 )做了修改。

目錄

如果解釋變量是離散的(比如,虛擬變量),這並不影響回歸。但有時候被解釋變量是離散的,而非連續的,這就讓人很頭疼了。

這類模型被稱為 離散選擇模型 (discrete choice model)或 定性反應模型 (qualitative response model)。另外,有時被解釋變量只能取非負整數,比如企業在某個時間內所獲得的專利數,這類數據被稱為 計數數據 (count data),其被解釋變量也是離散的。

考慮到離散被解釋變量的特點, 通常不宜使用OLS進行回歸

假設個體只有兩種選擇,比如 和 。是否考研,取決於畢業生畢業後的預期收入、個人興趣等等,假設這些解釋變量都被集成在向量 中。於是,最簡單的模型為 線性概率模型 (Linear Probability Model,LPM):

對 的壹致估計要求 (沒有內生性)。然而,這裏有幾個問題:

盡管 LPM 有上面所提到的各種缺點,但它的優點是計算方便,而且容易分析經濟意義。於是,為了使 的預測值總是介於 之間,我們對 LPM 進行拓展:在給定 的情況下,考慮 的兩點分布概率為:

於是,函數 就被稱為 連接函數 (link function),因為它將解釋變量 與被解釋變量 鏈接起來。由於 的取值要麽為 0 ,要麽為 1 ,於是 壹定服從 兩點分布

連接函數的選擇有壹定的靈活性,通過選擇合適的連接函數 可以保證 ,並將 理解為 “ 發生的概率”,因為:

特別地,如果 是標準的正態分布累計函數(cdf),則:

那麽這個模型就被稱為 Probit模型 。如果 是 邏輯分布 (logistic distribution)的 cdf ,即:

那麽這個模型就被稱為 Logit模型 。

由於邏輯分布函數有解析表達式,而正態分布則沒有,所以計算 Logit 模型通常比計算 Probit 模型更為方便。顯然,這是壹個 非線性模型 ,可以用最大似然法估計(MLE)。以 Logit 模型為例,第 個觀測數據的概率密度為:

可以不分段地寫成:

去對數,有:

假設樣本中的個體相互獨立,那麽整個樣本的 LLF (對數似然函數)為:

可以用 數值方法 求解這個非線性最大化問題。

需要註意的是,在這個非線性模型中,估計量 並非邊際效應(marginal effects)。以 Probit 為例,可以計算:

在這裏使用了微分的鏈式法則(chain rule),並假設了 為連續變量。由於 Probit 和 Logit 所使用的分布函數不同,所以其參數並不可以直接比較,而是需要 分別計算二者的邊際效應,然後進行比較 。然而,對於非線性模型而言, 邊際效應本身就不是常數 ,它隨解釋變量的變化而變化。常用的邊際效應的概念有:

以上三種邊際效應的計算結果可能會有差異。傳統上,計算樣本均值處的邊際效應比較簡單;然而,在非線性模型中,樣本均值處的個體行為通常不能代表個體的平均行為(average behavior of individuals differes from behavior of the average individual)。 對於政策分析而言,平均邊際效應比較有意義,也是 Stata 的默認方法

既然 並非邊際效應,那他有什麽經濟意義呢?對於 Logit 模型,令 ,那麽 ,由於 ,於是:

其中, 被稱為 幾率比 (odds ratio)或 相對風險 (relative risk)。如果幾率比為2,意味著 的概率是 兩倍。對第二個等式的右邊求導,我們可以發現 的意義是:若 增加壹個微小的量,那麽 幾率比的百分比 則會增加 。所以,可以把 視為 半彈性 ,即 增加壹個單位引起 幾率比的百分比 的變化。

還有另外壹個生物統計領域特別喜歡使用的意義,考慮 從而 變成了 ,於是新幾率比與原先幾率比的比率可以寫成:

所以, 表示 引起的 幾率比的變化倍數

事實上,如果 比較小,兩者方法是等價的( Taylor 展開)。然而,如果 必須變化壹個單位(如性別、婚否),則應使用 。另外,Probit 模型無法對系數 進行類似的解釋,這是 Probit 模型的劣勢。

如何衡量壹個非線性的模型的擬合優度呢?在不存在平方和分解公式的情況下, 是無法計算的,然而 Stata 依然匯報壹個 準R2 (Pseudo ),由 McFadden (1974) 提出,其定義為:

其中, 為原模型的 LLF 最大值,而 為 以常數項為唯壹解釋變量 的 LLF 的最大值。由於 是離散的兩點分布,似然函數 LF 的最大可能值為 1,於是 LLF 的最大可能值為 0,記為 。於是,必然有 ,於是 。

另外壹類判斷擬合優度的方法是計算 正確預測的百分比 ,實際上我認為目前機器學習領域的壹系列常用的擬合優度如 MSE、MAPE 等都可以使用。

本節主要是復習 高級計量12 高級計量13 的內容

總的來說,要對 Probit 和 Logit 模型進行統計推斷,需要作如下假設:

下面我們對兩種檢驗:對 所有系數的聯合檢驗 和 單個系數的獨立檢驗 進行說明

(1) 所有系數的聯合顯著性

在使用 Stata 時,會匯報壹個 LR 檢驗統計量,檢驗常數以外的所有其他系數的顯著性(即所有系數的聯合顯著性)。在 高級計量13 ,我們已經推導出對 MLE 的系數的 LR 統計推斷表達式:

上面的統計推斷表達式僅依賴於 樣本 i.i.d. 和 似然函數正確 這兩個條件,前者是為了應用 大數定律 中心極限定理 ,後者是為了使用 信息矩陣等式

對於 Probit 和 Logit 模型,如果分布函數設定不正確,則為 準最大似然估計 (QMLE),那麽我們要註意:

(2) 單個系數的顯著性

在使用 Stata 時,也會匯報每個系數的 Std. err. 。如果要對單個系數的顯著性進行推斷,則需要使用 高級計量12 的 6.5.2 節中的推導:

a. 在抽取的樣本為 i.i.d. 的假設下,我們用 大數定律 中心極限定理 可以推導出:

b. 在分布函數設定正確的假設下(於是可是使用 高級計量11 的 證明3 ),可以進壹步推導出:

前面已經提到, 就算分布函數設定不正確 ,如果 成立,那麽在 i.i.d. 的情況下,穩健標準誤就等於 MLE 的普通標準誤。所以上面的等式只要 成立就可以用了。

c. 如果 ,則 Probit 與 Logit 模型並不能得到對系數 的壹致估計。此時統計推斷並無意義。

欲從上面的式子單個系數進行檢驗,顯然需要 未知的 真實參數 。於是我們可以根據 高級計量12 的 6.6 的方法去處理,這裏就不再贅述了。

  • 上一篇:範憲的人生經歷
  • 下一篇:股東可以采取的出資形式有
  • copyright 2024律師網大全