數理統計(2)——數理統計基本概念

前言

這一小講將會介紹數理統計的基礎知識,後續的相關知識都是基於這些基礎知識來展開的,因此對於後續章節來說,當前章節是重要的基礎。

關於總體、樣本、統計量相關概念的介紹請參考下面這篇文章

一、常用抽樣分佈

統計量是樣本函數,也是一個隨機變量,統計量的分佈稱為抽樣分佈。如果能求出統計量的分佈,會對問題的研究非常有幫助。如果總體是正態分佈,問題會變得相對比較簡單,下面介紹四個基於正態總體的非常重要且常用的抽樣分佈。

  1. 標準正態分佈

標準正態分佈,是一個最標準的正態分佈, Xsim N(0, 1) ,其概率密度函數為

phi(x) = frac{1}{sqrt{2pi}}e^{frac{1}{2}(x-mu)^2}

圖1 標準正態分佈

2. chi^2 分佈

chi^2 分佈的定義,設 X_1,X_2,…,X_n 相互獨立,且均服從標準正態分佈 N(0,1) ,則稱

chi^2=X_1^2+X_2^2+···+X_n^2

服從自由度為n的 chi^2 分佈。

圖2 χ2分佈概率密度函數

需要註意的是,當自由度較高時, chi^2 分佈是單峰的不對稱的圖像。其性質如下所示,

(1)可加性。如果兩個 chi^2 分佈相互獨立,則兩者的和也是 chi^2 分佈,

Xsimchi^2(n), Ysimchi^2(m) ,則有 X+Ysimchi^2(n+m)

(2)如果一個分佈服從 chi^2(n) 分佈,則有 E(X)=n,Var(X)=2n .

3. t 分佈

圖3 t分佈

t分佈概率密度函數如下所示,

圖4 t分佈概率密度函數

自由度越高的t分佈,其曲線越符合正態分佈。一般來說, nge30 時,就可以將t分佈作為標準正態分佈。

4. F 分佈

圖5 F分佈

F分佈的概率密度函數圖像如圖6所示,

圖6 F分佈概率密度函數圖7 F分佈具有的性質

二、正態總體的抽樣分佈

正態分佈在概率論中處於中心地位,同樣地,在數理統計中,正態分佈的作用仍然是重要的,一般來講,如果總體服從正態分佈,那麼關於該總體的幾乎所有統計問題都相對簡單直接。這裡給出幾個在數理統計中常用的有關抽樣分佈的結論。

這部分是非常重要的內容,也是後續區間估計和假設檢驗的重要基礎,一定要掌握這部分的內容。

1.單正態總體抽樣分佈定理

圖8 單正態總體抽樣分佈定理

2.雙正態總體抽樣分佈定理

圖9 雙正態總體抽樣分佈定理

這裡不再證明這些定理,可以參考具體定理的證明。

三、上α分位點

分位點是數理統計學中的一個重要概念,特別是在參數的區間估計與假設檢驗中都是必不可少的。上 alpha 分位點的定義如下,

圖10 上α分位點

三種上 alpha 分位點

1. chi^2 分佈上α分位點

圖11 χ2上α分位點

2.t分佈上α分位點

圖12 t分佈上α分位點

3.F分佈上α分位點

圖13 F分佈上α分位點

牢記這三種上 alpha 分位點有助於後面的區間估計和假設檢驗,請務必牢記這個概念。

四、次序統計量及其分佈

除瞭樣本矩以外,另一類常見的統計量是次序統計量,次序統計量可以生成某些估計量和檢驗統計量,在實際和理論中有著廣泛的應用。

次序統計量的定義:

圖14 次序統計量圖15 單個次序統計量圖16 多個次序統計量

五、經驗分佈函數

圖17 經驗分佈函數

通過一道例題來理解經驗分佈函數。

六、充分統計量

充分統計量的定義:

總體分佈函數為 F(x;theta) ,設 X_1,X_2,…,X_n 是來自該總體的樣本,若在給定 T 的取值後, X_1,X_2,…,X_n 的條件分佈與參數 theta 無關,則統計量 T=T(X_1,X_2,…,X_n) 稱為 theta 的充分統計量。

赞(0)