曲天堯



摘要:數理統計是一門以概率論為理論基礎,研究隨機現象統計規律性的數學學科。在經濟全球化和信息化的今天,經濟、管理等學科領域越來越側重數理統計的應用,尤其是在大數據時代下,統計數據浩如煙海,數理統計的地位就更加凸顯。隨著社會的發展,推斷統計已經取代傳統的描述統計,成為現代統計的核心,而抽樣分布作為統計推斷的開篇內容,同時也是連結概率論與數理統計的橋梁,因此在統計推斷中占據重要地位。本文主要對統計推斷中常用的抽樣分布及其應用作總結,并結合例題對統計量的抽樣分布作出合理地判別。
關鍵詞:簡單隨機抽樣;正態分布;χ2分布;F分布;t分布
一、基本概念
(一)總體與個體
在數理統計中,總體就是研究對象的全體,個體即為構成總體的每個成員。對應到概率論中,總體是一個分布,總體的相關數量指標是服從這個分布的隨機變量。
(二)樣本
樣本是對應于總體而言的。為了深入了解總體X的分布,從總體X中隨機抽取的n個個體即為樣本。樣本具有二重性:一方面,由于樣本是從總體中隨機抽取的,在抽取前它們的數值是未知的,所以樣本是隨機變量,可以記為X1,X2,...,Xn;另一方面,樣本在抽取后經觀測就可以得到相應的觀測值,所以樣本又可以說是一組數據,用x1,x2,...,xn表示。在本文中,樣本用X1,X2,...,Xn表示,而x1,x2,...,xn表示相應的樣本觀測值。
(三)簡單隨機抽樣
簡單隨機抽樣是數理統計中最常用的一種概率抽樣方法。簡單來講,簡單隨機抽樣要求在每次抽取中,所有待抽取的個體均具有相同的可能性被抽中。具體來說,簡單隨機抽樣要求樣本具有隨機性和獨立性。利用簡單隨機抽樣方法所得到的樣本即為簡單隨機樣本,本文所涉及到的樣本都是簡單隨機樣本。
(四)統計量與抽樣分布
假設X1,X2,...,Xn是取自總體X,容量為n的樣本,若樣本函數T=T(X1,X2,...,Xn)中不含有任何未知參數,那么T就是統計量。換言之,統計量就是把樣本加工成函數,統計量的分布就是抽樣分布。
在數理統計中,常見的統計量主要有樣本均值、樣本方差與標準差、樣本矩、次序統計量等。本文涉及到的統計量主要是樣本均值、樣本方差與樣本標準差,其計算公式如下:
公式
其中,X、S2、S分別表示樣本均值、樣本方差及樣本標準差。根據無偏性的要求,本文中的樣本方差指的是修正樣本方差S,而并非未修正樣本方差公式。
二、抽樣分布的基本理論
(一)正態分布正態分布是概率論中連續型隨機變量最常見的一種
分布,它也是后面三大抽樣分布的理論基礎。設隨機變量X~N(m,s2),則其密度函數j(×)、分布函數Φ·()分別為
公式
其中,-?
對于一般的正態變量都可以通過一個線性變換,使其服從標準正態分布,即若設正態變量X~N(m,s2),則有
公式
下文中采用的是上側a分位數。
在統計推斷中,正態分布主要應用于推斷正態總體的均值。對于單個正態總體而言,當樣本容量n≥30時,或者當樣本容量n<30但總體方差σ已知時可以利用正態分布。若設x1,x2,...,xn是來自總體X~N(m,s2)的樣本,樣本均值為X,且n330,則有
公式
對于兩個正態總體而言,不妨設x1,x2,...,xn1,Y1,Y2,...,公式
的樣本,樣本均值分別為X和Y,并且n1,n2330,則有公式
(二)c分布
假設總體X~N(0,1),X1,X2,...,Xn是取自總體X,容量為n的樣本,則統計量
公式
關于c2分布的定義,也可以這么理解:若設x1,x2,...,xn是取自總體X~N(0,1)的樣本,令Y=X2,相應的樣本函數為Y=X2,則
公式
獨立且同分布,這樣便可輕易求得c2分布的數字特征:
公式
當n很大時,根據中心極限定理可知
公式
x^分布是一種非負連續型隨機變量的分布,具密度
函數的圖形位于第一-象限,峰值向左偏,隨著n的增大,峰值將會向右移動。x'分布的上側a分位數定義如下
公式
其中,fx()表示x2分布的密度函數。
在統計推斷中,x2分布主要應用于推斷單個正態總體的方差,即若設.....。是來自總體x~N(μ,σ2)的樣本,樣本方差為S,則有
公式
(三)F分布
假設X~x*(m),Y~x2(n),并且X與Y相互獨立,則統計量
公式
就是服從第--自由度為n,第二自由度為n2的F分布,記為F~F(n,m2)
F分布也是-.種非負連續型隨機變量的分布,其密度函數含有兩個參數n和n2,密度函數曲線的形狀與x2分布相似。F分布的上側a分位數定義如下
公式
其中,fr(:)表示F分布的密度函數。
在統計推斷中,F分布主要應用于推斷兩個正態總體的方差之比,即若設Xi,y,是分別來自兩個獨立的總體X~N(A,σ)和Y~N(14,σ2)的樣本,樣本方差分別為
公式
其中,i12.2...,.2=..特別地,如果σ=σ:則有
公式
(四)分布
假設X~N(0,1),Y~x2(n),并且X與Y相互獨立,則統計量
公式
就是服從自由度為n的t分布,記為t~t(n)。根據t分布的定義可得
公式
分布是-一種連續型隨機變量的分布,其密度函數的圖形關于直線x=0(y軸)對稱,形狀與標準正態分布曲線相類似。當自由度n足夠大(n≥30)時,t分布就可以用標準正態分布近似代替。但對于較小的n,t分布與標準正態分布相差較大。t分布的,上側a分位數定義如下
公式
其中,f,()表示t分布的密度函數。
與正態分布類似,在統計推斷中,t分布主要應用于推斷正態總體的均值。對于單個正態總體而言,當樣本容量n<30且總體方差σ未知時便可運用t分布。。若設.2...X。是來自總體X~N(u,σ2的樣本,樣本均值為義,且n<30,則有
公式
對于兩個正態總體而言,不妨設xX.,....川,.,.....是分別來自兩個獨立的總體X~N(n,σ})和Y~N(μ2,σ3)的樣本,樣本均值分別為x和Y,并且幾,”2<30,如果o},o;未知但相等,即o?=σ3=σ2,則有
公式
其中,s:是σ和吃的合并估計量,且有
公式
如果o,σ3未知且不相等,即σ°≠σ3,則有
公式
此時的自由度D滿足
公式
三、對抽樣分布的總結
公式
通過對抽樣分布經典模式的分析可以看出:正態分布是理論基礎,x2分布、F分布以及t分布都是在正態分布的基礎。上衍生而來,于是便有了如下的三個關系
公式
四、對抽樣分布的判別
在實際中,除了要理解這幾個抽樣分布的經典模式之外,還要對統計量所服從的抽樣分布作出合理地判別。
例1設x,X,X,x是來自總體x~N(,σ2)(σ>0)的簡單隨機樣本,試判斷統計量.X-X-所服從的分
|X;+X.-2|
布。
解:由題意可得
公式
例2設X,Xx,X,是來自總體X~N(0,σ2)(σ>0)的簡單隨機樣本,試判斷統計量2X,-X,
√2|x,|所服從的分布。
解:根據題意得
公式
例3設x..x(n≥2)是來自總體x~N(1,1)的簡單隨機樣本,記x=-Zx,則下列結論中不正確的是()
公式
因此,本題應選B。
參考文獻
[1]何志華.經濟分析中概率與數理統計的應用評價[].現代營銷(下旬刊),2017年01期.
[2]吳風慶,王艷明統計學[M]科學出版社,2016.
[3]茆詩松,程依明,濮曉龍.概率論與數理統計教程[M].高等教育出版社,2010.
[4]張小斐統計學[M].中國統計出版社,2013.