鐘無涯,顏 瑋
在社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)的應(yīng)用實(shí)踐中,包括居民生活消費(fèi)情況統(tǒng)計(jì)、房地產(chǎn)價(jià)格變化統(tǒng)計(jì)等大量的社會(huì)調(diào)查是建立在統(tǒng)計(jì)抽樣的基礎(chǔ)上完成的。這類通過樣本信息推測總體信息的統(tǒng)計(jì)工作,以及其他許多必須通過參數(shù)估計(jì)、統(tǒng)計(jì)推斷和統(tǒng)計(jì)檢驗(yàn)的工作都必然要涉及到自由度(degree of freedom,DF)的概念。然而目前國內(nèi)的大部分統(tǒng)計(jì)學(xué)教材對(duì)于自由度概念產(chǎn)生的背景、原因和性質(zhì)等方面沒有給出相關(guān)的解釋,也沒有對(duì)自由度概念作出完整、統(tǒng)一的定義。在實(shí)踐中對(duì)涉及自由度的應(yīng)用也大都直接在公式中生成,或機(jī)械套用。李友平(2007)探討了社會(huì)經(jīng)濟(jì)問題研究中統(tǒng)計(jì)假設(shè)檢驗(yàn)與統(tǒng)計(jì)抽樣分布中自由度的概念,并通過案例給出了自由度的粗略計(jì)算。程志明和韓兆洲(2011)則綜合了相關(guān)文獻(xiàn)在基于獨(dú)立性、樣本量等不同角度下對(duì)自由度的理解從而給出了自由度的一般性定義,并同時(shí)對(duì)自由度在幾何、樣本方差、回歸分析、獨(dú)立性檢驗(yàn)和擬合度檢驗(yàn)中的應(yīng)用進(jìn)行了闡述。在文獻(xiàn)中他們對(duì)自由度的概念和計(jì)算做了一定程度的說明,并列舉了自由度在多個(gè)領(lǐng)域的應(yīng)用實(shí)踐。但對(duì)自由度概念的產(chǎn)生以及應(yīng)用中自由度具體形式的取舍原因并未詳細(xì)說明。本文將在此基礎(chǔ)上,立足于自由度在經(jīng)濟(jì)統(tǒng)計(jì)實(shí)踐中的應(yīng)用特點(diǎn),力圖以更簡潔和直觀的方式闡明自由度的產(chǎn)生背景與原因,列舉自由度的應(yīng)用案例并嘗試給出一個(gè)社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)角度的自由度概念。
自由度概念的產(chǎn)生與抽樣調(diào)查密不可分。抽樣調(diào)查能夠解決全面調(diào)查無法解決或較難解決的問題,并且可以補(bǔ)充和修訂全面調(diào)查的結(jié)果。相比總體調(diào)查方式,抽樣調(diào)查方式具有經(jīng)濟(jì)性、時(shí)效性、準(zhǔn)確性和靈活性等優(yōu)越性。雖然限制在許多嚴(yán)格的條件假設(shè)以及諸多定律、定理如中心極限定理等基礎(chǔ)之上,也建立起相應(yīng)的假設(shè)檢驗(yàn)體系,但是,以點(diǎn)測面,或者以偏概全的抽樣調(diào)查方式卻仍然無法排除抽樣方法本身產(chǎn)生失真的風(fēng)險(xiǎn)性。因此,為了降低判斷失真的風(fēng)險(xiǎn),提高抽樣樣本與總體樣本的相關(guān)性,必須在形成抽樣樣本的數(shù)據(jù)構(gòu)成上特別慎重,同時(shí)也必須在樣本數(shù)據(jù)的處理上權(quán)衡斟酌。自由度的概念就是在這樣的背景和要求中產(chǎn)生的。
一般情況下,在確定樣本數(shù)量n后,樣本是由總體中任意抽取n個(gè)元素構(gòu)成。這個(gè)過程是完全任意的,即所謂的“自由”,并且抽取的方式是多樣的。若以H代表總體,n代表樣本數(shù)量的話,抽取的方式將是CnH種。但是,基于抽樣樣本的性質(zhì)需要以及用途等方面的要求,抽樣樣本必須體現(xiàn)出總體樣本的特定特征要求,因此必然使得抽樣樣本的形成在某些方面受到約束,比如均值xˉ要求、方差σ2要求等等,因此,樣本組成并不能完全隨機(jī)的選取n個(gè)元素,即必須放棄某些樣本的自由選擇機(jī)會(huì)以滿足相關(guān)約束條件或特征目標(biāo)。出于滿足樣本和總體之間某些約束條件的原因,通過限制部分變量或者元素的可調(diào)整性以實(shí)現(xiàn)這樣的目的,這是樣本選擇過程中自由度概念產(chǎn)生的最基本原因。
通常情況下,自由度是指當(dāng)以樣本的統(tǒng)計(jì)量來估計(jì)總體的參數(shù)時(shí),樣本中獨(dú)立或能自由變化的數(shù)據(jù)或元素的個(gè)數(shù)。謝啟南、韓兆洲(1991)認(rèn)為自由度是指在一組數(shù)據(jù)中可以自由取值的個(gè)數(shù)。Gravetter和Wallnau(2008)認(rèn)為:自由度是指樣本中有多少個(gè)數(shù)是獨(dú)立的,并可以自由變換的。以上學(xué)者的自由度概念偏重于起源思想和數(shù)量概念,且與本文中所提出的自由度概念的產(chǎn)生原因相契合;Mayhew(2004)則從樣本量和顯著性兩個(gè)角度界定自由度,認(rèn)為在統(tǒng)計(jì)檢驗(yàn)中自由度甚至有時(shí)直接等于樣本容量,有時(shí)卻要根據(jù)樣本容量來調(diào)整計(jì)算;而對(duì)于不同的顯著性檢驗(yàn),自由度的計(jì)算也是不一樣的,正確地選擇樣本自由度是進(jìn)行顯著性檢驗(yàn)的基礎(chǔ)。Joseph(2008)認(rèn)為,自由度是在不違背約束條件前提下可以隨意變化信息的數(shù)量。這兩位學(xué)者的自由度概念偏重于應(yīng)用實(shí)踐的范疇。筆者認(rèn)為,如果單從社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)的實(shí)踐角度出發(fā),統(tǒng)計(jì)樣本的代表性、統(tǒng)計(jì)過程的科學(xué)性、統(tǒng)計(jì)檢驗(yàn)的合理性以及統(tǒng)計(jì)結(jié)果的真實(shí)性應(yīng)該是決定統(tǒng)計(jì)工作質(zhì)量的主要方面,而這些方面工作的質(zhì)量又都取決于統(tǒng)計(jì)工作的力足點(diǎn),即統(tǒng)計(jì)樣本。因此,在形成統(tǒng)計(jì)樣本之初進(jìn)行自由度的選擇和確定,其重要性不言而喻。此外,因?yàn)樾纬山y(tǒng)計(jì)樣本的主要目的是為了體現(xiàn)出總體樣本特征的,因此界定自由度必然應(yīng)該從把握樣本與總體關(guān)系進(jìn)行契入。但是,抽樣樣本與統(tǒng)計(jì)總體的關(guān)系基于統(tǒng)計(jì)目的、統(tǒng)計(jì)性質(zhì)、統(tǒng)計(jì)方法、統(tǒng)計(jì)主體以及統(tǒng)計(jì)數(shù)量的不同而各異,因此不可能從統(tǒng)計(jì)方法角度去對(duì)自由度概念進(jìn)行概括定義。根據(jù)以上分析,筆者認(rèn)為,自由度應(yīng)該是在體現(xiàn)樣本與總體關(guān)系(出于統(tǒng)計(jì)目標(biāo)的不同,關(guān)系描述和特征目標(biāo)也有所差異),且不違背相關(guān)約束條件前提下可以隨意選擇、變化的元素?cái)?shù)量。從另外一個(gè)角度看,自由度實(shí)際上是樣本構(gòu)成中真正體現(xiàn)隨機(jī)選擇的有效元素?cái)?shù)量,是實(shí)際樣本容量與有效樣本容量的區(qū)別。
既然涉及到容量,或者元素?cái)?shù)量,因此必須考察自由度的數(shù)量問題。以一個(gè)相對(duì)簡單的自由度應(yīng)用公式-樣本,這是大部分教科書提供的計(jì)算公式。如果n非常大,則從整體角度觀察,n與n-1所引起的數(shù)值區(qū)別幾乎可以忽略;而當(dāng)n的數(shù)值不大,那么對(duì)于整個(gè)的統(tǒng)計(jì)體系而言,由于采用n與n-1兩種不同取值,就有可能帶來結(jié)果之間很大的差額。這僅僅是一個(gè)單一變量方差計(jì)算應(yīng)用,如果涉及到多變量、協(xié)方差或者其他相關(guān)性分析,不同的自由度取值對(duì)于建立在抽樣樣本基礎(chǔ)之上的整個(gè)統(tǒng)計(jì)體系的影響之大是顯而易見的。一般而言,相關(guān)變量少、元素?cái)?shù)量少的抽樣樣本對(duì)自由度取值的敏感性很大,相對(duì)而言,對(duì)于元素?cái)?shù)量較多,相關(guān)變量多的抽樣樣本對(duì)自由度取值的敏感性相對(duì)較弱。
通常情況下,抽樣樣本的所有數(shù)據(jù)都可以通過統(tǒng)計(jì)分析工作得出,但是總體數(shù)據(jù)卻只能通過基于抽樣樣本的統(tǒng)計(jì)分析結(jié)果去推算測度,因此必然存在一個(gè)統(tǒng)計(jì)數(shù)據(jù)和真實(shí)數(shù)據(jù)之間的擬合度問題。通常所謂的客觀存在的統(tǒng)計(jì)總體的真實(shí)數(shù)據(jù)即“參數(shù)(Parameter)”。那么,有什么依據(jù)使得抽樣樣本與統(tǒng)計(jì)總體的內(nèi)在關(guān)系具備以推測估算的方式去洞察呢?其中一個(gè)基本要求就是抽樣樣本的統(tǒng)計(jì)量必須是總體參數(shù)的無偏估計(jì),這是之所以可以通過抽樣樣本去估測統(tǒng)計(jì)總體的先決條件,同時(shí)也是社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)學(xué)和計(jì)量經(jīng)濟(jì)學(xué)理論體系中的一個(gè)重要基石。一個(gè)比較形式的描述性證明過程如下:
總體H中有一樣本S(s1,s2,s3,...sn),E(Hˉ)=μ,D(H)=σ2;根據(jù)參數(shù)的無偏性估計(jì)特點(diǎn),則必然有E(sˉ)=μ,方差的計(jì)算為例E(D(S))=σ2。以自由選擇的n個(gè)元素(即樣本元素全部自由選擇,而不采取n-1)構(gòu)成樣本S的情況說明,即:

由此可以看出,統(tǒng)計(jì)樣本S的n個(gè)元素如果全部自由選擇的話,E(D(S))≠σ2將無法滿足參數(shù)的無偏性估計(jì)特點(diǎn)。因此,當(dāng)統(tǒng)計(jì)樣本S的放棄一個(gè)元素的自由選擇,即自由度為n-1時(shí),卻能夠滿足參數(shù)的無偏性估計(jì)特點(diǎn):

由此可以形成結(jié)論:放棄一個(gè)元素自由選擇機(jī)會(huì)的統(tǒng)計(jì)樣本S的方差是總體H方差的無偏估計(jì)量,而全部自由選擇元素的樣本方差卻不是總體H方差的無偏估計(jì)量。產(chǎn)生如此差異的關(guān)鍵因素在于抽樣樣本S的元素?cái)?shù)量n的自由度選擇。這也說明大多數(shù)教科書并未解釋的樣本方差計(jì)算時(shí)為什么選擇n-1。
例1:某市統(tǒng)計(jì)局欲了解寬松貨幣政策環(huán)境下居民收入水平和消費(fèi)水平的情況。調(diào)查采用隨機(jī)抽樣的方式在某居民小區(qū)完成,希望通過小區(qū)抽樣數(shù)據(jù)來推斷小區(qū)整體居民的收入情況和消費(fèi)情況。該小區(qū)共有居民10000戶,采用隨機(jī)的方式抽取了2000戶居民組成樣本。因?yàn)檫x取的方式是在整體中隨機(jī)抽取,所以選取樣本的方式可以有C200010000種,但是在實(shí)踐操作過程中一般只會(huì)選取一個(gè)樣本。在選取樣本之前,整個(gè)小區(qū)作為數(shù)據(jù)總體有一個(gè)客觀存在的小區(qū)居民收入和消費(fèi)情況,但對(duì)于調(diào)查者而言這個(gè)數(shù)據(jù)是未知的。中心極限理論支持隨機(jī)抽取的樣本數(shù)據(jù)整體呈現(xiàn)正態(tài)分布的特點(diǎn),抽取的數(shù)據(jù)量越大,正態(tài)分布的特點(diǎn)越明顯。但是總體的實(shí)際分布情況卻并不一定如此,因此在以抽樣樣本估計(jì)統(tǒng)計(jì)總體是有風(fēng)險(xiǎn)的。統(tǒng)計(jì)理論要求樣本統(tǒng)計(jì)量必須與總體參數(shù)相等,因此,樣本組成元素的選取是受到一定條件約束的。比如最簡單的一個(gè)統(tǒng)計(jì)指標(biāo)算術(shù)平均數(shù)xˉ,其計(jì)算方式即為,而且不同的樣本組成就有可能有不同的算術(shù)平均數(shù)xˉ以及其他相對(duì)應(yīng)的統(tǒng)計(jì)量。這是從不同樣本去推測總體數(shù)據(jù)的情況,但單就單個(gè)樣本而言,給定了xˉ,也就意外著給定。但是由于平衡關(guān)系,其中的n-1個(gè)元素還是可以自由變化的,第n個(gè)元素只需要平衡前面n-1個(gè)的波動(dòng)就可以實(shí)現(xiàn)xˉ。因此,在這個(gè)居民收入和消費(fèi)情況統(tǒng)計(jì)的抽樣樣本中,可以自由變化的戶數(shù)應(yīng)該是2000-1=1999戶,而不是2000。
例2:某大型設(shè)備生產(chǎn)商擬進(jìn)行生產(chǎn)工藝升級(jí),希望實(shí)現(xiàn)流程改進(jìn),經(jīng)過研發(fā)部門的設(shè)計(jì),現(xiàn)有2種生產(chǎn)流程備選,分別命名為流程A和流程B?,F(xiàn)在希望通過現(xiàn)場多次測試的方法來了解并判斷流程A和流程B的整體運(yùn)行效率的差別,從而做出對(duì)這兩種流程的取舍決定。表1是測試數(shù)據(jù),圖1是測試結(jié)果的直觀顯示。

表1 生產(chǎn)流程用時(shí)表 (單位:天)

圖1 生產(chǎn)流程用時(shí)柱形圖(單位:天)
一般情況下,對(duì)于兩個(gè)方案的取舍是通過計(jì)算其生產(chǎn)流程的平均用時(shí)來決定的,或者進(jìn)行對(duì)兩種生產(chǎn)流程是否有明顯差距進(jìn)行判斷,基于此,以兩樣本的假設(shè)檢驗(yàn)判斷方式來進(jìn)行自由度的使用說明。

這里對(duì)流程A和流程B的自由度選擇做一說明:
流程A和流程B的樣本方差,采用DF=n-1,理由已經(jīng)前述。
對(duì)兩樣本數(shù)據(jù)進(jìn)行的假設(shè)檢驗(yàn)需要用到流程A和流程B的合并樣本方差(Pooled Sample Variance),這里的自由度選擇DF=n1+n2-2。理由是因?yàn)榱鞒藺和流程B的樣本方差在樣本選擇之時(shí)已經(jīng)各舍棄一個(gè)自由度,因此基于獨(dú)立樣本方差基礎(chǔ)之上計(jì)算的合并樣本方差自然應(yīng)該延續(xù)單獨(dú)樣本方差的自由度的選擇。因此兩樣本的合并樣本方差應(yīng)該是由總的樣本數(shù)量n1+n2舍棄2個(gè)樣本控制量,即DF=n1+n2-2。根據(jù)流程A和流程B的測試次數(shù)數(shù)據(jù)可知:DF=5+6-2=9。假定此次假設(shè)檢驗(yàn)采取的顯著性水平為0.10,由于給出的備擇假設(shè)H1未指明方向,故此次假設(shè)檢驗(yàn)為雙尾檢驗(yàn)。分析過程如下:

同理:s(B)=2.0976

因?yàn)榱鞒藺和流程B的測試次數(shù)較小(獲得的數(shù)據(jù)中流程A僅僅5次,流程B是6次),因此采用t值進(jìn)行檢驗(yàn)。

α=0.10,DF=9的t分布條件下,H0:μa=μb的接受域?yàn)閇-1.833,1.833],而我們計(jì)算出來的t=-0.662∈[-1.833,1.833],因此不能拒絕H0:μa=μb。統(tǒng)計(jì)結(jié)論是流程A和流程B在生產(chǎn)過程中所占用的時(shí)間并沒有明顯的差距,這也和圖1測試時(shí)間柱狀圖所表現(xiàn)出來的情況類似。
自由度是一個(gè)廣泛應(yīng)用于數(shù)理、經(jīng)濟(jì)、工程以及醫(yī)藥等多個(gè)學(xué)科統(tǒng)計(jì)分析工具的初級(jí)和基礎(chǔ)概念。根據(jù)國內(nèi)學(xué)者對(duì)自由度的理解和應(yīng)用等方面的相關(guān)文獻(xiàn),同時(shí)參考了部分國外學(xué)者在該領(lǐng)域的一些代表性觀點(diǎn)、看法,本文從社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)角度對(duì)自由度概念產(chǎn)生的原因和基礎(chǔ)進(jìn)行了分析,并給出了自由度的基本定義,即:自由度應(yīng)該是在體現(xiàn)樣本與總體關(guān)系(出于統(tǒng)計(jì)目標(biāo)的不同,關(guān)系描述和特征目標(biāo)也有所差異),且不違背相關(guān)約束條件前提下可以隨意選擇、變化的元素?cái)?shù)量。特別指出,自由度概念的界定應(yīng)該在全面的把握樣本與總體關(guān)系基礎(chǔ)上而不應(yīng)該僅僅從統(tǒng)計(jì)應(yīng)用的角度出發(fā)。本文通過兩個(gè)社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)的實(shí)例,著重體現(xiàn)自由度在實(shí)際應(yīng)用中的變化調(diào)整,并對(duì)統(tǒng)計(jì)結(jié)論進(jìn)行了解釋。
[1]李友平.關(guān)于社會(huì)統(tǒng)計(jì)中“自由度”概念的解析[J].統(tǒng)計(jì)與決策,2007,(6).
[2]程志明,韓兆洲.自由度的認(rèn)識(shí)與應(yīng)用[J].統(tǒng)計(jì)與決策,2011,(12).
[3]謝啟南,韓兆洲.統(tǒng)計(jì)學(xué)原理[M].廣州:暨南大學(xué)出版社,1991.
[4]Dauglas A.Lind,William G.Marshall.Statistical Techniques in Busi?ness&Economics(11thEdition)[M].New York,US:McGraw-Hill,2002.
[5]Gravetter and Wallnau.行為科學(xué)統(tǒng)計(jì)(第七版)[M].北京:中國輕工業(yè)出版社,2008.
[6]Glenn,Littler.A Dictionary of Mathematics[M].Totowa,NJ:Barnesand Noble Books,1984.
[7]James,Glenn.Mathematics Dictionary(4thEdition)[M].New York:Van Nostrand Reinhold,1976.
[9]Joseph.Degreesof Freedom[J].Teaching Statistics,2008,30(3).
[10]Mayhew.A Dictionary of Geography(3rdEdition)[M].Oxford,UK:Ox?ford University Press,2004.