河南師范大學 李勝坤
[本文系河南師范大學青年基金項目“我國企業負債期限結構研究”的階段性研究成果]
假設檢驗在實證研究中有著廣泛應用,參數檢驗和非參數檢驗是假設檢驗的兩種基本方法,參數檢驗對變量的分布有著嚴格限制,而非參數檢驗則對變量的分布沒有特殊要求,而且可以適用于各種類型的變量,因此非參數檢驗在社會學研究中有著廣泛應用。由于目前有關財務理論的實證研究主要以資本市場的數據及企業的財務報表數據為分析對象,這些數據大部分能夠滿足參數檢驗的分布要求,因此財務領域中的實證研究更多地采用了參數檢驗的方法。隨著財務管理研究的深入,一些社會學的研究方法開始引入財務管理的研究,尤其是問卷調研方法和實驗研究方法在財務管理的研究中運用越來越多,這些研究方法的采用也使得各種非參數檢驗方法在財務管理中有著廣泛的應用前景。因此本文針對常用的非參數檢驗方法及其在財務管理研究中的應用進行分析,以期對財務領域的實證研究提供借鑒。
參數檢驗是在假設總體分布已知的情況下,針對總體分布的某些參數進行推斷檢驗,因此參數檢驗對相關變量的分布有嚴格的要求。在現實中有許多變量的分布是否滿足某種特定的分布可能人們事先并不知道,或者雖然知道其分布類型,但其分布并不滿足參數檢驗的要求,無法采用參數檢驗的方法對相關假定進行推斷,這時候就需要采用非參數檢驗的方法。非參數檢驗方法主要適用于以下兩種情況:
其一,總體的分布未知,需要對總體分布進行推定。在研究中有時我們對研究對象的分布情況可能知之甚少,研究對象的分布情況本身就是有待研究的主要內容;或者希望通過參數檢驗的方法對研究對象進行深入分析,但對各變量的分布是否滿足參數檢驗的要求沒有足夠的把握。這時可以通過非參數檢驗的方法對研究變量的分布情況進行檢驗。
其二,總體分布情況已知,但變量不能夠滿足參數檢驗的要求。參數檢驗是基于變量的分布情況,利用樣本數據與變量分布的某些參數之間的關系構造一個分布已知的統計量,進而對特定的假設進行檢驗。參數檢驗首先要求被檢驗的變量屬于定距變量,對于定類變量和定序變量則無法采用采用參數檢驗的方法,參數檢驗除了對變量的層次有要求外,對變量的分布也有要求,如果變量不滿足參數檢驗的分布要求,采用參數檢驗方法則有可能得出錯誤的結論。因此對于定類變量、定序變量及不滿足分布要求的定距變量,一般采用非參數檢驗的方法進行分析。
同參數檢驗一樣,非參數檢驗有著眾多的方法,根據各種方法適用的情況不同,非參數檢驗主要包括單樣本的總體分布檢驗、兩獨立樣本的非參數檢驗、兩配對樣本的非參數檢驗及多樣本的非參數檢驗等。
其一,單樣本的總體分布檢驗。該檢驗是根據樣本數據對變量是否滿足所假設的分布進行檢驗。對于離散型的變量一般采用卡方檢驗的方法,其基本原理是根據假設的分布計算出變量在各個取值上的理論頻次,利用理論頻次和樣本實際頻次可以構造一個服從χ2分布的統計量,在假設的分布成立的情況下,該統計量不應該太大,根據計算出的統計量的值及其相伴概率(Sig)可以判斷原假設是否成立,當Sig小于設定的顯著性水平時應拒絕原假設。由于財務管理研究中所涉及的變量更多的是連續性變量,對于連續型變量可以將其取值分為若干區間,從而把連續型變量當作離散型變量來處理,采用卡方檢驗對其分布進行檢驗。但為了提高檢驗效率,一般采用單樣本的K—S檢驗,K—S檢驗的基本思想是在原假設成立的前提下,根據樣本數據得到的累計頻次分布與根據假設分布計算出來的理論累計頻次分布不應該有較大差異,根據理論分布確定的理論累計概率分布函數F(x)與根據樣本數據得到的經驗累計分布函數S(x)的差值D(x)應服從期望值為0的正態分布,由此根據D(x)的觀測值可以判斷是否接受原假設。卡方檢驗和單樣本K—S檢驗均可通過統計分析軟件SPSS實現,在SPSS中卡方檢驗的輸出結果主要有卡方值(chi-square)和相伴概率值(Sig),K—S檢驗的輸出結果為Z值及相伴概率值(Sig),對結果的判斷主要參考Sig值,如果Sig值低于顯著性水平則拒絕原假設,認為變量不滿足假設的分布。
單樣本的總體分布檢驗在財務研究中的應用主要在是在參數檢驗前對變量是否滿足參數檢驗的分布要求進行檢驗,如為檢驗我國上市公司2007年的高管持股比例是否滿足正態分布,我們選擇K—S檢驗進行檢驗,檢驗輸入的結果為Z=18.256,Sig=0.000,因此應該拒絕變量服從正態分布的假設(考慮到有相當部分的上市公司高管持股比例為0,剔除這部分樣本后Z=13.338,Sig=0.000,仍然拒絕變量服從正態分布的假設)。當然除了正態性檢驗以外,單樣本的總體分布檢驗還可以對變量是否滿足其他分布(比如指數分布、均勻分布、多項分布等)進行檢驗
其二,兩個獨立樣本的非參數檢驗。獨立樣本一般是指來自不同總體的樣本,獨立樣本檢驗的目的是判斷樣本來自的總體分布是否相同,其原假設是總體的分布無差異,如果拒絕原假設則認為總體分布之間存在差異。兩個獨立樣本的非參數檢驗方法主要有游程檢驗、秩和檢驗和累計頻次檢驗。游程檢驗的基本思想是將兩個樣本混合按大小順序排列后,如果兩個樣本來自的總體無差異,則排列后的樣本數據應該是隨機交替地來自兩個樣本,不應該出現兩個樣本各自集中于一端的現象。如果把重新排序后的序列中連續來自同一個樣本的子序列稱為游程,則在原假設成立的前提下,游程數量不應太少,因此利用游程數量的多少可以判斷兩個樣本來自的總體分布是否存在顯著性差異。當兩個樣本的容量均較大時,游程數近似服從正態分布,游程檢驗輸出的結果為Z值及其相伴概率Sig值,當Sig值小于設定的顯著性水平時,拒絕原假設,認為兩個總體分布存在顯著性差異。秩和檢驗的思路是將兩個樣本進行混合排序,以每個樣本數據的序號作為它的秩,如果兩個樣本來自的總體無差異,則在兩個樣本容量一定的情況下,兩個樣本的秩和不應該太大和太小,因此可以用其中一個樣本的秩和構造統計量,對假設進行檢驗。在SPSS中秩和檢驗對應的是Mann—Whitney U檢驗,該檢驗輸出的結果為Mann—Whitney U統計量的值和Z值及其相伴概率Sig值。當樣本容量較小時,以U值及其相伴概率作為判斷依據;當樣本容量較大時,以Z值及其相伴概率作為判斷依據。Sig值小于顯著性水平則拒絕原假設,認為兩個總體存在顯著性差異。累計頻次檢驗是通過兩個樣本在每個數據點的累計頻率的差值對總體分布差異性進行檢驗,如果兩個樣本來自的總體分布無差異,則兩個樣本在各點的累計頻率不應該有太大差別,累計頻率差值的最大絕對值可以作為判斷兩個總體分布是否存在差異的依據。在SPSS中累計頻次檢驗對應兩獨立樣本的K—S檢驗,輸出結果為Z值及相伴概率Sig值,當Sig值小于顯著性水平時拒絕原假設。
在財務研究中經常需要對不同類型的企業財務指標或財務行為是否存在差異進行分析,這時就可以從不同類型企業中抽取一定數量的樣本進行對比分析,此類樣本即屬于獨立樣本。國家自然科學基金重點項目“我國企業投融資運作與管理研究”為了研究企業的投融資行為進行了一次大型調查活動,調查對象包括上市公司和非上市企業,因此按照是否上市可把樣本分為上市公司和非上市企業兩個獨立樣本,為檢驗這兩類企業對銀行中期貸款的使用情況是否存在差異,根據項目組編制的調研數據庫中的數據,我們可選取秩和檢驗和累計頻次檢驗進行分析。秩和檢驗輸出結果分別為Z=-2.755、Sig=0.006;累計頻次檢驗輸出結果分別為Z=-1.493、Sig=0.023。如果顯著性水平選取0.05,則兩種檢驗的結論均拒絕原假設,認為上市公司和非上市企業在銀行中期貸款的使用上存在顯著差異。
其三,兩配對樣本的非參數檢驗。配對樣本一般是指對同一調查對象在不同情況下進行的多次調查,以分析調查對象在不同情況下是否存在顯著性變化或差異,配對樣本檢驗的原假設是多次調查不存在差異。兩配對樣本的非參數檢驗方法主要有符號檢驗法和符號秩檢驗法。符號檢驗法是根據調查對象兩次調查數據變化的正負符號來判斷調查對象是否出現存在顯著性差異。其基本思想是在原假設成立的前提下,配對樣本數據變化的正負個數應該基本相當,如果兩者差異很大,則認為調查對象在兩種情況下存在顯著性差異。當樣本容量較大時,SPSS中符號檢驗法輸出的結果為Z值及相伴概率Sig值,當Sig值小于顯著性水平時拒絕原假設。符號秩檢驗是在符號檢驗的基礎上,除了考慮配對樣本變化的符號外,還把變化的大小也考慮進去。這種方法以變化值的絕對值進行排序作為每個樣本的秩,分別計算變化值為正的樣本秩和及變化值為負的樣本秩和,在原假設成立的前提下,兩個秩和差別不應太大。符號秩檢驗對應SPSS中的Wilcoxon檢驗,輸出結果為Z值和Sig值,Sig值小于顯著性水平則拒絕原假設。
企業對不同融資工具的使用是否存在顯著性差異就屬于配對樣本的檢驗問題,比如為檢驗企業對銀行短期貸款和銀行中期貸款的使用是否不同,我們利用調研數據庫中的數據使用符號檢驗和符號秩檢驗對其進行分析,符號檢驗的輸出結果為Z=-16.618,Sig=0.000;符號秩檢驗的輸出結果為Z=-15.794,Sig=0.000。設定顯著性水平為0.05,則兩種檢驗的結論均拒絕原假設,認為企業在銀行短期貸款和中期貸款的使用上存在顯著差異。
其四,多樣本的非參數檢驗。兩獨立樣本和兩配對樣本的非參數檢驗是對兩個總體的分布是否存在差異進行檢驗,實證研究中有時需要對多個總體分布是否存在差異進行檢驗,這時就要用多個樣本進行檢驗,同兩個樣本一樣,多樣本也有獨立樣本和配對樣本。獨立多樣本的非參數檢驗方法主要有中位數(Median)檢驗和K—W檢驗,獨立配對樣本的非參數檢驗主要采用Friedman檢驗。中位數檢驗的基本思想是把多個樣本混合以后,取其中位數作為參考,把每個樣本的數據與這個共同的中位數比較,則在多個總體分布無差異的情況下,每組樣本數據中大于和小于這個中位數的數量的期望值應該各為1/2,如果實際樣本中這兩者的數量相差較大,則應拒絕總體分布無差異的假設,中位數檢驗就是根據各樣本數據中大于和小于共同中位數的數量構造統計量來對假設進行檢驗,該檢驗在SPSS中輸出的結果為χ2值和Sig值,Sig值小于顯著性水平則認為總體分布存在差異。K—W檢驗的基本思想與兩獨立樣本的秩和檢驗相同,都是利用樣本的秩和作為判斷依據,不同的是K—W檢驗根據多個樣本的多個秩和構造出一個服從χ2分布的統計量作的判斷依據,輸出結果為χ2值和Sig值。Friedman檢驗的思想是將每一觀察對象的配對樣本數據按大小排序,以其序號設定其秩,然后計算各組樣本的秩和,如果每組樣本對應的總體分布無差異,則各組的秩和應該差異不大。Friedman檢驗根據各組秩和構造統計量,輸出結果為χ2值和Sig值,Sig值小于顯著性水平則拒絕總體分布無差異的假設。
“我國企業投融資運作與管理研究”項目的調查將企業資信等級分為AAA級、AA級和A級及以下,資信等級不同的企業對銀行中期貸款的使用情況是否存在不同就屬于多獨立樣本的檢驗問題。根據調查數據,分別選用中位數檢驗和K—W檢驗,輸出結果分別為中位數檢驗χ2=0.917、Sig=0.632;K—W檢驗χ2=0.367、Sig=0.832,如果設定的顯著性水平為0.05,則不能拒絕原假設,不能認為資信等級不同的企業對銀行中期貸款的使用存在差異。對于企業在多個債務融資工具上的使用是否存在不同,則需要采用多配對樣本的非參數檢驗,根據調研數據采用Friedman檢驗輸出的結果為χ2=1530.17、Sig=0.000,由于Sig小于顯著性水平,因此拒絕原假設,認為企業對各種債務融資工具的使用頻率存在差異。
非參數檢驗作為假設檢驗的一類,是利用樣本數據推斷總體的特征,其推斷過程同樣有可能會犯兩類錯誤,第一類錯誤是在原假設成立的前提下拒絕原假設,第二類錯誤是在原假設不成立的情況下接受了原假設。假設檢驗控制的是第一類錯誤,如果非參數檢驗的結論是拒絕原假設,則犯錯誤的概率應該小于設定的顯著性水平。當檢驗結論不能拒絕原假設的情況下,此時如果我們接受原假設,則有可能犯第二類錯誤,而且犯第二類錯誤的概率是無法控制的,一般來講,樣本容量越大或者對樣本的信息利用越充分,犯此類錯誤的概率會越小。由于參數檢驗利用的樣本信息多于非參數檢驗,因此在變量滿足參數檢驗的情況下采用參數檢驗得到的結論會更可靠,尤其是在兩種方法得出的結論不一致時,應該采信參數檢驗得出的結論。
[1]盧淑華:《社會統計學》,北京大學出版社2000年版。
[2]齊寅峰、王曼舒等:《中國企業投融資行為研究》,《管理世界》2005年第3期。