[摘 要]穩健統計學是一項應用性很強的學科,其主要針對的是統計學中一個普遍而實際的問題,這套方法不管是對科學研究還是對有關部門的經濟政策的制定都有著十分重要的理論意義與現實意義,所以,筆者認為穩健統計在經濟指標中的應用前景是非常客觀的。本文主要從以人均收入水平為指標以及穩健性的基本思想這兩方面對穩健統計在經濟指標中的應用進行了研究。
[關鍵詞]穩健統計; 經濟指標; 應用;
一、以人均收入水平為指標對統計穩健性的思考
我們在各種媒體上經常會看到平均數,尤其是算數平均數這兩個經濟指標;平均數是表示一組數據集中趨勢的量數,它主要是反映數據集中趨勢的一項指標;算術平均數是全部數據的算數平均,它是集中趨勢作主要的測度值,在統計學中占有核心地位,是進行統計分析與統計推斷的重要基礎內容。對其觀察值的代表性研究通常采用的是方差,即各個數據與平均數之差的平方的平均數,將其作為主要的不同類型的指標。但是,平均值與方差所應用的條件通常沒有得到人們的高度重視,其中最具有代表性的表現就是人們日常不會對觀察值所具有的形態分布進行全面的考慮,同時,也不會對分布的偏斜程度以及觀察值的數據中的一個或幾個數值與其他數據之間的差異情況進行充分的考慮。
從數據的純度量情況上看,如果在實際收入數據中存在著百萬或者是億萬的富翁時,那么,在很大程度上會將人均收入水平提高。從這點我們不難看出,采用算術平均的方法來計算人均平均收入的指標,離群值會對其造成嚴重的影響,并且離群值對其造成的影響還會將各種數據對平均數造成的不良影響消除。可以說,在這樣的一種情況下,算術平均數在統計指標中算不上是一個好的。反之,從人均收入本特值的角度而言,如果將中位收入替代算數人均收入,那么就會對一個函數的極大值或者極小值帶來的干擾進行有效的抵抗。當前,就收入的具體分布情況來看,中位收入與算術平均收入相比,其能夠充分的抵抗離群值造成的干擾,可以說,它是一項比較好的統計指標。
人均收入水平的統計指標,不僅可以通過可支配總收入除以平均人數的方法最終獲得數值,并且我們還可以根據政府統計系統的問卷調查方式產生,并根據該調查情況對整體的人均指標進行推斷。一般來說,相一致的統計數量與檢驗值在解釋過程中都是在高斯分布的假設下而進行的。所以,只要我們滿足了高斯分布的假設在實際過程中的具體要求,那么,人均收入指標就可以被我們所使用,這時,其具不具有穩健性也就無關緊要了,因而,我們在實際中就可以制定多種方法對收入的具體分布情況進行充分的檢驗,看其是否是高斯分布。
如果我們在實際收入分布中發現了一定數量的離群值,雖然其在數據的總數量中并沒有占多大的比例,但是它會嚴重的影響了算術人均收入,比如說,20%的高收入人群擁有著80%的收入總量。人們試著用高斯分布擬合檢驗的方法對離群值和高斯分布造成的影響進行充分全面的考察,但由于部分高斯分布的最終檢驗結果對小部分離群值以及對高斯分布造成的偏差難以有個準確的結論,所以,收入數據中存在的離群值對于只有在高斯分布假設下才能發揮作用的統計量會造成嚴重的影響。
穩健統計量與傳統統計量是在比較之中不斷的發展起來的;傳統統計量對于統計量過程中存在的計算程序是極為重視的。而穩健統計量更加重視的是將具有代表性的統計討論,放到對數據特征進行分析、認識的基礎上。穩健統計量的首要任務就是要摸索出收入具體的分布特點,之后才實際對統計量進行計算。目前,就人均收入指標來說,如果收入分布的特征不能夠明確,那么,就無法解釋清楚人均收入指標的具體情況。
二、穩健統計的基本思想
在高斯分布假設下諸多的計算系統模型參數與樣本推斷的措施,假如以樣本方差估計總體方差的方式、以樣本均值估計總體期望值方式等等,這些方法都具有高效性,沒有偏斜性,不管我們怎么對其進行檢查與論證,最后得出的結論都是很理想的。
然而,不管是在經濟方面還是在社會管理方面,以及自然科學中存在的諸多現象在對數據進行分析的過程中我們看出,高斯分布的基礎假設有時候也會無法滿足,人們通常會發現諸多的數據在分布過程中都不屬于高斯分布,并且也不是對稱的。在對諸多的數據分布形態的研究中發現,高斯分布屬于一種理論分布,實際體現為其傾斜程度比較適當,而就是這樣一種適當傾斜程度也會影響到估計量的穩健性。如果在實際中,有一種統計方法與偏離高斯假設的分布相背離,那么,這種統計方法就不具有穩健性。
最先對穩健統計問題進行理論探討的是戈賽特等人。他們在研究中發現,如果實際過程中無法滿足高斯分布假設,那么,在高斯分布基礎上建立起來的的估計以及推斷方法的價值水平是否是精確的還有待我們進一步的深入研究,如果精確度不夠,那么,就會直接的影響最后結論。假如對總體分布的高斯假設進一步放寬,那么,可以通過中位數等統計量的方式來推斷總體分布。
在穩健統計的開發與研究過程中,除了切尾均值,即在一個數列中,去掉兩端的極端值之后計算的算術平均數;中位數,即將統計總體當中的各個變量值按照大小順序排列起來,形成一個數列,處于變量數列中間位置的變量值等較好的穩健統計估量之外,同時還出現了一系列位置參數的穩健估計量方法。除了穩健估計量之外,還有兩種統計方法也不同程度上受到了統計專家們的重視,即穩健平滑線與穩健擬合線。由于數據分布各個部分的局部離群值較大,對平均平滑線及方程擬合線會造成影響,所以,應制定一套具有高水平的穩健平滑線和穩健擬合線技術。
良好的穩健統計方法能夠允許模型的假設與實際情況存在一定的偏差性,其能夠有效地抵抗數據中的離群值帶來的干擾,在各個方面都發揮著重要的作用。
綜上所述可知:本文主要從以人均收入水平為指標、穩健統計基本思想這兩方面對穩健統計在經濟指標中的應用進行了研究。
參考文獻:
[1]謝玉瓏,王繼紅,梁逸曾,俞汝勤.化學計量學中的穩健估計方法[J].分析化學,1994年03期
[2]連家林.關于參數統計非參數統計和穩健統計方法的應用[J].鄭州航空工業管理學院學報,1990年04期
[3]趙選民.穩健統計與穩健設計[J].航空標準化與質量,1991年04期