999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

居民收入樣本分組數與基尼系數測算的關系探討

2011-09-05 02:48:02陳建東
統計與決策 2011年15期
關鍵詞:農村

陳建東,戴 岱,馮 瑛

(1.西南財經大學 財稅學院,成都 611130;2.西南財經大學 工商管理學院,成都 611130;3.成都電子機械高等專科學校,成都, 610031)

0 引言

衡量收入不平等的標準有很多,如泰爾-L指數、變異系數、平均離方差(又稱庫茨涅茨指數)和基尼系數等。不過兩個最常用的標準是洛倫茨曲線和基尼系數(Sloman,2000)。而基尼系數是最重要的衡量收入不平等程度的指標(Sen,1997;Champernowne 和Cowell,1998)。意大利統計學家 Corrado Gini在1912年發表的Variability and Mutability一文中,首次提出了一種衡量不均等的指數及其計算方法。該方法后來便逐漸演變為大家熟知的基尼系數(李實,2002)。

測算基尼系數最理想的數據源就是原始的住戶調查數據,根據(1)式,利用相關的軟件1就能迅速準確地計算居民收入的基尼系數。(1)式中n代表人口總數(或家庭戶數);u為平均收入;yi和yj分別代表第i和j居民(或家庭)的收入。

目前公開出版的相關統計年鑒有:《中國統計年鑒》、《中國城市(鎮)生活與價格年鑒》、《農村住戶調查年鑒》和《中國價格及城鎮居民家庭收支調查統計年鑒》,后兩者居民收入的分組數據和《中國統計年鑒》類似。雖然《中國城市(鎮)生活與價格年鑒》提供的城鎮居民分組數多于《中國統計年鑒》。但是《中國城市(鎮)生活與價格年鑒》從2006年才正式出版。然而,目前公開出版的居民收入數據都是在原始住戶調查數據的基礎上重新按收入進行分組而得到的數據。

《中國統計年鑒》是估計我國居民收入基尼系數最主要的數據源,特別是在2000年以前沒有住戶調查年鑒的情況下。例如陳宗勝和周云波(陳宗勝,1999;陳宗勝和周云波,2002)就是以《中國統計年鑒》為基礎并對其重新加工。但是《中國統計年鑒》中有關居民收入的數據遭到了廣泛的質疑。Khan和Riskin(2001)認為《中國統計年鑒》提供的收入數據過于集中,從而影響了對收入不平等的深入分析。Fang、Zhang和Fan(2002)也認為過于集中的分組數據忽略了組內數據的差異,因此不夠精確。如1996年《中國統計年鑒》提供的農村住戶收入數據,人均年純收入超過2000元的農村家庭占樣本總數的38.4%,統計年鑒沒有對這些農村中高收入家庭的收入進一步分組;2007年《中國統計年鑒》提供的農村住戶收入數據,人均年純收入超過5000元的農村家庭占樣本總數的30.94%,統計年鑒也沒有對這些農村中高收入家庭的收入進一步分組。所以,根據《中國統計年鑒》提供的數據我們只能計算出組間的收入差距,而組內的收入差距沒辦法計算,所以最終的結果必定被低估。

由于需要大量和復雜的統計調查,個人或非統計部門很難得到連續的有關我國居民收入的第一手數據。如果可以進入原始的住戶調查數據源,利用(1)式就可以迅速準確地計算出我國居民收入的基尼系數。而在目前數據源的條件下,準確地計算中國基尼系數還需要克服很多技術問題。雖然大家都清楚目前居民收入的分組數據會導致基尼系數被低估,但是尚未發現相關文獻對此給予實證的分析。另外,我們知道統計年鑒不可能提供原始的住戶收入數據,但是分組數據太少如目前的5分組或7分組又不利于分析居民的收入差距。所以本文關注的是:樣本收入分組數與準確測算基尼系數的關系,與此問題相聯系的另一個問題是分組數多少才能比較準確地估計基尼系數。

1 分組數據對基尼系數測算的影響

這里表示不同群體之間的基尼系數;Gi表示第i個群體內部的基尼系數;第i個群體的收入占總收入的比重為Ii,第i個群體的人口占全體人口的比重為Pi;G(f)大小取決于各個分組之間收入分布的重疊程度,只有當分組之間的收入分布完全不重疊時,該項才會等于零(Mookherjee和Shorrocks,1982;Shorrocks和 Wan,2005)。(2)式可以解釋為什么運用統計年鑒的數據會低估基尼系數。《中國統計年鑒》提供的城鎮和農村居民收入分組是按從低到高排序的,因此在計算城鎮內部和農村內部的基尼系數時G(f)為零,但是利用《中國統計年鑒》測算城鎮內部和農村內部的基尼系數時,沒有辦法計算各收入分組的組內收入差距,相當于省略了(2)式中的

本文利用分解基尼系數的方法來解釋分組數據對基尼系數測算的影響。從不同的收入來源來分解基尼系數已為大家所熟知,而從不同的收入組來分解基尼系數相對來說則比較困難。最早從事該領域研究的是Bhattacharya和Mahalanobis(1967)。簡言之,全體居民的基尼系數可以分解為:所以最終的結果必定被低估。

如果所有居民的收入按從低到高排列,則(2)式中G(f)=0,那么全體居民收入的基尼系數為:

如果所有居民的收入按從低到高排列,并且按人口平均分為兩組,那么兩組間居民收入的基尼系數為:

如果按人口平均分為四組,組間居民收入的基尼系數為:

(5)式中與(4)式中相同,(5)式相當于首先把全體居民按人口平均分成兩組計算出兩組間的基尼系數(),然后再分別計算兩組組內的基尼系數

如果按人口平均分為八組,組間居民收入的基尼系數為:

如果按人口平均分為2n(n為正的偶數)組,組間居民收入的基尼系數為:

(8)式表明如果按人口平均分組,分組數每增加一倍引起的全體居民基尼系數的增加數至少以2的負1次方衰減,即隨分組數的增加全體居民基尼系數也會增加,但是增幅呈收斂態勢。

如果我們設定可接受的測算誤差,我們就可以確定分組數的下限,如:如果樣本為16等分組,基尼系數的計算誤差一定小于7%(即1 24);32等分組,計算誤差一定小于4%;64等分組,計算誤差一定小于2%;128等分組,計算誤差一定小于1%。這些誤差結果都是理論上極限值,實際的誤差會大大小于這些誤差的上限。

2 分組數對測算基尼系數的影響的實證分析

2.1 收入分布函數的確定

為了研究分組數對最終測算結果的影響,我們通過擬合2004~2006年年我國城鎮和農村居民的收入分布來觀察來分組數的影響。在擬合居民收入分布之前,需要知道居民收入服從何種類型的分布函數。Slevn(1959)認為同類的群體,如農村居民,他們的收入分布可以很好地由對數正態分布(log-normal)來描述。Balintfy和Goodman(1973)強調收入分布是由一種特殊的隨機過程產生的,對數正態分布可以很好地解釋它。從實證的結果來看,世界銀行在2006年的研究中(Lopez和Servén,2006)利用近40年包括發達國家和發展中國家的收入數據證明了收入分布服從對數正態分布。Souma(2000)通過對日本居民從1887年至1998年收入的研究,指出對數正態分布是居民收入分布的普遍結構(universal structure)。由于我國是一個典型的二元社會,城鄉收入差距巨大,因此全體居民的收入分布與“啞鈴型”類似。但是如果我們分別來考察城鎮居民和農村居民的收入分布,我們不難發現它們仍服從服從對數正態分布。

假設城鎮居民收入xi(i=12,…,n)為獨立同分布隨機變量,服從參數為μ和δ的對數正態分布,其密度函數為:

設μ和δ分別是對數正態分布的均值與方差(參見上式),洪興建、李金昌(2006)已證明對收入變量x而言,若Lnx~N(μ,δ2),則基尼系數

根據(10)式,對任意δ,通過標準正態分布函數表能方便地計算出基尼系數。這里我們反其道而行之,利用國家統計局提供的城鎮內部和農村內部的基尼系數和城鄉居民的人均收入去找對應的μ和δ。由于Y=exp(μ+δ22),這里Y為已知的城鎮或農村居民的平均收入,可以得到(11)式:

國家統計局城市社會經濟調查總隊和農村社會經濟調查司提供了2004年到2006年城市內部和農村內部的基尼系數。我們利用Matlab編寫的軟件能在輸入城鎮內部和農村內部基尼系數后,直接計算出對應的δ值并且精確到小數點后4位。有了δ值和已知的城鎮和農村居民平均收入(Y),根據(11)式可測算出μ。這樣就可以得到從2004年到2006年農村居民和城鎮居民收入的分布函數。接下來利用Matlab生成服從參數為μ和δ的對數正態分布的隨機數,這些隨機數就代表了單個居民的收入,可以近似地擬合真實的居民收入數據。在我們的實際計算中,運用Matlab生成的服從對數正態分布的隨機數共計10000個,根據(1)式我們計算了在各種分組條件下城鎮居民和農村居民收入的基尼系數。

在計算全國居民的基尼系數時,我們按城鄉實際的人口數量來控制隨機數的比率,隨機數也是10000個。由于我們的目的不是為了準確測算全國居民的基尼系數,而是為了得到服從一定分布規律的隨機數,我們只利用一次計算所生成的隨機數。在另一項測算全國居民收入的基尼系數研究中,我們采用的是模擬100次結果的平均數。

除了上述方法,還可以通過“EM兩步法”來估計參數μ和δ(鄧明、楊藝,2004)。利用(11)式來測算μ和δ必須知道樣本的平均收入和基尼系數,而運用“EM兩步法”的前提是必須知道樣本的分組數據,并且分組數不能太少,否則會影響最終結果。“EM兩步法”是一種迭代方法,該方法主要用來求后驗分布的眾數(即最大似然估計),它的每次迭代由兩步組成:E步(求期望)和M步(極大化)。記θ為未知參數,將上述E步和M步進行迭代直至‖θi+1-θi‖充分小時停止。該算法的最大優點是簡單和穩定。

2.2 測算結果

根據(11)式,我們利用國家統計局城市社會經濟調查總隊和農村社會經濟調查司提供了2004年到2006年城市內部和農村內部的基尼系數,得到了2004年至2006年我國城鎮人口和農村居民收入分布的主要參數(見表1)。

表1 2004年至2006年城鄉居民收入的主要參數

表2 不同分組數的城鄉居民收入的基尼系數

根據表1,利用生成隨即數的辦法得到各有10000個樣本的城鎮居民和農村居民的收入數據,然后分別把樣本等分成2組、4組、8組、16組、20組、40組、80組、200組和1000組,利用我們編制的程序分別計算了不同分組的組間基尼系數。表2是的計算結果。

式(8)表明基尼系數收斂速度與分組數之間的關系,我們列出了由于分組數增加導致的基尼系數增加的上限,而實際基尼系數的增幅應比較小。表2顯示從2004年至2006年隨分組數的增加,城鎮居民和農村居民收入的基尼系數也在增加,但是收斂的速度更快。兩分組得到的基尼系數占全體居民基尼系數的比重為2/3強;16分組得到的基尼系數占全體居民基尼系數的比重為99%;20分組得到的基尼系數占全體居民基尼系數的比重超過99%。如果以1%的誤差為標準,16等分組或20等分組得到的基尼系數基本上能夠反映全體城鎮居民或農村居民收入的基尼系數。

測算全國居民的基尼系數的方法,不同于測算城鎮居民或農村居民收入的基尼系數。以計算2006年全國居民收入基尼系數為例,2006年我國城鎮居民人口比重為43.9%,根據表1中2006年城鎮居民收入分布函數的參數,生成4390個隨機數;同樣根據表1中2006年農村居民收入分布函數的參數,生成5610個隨機數。合并上述兩部分隨機數,我們就得到了2006年全國居民收入樣本,根據該樣本我們計算了各種分組情況下的基尼系數。通過表3,我們發現全國居民收入基尼系數與分組數的關系和城鄉居民收入基尼系數與分組數的關系相同。如果城鎮居民和農村居民的分組數都為16組或20組,則最終測算的全國基尼系數的誤差小于1%。不過上述的分析都是基于服從特定參數的隨即數,那么真實的情況是否也支持我們上面的分析?這里我們以2008年12月份四川省城鎮居民的統計樣本數據來檢驗分組數與基尼系數的關系,該統計樣本超過10000戶城鎮家庭。計算結果表明2008年12月份四川省城鎮居民收入的基尼系數為0.3421。在按收入從低到高排列四川省城鎮居民收入數據后,我們仍然把樣本按人口等分成2組、4組、8組、16組、20組、40組、80組、200組和1000組來分別計算相應的基尼系數。計算結果和基于服從特定參數的隨即數得到的基尼系數基本一致,兩分組得到的基尼系數占全體居民基尼系數的比重大約為2/3;16分組得到的基尼系數占全體居民基尼系數的比重大約為99%;20分組得到的基尼系數占全體居民基尼系數的比重超過99%。

表3 不同分組數的全國居民收入的基尼系數以及四川居民收入的基尼系數

綜上所述,如果統計年鑒能夠提供按人口等分的16組或20組居民收入的數據,那么較為準確地估計相應樣本總體的基尼系數就不再是一個難題。

3 結論

我們認為目前的數據源是困擾計算我國居民收入基尼系數的根本原因。進一步,目前年鑒提供的城鎮居民和農村居民分組數據太少影響了對基尼系數的準確估計。研究表明,雖然分組的增加可以提高測算基尼系數的精度,但是基尼系數的增加幅度隨分組數的不斷提高呈快速收斂趨勢。通過實證分析,我們認為如果能夠提供16或20按人口等分組的收入數據,就可以比較準確地測算樣本總體的基尼系數。因此建議統計部門提供更為詳細的居民收入分組數據。同時我們建議為了克服數據源的限制,目前還需要從測算手段上進行突破。本文通過反推城鎮居民和農村居民收入分布函數的方法嘗試提出了測算全國居民收入基尼系數的新方法。

[1]陳宗勝.改革、發展與收入分配[M].上海:復旦大學出版社,1999.

[2]陳宗勝,周云波.再論改革與發展中的收入分配-中國發生兩極分化了嗎?[M].北京:經濟科學出版社,2002.

[3]鄧明,楊藝.基于分組數據的對數正態分布的參數估計[J].系統工程理論方法應用,2004,(6).

[4]國家統計局.中國統計年鑒[M].北京:中國統計出版社,2005~2007.

[5]國家統計局城市社會經濟調查總隊.中國城市(鎮)生活與價格年鑒[M].北京:中國統計出版社,2006~2007.

[6]洪興建,李金昌.關于基尼系數若干問題的再研究—與部分學者商榷[J].數量經濟技術經濟研究,2006,(2).

[7]李實.對基尼系數估算與分解的進一步說明[J].經濟研究,2002,(5).

[8]Balintfy,L,Goodman,S.Socio-Economic Factors in Income Inequality:A Log-Normal Hypothesis[J].Zeitschrift fiir Nationalokonomie,1973,(33).

[9]Bhattacharya,N.,Mahalanobis,B.Regional Disparities in Household Consumption in India[J].Journal of the American Statistical Association,1967,(62).

[10]Champernowne,D.,Cowell,F.Economic Inequality and Income Distribution[M].Cambridge:Cambridge University Press,1998.

[11]Khan,A.,Riskin,C.Inequality and Poverty in China in the Age of Globalisation[M].Oxford:Oxford University Press,2001.

[12]Lambert,P,Aronson,R.Inequality Decomposition Analysis and the Gini Coefficient Revisited[J].The Economic Journal,1993,(103).

猜你喜歡
農村
農村積分制治理何以成功
今日農業(2022年1期)2022-11-16 21:20:05
“煤超瘋”不消停 今冬農村取暖怎么辦
今日農業(2021年21期)2022-01-12 06:32:04
我們的新農村
我們的新農村
提高農村小學習作講評的幾點感悟
活力(2019年21期)2019-04-01 12:17:48
今日新農村
民族音樂(2018年6期)2019-01-21 09:30:04
四好農村路關注每一個人的幸福
中國公路(2017年16期)2017-10-14 01:04:28
愿多出現這樣的農村好報道
湖南農業(2017年1期)2017-03-20 14:04:48
新天新地新農村
草原歌聲(2016年2期)2016-04-23 06:26:27
農村初中留守兒童教育初探
主站蜘蛛池模板: 久久公开视频| 亚洲精品成人福利在线电影| 国产一级二级三级毛片| 中国一级特黄视频| 成人国内精品久久久久影院| 国产免费看久久久| 亚洲热线99精品视频| 亚洲无码精品在线播放 | 久久精品一卡日本电影| 欧美日韩免费在线视频| 日韩午夜福利在线观看| 日韩午夜伦| 亚洲欧美国产视频| 亚洲系列无码专区偷窥无码| 色呦呦手机在线精品| 国产三级精品三级在线观看| 国产精品视频第一专区| 欧美亚洲国产一区| 日韩欧美视频第一区在线观看| 久久精品66| 97在线视频免费观看| 日韩高清在线观看不卡一区二区| 色综合成人| av一区二区三区高清久久| 国产成人高清亚洲一区久久| 国产亚洲精品自在线| 亚洲欧美日韩综合二区三区| 日本影院一区| 国产打屁股免费区网站| 久一在线视频| 67194亚洲无码| 久久a毛片| 中国丰满人妻无码束缚啪啪| 国产黄色免费看| 麻豆精品在线| 亚洲av无码久久无遮挡| 日本不卡在线视频| 久久精品国产免费观看频道| 免费国产黄线在线观看| 亚洲第一区精品日韩在线播放| 91久久国产热精品免费| 97se亚洲综合在线韩国专区福利| 久久精品中文字幕免费| 91精品久久久久久无码人妻| 黄色国产在线| 国产产在线精品亚洲aavv| 国产无码网站在线观看| 在线免费看黄的网站| 亚洲一区二区黄色| 九色91在线视频| a网站在线观看| 91精品专区| 亚洲美女高潮久久久久久久| 成人一级免费视频| 亚洲综合色在线| 性色一区| 999国内精品久久免费视频| 亚洲制服中文字幕一区二区| 狠狠久久综合伊人不卡| av尤物免费在线观看| 国产一二三区视频| 无码中文AⅤ在线观看| 国产精品久久精品| 中文字幕第1页在线播| 全色黄大色大片免费久久老太| 久久久噜噜噜久久中文字幕色伊伊 | 午夜性刺激在线观看免费| 日日拍夜夜嗷嗷叫国产| 亚洲无码精彩视频在线观看| 国产精品99在线观看| 午夜无码一区二区三区在线app| 中文字幕在线永久在线视频2020| 无码内射在线| 精品国产自在在线在线观看| 国产精品lululu在线观看| 欧美午夜在线播放| 中文字幕亚洲乱码熟女1区2区| 农村乱人伦一区二区| 麻豆精品久久久久久久99蜜桃| 超碰色了色| 99精品久久精品| 国产福利免费视频|