江欣妍?錢夢媛?耿薇?陸美婷?熊丹丹



一、引言
21世紀以來,我國富裕階層規模擴大,財富水平不斷提升,高收入群體漸漸在社會中占據了重要地位(羅楚亮,2021)。與此同時,我國居民收入分配狀況呈現出惡化趨勢,衡量收入不平等程度的基尼系數持續攀升。國家統計局數據顯示,2017年我國居民人均可支配收入的基尼系數為0.467,超過國際認知的0.4警戒線。盡管高收入群體的重要性被廣泛認可,但學術界對其研究仍不足,高收入群體的定義、測量等基礎性問題仍存在爭議。為科學評估居民收入不平等,需要在住戶數據外完善和補充高收入人群數據。對此,國際上已經采納了多種方法,包括利用帕累托(Pareto)函數進行數據擬合、利用遺產稅數據進行逆向推導等,并取得了豐碩成果(Li等,2020)。
在我國,由于沒有建立遺產稅制度、稅務部門的納稅數據難以獲取等原因,學者們對高收入群體的研究受到極大限制。目前,全球受到COVID-19病毒沖擊的時代已經過去,這一公共衛生事件已經深刻改變了人類社會,包括居民收入差距。那么,引入高收入群體后居民收入差距到底有多大?公共衛生事件發生前后我國居民收入差距是否有所減小?對上述問題的回答至關重要。
對此,本文以近十年來的胡潤富豪榜為主要數據來源,輔以福布斯榜單,構建我國高收入群體數據庫(Top income database,簡稱TIC數據)。并以此為基礎,與我國家庭追蹤調查(CFPS)數據相拼接得到混合數據,從而分析我國2014—2020年基尼系數的變化情況,并探究公共衛生事件前后的變化趨勢。相較于已有文獻,本文有以下邊際貢獻。首先,現有文獻中關于我國高收入群體的研究缺乏微觀數據,所得結論存在局限性。本文構建的TIC數據庫,為本領域的研究提供更為全面的數據基礎;其次,本文運用統計學模型將兩類數據拼接,基本繪制出我國居民收入的全景圖;最后,比較分析公共衛生事件發生前后我國基尼系數的變化情況,為相關收入分配政策的制定和調整奠定現實基礎。
本文第二部分是文獻綜述,對相關文獻進行整理與分析;第三部分簡要介紹住戶數據與高收入群體數據;第四部分引入高收入群體后再次估算基尼系數,介紹研究方法以及數據拼接方法;第五部分是結論分析與政策建議。
二、文獻綜述
(一)高收入群體的相關研究
李實(2015)根據高收入人群的帕累托分布參數,對其收入進行估計,在此基礎上得到新的基尼系數,研究結果發現高收入人群的收入樣本偏差使收入差距被嚴重低估。榮慧娟等(2022)基于2013年和2018年住戶數據和高收入群體數據庫,發現在引入高收入群體數據前,我國居民收入呈現多極化特點,引入高收入群體數據后,收入極化程度明顯提高。Matthias等(2023)利用德國統計局的信息發現,女性在高收入群體中的代表性嚴重不足;相較于低收入人群,高收入人群中高學歷的人數更多。
(二)收入差距變化的相關研究
靳永愛和謝宇(2015)利用CFPS數據估算出2012年我國家庭凈財產基尼系數為0.73。Piketty等(2019)研究了1978-2015年我國收入分配和財富積累狀況,向上修正了官方不平等的估計,發現我國不平等程度不斷加劇。李實(2020)研究發現2008年以后我國收入差距呈小幅度下降趨勢,我國已經跨過了“倒U型”拐點。羅楚亮(2021)利用2013-2018年度住戶調查數據研究發現,我國居民收入差距近十年來處于比較穩定的水平。
盡管上述研究意識到高收入群體的重要性,但由于數據所限并未深入展開研究,科學評估我國居民收入不平等仍任重而道遠。
三、數據介紹
為探究公共衛生事件發生前后我國居民收入變化情況,本文選取2014、2016、2018、2020年高收入群體數據(TIC數據)以及住戶數據(CFPS數據)進行研究。
(一)高收入人群數據
本文采用2014-2020年胡潤富豪榜和福布斯富豪榜數據,輔以多年數據進行推理與插補,使處理過程更具說服力和延續性。值得注意的是,富豪榜給出的僅為富豪家族總資產,本文通過手動檢索和數據抓取等形式確定富豪家族人數,將富豪家族總資產除以家族人口規模,得到家族人均資產。參照李實和羅楚亮(2011)的處理思路,按照5%的資產回報率將人均資產折算為人均收入,得到高收入群體樣本數據。
表1詳細描述了兩榜高收入人群內部收入分布情況。統計結果顯示,兩榜富豪的收入普遍超過2000萬元,而低于100萬元的人數較為稀少。2014—2020年高收入人群的收入水平呈現上升趨勢,年收入超過1億元的人數逐年增加。
(二)住戶數據
我國家庭追蹤調查(CFPS)是一項全國性、大規模、多學科的固定樣本追蹤調查項目,旨在滿足我國社會變遷、家庭結構等方面的深入研究需求。本文選擇家庭人均年收入作為指標,去除空缺值和負值,得到我國居民收入的樣本數據。由表2可知,2014-2020年我國居民的人均家庭收入不斷上升,反映出我國經濟持續發展,人民生活水平不斷提高。
四、引入高收入群體后基尼系數的估算
(一)研究方法
TIC數據存在加權和未加權兩種情形,加權數據更能代表我國高收入群體的相關特征。將兩榜富豪數據加權后繪制對數收入的核密度曲線。以2018和2020年為例,由下圖可知,富豪榜數據的核密度函數圖呈現拖尾趨勢,在某種意義上近似服從帕累托分布。
帕累托分布是一種用來描述不均衡分布的概率分布模型,在經濟學中,常被用來解釋財富分配的不均衡現象。本文運用帕累托模型將CFPS數據與TIC數據進行拼接并修正基尼系數。參考Clauset等(2009)與Jenkins(2017)提出的方法,利用軟件得出2014-2020年各年財富拼接值,如表3所示。
(二)混合數據的建立
在建立模型的過程中,確定符合帕累托分布的樣本較為關鍵。經過帕累托函數模擬,發現只有達到門檻值的數據能夠真正滿足帕累托分布。因此,小于門檻值的TIC數據不符合帕累托分布,存在低估現象。為確保數據的準確性,將TIC數據中小于門檻值的數據剔除。對于門檻值及以上的TIC數據,通過估算帕累托分布中的參數值,確定CFPS數據中服從同一分布的具體數值,即CFPS數據與TIC數據的拼接點。然而,TIC數據中處于CFPS數據的最大值與門檻值之間的數據并不符合帕累托分布。針對這一部分數據,本文選擇以帕累托模型進行擬合,以完成數據的完美連接。整合后的數據共分為四段,涵蓋了我國不同收入層次的收入分布特征,具體構成如表4所示。
(三)基于門檻值修正基尼系數
根據李實和羅楚亮(2011)的介紹,本文通過帕累托模型計算出引入高收入人群數據后的基尼系數,計算結果見表5。
由表5可知,混合數據的計算結果遠遠高于CFPS數據的計算結果,其反映出以往住戶數據對高收入群體的代表性存在嚴重不足。縱觀4年數據,CFPS數據2014-2020年逐年上升,基尼系數由0.521升至0.543,這表明隨著我國經濟發展,居民收入不斷提升,內部收入差距有所增加。而基于TIC數據的計算值逐年降低,由0.802降至0.775,說明我國高收入群體間的收入差距較為懸殊,后續有所下降但仍保持較高水平。引入高收入人群數據后修正了我國居民收入基尼系數,計算結果逐年降低,體現了我國居民總體收入差距有所改善,并且存在繼續減小的趨勢。
重點研究2018-2020年,基尼系數CFPS數據增長0.009,反映出經過公共衛生事件后,我國中低收入人群內部收入不均程度有所加劇。而基尼系數TIC數據降低0.012,降幅為幾年中最大,這體現了公共衛生事件對高收入人群沖擊較大。將CFPS數據與TIC數據混合后的計算值減小0.001,表明公共衛生事件后我國居民總體收入差距仍有所減小,但增速有所減緩。
五、結論分析與政策建議
本文以TIC數據庫中2014-2020年胡潤百富榜和福布斯富豪榜富豪數據為基礎,運用統計學模型將其與CFPS數據進行有效拼接,以修正基尼系數,得出以下主要結論:
首先,通過研究TIC數據,本文發現富豪之間同樣存在較大收入差距。
其次,運用帕累托模型建立混合數據并修正基尼系數。結果顯示,混合數據計算值高于CFPS數據計算值,體現了引入高收入樣本的重要性。同時2014—2020年混合數據的基尼系數逐年下降,體現了我國居民總體收入差距不斷減小。
最后,重點研究2018-2020年的數據,發現CFPS數據與混合數據計算值之間的差距越來越小,表明在經歷公共衛生事件、應對挑戰時,我國采取的經濟和社會保障措施對于縮小收入差距起到了積極作用。
結合我國國情,本文提出以下政策建議:
首先,加強收入再分配。通過稅收制度改革,適當提高高收入者的稅收負擔,增加對低收入群體的稅收減免和福利補貼,實現收入的再分配。
其次,推動教育公平,為低收入群體提供公平的教育機會與教育資源。同時,加強職業教育和技能培訓,提高勞動者的就業能力和競爭力。
最后,促進就業創業。加大對中小企業的支持力度,提供更多的就業機會。通過鼓勵創新創業和發展新興產業,減少就業壓力和收入差距。
(作者單位:南京財經大學)
作者簡介:江欣妍,2003年9月出生,女,漢族,江蘇南京人,南京財經大學在讀。研究方向:居民收入差距。
基金項目:2023年江蘇省大學生創新創業訓練計劃項目“中國高收入群體數據庫建設第IV期——疫情之后的再審視”(202310327004Z)。