周燕芳 劉小瑜
教育一直以來都是人力資本中的重要因素。利用CFPS2016家庭和個人數據庫,依據家庭平均受教育年限將所有家庭分為五個教育等級并進行人均純收入顯著性檢驗和收入不平等描述,基于收入決定方程Shapley值分解法測算家庭特征對收入不平等的貢獻率,結果表明:收入不平等與家庭教育等級之間存在W型關系;城鄉差異是導致收入不平等的最主要原因,且在平均受教育水平高的家庭更加突出;隨著家庭教育等級的提高,家庭平均人口數越來越少,對收入不平等的貢獻率越來越高,擁有家庭凈資產的貢獻率越來越低,戶主健康狀況的貢獻率也較為突出;教育等級越高的家庭平均年齡越大,婚姻狀況對其收入不平等的貢獻越突出。因此,應推廣高職教育,推動城鎮化建設并鼓勵教育人才投身農村,給予老弱家庭相應補貼,提高高等級人才幸福指數以縮小家庭收入不平等差距。
教育作為重要的人力資本投入要素一直備受學者們關注,無論是其對經濟增長的作用,還是對收入分配的影響都是研究的熱點。早期的人力資本理論都認為教育是最重要的人力資本積累,對收入分配起著重要的作用。關于教育與收入不平等的關系主要歸納為以下四種:
第一種觀點認為教育發展與收入不平等呈負相關關系,教育的發展可以有效減小收入不平等。如國外學者Becker &Chiswick利用美國、加拿大、墨西哥等國數據進行實證檢驗證明了教育水平的提高可以減少收入不平等。[1]Gregorio &Lee利用全球100多個國家的面板數據進行研究表明教育水平的提升和教育投資的均衡化可以顯著改善收入不平等。[2]國內學者李明芳認為教育總體水平的提高可以降低基尼系數從而改善收入不平等。[3][4]卜振興運用分位數回歸模型和非結構化模型均證明了高等教育的發展可以減少收入不平等。[5][6]陳晨和仲偉周運用我國1979-2006年省級面板數據進行方差分解后認為不同級別的教育投入對縮小收入不平等的平均貢獻率達到11.9%。[7]
第二種觀點認為教育發展與收入不平等呈正相關關系,教育的發展會加劇收入不平等。如Stiglitz[8]運用篩選理論證明了教育會加大收入不平等。Harmon[9]、Fersterer &Winterenmer[10]、Martins &Pereira[11]都認為高收入群體擁有比低收入群體更高的教育收益率,教育擴展會導致個體間收入差距擴大。薛進軍和高曉淳通過對我國住戶調查數據的實證分析表明,教育水平的提高擴大了收入不平等的差距。[12]李祥云等運用21個省級面板數據構建誤差修正模型發現公共教育支出無論從長期還是短期來看均加劇了收入不平等。[13]
第三種觀點認為教育發展與收入不平等之間的關系是非線性的。Giustinelli利用意大利的數據發現,教育收益與收入的非線性關系類似于“正U型”的曲線。[14]我國很多學者認為教育發展與收入不平等之間呈“倒U型”關系,例如賴德勝[15]、周金燕和鐘宇平[16]、王靜和霍學喜[17]、習明明和張進銘[18]都證明了教育與收入不平等的“倒U型”關系。韓雪峰不僅證明了高等教育與收入不平等之間呈“倒U型”,而且認為我國已經跨越了“倒U型”的峰值,處于曲線的右側,教育的發展會縮小收入不平等。[19]而白雪梅[20]、成謝軍[21]、李祥云[22]等人卻認為我國目前處于“倒U型”曲線的左側。
第四種觀點認為教育發展與收入不平等之間的關系是不確定的或者并不顯著的。Morduch &Sicular以山東省鄒平縣農村調查數據為例研究發現,當以基尼系數和變異系數衡量收入差距時,教育擴大了收入差距,而以泰爾指數作為收入差距衡量指標時,則縮小了收入差距。[23]候玉娜和易全勇利用文獻綜述的方法基于不同的研究視角發現,經濟視角上教育發展具有改善收入不平等差距的作用,社會學視角上教育發展無法改善收入不平等狀況。[24]鄭猛利用2014年云南省流動人口數據實證發現盡管教育擴張能夠提升收入整體水平,但并不能有效改善收入不平等,最終將導致“均值高、方差大”的“二元分配格局”。[25]石大千和張哲誠從微觀層面基于環境——努力二分法解構教育不平等,發現教育機會不平等顯著擴大了收入差距,教育努力不平等顯著縮小了收入差距,由于教育機會不平等和教育努力不平等的反向作用,總體教育不平等對收入差距的影響不再顯著。[26]
綜上可知,研究的方法、時期、指標和角度不同都會導致完全不同甚至相悖的結論。針對國內的研究來看,大多數學者選用的數據較早期,其次是分析方法大多采用回歸分析的方法,分析時一方面很少從家庭特征的角度進行深入研究,另一方面大多從較早時期個人數據的角度來研究教育與收入的關系,而極少從家庭的角度來研究;再次鮮有學者將家庭教育水平進行等級劃分后再進行分解和因素分析。本文選取CFPS2016數據,將所有家庭按平均受教育年限劃分為不同的教育等級,對家庭教育等級與家庭收入不平等之間的關系進行檢驗,并進一步通過因素分解來探析不同教育等級家庭中導致收入不平等的各種家庭特征的貢獻。本文研究特色主要體現在三個方面:一是以家庭為研究單位,并按家庭的受教育年限劃分等級,分析各教育等級家庭收入不平等的變化,發現其變化與現有研究結論存在差異;二是利用shapley值法就不同教育等級家庭分解其家庭特征因素對家庭收入不平等的貢獻程度;三是結合各家庭特征因素的變化及其貢獻率發現不同教育等級家庭存在收入不平等的原因。
CFPS2016數據來源于北京大學開放研究數據平臺中的中國家庭追蹤調查(CFPS),該項目是由北京大學中國社會科學調查中心設計并實施的一項全國性家庭跟蹤調查計劃,CFPS基線調查樣本覆蓋全國25個省市161個區縣的649個村居樣本,其中抽取1.5萬個家戶樣本及其樣本家戶中的全部家庭成員,該調查以2010年為基線調查,其后每兩年對調查對象進行一次追蹤訪問。目前最新的調查數據是CFPS2018年的調查結果,但是官網上2018年的家庭成員樣本不完整,導致很多變量無法計算,故采用樣本量最大,數據庫最完整的2016年數據進行分析,2016年的調查數據中有14019戶家庭樣本,共計58179個家庭成員樣本。
本文采用了CFPS2016數據中的家庭成員數據庫和家庭經濟數據庫。利用stata統計分析軟件進行數據整理和分析,根據家庭成員樣本數據集中的個人出生年份計算出每位家庭成員的年齡,將每位家庭成員的個人最高學歷轉換為相應的受教育年限(文盲/半文盲為0年,小學為6年,初中為9年,高中/中專/技校為12年,大專為15年,大學本科為16年,碩士為19年,博士為22年),刪除與家庭經濟上不是一家人的樣本以及非在家住基因成員①,計算家庭總人口數、家庭平均年齡和平均受教育年限,與家庭經濟樣本數據集合。為了更好地反應戶主情況(最主要的家庭收入來源者),刪除非最適合人員回答問卷的家庭。為了更真實地反應收入的變化情況,本文選擇調整后可對比的各項收入進行研究,刪除收入缺失值樣本,刪除各收入來源之和與全部家庭純收入不相等的樣本,刪除家庭特征缺失樣本,最后得到7629個家庭樣本。
為了檢驗家庭受教育水平是否會顯著影響家庭收入,將所有樣本家庭依據家庭平均受教育年限劃分為5級,即1級(6年以下,占23.1%)、2級(6—9年,占27.5%)、3級(9—12年,占24.8%)、4級(12—15年,占15.7%)、5級(15年以上,占8.9%)以便更準確地檢驗各級家庭之間的收入差異。
選取家庭人均純收入作為檢驗變量以說明不同教育等級家庭之間的收入是否有顯著差異,并運用Herve M.CACI編寫的宏命令Kwallis2進行非參數檢驗,這個命令是一段專門針對從不同人群中抽取的獨立樣本進行兩兩比較和檢驗的程序,它提供了多組兩兩比較的秩和檢驗結果,既包含單因素分析和K-W檢驗的作用,又克服了不能滿足參數檢驗數理條件的缺陷,對總體分布類型不做任何要求,不受總體參數的影響,可以應用于任何類型的資料。從表1的檢驗結果可以發現,所有組之間的P值都遠小于0.05,即拒絕了沒有顯著差異的原假設,各教育等級家庭之間人均純收入都存在著顯著差異,說明教育是影響家庭收入不平等的重要因素。

表1 2016年我國不同教育等級家庭人均純收入差異顯著性檢驗結果
目前,國際上通用的測量收入不平等的指標仍然是基尼系數。本文對5個不同教育等級家庭組分別計算家庭純收入均值和家庭人均純收入均值,并分別依據家庭純收入和家庭人均純收入計算基尼系數見表2,從表2的結果發現隨著家庭教育等級的上升,家庭純收入均值先上升后下降,3級家庭純收入水平最高,而家庭人均純收入則隨著家庭受教育等級的提高不斷上升。繪制家庭教育等級與收入不平等的關系圖,如圖1所示,可以發現家庭人均純收入表現出來的收入不平等與家庭純收入表現的收入不平等形狀極為相似,都表現出“W”形的起伏變化,教育等級最低的1級家庭組和最高的5級家庭組均表現出較大的收入不平等,基尼系數均在0.5以上,其次是3級的家庭組收入不平等程度略低一點,2級和4級家庭組的收入不平等程度都較低。可見家庭教育等級與收入不平等之間并不是簡單的線性關系,家庭教育等級高到一定水平以后,收入不平等又會增大。

表2 2016年我國不同教育等級家庭收入不平等情況

圖1 不同教育等級家庭的收入差距變化
Shapley值分解法的步驟是:(1)構建收入決定方程,找出影響家庭收入的顯著變量。(2)對收入決定方程中通過檢驗的變量進行Shapley值分解,計算出各顯著變量對家庭收入不平等的貢獻率。Shapley值法有基于回歸預測的分解(Fields,2003)[27]和基于擬合優度的分解(Wan,2004)[28],本文采用基于擬合優度的Shapley值分解方法,在包含該自變量的組合回歸模型中測算R2,然后剔除該自變量以觀察R2的變化,R2減少的程度與該變量的邊際貢獻成正比,R2減少越多,該自變量對因變量變異的貢獻率越大。
設定自變量集合K={xj},假設θ是自變量的一組排列,而θ(j)表示變量在θ中的位置,因此在排列θ中,任一其他變量xj對于擬合優度的改變程度可用式(1)計算:

其中,MC(xj,θ)是變量xj在θ中的臨界貢獻,f[P(θ,xj)∪{xj}]表示xj取實際值時造成的收入差異,f[P(θ,xj)]表示xj取均值時造成的收入差異。
將Θ(K)作為K的所有組合排序,計算xj的Shapley值為:


表3 變量定義及其描述性統計
學者們研究收入不平等家庭特征時,通常會從家庭人力資本角度來考慮對收入的影響因素,而各項家庭特征往往與其收入狀況息息相關,其中主要包括家庭的總人口數,平均年齡,主要收入者性別、身體健康狀況及婚姻狀態(用戶主的性別、健康狀況和婚姻狀態代表),這些代表了一個家庭的勞動能力,另外家庭擁有的凈資產、城鄉分類和家庭所在地區也是導致家庭收入不平等非常重要的因素。[29][30]本文將戶主的婚姻類型統一歸為三類,未婚、在婚和其他(包含了同居、離婚和喪偶),設置兩個虛擬變量mar1和mar2。由于數據中省份太多,本文將其統一按東部、中部和西部進行劃分,設置兩個虛擬變量region1和region2。因變量則選擇可以更好地代表個體收入情況的家庭人均純收入,并對其取對數以便更加平穩。對各變量進行描述結果見表3。
對所有的自變量按家庭教育等級統計其均值,結果見表4,可以發現,隨著家庭教育等級的提高,戶主健康狀況越來越好,家庭在東部地區的比例越來越高。除1級家庭外,其余四個等級家庭組隨著家庭教育等級的提升,家庭人口數均值越來越小,平均年齡越來越大,在婚比例越來越低,其他婚姻狀況的比例越來越高。

表4 2016年我國不同教育等級家庭特征等自變量均值描述
根據明瑟收入方程,構建家庭人均純收入的半對數收入決定方程為:

針對不同教育等級家庭將各變量代入方程計算參數,并做顯著性檢驗,將年齡和年齡的平方作為組合變量。自變量與因變量的相關性越強,則對家庭人均純收入差距的貢獻就會越大,相反則越小。采用逐步回歸法剔除掉表現不顯著的變量,最終的收入決定方程結果見表5。對全部家庭進行逐步回歸,發現家庭人均純收入與所有變量均表現出顯著的相關關系,但是當我們將其按照不同教育等級分類進行回歸的時候,各自變量卻表現出了差異:1級家庭組的家庭人均純收入與家庭人口數呈負相關關系,與戶主健康狀況、家庭凈資產、城鄉分類及家庭所在地區呈正相關;2級家庭組的家庭人均純收入與家庭人口數呈負相關,與家庭平均年齡、戶主健康狀況、家庭凈資產、城鄉分類及家庭所在地區呈正相關;3級家庭組的家庭人均純收入與家庭人口數、戶主婚姻狀況呈負相關,與家庭平均年齡、戶主健康狀況、戶主性別、家庭凈資產、城鄉分類及家庭所在地是否在東部地區呈正相關;4級家庭組的家庭人均純收入與家庭人口數、戶主婚姻狀況呈負相關,與戶主健康狀況、家庭凈資產、城鄉分類及家庭所在地是否在東部地區呈正相關;5級家庭組的家庭人均純收入與家庭人口數、家庭平均年齡、是否為其他婚姻狀況和家庭所在地是否在中部地區呈負相關,與戶主健康狀態、家庭凈資產、城鄉分類呈正相關。

表5 收入決定方程逐步回歸結果
根據表5顯示的全部家庭及各教育等級家庭的顯著影響因素,基于收入決定方程用Shapley值法分解全部家庭及各教育等級家庭中顯著特征因素對收入不平等的貢獻,結果見表6。
從表6可知,不進行分類時,所有特征因素對全部家庭人均純收入不平等的共同貢獻率為26.947%,其中城鄉分類的貢獻率最大為7.65%,說明我國城鄉二元化非常明顯,是影響收入不平等的重要因素。教育的貢獻率其次,為6.684%,由此可見教育是造成家庭收入不平等的非常重要原因之一。戶主的健康狀況和家庭人口數對收入不平等的貢獻率都在3%以上,家庭所在地區是否在東部地區的貢獻率達到2.066%,家庭凈資產的貢獻率為1.879%,家庭平均年齡、戶主性別、家庭所在地區是否在中部地區和戶主婚姻狀態的貢獻率則較低,都在1%及以下。固定各家庭教育等級,對家庭按各教育等級分別進行分解后發現,前四級家庭組所有因素的共同貢獻都大幅度下降了,可見教育水平越低的家庭,教育對其收入的影響越大。5級家庭組所有因素的共同貢獻率高達37.375%,說明當家庭教育等級提升到一定程度時,家庭特征因素對收入不平等的貢獻越來越大。

表6 基于收入決定方程的Shapley值法分解結果 單位:%
結合表4中各級家庭的特征表現和表6中各特征對收入不平等的貢獻率,可以發現各教育等級家庭特征對收入不平等貢獻率的變化特點是:城鄉分類在各教育等級家庭中的貢獻率都是最高的;從教育等級2開始,隨著教育等級的提升,家庭人口數的貢獻率越來越高;各教育等級家庭的戶主健康狀況越來越好,其貢獻率也較為突出,尤其是5級家庭組的貢獻率較高;東部地區家庭占比越來越高,家庭是否在東部地區對1-4級家庭均有較大的貢獻率;家庭凈資產對各教育等級家庭收入不平等的貢獻率逐漸下降;地區差異在各教育等級家庭組中普遍存在且貢獻率變化幅度不大。
1級家庭組中,教育水平最低,農村家庭占比最高,家庭凈資產遠低于社會平均水平,戶主健康狀況最差,家庭人口數較多,是否擁有一定的家庭凈資產對家庭收入不平等貢獻較高。2級家庭組依然大部分集中在農村,戶主健康狀況和家庭擁有凈資產都有所提高,但是仍低于社會平均水平,家庭人口數最多,婚姻狀況穩定,平均年齡最低,戶主健康狀況和家庭擁有凈資產表現出較大的貢獻率。3級家庭組相較前兩級家庭來說,農村家庭所占比重下降,但是仍以農村家庭為主,戶主健康狀況進一步提升,家庭擁有凈資產也大幅度增加,高于社會平均水平,家庭人口數均值略小了一些,平均年齡不高,除了戶主健康狀況和家庭擁有凈資產表現出一定的貢獻率外,家庭人口數表現出了較大的貢獻率,婚姻狀態開始產生一定的貢獻。4級家庭組開始進入非義務教育階段,大多接受了高等級教育,較多集中在城鎮,戶主健康狀況較好,家庭擁有的凈資產最高,除了戶主健康狀況和家庭擁有凈資產依然產生較明顯的貢獻外,家庭人口數的貢獻率較高,東部地區的貢獻率較明顯,是否在婚產生了較明顯的貢獻。5級家庭組中,受教育水平最高,基本集中了我國的教育精英和各類高等級教育人才,家庭人口數最少,平均年齡最高,戶主健康狀況最好,大多集中在東部地區,但是家庭擁有的凈資產并不高,婚姻狀況不好,在婚比例最低,其他婚姻狀況的比例最高,除了家庭凈資產這個特征因素以外,其他表現顯著的家庭特征因素的貢獻率都大幅度提高,家庭特征對這組家庭的收入不平等貢獻最大。
綜合以上表現,從外部來看,城鄉二元化是導致收入不平等的最主要因素,地區差異始終存在并導致收入不平等。從各級家庭組的內部因素來看,1級家庭組教育等級低,主要集中在農村,且家庭人口多,擁有的資產少,戶主健康水平低于社會平均健康水平,這些都是導致其家庭收入低的原因,在收入水平低的情況下凸顯了家庭擁有資產的相對不均帶來的影響,2級和3級家庭組主要集中在農村和城鎮的年輕家庭中,這兩類家庭收入水平較低,且收入不平等的一部分原因體現在孩子較多,孩子多會拉低家庭平均年齡和平均受教育水平,由于國家并沒有針對孩子多的家庭進行補貼,所以孩子多的家庭會相應地拉低家庭人均純收入,從而帶來一定的收入不平等。4級和5級家庭組屬于高等教育家庭,戶主的健康狀況對家庭的影響很大,尤其是對高學歷家庭的影響最甚,說明在高學歷家庭中戶主作為主要經濟來源的作用充分體現,且家庭婚姻狀況是否穩定對這兩組家庭產生了較明顯的貢獻,尤其在5級家庭組中,其婚姻穩定狀態明顯不如其他家庭,其他婚姻狀態帶來的影響也較顯著。
本文基于CFPS2016數據將家庭按平均受教育年限分為5級,對家庭人均純收入與家庭教育等級關系進行檢驗,然后結合家庭特征因素構建收入決定方程,并對家庭收入不平等進行shapley值分解,研究結果表明:
家庭教育等級與家庭收入差距之間呈W型關系,且兩頭高于中間,教育對家庭收入差距的作用是非線性的,整個社會的家庭平均受教育水平過低或者過高都有可能帶來收入差距的加大。目前我國整個社會的家庭平均受教育年限低于9年,還處于初中義務教育階段。這個等級的家庭人均純收入基尼系數低于社會平均基尼系數。數據分析顯示,隨著家庭受教育水平的提高進入下一個等級后,可能會面臨家庭收入差距的短期拉大。當整個社會的家庭平均受教育年限達到12-15年之間即高中到大專之間時,家庭收入差距最小。
城鄉差異是影響家庭收入不平等的最主要因素,從教育等級2開始,隨著家庭教育等級的提升,貢獻率不斷增加,地區差異在各級家庭組中較均勻地存在。受教育水平低的家庭集中在農村地區和中西部地區,結合我國教育資源分布現狀,揭示出我國教育資源和人才主要集中在城市,農村教育資源匱乏,中西部地區教育資源相對落后。
從教育等級2開始,隨著家庭教育等級的提高,家庭人口數越來越少,對收入不平等的貢獻率提高,家庭擁有凈資產的貢獻率越來越低。隨著我國進入老齡化社會,醫療條件的改善,老人壽命延長,生育政策放寬,家庭撫養比會增大,但是往往越窮的家庭反而生得越多。
對于平均受教育年限在15年以上的高級教育家庭來說,更多從事腦力勞動,精神壓力較大,例如高校教師、科研院所的工作人員等,該類家庭平均年齡最大,人口最少,婚姻狀況不穩定,這些家庭特征因素都是導致該類家庭收入不平等擴大的主要因素。
針對目前我國收入不平等的現狀,結合本文的分析結論,給出以下幾點建議:
第一,研究表明,平均教育水平處于高中至大專階段最有利于收入差距的縮小,因此,大力普及高中教育、大專教育和高職教育應是我國教育未來的主要發展方向(本科以上高校則采用精英教育的方式,重點培養高級人才),可能是今后一段時期我國縮小收入差距的舉措。高職教育作為我國未來專業技術人員的主要供應渠道應被大眾普遍接受和推廣。
第二,針對我國教育資源的分布不均、城鄉差異大、地區差異大的現狀,在加速城鎮化的同時,應多渠道提高農村居民收入,著重提高農村教學水平和質量,增加農村教育經費投入,鼓勵各類師資人才投身到農村教育中。
第三,家庭人口數帶來的撫養壓力是造成收入不平等的一個重要因素。在家庭撫養壓力不斷增大的同時,國家應給予兒童、老人更多的社會福利,對于收入特別低、孩子比較多、老人比較多的家庭,呼吁社會給予一定的幫助,政府給予相應的補貼。
第四,對于高等級教育人才和家庭應給予更多的精神關懷,創造更多的緩解精神壓力的渠道,關注腦力勞動者的身體健康和家庭婚姻的穩定,提高幸福指數。另外從現有研究來看,高等教育家庭的孩子數量很少,但其往往經濟能力充足,只是都忙于事業,國家應適當鼓勵高等教育家庭多生育孩子,這有利于收入不平等的縮小和未來人口整體素質的提高。
注釋:
①中國家庭追蹤調查中將基因成員定義為所有家庭成員及其之后的新生血緣子女或是不超過10歲的領養子女。