地區差距與中國居民收入差距（2002-2013）

2018-06-23 02:47:04羅楚亮曹思未

產業經濟評論 2018年3期

羅楚亮曹思未

一、引言

經濟轉型過程中，我國居民收入差距總體上表現出不斷擴大的趨勢。但這一現象似乎在進入新世紀以來出現了某種程度改變。國家統計局公布了2003年以來的全國收入基尼系數顯示，我國居民收入差距經歷了一個逐漸上升的過程，2008年達到頂峰，然后開始出現了持續的下降（國家統計局住戶調查辦公室，2017年，第457頁）。我國居民收入差距的研究中，通常對于前一段時期的收入差距變化特征關注得比較多。既有的研究發現，在前一時期中，收入差距總體上表現出全方位擴大的特征，城鄉之間與城鄉內部、區域之間與區域內部等人群組特征所顯示的收入差距都出現明顯的擴大趨勢。

地區差距是解釋我國收入差距變動的重要因素，其中既包含城鄉差距，也包括東中西部區域之間的差異性。就城鄉差距而言，根據國家統計局公布的城鎮和農村居民人均收入可以發現，上個世紀80年代末期以來，城鄉居民收入差距表現出持續上升傾向，2009年以后則出現了下降傾向。根據平均對數離差（MLD）或泰爾指數（Theil）可以將總體收入差距按人群組分解為組內差距和組間差距。基于中國居民收入分配課題組CHIP歷年住戶調查數據，別扭·古斯塔夫森和李實（1999）發現，城鄉之間的收入差距對總體收入差距的解釋份額從1988年的38%上升到1995年的43%，2002年達到47%（Sicular等，2007）；羅楚亮（2006，2017）的分解結果表明，城鄉差距對全國收入差距的解釋份額在1988年、1995年和2002年分別為33%、37%和40%，2007年進一步上升至46%，而2013年則下降至35%。城鄉之間收入差距的下降成為2007年至2013年期間全國收入差距下降的主要解釋因素（羅楚亮，2017）。由此可見，城鄉差距在居民總體收入差距中通常具有非常重要的地位。

區域之間的發展不平衡，是人們理解收入差距的另一個重要視角。上個世紀90年代以來，區域之間的差距持續擴大（范劍勇、朱國林，2002；李善同、許召元，2006）。為此，出現了來自不同角度的解釋，也引致了區域性的經濟發展政策，如西部大開發、振興東北等。類似地，如果采用MLD和泰爾指數分解，東中西三大區域之間的收入差距占總體收入差距的份額1988年為7.5% 1995年上升至9.3%，在這一期間略有上升；如果采用“城鄉”與“東中西”部的交叉分組，所形成的六大區域之間的收入差距占全國收入差距的份額在1988年為46.4%、1995年為45.4%（李實、趙人偉，1999）。按照國家統計局的人均可支配收入概念，東中西部區域之間的收入差距對總體收入差距的解釋份額在2007年和2013年分別為13%和8%左右（羅楚亮等，2018）。

由此可見，城鄉差距和區域差距是理解我國居民收入差距的重要維度，對居民收入差距的變動具有重要影響。本文以（CHIP）最新三輪住戶調查數據為基礎，在收入函數估計的基礎上，討論了城鄉差距和區域差距對于總體差距及其變動的解釋效應。相對于既有的研究文獻，本文的討論在以下幾個方面有所區別。在分析方法上，本文對地區效應的討論建立在收入函數回歸分析的基礎上，這不同于基于廣義熵指數的人群組分解。本文從“農村-城鎮-流動人口”和“東-中-西部”兩個維度區分全部樣本，并作為收入函數的解釋變量，以此衡量地區差距在總體差距中的解釋份額。在此基礎上，本文在收入函數中引入了教育變量，并且與地區變量做交叉乘積，這將有助于理解地區之間的教育回報差異及其對于收入不平等的影響。除了采用G·Fields分解來識別不同因素對于總體收入不平等的影響程度外，本文還采用了基于 RIF（Recentered influence function）回歸的分解思路，對于總體不平等以及高端和低端不平等（分別指 90%分位點與中位數的對數差、中位數與10%分位點的對數差）進行了分解分析，以討論地區效應、不同地區之間的教育回報差異對相應的不平等度量指標的影響程度。

本文其余部分包括，第二部分在數據描述的基礎上說明了我國收入差距的總體變動特征，第三部分簡要說明了本文所采用的G·Fields分解和基于RIF回歸的分解分析思路；第四部分是對總體收入不平等程度的G·Fields分解；第五部分是在RIF回歸的基礎上，對不同分位點上的收入增長以及不同年份的收入分布特征（包括總體不平等程度，如基尼系數和對數方差，和收入分布的高端與低端不平等）的分解結果；最后是全文的總結。

二、收入差距的總體變動特征與數據描述

本文數據來自于中國居民收入分配課題組（CHIP）最近三輪的住戶調查，即2002年、2007年和2013年數據。CHIP課題組由中外收入分配方面的研究者組成，自上個世紀80年代起已經進行了五次全國范圍的住戶抽樣調查，相應的調查年份分別為1988年、1995年、2002年、2007年和2013年。CHIP課題組設計了調查問卷，各年份的住戶調查都是在國家統計局的住戶調查部門協助下完成的，包括抽樣和現場訪談。CHIP的住戶樣本也來自于國家統計局的常規住戶調查對象。最近三輪調查的收入變量直接來自于國家統計局的過錄數據。國家統計局是以日記賬的形式搜集住戶的收入和支出信息，也就是要求被調查戶對其經濟活動以及由此所產生的收入和支出流量給予詳細的記錄①通常的住戶調查大多采取的是回顧性調查的方式搜集住戶的收入和支出信息，如要求被調查戶回顧過去一定時期中的收入和支出狀況。在被調查戶配合調查的情形下，日記賬的形式可能比回顧性調查更能得到收入的準確估計，當然，這種方式也會增加被調查戶的時間成本。。

CHIP最近的三輪調查所覆蓋的三個年份，基本上包含了官方所公布基尼系數的轉折時期。按照官方公布的結果，收入基尼系數在2008年之前呈現出逐漸上升的趨勢，而2008年之后則表現出相對穩定并有所下降的特征。這也與CHIP最近三個年份中的收入不平等變化特征是一致的。表1描述了這三個年份中的收入差距特征，2002年至2007年期間收入差距表現出擴大傾向，而在2007年至2013年期間有所縮小。表1給出了4個常見的不平等指標，包括變異系數、基尼系數、泰爾（Theil）指數和平均對數離差（MLD，mean log deviation）。這些指標的變動特征基本上都是相同的，在2002年至2007年期間有所上升，而在2007年到2013年期間則表現出下降傾向。這一特征與官方所公布的歷年基尼系數變化狀況也是類似的。按照官方的公布結果，2003年到2008年期間的基尼系數是上升的，2008年以后這種趨勢性特征有所改變，出現了較為持續的下降。表1中，基尼系數從2002年的0.449 4上升到2007年的0.466 0，然后在2013年降至0.447 5。

本文中的收入都是名義量②本文的家庭人均收入定位為全部家庭可支配收入除以家庭人口規模，其中隱含的假定是家庭收入在家庭成員內部是均等化分配的。，不同年份及省份之間沒有進行價格指數調整。無論是從2002年到2007年還是從2007年到2013年，這兩段時期中，家庭人均收入的平均水平都翻了一番，如表1所示，收入均值從2002年的4 474元上升至2007年的9 190元，2013年進一步增長至18 756元。表1還給出了某些分位點上的家庭人均收入水平，不同年份各分位點上的收入水平都出現了比較明顯的增長。這種收入增長特征也反映在圖1中。圖1為家庭人均收入對數的核密度圖，收入增長表現為不同年份對數收入核密度圖的平移。2007年對數收入的核密度曲線相對于2002年右移，而2007年對數收入核密度曲線又處于2013年的左邊。

根據不同分位點上的收入水平，可以計算得到不同分位點之間的對數收入差，這也反映了收入差距。例如，表示 90 分位點和 10 分位點之間的收入對數差，通常也反映了整個收入分布的不均等程度。而則分別表示收入分布的高端不平等和低端不平等，前者描述了收入分布90分位點與中位數的收入不平等狀況，后者描述了收入分布中位數與10分位點的收入不平等狀況。表1最后四行給出了根據分位點度量的收入分布不均等程度。在 2002 年至 2007 年期間，所度量的總體不平等變化主要是由于低端不平等造成的，而高端不平等基本不變。2007年至2013年期間，總體不平等是下降的，但高端與低端不平

等的變動方向是相反的。降低了 0.11，但有所上升，意味著在這一時期總體不平等的下降是由于高端不平等的降低所造成的。

表1 收入不平等程度

圖1 對數收入的核密度分布曲線

為了描述收入分布不同分位點上的增長特征，圖2給出了兩個時期的增長曲線，即收入分布不同分位點上的收入增長率。其中，收入增長率是以不同年份收入分布中相同分位點上的收入對數差來衡量的，如其中t表示這一時期所覆蓋的年份數，表示相應的分位點。從圖2中可以看出，不同分位點上的增長率存在著非常明顯的差異。兩個時期中，收入增長率總體上都隨著收入分布分位點的提高而呈現出倒 U型特征，即在收入分布的低端和高端人群中的收入增長率通常都會低于收入分布中間的某些分位點。所不同的是，在2002年至2007年期間，收入增長率在65%的分位點達到最高，而2007年至2013年期間，35%分位點的增長率要高于其他分位點。從兩個時期的比較來看，40%分位點以下的收入分布部分，其收入增長率在2007年至2013年期間要高于2002年至2007年期間；但40%分位點以上的收入分布部分，增長率的這種相對關系則有所改變。總體而言，比較兩個時期的收入增長曲線可以發現，2007年至2013年期間，收入分布低端人群的收入增長率會更快一些，而收入分布高端人群的收入增長率則要更低一些。收入增長分布特征的這種變化導致了收入差距的不同變動方向，即2007年至2013年期間收入不平等程度下降①也存在另一種可能，即如果住戶調查樣本中高收入人群的遺漏現象越來越嚴重，也可能導致收入分布不同分位點增長曲線的上述特征。。

圖2 收入增長曲線

圖3 各分位點城鎮和流動人口相對收入（農村=1）

三、分解方法

在收入不平等的研究中，經常采用各種分解分析方法來討論各種因素對于收入差距的影響。G·Fields分解是其中比較常用的方法之一，其基本思路是：在對數收入函數估計結果的基礎上分解出各解釋因素對總體收入對數方差的貢獻份額。若對數收入函數的回歸結果為，

則第個因素對y的對數方差的解釋份額為：

顯然，各因素對于y的對數方差的解釋份額之和等于回歸方程的R2。第個因素對y的對數方差的解釋份額，既取決于與lny在分布特征上的關聯性，也依賴于收入函數中的回歸系數，并且對于這兩種因素的影響沒有加以區分。在這一分解中，常數項對于不平等的貢獻為0。各因素對兩個時點收入差距變化的解釋份額可以通過如下方式的分解得到：

其中，分別表示時期t和時期0的不平等指標。本文只討論不同年份之間的基尼系數變化。

值得說明的是，盡管G·Fields分解可以得到在控制其他條件下，各種因素對于總體不平等的解釋份額，但這是以相關因素對收入對數方差的解釋份額來推測的，并沒有建立起各解釋因素與對數方差以外的不平等指數的直接聯系。此外，由于OLS估計給出的是各解釋變量對于總體不平等的組間效應，這意味著G·Fields分解所討論的也只是組間不平等。

Firpo，Fortin與Lemieux（2007，2009）所提出的無條件分位數回歸，通過再中心化影響函數（recentered influence function，RIF），可以將基于分布的任意統計量寫成關于解釋變量的線性函數，這些統計量包括分位點以及對數方差、基尼系數等不平等指標。在此基礎上，利用Oaxaca分解識別各種解釋因素對于相應統計量變動的解釋。相對于G·Fields分解，基于RIF回歸的FFL分解可以建立起基尼系數等不平等指數與解釋變量之間的直接聯系，并且具有更為靈活的分解形式，可以針對多種分布特征進行分解分析。

給定收入分布對于任意實值函數的影響函數（influence function）IF可以表示為：

其中為y附近的概率分布質量（mass）。再中心化的影響函數被定義為：

根據此定義如果建立與的線性回歸關系則

分位點的再中心化影響函數為：

在分布函數的基礎上，基尼系數可以表示為其中為廣義洛倫茨曲線，則基尼系數的再中心化影響函數可以表示為類似于分位點的特征，也有

對于時期t和s，對應的收入分布函數分別為與，根據Oaxaca-Blinder分解（O-B分解），不同時期的變動可以分解為：

這一等式右邊第一項為變量（稟賦）特征變動的效應，第二項為系數回報變化對給定收入分布特征的影響。既可以包含不平等測度指標，也可以包含不同分位點。

RIF分解建立起了分布特征（不平等指數）與解釋變量之間的直接聯系。在本文中，我們著重關注兩種類型分布特征的分解：一是總體不平等程度，如收入基尼系數、收入對數方差的分解；二是不同分位點上的差異分解，如收入分布低端不平等或高端不平等的變動分解。

值得注意的是，這兩種分解方法所得到的某種因素對不平等（及其變動）的解釋效應可能并不是相同的。在G·Fields分解中，所考慮的只有變量的組間效應，而在基于RIF回歸的分解中，則進一步包含了組內效應。

四、收入函數的OLS估計及總體不平等程度的G·Fields分解

G·Fields分解是以收入函數的OLS估計為基礎。表2給出了相應年份中的收入函數估計結果，其中被解釋變量為家庭人均收入對數，解釋變量包括地區變量、家庭結構和教育程度。所給出的回歸結果包括兩種類型，一是只包括地區變量的回歸結果，二是在此基礎上，加入了家庭結構特征和教育程度變量。地區變量包括兩種類型，一是根據戶籍所區分的城鎮、農村和流動人口，二是根據地理區域而劃分的東、中、西部，并且還考慮了這兩類變量的交互乘積形式。家庭結構特征包括家庭規模、勞動年齡人口占家庭總人口的比重、65歲以上人口占家庭總人口的比重以及勞動年齡人口中的性別結構。教育程度變量中包括戶主教育程度和家庭勞動力人口的平均教育年限。在教育程度變量中，還考慮了地區變量與教育程度變量之間的交叉效應，以反映不同地區之間教育回報在收入決定中的影響差異。

附表1至附表3分別給出了相應年份各解釋變量的均值特征，這也反映了相應年份的經濟結構特征。從地區結構來看，城鎮人口與流動人口的比重上升速度比較快。從2002年到2007年期間，流動人口在總人口中的比重從2.3%上升到10.9%，城鎮人口的比重則從2007年的34.7%上升到2013年的42.4%。這是對樣本進行重新加權的結果，加權的方式可以參照李實等（2018，附錄I）的說明。

教育變量通過兩種方式來反映。一是戶主教育程度。在這三個年份中，戶主教育程度在大學以上的有大幅度上升，從2002年的9.3%上升到2007年的12%，2013年進一步上升至13.6%。另一個反映教育程度的變量是家庭勞動年齡人口（年齡在16到65歲之間）平均教育年限（其中不包括戶主），其均值從2002年的8.14年上升至2007年的8.283年，2013年則快速上升至9.025年。其他家庭人口結構變量有兩個明顯特征，一是戶主年齡上升，另一個是老年人口占家庭人口的份額也在上升，從2002年的0.051上升到2013年的0.089。這種變化特征與我國的人口老齡化特征也是相一致的。

在表2的前三列中只包括了地區變量，但不難發現，回歸結果中所得到的R2是比較高的。2007年的調整R2達到0.561 2，2013年的也在0.4以上，表明地區差異在收入決定中總體上具有非常高的解釋作用。從2002年到2007年期間，調整R2有所上升，增加了6個百分點，表明地區因素對于收入不平等的影響在上升；從2007年到2013年期間，調整R2下降了16個百分點，表明收入不平等的決定中，地區因素的解釋作用有較大幅度的下降。

從收入函數的估計系數中可以看到，從2002年到2007年期間，城鎮和流動人口這兩個變量的估計系數都是在上升的，這表明城鎮和流動人口相對于農村常住人口的收入差距有所擴大，城鄉之間的收入差距在上升。但在2007年到2013年期間，這兩個變量的估計系數都在下降，城鄉之間的收入差距在縮小。從東部、中部和西部地區劃分的估計系數中可以看到，地區之間的收入差距在2002年至2007年相對比較穩定，但在2007年至2013年期間則有更為明顯的下降。城鄉與東中西部的交互項反映城鄉差距在不同區域之間具有不同的表現形式（或者區域對城鄉人群收入的不同影響）。在本文所討論的兩個時期中，這些變量的影響具有不同的變化特征。

對應于不同年份地區變量的回歸結果，表3給出了相應的G·Fields分解。從中可以看到，城鄉特征對于總體收入不平等的解釋份額從2002年的35.24%上升到2007年的42.71%，2013年則下降為31.03%。因此，在2007年前后的兩個時期中，城鄉差距對于總體不平等的解釋份額發生了重要變化。而區域以及區域與城鄉的相互項的解釋份額則表現出持續下降傾向：根據G·Fields分解結果，2002年區域對當年基尼系數的貢獻份額為 12%，“城鄉*區域”交叉項的貢獻份額為2.39%，而2013年區域以及交互項的影響分別下降至7.94%和1.21%。地理區域在總體收入不平等中的解釋份額總體上都是在下降的，這一特征可能與勞動力流動相關，即勞動力在區域間的流動性增強降低了區域因素在收入不平等中的作用。

從基尼系數變動狀況的分解來看，“城鄉”因素的貢獻份額在兩個時期都是為正的，也就是說“城鄉”因素的貢獻總是與總體收入差距的變動方向相同。無論是收入差距擴大時期還是縮小時期，城鄉差距都是收入差距變動的重要解釋因素。在2002年至2007年期間，城鄉差距的擴大主導著總體收入差距的擴大，但區域以及“城鄉*區域”交互項具有縮小總體差距的效應。在2007年至2013年期間，總體收入差距的縮小也主要是由于城鄉差距的縮小所導致的。在后一個時期中，盡管區域以及“城鄉*區域”交互項對收入不平等的貢獻符號與前一個時期相反，但由于收入差距具有不同的變動方向，因而同樣具有縮小總體收入差距的作用。

表2 收入函數的OLS回歸結果

在表2后面三列的回歸中進一步加入了家庭人口結構特征、教育以及教育與地區變量的交互項。在控制這些因素后，表2后三列中的地區變量估計系數值（或絕對值）通常要低于相應年份中沒有這些控制變量的結果，意味著前三列估計的地區因素一部分表現為家庭結構、教育等特征在地區之間的差異性。

在控制教育回報和家庭結構特征后，從估計系數的變化來看，城鎮、流動人口與農村居民之間的收入差距從2002年到2007年期間仍在擴大，但2007年至2013年期間則在縮小。2002年至2007年期間，中部、西部地區與東部地區的收入差距依然在擴大（因為估計系數顯著為負，并且系數絕對值是在增加的），但從2007年到2013年期間，這種地區之間的收入差距有所縮小。因此，地區差距（包括城鄉與東中西部）仍是收入差距變化的主導因素。

表3 基于OLS的G·Fields分解（%）

從教育程度變量的估計結果來看，戶主教育程度變量中只有大學的估計系數顯著為正，家庭勞動力平均受教育程度對家庭人均收入也具有顯著的正效應。家庭勞動力平均受教育程度越高，則家庭人均收入水平也越高，而且這一變量的估計系數在不同年份中有明顯的上升趨勢。在2002年和2007年的估計結果中，戶主為初中的相對于小學及以下的估計系數顯著為負的，這可能是因為這部分家庭主要集中在農村住戶中，而農村家庭的人均收入水平相對要更低一些。

在教育程度變量的估計結果中，一個非常值得關注的現象是地區變量與教育程度變量交叉項的估計系數通常都是顯著的。這意味著在不同地區之間，包括城鄉之間以及東中西部之間，教育的回報存在著顯著的差異性。這一現象也意味著勞動力市場在地區之間是分割的，從而導致要素回報具有顯著的地區差異性。在城鄉劃分中，城鎮與戶主教育程度的交叉項通常都是顯著為正的，意味著城鎮家庭中戶主教育程度對于家庭人均收入水平比農村家庭具有更為重要的影響。但城鎮與家庭勞動年齡人口平均教育年限的系數顯著為負，表明城鎮中家庭勞動力年齡人口教育年限對家庭收入的影響要低于農村。這是由于家庭結構特征的城鄉差異引起的，即城鎮家庭規模通常較小，因而家庭勞動年齡人口中的主要成員就是戶主，從而在戶主教育程度與勞動力教育年限之間具有更強的相關性。

從區域與教育的交互項來看，中部地區中，戶主教育程度對家庭人均收入的影響通常顯著為正，并且估計系數具有遞增傾向；而西部地區中，戶主教育程度對家庭人均收入的影響在 2007年要低于參照組。此外，在較低的教育程度中（如初中、高中），教育變量的估計系數比參照組要更高一些。

表3的G·Fields分解結果表明，當收入函數中增加家庭結構、地區變量與教育變量的交叉項以后，城鄉、區域以及兩者交叉項對于當年基尼系數的解釋份額均有所下降。但這三個地區變量對于基尼系數的貢獻份額總和由2002年的1/3上升至2007年的43%，上升了10個百分點，而到2013年又下降至32%。從對各年份基尼系數的解釋來看，2013年“教育”對收入不平等的解釋程度比以往更高。但城鄉之間的教育回報差異具有縮小收入差距的效應。G·Fields分解中，由于某因素對于總體收入差距的影響并沒有被區分為系數效應和稟賦結構效應，因此教育與城鄉變量交互項對于總體收入基尼系數的縮小效應，既表現在這一變量的系數效應，也表現在城鄉之間教育程度差異的縮小。從估計系數來看，這主要表現在城鎮、流動人口與家庭勞動力教育年限的交叉項的估計系數顯著為負，這意味著城鎮和流動人口中，家庭勞動力教育年限的回報相對低于農村。而區域與教育交叉項對于年度基尼系數的解釋作用不明顯。城鄉、區域與教育交叉項在總體收入差距中的不同解釋作用，可能與勞動力的流動特征有關系。城鄉分割是一種制度性分割，即便是從農村進入城鎮地區的勞動力，依然不能改變其戶籍特征；區域分割更傾向于地理性的分割，其特征屬性更容易隨著勞動力的跨地區流動而改變。隨著勞動力跨地區流動性的增強，區域分割在收入差距方面的決定作用也會有所下降。

從兩個年份的基尼系數變動來看，加入家庭結構和教育及其交互項后，地區變量（尤其是城鄉因素）對收入差距依然具有主導性的解釋作用，并且在兩個時期中的解釋作用都是正的，也就是說地區因素所導致的收入差距與收入差距的總體變動方向是相同的。地區收入差距的變化既主導了2002年至2007年期間的收入差距擴大傾向，也主導了2007年至2013年期間的收入差距縮小特征。“教育”因素總體上傾向于擴大收入差距，兩個時期中都是如此，而區域與教育的交互項在兩個時期中都傾向于縮小收入差距。

五、不同分位點收入增長特征及不平等程度的RIF分解

（1）不同年份收入分布各分位點回歸系數的比較

各年份收入函數無條件分位回歸結果可見表4-1至表4-3。各年份回歸結果的被解釋變量包括基尼系數、對數方差和一些分位點收入水平。以基尼系數和對數方差作為被解釋變量，給出的結果表明各種變量對于這兩個總體收入差距指標的邊際效應。在各地區變量中，“中部”和“西部”這兩個變量的系數顯著為正，也就是說這兩個地區的人口增加總體收入差距將會是上升的。而其他地區變量的估計系數通常都是顯著為負的，也就是說，人口向這些地區（如城鎮）轉移，具有縮小收入差距的效應。教育變量的估計結果在不同年份中則有所差異。如戶主教育程度在不同年份的估計結果中都是顯著為正的，表明戶主教育程度具有擴大收入差距的效應。但家庭中勞動年齡人口的平均教育年限則在不同年份中有所差異，如2002年這一變量的估計系數是不顯著的，但2007年和2013年的估計結果中這一變量的估計系數顯著為負，即具有縮小收入差距的效應。教育變量與地區變量的交叉項對于收入差距估計結果通常也都具有顯著的效應。總體而言，“城鎮”、“流動”與教育變量交叉項的估計系數通常是顯著為正的，即城鎮與流動人口教育程度上升具有擴大收入差距的效應；而“中部”、“西部”與教育變量交叉項的估計系數通常顯著為正，即中部和西部地區教育程度的提高具有縮小收入差距的效應。

表4-1 2002年變量均值與分位數回歸結果

針對收入分布不同分位點的估計結果給出了各因素對相應分位點收入的邊際效應。不同分位點估計系數給出了該因素對于高收入與低收入人群的邊際效應差異。這種差異同時也給出了該因素對于收入分布的總體影響。例如，在2002年的估計結果中，“城鎮”變量在收入分布低分位點上的邊際效應通常要高于高分位點。這種系數效應分布特征使得“城鎮”具有縮小收入差距的效應。更進一步，從最低的10分位點到50分位點，“城鎮”的估計系數隨分位點上升有所上升；而從50分位點到90分位點，“城鎮”的估計系數隨著分位點上升而下降。這一特征意味著，“城鎮”有擴大收入分布低端不平等的效應，但會縮小收入分布的高端不平等。按照類似的方式，從附表1至附表3中各分位點的回歸結果可以看出，“中部”和“西部”這兩個變量在高分位點的估計系數要高于低分位點，因而這兩個變量具有導致收入差距擴大的效應。城鄉與區域交叉項的低分位點估計系數要高于高分位點，從而具有收入差距的效應。

表4 -2 2007年變量均值與分位數回歸結果

戶主教育程度變量也具有擴大收入差距的效應，其低分位點的估計系數通常低于高分位點。但家庭勞動年齡人口平均教育年限在各分位點上的估計系數特征則相反。教育變量與城鄉、區域變量的交叉項在收入分布不同分位點上影響通常也都是顯著的。這些交叉項反映了不同地區教育回報特征的差異性，與勞動力市場的地區分割相關。并且這種分割程度對于收入分布不同分位點人群的影響具有差異性。

表4 -3 2013年變量均值與分位數回歸結果

（2）不同年份各分位點收入增長特征的分解分析

在無條件分位回歸的基礎上，表5給出了兩個年份中相同分位點收入增長的分解分析。地區、教育等變量對于兩個時期收入分布不同分位點上的收入增長所具有的解釋作用也存在著比較明顯的差異性。

從兩個時期分解結果的比較中可以看出，2002年至2007年期間，稟賦效應對各分位點收入增長的影響要高于后一個時期。在2002年至2007年期間，稟賦效應使得各分位點對數收入增加0.276 9（第10個百分位點）至0.517 6（第75個百分位點），而在2007年至2013年期間，稟賦效應貢獻最高的50%分位點也只有0.042，其他分位點上的貢獻甚至為負，遠遠低于前一個時期。按照本文的定義，稟賦結構反映了人口在地區之間以及不同教育程度之間的分布特征。不同分位點上收入增長的稟賦效應意味著，前一個時期社會經濟結構的變化成為收入增長的重要原因；但這種結構變動對于后一個時期的收入增長則沒有明顯的貢獻。

表5 不同分位點收入增長的Oaxaca-Blinder分解

在稟賦效應中，地區因素（包括“城鄉”、“區域”以及“城鄉*區域”三者稟賦效應之和）對于收入增長（以收入對數差來衡量）的貢獻在較低的收入分位點上具有重要的解釋份額，但對于高分位點（90%）的解釋作用要小很多。在2002年至2007年期間，地區因素導致收入分布最低10%至75%分位點的對數收入增長通常都在0.3左右，但90%分位點上的解釋效應下降至0.11。這一特征在2007年至2013年依然成立，即地區因素對于較低分位點上的收入增長具有比較高的貢獻份額，盡管后一個時期中地區因素對于收入增長的貢獻要遠遠低于前一個時期。兩個時期中，地區因素對于高分位點（90%）收入增長貢獻都非常低。這意味著，人口在地區之間的流動對于低收入人群的收入增長具有更為重要的影響。

與地區因素的收入增長效應隨收入分位點的變化特征不同，教育的稟賦效應（包括“教育”、“城鄉*教育”、“區域*教育”三者稟賦效應之和）對于高分位點收入增長具有更大的貢獻。如在90%分位點中，教育的稟賦效應在兩個時期中都具有正的貢獻，2002年至2007年期間為0.154 3，2007年至2013年期間為0.031 8；而在較低的分位點中，教育稟賦效應通常都比較低，在2002年至2007年期間教育稟賦效應的貢獻甚至為負。在2007年至2013年期間，教育稟賦結構對于50%分位點的收入增長貢獻最高。教育稟賦結構變化有助于高收入人群的收入增長，但并不構成低收入人群收入增長的有利因素。

從系數效應來看，常數項對于各分位點上的收入增長都具有比較重要的影響。本文的分解中，常數項通常包括三種效應：一是價格效應，因為本文沒有對不同年份的收入進行價格指數調整①因為本文的重點在于收入不平等，是否進行跨年份的價格指數調整不會影響到收入不平等指數。在 2002年至 2007年期間，價格指數（CPI）的對數差為0.129 8；2007年至2013年期間，價格指數的對數差為0.186 7。；二是省略組效應，回歸中的省略組包括農村居民和教育程度為初中以下的戶主，即常數項對收入增長的解釋中包含省略組人群的收入增長效應；此外，也意味著在收入函數所涉及的變量之外，還存在著其他重要影響因素。

除了常數項以外，收入函數的系數效應通常對不同分位點上的收入增長不具有正向的解釋作用。地區因素和各教育變量的系數效應對2002年至2007年期間不同分位點上的收入增長大體上隨著分位點的上升而增加。與此不同的是，對2007年至2013年期間各分位點收入增長的貢獻則大體上呈U型，即對低分位點和高分位點的解釋程度比較高，但對中間分位點的解釋相對較低。在后一時期中，教育回報特征對于收入增長的解釋作用隨著分位點的上升而遞減。

（3）收入不平等變化特征的分解分析

在無條件分位回歸的基礎上，表6給出了兩個時期中收入不平等變化特征的分解結果。收入不平等程度采用了4種度量方式，包括以基尼系數和對數方差度量收入分布總體不平等的變動；以90與50分位點對數差以及50與10分位點的對數差分別衡量收入分布的高端不平等與低端不平等的變動特征。這里對于基尼系數和對數方差的分解給出了更為詳細的信息，如稟賦效應與系數效應，而且與G·Fields的分解結果也可能存在某些差異，這是因為基于RIF回歸的分解考慮了解釋變量的組內效應。

表6 收入不平等的RIF回歸分解

2002年至2007年期間，基尼系數上升了1.85個百分點；2007年至2013年期間則下降了1.47個百分點①這里的基尼系數變動幅度與表1的描述性結果之間存在一些差異，這是由于為了保證各種回歸中所用到的樣本是相同的，因而樣本范圍限定為對數收入不為缺失值的情形，即不包括收入小于等于0的樣本。。但從不平等的內部結構來看，2002年至2007年期間高端不平等基本上是穩定的，只有略微的增長，低端不平等有較大幅度的上升。在2007年至2013年期間，高端不平等有明顯的下降，而低端不平等反而有所上升。因而，前一個時期的收入不平等上升主要是由于低端不平等的上升導致的，而后一個時期的收入不平等下降主要是由于高端不平等的下降所導致的。

在兩個時期中，地區因素的稟賦效應都具有縮小收入分布總體不平等（基尼系數與對數方差）的作用。這可能體現了勞動力在地區之間流動的結果。除了2002年至2007年期間的對數方差變動外，城鄉結構變化具有縮小收入差距的效應，這既表現在“城鄉”變量的稟賦效應，也體現在“城鄉*區域”交叉項的稟賦效應。從不平等的內部結構來看，地區因素稟賦效應縮小了高端不平等（90與50分位點的對數收入差），但擴大了低端收入不平等（50與10分位點的對數收入差）。這可能是因為高收入人群具有更強的流動性。

在2002年至2007年期間，教育變量的稟賦效應擴大收入差距，無論是總體差距還是高端或低端不平等的變化，盡管在低端不平等變化中，教育稟賦的影響要相對低一些。在2007年到2013年期間，教育稟賦效應對于基尼系數和對數方差的影響非常微弱，即對于總體不平等程度的影響不明顯，但對于高端和低端不平等具有不同的影響，即縮小了高端不平等而擴大了低端不平等。在兩個時期中，教育狀況都成為擴大低端不平等的因素，這可能表明改善低收入人群教育狀況對于縮小收入差距的重要性。值得注意的是，“城鄉*教育”交叉項的稟賦效應總是擴大收入差距，在兩個時期的各種不平等衡量方式中都是如此。這反映了城鄉之間的教育差距對于收入差距的重要影響。

總體而言，兩個時期的稟賦效應都具有縮小基尼系數和高端不平等（90與50分位點收入對數差）的效應，也都具有擴大對數方差和低端不平等（50與10分位點收入對數差）的效應①這一現象也表明，某因素對于收入對數方差和基尼系數變動可能具有不同的影響。而在G·Fields分解中，事實上認為各因素對不同收入不平等指標的影響方向（乃至貢獻份額）都是相同的。。

在2002年到2007年期間，不論是地區還是教育因素，其系數效應都產生了擴大收入差距的效應。“城鄉”系數效應衡量的是城鎮、流動人口與農村居民的收入差距，這一因素對收入差距明顯起到了擴大效應，成為收入差距擴大的主要影響因素，這種影響對于收入分布低端不平等擴大所起到的作用尤為明顯。各教育變量的系數效應在這一期間總體上也是擴大收入差距的。這種效應主要是由“教育”所導致的。與地區變量的交叉項在不同類型收入不平等的變化中則具有不同的表現形式。一個比較明顯的差異在于，“城鄉*教育”交叉項在此期間擴大了收入分布的高端不平等（90與50分位點對數收入差），但縮小了收入分布的底端不平等（50與10分位點對數差）。而“地區*教育”交叉項的特征則剛好相反。

在2007年到2013年期間，地區因素的系數效應對于基尼系數變動的解釋份額出現大幅度下降，甚至具有縮小對數方差的效應。但對收入分布的高端與低端不平等具有截然不同的影響，擴大了高端不平等，但縮小了低端不平等。更進一步地，這種變化主要是由于“城鄉”變量的系數效應所導致的。教育因素的系數效應對于各種不平等形式總體上都具有縮小的效應。值得注意的是，“教育”的系數效應擴大了高端不平等，縮小了低端不平等，但教育與地區變量的交叉項對于高端不平等都具有縮小效應，而對于低端不平等都具有擴大效應，這與前一個時期的特征也完全不同。

六、總結

本文根據中國居民收入分配課題組（CHIP）最近三輪的住戶調查數據，討論了城鄉差距和區域差距在全國收入差距及其變動方面的解釋作用。這三個年份所構成的兩個時期，2002年至2007年、2007年至2013年，基于住戶調查數據所反映的全國收入差距表現出兩種不同的變化特征：前一時期中，居民收入差距繼續擴大；后一時期中，居民收入差距有所縮小。在這兩種變化過程中，城鄉（城鎮-農村-流動人口）之間、區域（東中西部）之間的收入差距狀況都具有非常重要的解釋作用。城鄉和區域變量在收入函數的估計結果中具有非常高的解釋份額，如僅包含城鄉和區域變量，2013年收入函數的調整 R2為0.401 7，而2007年則為0.561 2；如果考慮到城鄉和區域之間的教育回報差異，收入函數的調整 R2相應地有進一步上升。在控制教育回報特征的地區差異后，城鄉和區域變量對于收入基尼系數的變動（無論是收入基尼系數的上升還是下降）都具有正向的解釋效應。

從對收入分布無條件分位回歸結果的分解分析來看，地區因素對于收入分布低分位點的收入增長具有重要解釋作用，而教育特征對于高分位點的收入增長具有更高的解釋份額。一定程度上表明，在本文所討論的兩個時期中，低收入人群從人口的跨地區流動中獲得收入增長的機會。根據對兩個時期收入不平等指標的RIF分解分析，地區因素的稟賦效應都具有縮小收入分布總體不平等（基尼系數與對數方差）的作用；從不平等的內部結構來看，地區因素稟賦效應縮小了高端不平等（90與50分位點的對數收入差），但擴大了低端收入不平等（50與10分位點的對數收入差）。這可能是因為高收入人群具有更強的流動性。教育稟賦效應對于總體不平等程度的影響不明顯，但縮小了高端不平等而擴大了低端不平等。在兩個時期中，教育狀況都成為擴大低端不平等的因素，這可能表明改善低收入人群教育狀況對于縮小收入差距的重要性。

[1] 別扭·古斯塔夫森、李實，1999，《中國變得更加不均等嗎？》，載于趙人偉、李實、卡爾·李思勤主編《中國居民收入分配再研究》，北京：中國財政經濟出版社。

[2] 范劍勇、朱國林，2002，《中國地區差距演變及其結構分解》，《管理世界》第7期。

[3] 國家統計局住戶調查辦公室，2017，《中國住戶調查年鑒（2017）》，北京：中國統計出版社。

[4] 李善同、許召元，2006，《近年來中國地區差距的變化趨勢》，《中國發展評論》第1期。

[5] 李實、趙人偉，1999，《中國居民收入分配再研究》，《經濟研究》第4期。

[6] 李實、岳希明、史泰麗和佐藤宏主編，2018，《中國收入分配格局的最新變化》，中國財政經濟出版社。

[7] 羅楚亮，2006，《城鄉居民收入差距的動態演變：1988-2002年》，《財經研究》第9期。

[8] 羅楚亮，2017，《城鄉收入差距的變化及其對全國收入差距的影響》，《勞動經濟研究》第1期。

[9] 羅楚亮、史泰麗和李實，2018，《中國收入不平等的總體狀況（2007-2013年）》，載李實、岳希明、史泰麗和佐藤[9] 宏主編，《中國收入分配格局的最新變化》，北京：中國財政經濟出版社。

[10] Firpo, S., N. Fortin And T. Lemieux, 2007, “Decomposing Wage Distribution Using Recentered Influence Function Regression”，未發表論文。

[11] Firpo, S., N. Fortin And T. Lemieux, 2009, “Unconditional Quantile Regression”,Econometrica, 77(3): 953-973.

[12] Sicular, Terry, Ximing Yue, Bjorn Gustafsson, And Shi Li, 2007, The Urban-Rural Income Gape And Inequality In China,Review Of Income And Wealth, 53(1), 93-126.