莫 旋,陽玉香,唐成千
(1.上海財經大學 經濟學院,上海 200433; 2.衡陽師范學院 經濟與管理學院,湖南 衡陽 421008)*
隨著中國經濟高速發展、工業化和城鎮化快速推進,在城鄉之間、地區之間出現了大規模的人口流動,根據《中國流動人口發展報告(2016)》顯示,中國流動人口規模高達2.47億,約占人口總數的18%[1]。目前,中國經濟社會發展進入新階段,大規模的人口流動已成為推動經濟社會結構變遷和利益分配格局調整的重要因素,但流動人口在促進經濟社會發展與城市化進程的同時,也給社會已有的利益分配格局調整帶來了巨大挑戰和沖擊,突出的問題是,如何讓流動人口更好地共享改革發展成果,使經濟社會發展更平衡、更充分。習近平總書記在黨的十九大報告中指出:“中國特色社會主義進入新時代,我國社會主要矛盾已經轉化為人民日益增長的美好生活需要和不平衡不充分的發展之間的矛盾。”這一重大的政治論斷,深刻揭示了我國社會矛盾運動的新變化和新特點。讓人們過上更美好的生活是我們一切工作的出發點和落腳點,因此,政府和學界對流動人口在流入地的生存與發展狀況高度關注,而收入水平是流動人口在流入地得以立足的經濟基礎,也是個體社會經濟地位的重要標志,自然成為大家關注的焦點。
流動人口收入水平是由其個體特征、社會制度安排、勞動力市場結構等多種因素綜合作用的結果。流動人口的個體特征是流動人口收入決定的關鍵性因素。甄小鵬(2017)[2]認為,由于年齡、性別和教育等個體特征不同,導致流動人口之間存在巨大的收入差異。鄧曲恒(2007)[3]認為教育對流動人口收入提升作用巨大,但其效果也因人而異。鄭猛(2017)[4]認為教育能夠提升流動人口收入的整體水平。趙延東(2002)[5]認為流動人口的社會網絡與社會資本對其經濟地位的獲得具有重要作用。影響流動人口收入的其他個體特征,比如婚姻與健康狀況、外出務工時間、流動范圍等,一般都認為與流動人口的收入水平緊密相關。影響流動人口收入的制度安排,主要以戶籍制度這一因素的研究為主,楊菊華(2011)[6]研究指出,在探討流動人口收入時必須區分其戶籍身份,戶籍制度引發流動人口收入分化,城-城流動人口的收入明顯高于鄉-城流動人口,得出類似結論的還有章莉(2014)[7]等。勞動力市場結構也是影響流動人口收入的重要因素,陽玉香(2017)[8]研究表明,在流動人口勞動力市場,雇主擁有強勢地位,從而壓低雇員的工資水平。
現有文獻對流動人口收入問題進行了深入研究,為如何提高其收入水平提供了參考和借鑒[9]。但是,現有的研究仍存在以下不足:一是研究較多關注流動人口和流入地城鎮居民之間的收入差異,卻忽略流動人口本身收入水平是如何決定;二是利用流動人口數據研究流動人口收入問題時,普遍忽視數據的分層聚類性;三是現有文獻研究流動人口收入時,忽視了異質性作用與不同層次因素之間的互動。分層線性模型考慮了數據的分層聚類性,將個體因素對流動人口收入的影響從群體因素中分解出來,并從跨層角度分析不同層次因素之間的互動關系,從而可獲得較可靠的參數估計和假設檢驗,并且還能夠回答一些具有實際意義而傳統模型無法回答的問題[10]。目前國內利用分層線性模型分析流動人口數據的文獻不多,主要是從社會融合角度進行研究,如薛燕(2016)[11]和李含偉(2017)[12]。值得注意的是,利用分層線性模型分析中國流動人口收入決定問題的研究尚未見于國內文獻。基于此,本文利用中國流動人口動態監測數據,采用分層線性模型,從分層異質視角研究流動人口收入的決定,為相關研究提供一個全新的視角。
本文所使用的數據來自2014年中國流動人口動態監測數據。該數據以山東省青島市、浙江省嘉興市、福建省廈門市、廣東省深圳市和中山市、河南省鄭州市、四川省成都市、北京市朝陽區八市(區)為調查地點;抽樣方法按照多階段、分層、與規模成比例的PPS方法進行;該數據的調查對象為在流入地居住一個月以上、非本市(區)戶口、且年齡在16~60歲的流入人口;刪掉流動人口小時收入變量數據缺失的樣本,并剔除處于第1百分位數以下和第99百分位數以上的極端值;同時刪除其它變量觀察值缺失的樣本,最終獲得樣本數為14255。
數據分析的方法包括描述性分析與模型分析。首先從流動人口的社區特征和個體特征視角對流動人口收入作描述性統計,分析流動人口收入的異質性。然后對流動人口收入的決定作模型分析,模型的選取取決于數據結構,由于流動人口數據包括社區層次和個體層次資料,具有明顯的分層聚類性,不滿足OLS分析中方差齊次性及個體間隨機誤差相互獨立的假設,這可能導致參數與標準誤估計的偏誤,采用分層模型來處理數據分層聚類性,參數估計更為準確,假設檢驗更為保守和恰當,從而降低犯第I類錯誤的可能性,提高模型的適應性[13];由于流動人口收入是連續變量,因此,我們采用分層線性模型進行模型分析。根據研究的需要,將流動人口收入數據分為社區和個體兩個層次,分別采用分層線性模型中的無條件平均模型、隨機截距模型、隨機截距與隨機斜率模型對流動人口收入決定進行實證分析。為節約篇幅,我們只簡要介紹隨機截距與隨機斜率模型,并利用該模型分析不同層次因素之間的互動。
隨機截距與隨機斜率模型不僅允許回歸截距因社區而異,而且允許個體層次因素對流動人口收入的影響隨社區層次因素而不同。其方程式為:
yij=β0j+β1jx1ij+εij
(1)
其中,yij表示社區j中個體i的收入,x1ij表示個體特征變量,β1j是x1ij的系數,反映社區j內個體層面因素對流動人口收入的影響,下標j表示個體特征變量因社區而異。由于個體生活于不同的社區,而社區特征又反作用于個體,因此,β0j和β1j都可能因社區而異,為隨機變量,是社區特征變量G1j的函數。
β0j=γ00+γ01G1j+δ0j
(2)
β1j=γ10+γ11G1j+δ1j
(3)
式(2)和式(3)是對回歸系數的回歸,個體層次模型的截距和斜率,在社區層次模型中成為被解釋變量,每個社區的系數都取決于社區特征。將式(2)和式(3)代入式(1),可以得到隨機截距與隨機斜率模型的完整表達式:
yij=(γ00+γ01G1j+γ10x1ij+γ11G1jx1ij)+(δoj+δ1jx1ij+εij)
(4)

1.收入。流動人口動態調查問卷中提供了流動人口的月收入,包括工資、獎金、津貼、加班費和單位包吃住折算的金額,但月收入沒有考慮個體工作時間上的差異,因此,小時收入更為合理,但調查問卷中沒有小時收入,我們采用4乘以周工作小時數來估計月工作小時數,小時收入即為月收入除以月工作小時數。
2.社區特征。影響流動人口收入的社區特征變量包括社區類型和社區所在的城市變量。(1)社區類型。問卷中有流動人口目前居住的社區信息,居住在別墅區或商品房社區取值為1,表示高檔社區;其他取值為0,表示普通社區。(2)城市。構造城市虛擬變量,以北京市為對照組,反映區域經濟發展不平衡導致的流動人口收入差異。
3.個體特征。影響流動人口收入的個體特征變量主要有:(1)性別。設定虛擬變量,男性取1,女性取0。(2)戶籍身份。設定虛擬變量,城-城流動人口取1,鄉-城流動人口取0。(3)年齡。一般認為勞動者的收入水平與年齡呈倒“U”型變化,加入年齡的平方項以考察收入水平與年齡之間的非線性關系。(4)受教育程度。設定虛擬變量,初中及以下教育程度者取值為0,表示接受初等教育;高中教育程度者取值為1,表示接受中等教育;大專及以上教育程度者取值為2,表示接受高等教育。(5)婚姻狀況。設定虛擬變量,在婚者取值為1,其它取值為0。(6)外出務工時間。外出務工時間用第一次離開戶籍地到本次調查的年限表示,即2014減去第一次外出務工的年份。(7)流動范圍。設定虛擬變量,取0表示市內跨縣流動,取1表示省內跨市流動,取2表示跨省流動。(8)健康狀況。問卷中流動人口對自己身體健康狀況有一個主觀評價,健康狀況差取0;健康狀況一般取1;健康狀況好取2;健康狀況很好取3;健康狀況非常好取4。(9)社會資本。用流動人口在本地參加社會組織的數量作為其社會資本的代理變量,沒有參加任何社會組織者取0,表示其社會資本較少;參加1個社會組織者取1,表示其社會資本中等;參加2個及以上社會組織者取2,表示社會資本較多。
表1從社區特征和個體特征視角分析流動人口收入異質性。流動人口平均小時收入為17.44元,其中,居住于高檔社區流動人口的小時收入為21.56元,較居住于普通社區流動人口的小時收入16.62元,高出29.72%,流動人口收入的社區差異非常明顯。這表明流動人口的收入與其所居住的社區有明顯的關聯,流動人口的收入隨社區而異。

表1 流動人口收入異質性
注:表中分別是流動人口小時收入和樣本量,括號內分別為其標準差和樣本占比。
流動人口包括鄉-城流動人口和城-城流動人口,他們在人力資本、社會資本、戶籍及其衍生因素方面存在明顯差異,因此,有必要從戶籍角度分析流動人口收入差異。城-城流動人口的小時收入為23.87元,較鄉-城流動人口的小時收入16.42元,高出45.37%。從戶籍身份和社區類型的交叉表可知,居住于普通社區的鄉-城流動人口占比最大,為73.93%,但收入最低,小時收入僅為15.94元;居住于普通社區的城-城流動人口收入明顯高于居住于高檔社區的鄉-城流動人口;居住于高檔社區的城-城流動人口占比最少,僅占流動人口總數的3.98%,但收入水平最高,小時收入高達28.75元。
從流動人口的受教育程度來看,受教育程度越高者,其收入水平越高,接受高等教育者的平均小時收入為24.91元,較接受初等教育者的平均小時收入15.15元,高出64.42%,這表明流動人口的受教育程度對其收入的決定有重要影響。從受教育程度和社區類型的交叉表可知,居住于普通社區接受初等教育者占比最大,為52.77%,但收入最低,小時收入僅為14.89元;居住于高檔社區接受高等教育者占比最小,為4.17%,但收入最高,小時收入高達29.43元;而且發現,居住于普通社區接受高等教育者收入高于居住于高檔社區接受中等教育者,居住于普通社區接受中等教育者收入高于居住于高檔社區接受初等教育者,這可能意味著受教育程度對流動人口收入的提升作用較社區更大,教育是流動人口收入決定的關鍵性因素。
從流動人口的社會資本來看,社會關系網絡越廣,社會資本越多,其收入水平越高。擁有較多社會資本者的平均小時收入為21.77元,較擁有較少社會資本者的平均小時收入16.75元,高出29.97%,這表明社會資本對流動人口收入的決定有重要影響。從社會資本和社區類型的交叉表可知,居住于普通社區擁有較少社會資本者占比最高,為60.81%,但收入最低,小時收入僅為16.11元;居住于高檔社區擁有較多社會資本者占比最小,僅為1.89%,但收入最高,小時收入高達28.34元;而且發現,居住于高檔社區擁有較少社會資本者的收入高于居住于普通社區擁有中等社會資本者,居住于高檔社區擁有中等社會資本者的收入高于居住于普通社區擁有較多社會資本者,這可能意味著,在流動人口收入的決定中,社區因素的作用要超過社會資本。
流動人口收入異質性表明,流動人口的收入不僅受其個體特征的影響,還會受其所處社區環境的影響,樣本的分層聚類性質非常明顯。但戶籍身份、受教育程度和社會資本三類個體特征在不同的社區環境下,對流動人口收入的影響有所不同。上述判斷是基于社區類型和相應個體特征變量而言,并沒有控制其他因素,流動人口的收入還受到許多其他個體特征和社區特征變量的影響,在研究流動人口收入決定時,需對這些變量加以控制。因此,還需通過更為嚴謹的實證分析來處理數據的分層聚類性,以得到較為精準可靠的分析結論。
本文采用stata軟件,基于分層線性模型對流動人口收入的決定進行實證分析,包括無條件模型、隨機截距模型、隨機截距與隨機斜率模型,并對流動人口收入不同層次因素之間的互動進行分析。
無條件平均模型即空模型,是指模型中只有被解釋變量,沒有指定任何一個解釋變量。對數據進行無條件平均模型分析,可以確定社區層次因素對流動人口收入影響的程度,從而決定是否需要采用分層模型技術。因此,無條件平均模型實際上是一個診斷模型。


表2 流動人口收入無條件平均模型分析結果
注:***、**、*分別表示在0.1%、1%和5%水平上顯著。
根據隨機效果中群間變異和群內變異值的大小,可以計算出社區間關聯度系數:
該數值表示,流動人口收入的變異性中有40%來自于社區因素(即群間變異),60%來自于個體因素(即群內變異)。因此,社區因素和個體因素對流動人口收入的決定都具有重要的作用,但個體本身的特征要更重要一些。
將社區特征變量和個體特征變量納入模型之中,以分析社區層次因素和個體層次因素對流動人口收入決定的影響。隨機截距模型假定,流動人口收入變異都源于社區層次和個體層次因素,且個體特征對流動人口收入的影響不因社區而異。
從表3模型2可知,社區特征變量與流動人口收入水平顯著相關。在其他條件給定的情況下,居住在高檔社區流動人口的小時收入比普通社區平均高出3.16元;流動人口收入的城際差異也十分明顯,與對照組北京市相比,其他城市流動人口的收入水平明顯偏低,其中,成都市最低,深圳市相對較高。個體特征變量對流動人口收入水平的影響也非常顯著,男性小時收入平均比女性高出3.28元,工資性別差異十分明顯;城-城流動人口較鄉-城流動人口小時收入平均高2.05元,戶籍身份是影響流動人口收入的重要因素;年齡與收入水平的關系呈倒U字型,流動人口小時收入在35歲左右最高;流動人口小時收入與受教育程度呈正向關系,受教育程度越高,收入水平越高;在婚者小時收入較其他群體高1.81元;流動人口在外務工時間越長,收入水平越高,外出務工時間每增長1年,小時收入提高0.05元;流動人口的流動范圍越遠,其收入水平越高;健康狀況越好者,其收入水平越高;社會資本對流動人口收入的提升作用也非常明顯。
就隨機參數而言,社區層次隨機變量的變異值,在無條件平均模型中為5.87,在隨機截距模型中僅為3.93,通過比較兩個模型中社區層次隨機變量的變異值,發現社區特征變量對流動人口收入在社區層次變異的解釋度為33.05%;而個體層面隨機變量的變異值仍然較大,僅從原來的8.93,下降到8.40,個體特征變量對流動人口收入在個體層次變異的解釋能力較低,約為5.9%。因此,隨機截距模型中社區特征變量對流動人口收入的解釋能力遠高于個體特征變量。但是,隨機截距模型中社區層次和個體層次隨機變量的變異值都非常顯著,這表明仍有一些重要的、未被觀測到的社區層次因素和個體層次因素影響流動人口的收入,這可為調查問卷設計的完善提供一定的參考依據。
隨機截距模型可糾正聚類而引起的樣本間不獨立問題,并能分析分層數據的群間變異與群內變異,但是,該模型假定個體特征對流動人口收入的影響在不同的社區之間是恒定的。事實上,在流動人口收入的決定中,個體特征對流動人口收入的影響可能隨社區而異。隨機截距與隨機斜率模型既可分析不同社區擁有不同的截距,又可分析不同社區擁有不同的斜率,并能夠分析社區層次變量和個體層次變量之間的互動關系。下面我們利用隨機截距與隨機斜率模型,分別考慮戶籍身份、受教育程度和社會資本三類個體特征變量對流動人口收入的影響,并分別加入其與社區類型變量的交互項,從跨層的角度來研究流動人口收入的決定。
首先,分析流動人口收入決定中是否需要加入隨機斜率項,從表3的隨機截距與隨機斜率模型可知,雖然截距與斜率協方差成分的變異不顯著,但隨機斜率都非常顯著。因此,模型中加入隨機斜率項,可在一定程度上提高模型的適應性,從而獲得更為精確的參數估計。如果隨機斜率、截距與斜率協方差成分的變異均不顯著的話,采用隨機截距模型即可[14]。

表3 流動人口收入決定的分層線性模型分析
注:***、**、*分別表示在0.1%、1%和5%水平上顯著。
在隨機截距與隨機斜率模型中加入戶籍身份與社區類型的交互項,以考察不同層次因素之間互動對流動人口收入的影響。在控制其他個體特征變量和城市變量后,相對于鄉-城流動人口,城-城流動人口的小時收入高1.48元,相對于普通社區,居住于高檔社區流動人口的小時收入高3.09元,二者均很顯著,戶籍身份與社區類型交互項的系數為1.93,也非常顯著。這表明戶籍身份和社區類型變量對流動人口收入的提升作用,很大部分通過戶籍身份與社區類型交互項來體現。
在模型中加入受教育程度與社區類型的交互項,以全面考察受教育程度對流動人口收入決定的作用。在控制其他因素后,受教育程度與社區類型變量的系數分別為2.56和2.93,受教育程度與社區類型交互項的系數為0.74,三者均非常顯著。這表明受教育程度是影響流動人口收入的關鍵性因素,且受教育程度對流動人口收入的提升作用較社區更大;同時,受教育程度對流動人口收入的提升作用還取決于社區類型,受教育程度對居住于高檔社區流動人口收入提升效果更明顯。
在模型中加入社會資本與社區類型的交互項,以全面考察社會資本對流動人口收入提升的影響。在控制其他因素后,社會資本與社區類型變量的系數分別為1.10和2.76,社會資本與社區類型交互項的系數為1.75,三者均非常顯著。這表明社會資本對流動人口收入的決定有重要作用,但社區對流動人口收入的提升作用較社會資本更大;社會資本對流動人口收入的提升作用,很大部分通過社會資本與社區類型交互項來體現。
流動人口收入決定中不同層次因素之間存在互動關系,部分社區層次因素對流動人口收入的影響通過個體層次因素體現,而部分個體層次因素對流動人口收入的影響,是通過社區層次因素來體現。在隨機截距與隨機斜率模型中,考慮不同層次因素之間的互動,能夠更好地反映流動人口收入的決定過程。
本文基于分層線性模型,利用中國流動人口動態監測數據,從分層異質視角研究流動人口收入的決定。主要研究結論如下:
一是流動人口的收入具有明顯的分層聚類性,社區層次因素和個體層次因素對流動人口收入的決定都具有重要影響,將流動人口收入的變異分解到社區層次因素和個體層次因素,研究發現,流動人口收入的變異性中有40%可由社區層次因素來解釋,剩余的60%來自于個體層次因素,個體層次因素對流動人口收入決定的作用要更重要些。
二是通過分層線性模型,區分不同層次解釋變量對流動人口收入決定的解釋能力。研究發現,流動人口收入在社區層次變異的1/3可由社區特征變量來解釋,但個體特征變量能解釋流動人口收入在個體層次變異中的比例不足10%。這表明受制于模型數據的可獲得性,模型中遺漏了一些對流動人口收入決定至關重要的個體特征變量,同樣,即使社區特征變量的解釋能力較強,但社區層次隨機因素的變異仍非常顯著,這表明還需進一步考慮其他重要的社區因素,這些研究結果可為調查問卷設計的完善、研究理論與模型的發展提供相關參考依據。
三是流動人口的個體特征和社區特征對其收入水平的影響非常顯著,我們著重考慮戶籍身份、受教育程度和社會資本三類個體特征變量對流動人口收入的影響,城-城流動人口的收入高于鄉-城流動人口,受教育程度和社會資本均能顯著提升流動人口的收入水平。在模型中加入個體特征變量與社區類型變量的交互項,研究發現,個體層次因素對流動人口收入的影響,部分通過社區層次因素來體現,而社區層次因素對流動人口收入的影響,部分通過個體層次因素來體現,不同層次因素之間存在互動,從而能夠更好地反映流動人口收入的決定過程。
當前,中國特色社會主義進入新時代,提升流動人口的收入,讓流動人口能夠更好地共享改革發展成果,促進經濟社會平衡充分發展,已成為我國經濟社會發展進程中不容忽視的重大戰略性問題。因此,研究流動人口的收入決定問題恰逢其時。本文的研究可為新時代下經濟社會平衡充分發展提供一些政策啟示:一是積極推進戶籍制度改革,縮小城鄉差距,讓流動人口能與本地居民享有同等的公共服務與社會福利,為流動人口融入城市創造良好的環境,從而提高城鎮化的質量。二是加大對流動人口的教育投入力度,提高流動人口的整體受教育水平,進而提升其學歷與技能。三是政府要采取各種措施鼓勵流動人口參與各種社團活動,為流動人口進行社會資本的個人投資與積累創造條件,同時,要為流動人口提供一個基于城市生活的社會網絡,促進流動人口社會資本的轉化。
參考文獻:
[1]國家衛生和計劃生育委員會流動人口司.中國流動人口發展報告[M].北京:中國人口出版社,2016:3-4.
[2]甄小鵬,凌晨.農村勞動力流動對農村收入及收入差距的影響[J].經濟學(季刊),2017(4):1073-1096.
[3]鄧曲恒. 城鎮居民與流動人口的收入差異[J].中國人口科學,2017(2):8-16.
[4]鄭猛. 教育擴張能否改善收入差距[J].科學決策,2017(7):26-49.
[5]趙延東,王奮宇. 城鄉流動人口的經濟地位獲得及決定因素[J].中國人口科學,2002(4):8-15.
[6]楊菊華.城鄉分割、經濟發展與鄉-城流動人口的收入融合研究[J].人口學刊,2011(5):3-15.
[7]章莉,李實,William A, Darity Jr.中國勞動力市場上工資收入的戶籍歧視[J].管理世界,2014(11):35-46.
[8]陽玉香.流動人口獲得了公平的勞動收入嗎?[J].華東經濟管理,2017(6):31-37.
[9]王贊新.論中國特色收入分配制度的現代化轉型[J].湖湘論壇,2016(6):76-80.
[10] 楊菊華.多層模型在社會科學領域的應用[J].中國人口科學,2006(3):44-51.
[11] 薛艷.基于分層線性模型的流動人口社會融合影響因素研究[J].人口與經濟,2016(3):62-72.
[12] 李含偉,王賢斌,劉麗.流動人口居住與住房視角下的社會融合問題研究[J].南方人口,2017(5):38-47.
[13] Teachman J, Crowder K. Multilevel models in family research: some conceptual and methodological issues[J].Journal of Marriage and Family,2002,64(2):280-294.
[14] 楊菊華.數據管理與模型分析:STATA軟件應用[M].北京:中國人民大學出版社,2012. 332-372.