張曉華



內容摘要:城鎮化的發展在當前經濟發展的轉型期有著重要的作用,而物流業是帶動城鎮均衡、持續、穩定、跨越發展的戰略性產業。本文采用因子分析法降維、非參數回歸等方法來處理物流業對城鎮化的影響并進行分析。結果表明,從時間數據上來看,物流業對城鎮化的影響是非線性的正向關系,從截面數據上來看,2014年不同區域兩者之間正向關系有待考究。
關鍵詞:降維 ? 樣條基 ? 自然樣條 ? 非參數回歸
引言
當前我國已進入經濟高速發展的轉型期,城鎮化發展無疑成為深入發展的重點,其在現代化、經濟持續發展、產業結構轉型升級、解決農村農民問題、推動區域協調發展、促進社會全面進步等方面有重大的意義。物流業在城鎮化發展中具有促進產業分工、吸引產業集聚、提升生活質量、擴大就業數量、帶動城鎮均衡、持續、跨越、穩定發展的重要作用,是支撐和引導城鎮化發展的戰略性產業。對于兩者之間的關系,國內外研究頗多,研究成果各有建樹。然而這些學者大多基于時間序列做定量研究,且采用降維后再引入樣條非參數回歸的方法更是鮮有人涉及。因此,本文采用另一種方法,從一個新的角度闡釋物流業對城鎮化的影響。
指標設計和模型設定
衡量物流業發展的指標迄今為止沒有一個唯一的標準,不同學者所定義的指標也不完全一樣。本文根據我國物流發展的實際情況,依據數據的可得性,建立三個一級指標和九個二級指標。一級指標分為經濟指標,基礎實施和物流規模。經濟指標下面的二級指標分為地區產總值,地區交通運輸、倉儲和郵政業增加值和地區社會消費品零售總額。基礎設施下面的二級指標分為地區公路里程。物流規模下面的二級指標分為地區郵電業務總量、地區貨運量、地區貨物周轉量、地區客運量和地區旅客周轉量。采用因子分析法將衡量物流業發展的九個指標降維成一個指標x。y代表城鎮化發展采用城鎮化率,最后用非參數回歸法來研究物流業x對城鎮化y發展的影響。
(一)因子分析法降維
第一步,將所有衡量物流業的變量進行無量綱處理。
第二步,計算相關矩陣的特征根λ和特征向量γ、方差貢獻率,根據累計方差貢獻率大于85%確定公因子個數。
第三步,用最大化正交法求載荷矩陣(),確定公因子名稱和公因子得分。
第四步,用方差貢獻率作為權重,和公因子做加權平均得到一個綜合得分x。
(二)非參數回歸
線性模型雖然簡單,解釋性強,推斷理論也相對成熟,但變量之間若存在著大量的非線性關系,如果仍然用線性關系來研究非線性變量關系,實證結果就會難以讓人信服,因此本文選用非參數回歸。
為了研究相應變量y和協變量x之間的非線性關系,如模型(1)所示,f(xi)是基函數(可以選用不同的基,本文主要使用多項式基和樣條基)。
yi=β0+f(xi)+εi ? ? ? ? ? ?(1)
若基函數f(xi)是多項式函數,即x1,x2,x3,…,xd的線性組合,這種回歸就是多項式回歸,d一般不大于3或者4(d越大,多項式曲線就會越光滑,甚至會在x變量定義域的邊界處呈現異樣的形狀)。多項式回歸系數的求法可用最小二乘求解。
更加穩定的基函數f(xi)是樣條函數,一個有k個結點的三次樣條函數可以由b1(x1)、b2(x2)、b3(x3)、…、bk+3(xi)的線性組合構成,其中,bi(xi)有多種選法,本文選用三次多項式為基礎,然后在每個結點添加一個截斷冪基,即:
yi=β0+β1xi+β2xi2+β3xi3+β4h(xi,ξ1)+……+βk+3h(xi,ξk)+εi ? ? (2)
其中,h(x,ξ)=(x-ξ)3,(x>ξ),h(x,ξ)=0,(x<ξ)。ξ是結點,截斷冪基項只會使三次多項式在ξ處的三階導數不連續,而在每個結點,函數本身、一階導數、二階導數都是連續的。在邊界的結點外,函數是三次多項式,估計模型時,仍然采用最小二乘法估計k+4個系數。
雖然三次樣條函數相對穩定,然而在預測變量之外的區域,即x取較大值或較小值時,有較大方差,體現在圖形中是邊界區域置信帶較寬,自然樣條,即模型(3)彌補了這點。
yi=β0+β1xi+β4h(xi,ξ1)+……+βk+3h(xi,ξk)+εi ? ? ? ? ? ? ? ? ? ? ? ?(3)
其中,h(x,ξ)=(x-ξ)3,(x>ξ),h(x,ξ)=0,(x<ξ)。三次自然樣條函數可以看作是三次樣條并附加了邊界約束(二階和三階導數為0)的回歸樣條,在邊界的結點外,函數為一次多項式,估計模型時,依然采用最小二乘法估計k+2個系數。
物流業對城鎮化發展的實證結果與分析
本部分從時間序列數據和橫截面序列數據兩個角度來研究物流業對城鎮化的影響。
(一)時間序列角度
本文通過2015年《中國統計年鑒》收集了2000-2014年每年物流業發展的八個指標的數據,根據因子分析法降維的思想得到了一個主成分(第一主成分達到86.5%)x來衡量物流業的發展。再收集2000-2014年城鎮化率的指標數據y來代表城鎮化的發展。如表1所示。
表1顯示,2000年以來,我國城鎮化率快速發展,物流業發展水平也在逐年增加。用R軟件對上述城鎮化率y和物流業發展x標準化處理后做多項式回歸和樣條回歸擬合,顯然非線性擬合比線性擬合更加貼合散點圖,如圖1所示。從模型的殘差標準誤上來看,一元一次線性回歸是0.1561,4次多項式回歸是0.1109,三次樣條回歸是0.107(結點分別在25%、50%、75%處),自然3次樣條是0.135,可見3次樣條的模擬結果最好,自然樣條在邊界處置信帶較窄的優勢在此并不明顯,反而標準誤大于三次樣條。結果表明,物流業對城鎮化影響確是正向關系,即隨著物流業發展的增加,城鎮化發展也隨之加快,兩者協調一致。從模擬曲線的斜率來看,城鎮化發展隨著物流業發展的速率經歷了由快到慢再到快的趨勢。
(二)截面序列角度
本文通過2015年《中國統計年鑒》收集了2014年我國31個省市自治區(港澳臺地區除外)的物流業發展的八個指標的數據,采用同上的方法—因子分析法降維得到兩個主成分(累計貢獻度達到87.1%),再將其進行加權平均得到最終公因子得分x來衡量物流業的發展。收集2014年31個省市自治區的城鎮化率y衡量城鎮化的發展,如表2所示。
結果顯示,2014年物流業綜合發展水平排在前五位的有廣東省、江蘇省、山東省,浙江省和河南省,這些省份是工業大省和人口大省,其交通運輸收益和運力較高,是物資消耗和人員的周轉集散地。而排在后五位的省份大多處于西部地區,西部發展較晚,基礎設施相對不完善,因此要加大西部地區物流業的發展。
用R軟件對上述截面數據城鎮化率 和物流業發展 標準化處理后做散點圖,顯然非線性擬合仍然比線性擬合更加貼合散點圖,如圖2所示。從模型的殘差標準誤上來看,一元一次線性回歸是0.9858,4次多項式回歸是0.9791,3次B樣條是0.943,自然3次樣條是0.9749,仍然是3次B樣條的模擬結果最好。圖形顯示,物流業對城鎮化影響并不像縱向數據那樣呈現正向關系,兩者之間也并不協調一致,比如河北省、安徽省、湖南省、遼寧省等物流業發展水平相對高的地區(不是最高)其城鎮化率卻較低,說明2014年全國不同省份物流業對城鎮化影響不盡同,高物流水平的省份城鎮化率反倒不高,因此物流業對城鎮化的因果關系也有待考究。
結論
本文采用非參數回歸來研究物流業對城鎮化的影響,之所以提出此法是因為非參數回歸形式自由,受約束少,且無論從時間序列角度還是從截面序列角度來看,兩者之間關系非線性都比線性擬合更好,殘差標準誤更低。結果發現,我國物流業對城鎮化的影響從時間趨勢上來看是協調一致發展的,呈非線性正向相關關系,然而從截面角度來看,不同區域物流業對城鎮化的影響并不都是正向關系,甚至有負向關系,原因有待進一步考究。此外,非參數回歸的方法需要大的樣本容量,本文樣本量不夠大,時間趨勢上是15年的數據,截面空間是31個省自治區,所以非參數回歸結果有待商榷。
根據實證結果表明,物流業在我國城鎮化持續健康發展的過程中具有重要的作用,但全國不同區域地理位置、自然資源、經濟發展方式有所差別,具體到各個地區來研究又有很多特點,因此區域物流業對城鎮化的影響作用有待考究。因此,應增強城鎮化發展的動力,以積極推進物流業帶動城鎮化高效和諧全面發展。