孫 碩, 宋 妙, 陳 川 (同濟大學 交通運輸工程學院, 上海201804)
SUN Shuo, SONG Miao, CHEN Chuan (School of Transportation Engineering, Tongji University, Shanghai 201804, China)
近年來, 隨著電子商務等的迅猛發展, 我國快遞產業也進入了高速增長階段。 數據顯示, 2007~2011 年, 我國快遞業務收入年復合增長率為21.96%, 2011~2014 年, 我國快遞業務收入年復合增長率為39.2%[1]。 2014 年5 月, 據國家郵政局發展研究中心與德勤發布的《 中國快遞行業發展報告(2014)》 預測, 2015 年中國快遞市場行業規模將達2 800 億元人民幣, 2013~2015年中國快遞市場年均復合增長率將在39.4%左右[2]。
快遞業務的發展越來越受到社會各界的重視, 而快遞業務規模的預測研究也有著極其重要的意義。 一方面, 科學合理的預測能夠為決策者提供規劃依據, 從而合理布局基礎設施, 促進物流與交通的協調發展; 另一方面, 預測結果可以為快遞產業界提供參考, 從而加深其對于快遞市場規模和發展趨勢的認識, 促進快遞產業界的良性發展, 以更好地符合經濟和社會發展的需要, 滿足人民的物質文化需求。
為此, 學者們也對快遞業務發展趨勢和需求量的預測作了不少研究。 王蓮花運用GM (1,1)模型來模擬我國快遞行業的總收入, 并對未來幾年的中國快遞收入進行了預測, 檢驗結果表明GM (1,1)模型能夠很好地模擬中國快遞行業收入數據, 而且具有較高的模擬精度[3-4]。 張仲斐等選擇ARIMA (1,1,1 )(1,1,1 )4作為模型, 利用四大快遞公司的季度跨國快遞包裹量, 對全球跨國快遞業務量進行了預測[5]。 王天保等利用近年來全國快遞運送量, 采用一次移動平均法和二次移動平均法對2016 年快遞運送量進行了預測[6]。 吳傳嶺等引入二級多要素CES 生產函數, 利用郵政快遞業從業人員數量、 地區資產形成規模和地區人均消費水平三個生產要素分別分析了中國快遞業務數量和收入規模的貢獻與要素的替代彈性, 結果顯示中國快遞業的形成主要受到消費水平的拉動[7]。
快遞需求規模的發展變化一方面有其自身的規律, 會按一定的趨勢變化, 因此, 可以利用自身的時間序列數據來總結變化的特點, 進而推測未來的發展變化; 另一方面, 快遞需求規模與地區的經濟社會發展水平等息息相關, 雙方具有極高的相關性與依存性, 而經濟與社會發展的規律性相對更強, 更容易對其進行更為可靠的預測, 故可以利用二者的相關性, 通過經濟與社會發展相關聯要素的預測來推測快遞需求的變化情況。 因此, 本文以全國快遞業務收入表征全國快遞業務規模, 基于快遞產業的相關性而建立了多元逐步回歸模型, 基于快遞業自身時間序列數據而建立了灰色預測模型和多項式回歸分析模型, 通過對三種預測模型結果的綜合加權來得到最終的規模預測值, 以期為行業發展提供可靠的理論依據和參考。
由于經濟與社會發展要素一般具有較強的規律性, 相較快遞發展而言易于預測, 因此, 可利用多元逐步回歸模型, 分析其與快遞業的關聯性, 以找出對快遞業發展顯著相關的要素, 實現對未來快遞業務規模的預測。
在實際問題中, 人們總是希望從對因變量有影響的諸多變量中選擇一些變量作為自變量, 應用多元回歸分析的方法建立“ 最優” 回歸方程以便對因變量進行預報或控制。 所謂“ 最優” 回歸方程, 主要是指期望在回歸方程中包含所有對因變量影響顯著的自變量而不包含對影響不顯著的自變量的回歸方程。 逐步回歸分析正是根據這種原則提出來的一種回歸分析方法。 它的主要思路是在考慮的全部自變量中按其作用大小, 顯著程度大小或者貢獻大小, 由大到小地逐個引入回歸方程, 而那些作用不顯著的變量可能始終不被引入回歸方程。 另外, 己被引入回歸方程的變量在引入新變量后也可能失去重要性, 而需要從回歸方程中剔除出去。 引入一個變量或者從回歸方程中剔除一個變量都稱為逐步回歸的一步, 每一步都要進行檢驗, 以保證在引入新變量前回歸方程中只含有對影響顯著的變量, 而不顯著的變量已被剔除, 其主要計算步驟如下:
(1) 確定F檢驗值
在進行逐步回歸計算前要確定檢驗每個變量是否顯著的F檢驗水平, 以作為引入或剔除變量的標準。F檢驗水平要根據具體問題的實際情況來定。 一般地, 為使最終的回歸方程中包含較多的變量,F水平不宜取得過高, 即顯著水平α 不宜太小。F水平還與自由度有關, 因為在逐步回歸過程中, 回歸方程中所含的變量的個數不斷在變化, 因此方差分析中的剩余自由度也總在變化, 為方便起見, 常按n-k-1 計算自由度。n為原始數據觀測組數,k為可能選入回歸方程的變量個數。 例如n=15, 估計可能有2~3 個變量選入回歸方程, 因此取自由度為15-3-1=11, 查F分布表, 當α=0.1, 自由度f1=1,f2=11 時, 臨界值Fα=3.23, 并且在引入變量時, 自由度取f1=1,f2=n-k-2,F檢驗的臨界值記F1, 在剔除變量時自由度取f1=1,f2=n-k-1,F檢驗的臨界值記F2, 并要求F1≥F2, 在實際應用中可取F1=F2。
(2) 逐步計算
如果已計算t步(包含t=0) , 且回歸方程中已引入l個變量, 則第t+1 步的計算為:
①計算全部自變量的貢獻V'(偏回歸平方和) 。
②在已引入的自變量中, 檢查是否有需要剔除的不顯著變量。 這就要在已引入的變量中選取具有最小V'值的一個, 并計算其F值, 如果F≤F2, 表示該變量不顯著, 應將其從回歸方程中剔除, 計算轉至③。 如F>F2則不需要剔除變量, 這時則考慮從未引入的變量中選出具有最大V'值的一個并計算F值, 如果F>F1, 則表示該變量顯著, 應將其引入回歸方程, 計算轉至③。如果F≤F1, 表示已無變量可選入方程, 則逐步計算階段結束, 計算轉入③。
③剔除或引入一個變量后, 相關系數矩陣進行消去變換, 第t+1 步計算結束。 其后重復①~③再進行下一步計算。
由上所述, 逐步計算的每一步總是先考慮剔除變量, 僅當無剔除時才考慮引入變量。 實際計算時, 開頭幾步可能都是引入變量, 其后的某幾步也可能相繼地剔除幾個變量。 當方程中已無變量可剔除, 且又無變量可引入方程時, 第二階段逐步計算即告結束, 這時轉入第三階段。
(3) 其他計算
主要是計算回歸方程入選變量的系數、 復相關系數及殘差等統計量。
借鑒國家郵政總局與德勤發布的《 中國快遞行業發展報告2014》 中對中國快遞服務市場發展驅動力的分析成果, 以全國快遞業務收入為因變量y, 選取經濟與社會兩大類共21 個相關聯指標要素作為自變量進行建模, 如表1 所示。
查詢國家統計局、 相關部委及中國電子商務研究中心等網站, 得到2007~2013 年數據(2014 年部分數據尚未更新) , 利用MATLAB 進行逐步回歸建模。 模型分析結果如表2、 表3 和圖1 所示。
根據模型檢驗結果得出結論: 剩余標準差較小, 決定系數及調整后的決定系數均為1, 表示回歸方程對于快遞業務收入的解釋性良好。 回歸方程的顯著性檢驗(即F檢驗) 方面,F值為2.73154+E6, 數值較大, 且伴隨概率p<0.001, 說明自變量造成的因變量的變動遠遠大于隨機要素對因變量造成的影響, 方程總體線性關系顯著。 變量的顯著性檢驗方面, 各參數t統計量的伴隨概率均通過了0.05 的顯著性檢驗, 擬合效果顯著。
模型結果顯示, 對y影響顯著的變量分別為:x4全國網上零售額(億元) 、x7全國B2B 市場交易規模(萬億元) 、x13貨運周轉量(億噸公里) 、x17居民消費水平(元) 、x21互聯網上網人數(億人) 。 回歸方程如下:
其中:y——全國快遞業務收入(億元) ;x4——全國網上零售額(億元) ;x7——全國B2B 市場交易規模(萬億元) ;x13——貨運周轉量(億噸公里) ;x17——居民消費水平(元) ;x21——互聯網上網人數(億人) 。
由于短期內網上零售額、 B2B 市場交易規模、 居民消費水平等的發展趨勢規律性較強, 故可采用多元回歸分析對2020 年的值進行簡便預測。 預測結果如表4 所示。

表1 快遞行業相關自變量列表

表2 模型參數回歸系數結果

表3 模型檢驗結果
根據表4 結果, 利用逐步回歸方程計算可得2020 年全國快遞業務收入為10 521.5 億元。

表4 2020 年相關變量回歸預測結果
灰色系統理論是基于關聯空間、 光滑離散函數等概念定義灰導數與灰微分方程, 進而利用離散數據建立微分方程形式的動態模型, 由于這是表征灰色系統的基本模型, 它是近似的、 非唯一的, 稱為灰色模型(GM) 。 其基本過程如下:
由歷史數據, 計算每年的總和, 記為:
α 為確定參數, 得到GM (1,1)的白化微分方程模型為:
其中參數由灰微分方程(4) 確定:
于是方程(3) 有響應(特解) :
故相應的有:
根據灰色預測原理, 以2007 年為起始年, 2007~2014 年全國快遞收入為依據數據, 利用MATLAB 建立灰色預測模型GM (1,1),對2020 年全國快遞收入進行預測。 模型的后驗差比(均方差比值)C為0.10117, 小于0.35, 小誤差概率P為1, 大于0.95, 說明此模型精度等級為1 級(好) 。 根據模型得出, 2020 年, 全國快遞業務收入約為11 355.9 億元(軟件輸出趨勢如圖2 所示) 。
設x1,x2,…,xm為系統的相關因素, 對這些相關因素若有n次觀測得到的樣本數據為則系統相關因素的相關矩陣為
根據回歸分析原理, 以2007 年為起始年, 2007~2014 年全國快遞業務收入為基礎數據, 利用Excel 作快遞業務收入變化關系的擬合分析, 擬合結果顯示回歸擬合方程的確定性系數為0.9997, 說明擬合結果可靠性很高, 回歸模型對快遞業務收入的預測性能良好, 結果如圖3 所示。
其回歸方程為:y=53 756x3-127 557x2+677 022x+3 000 000
根據快遞業務收入發展趨勢的計算公式, 可得:
2020 年:y2020=10 834.6 億元, 即2020 年, 全國快遞業務收入將達10 834.6 億元左右。
匯總以上三種模型結果, 整理如表5 所示。
綜合三種模型預測結果, 取平均值得2020 年, 我國快遞業務收入將達10 900 億元左右。

表5 全國快遞業務收入預測結果匯總
本文從快遞產業的經濟社會相關性及其自身發展特點兩個方面, 分別建立了多元逐步回歸、 灰色預測和多項式回歸分析模型, 檢驗結果表明模型具有較高的精度, 而三個模型預測結果間最大僅相差7.9%, 這也從側面驗證了結果的可靠性。
綜合三個模型結果, 預測我國2020 年快遞業務收入將達10 900 億元左右, 我國快遞業在未來幾年將繼續保持中高速的增長趨勢。 其次, 通過多元逐步回歸模型的關聯性分析顯示, 全國網上零售額、 B2B 市場交易額、 貨運周轉量、 居民消費水平及互聯網上網人數等5 個指標對快遞業務規模影響顯著, 表明這5 個指標與快遞產業發展息息相關。
[1] 國家郵政局. 2014 年郵政行業發展統計公報[EB/OL]. (2015-04-29)[2015-06-25]. http://www.spb.gov.cn/dtxx_15079/201504/t20150429_462010.html.
[2] 國家郵政局發展研究中心, 德勤. 中國快遞行業發展報告(2014)[Z]. 2014.
[3] 王蓮花. 基于GM (1,1)模型的中國快遞行業收入預測分析[J]. 物流技術, 2012,31(2):84-86.
[4] 王蓮花. 我國快遞行業季度業務收入預測模型及分析[J]. 物流技術, 2014(6):144-146.
[5] 張仲斐, 趙一飛. 基于ARIMA 模型的全球跨國快遞業務量預測[J]. 華東交通大學學報, 2012,29(1):102-107.
[6] 王天保, 張玉軍, 武傳勝,等. 移動平均法在快遞預測上的研究[J]. 東方教育, 2014(11):177,315.
[7] 吳傳嶺, 施國洪. 基于二級多要素CES 生產函數的快遞業務規模研究[J]. 統計與決策, 2010(13):72-74.
[8] 徐群. 非線性回歸分析的方法研究[D]. 合肥: 合肥工業大學(碩士學位論文) , 2009.