嚴彥 侯劍
【摘 要】 為正確預測內河港口貨物吞吐量,以江蘇省主要內河港口為例,從港口設施及腹地經濟出發,采用主成分分析法提取影響江蘇省內河港口貨物吞吐量的3個因素:第二產業值、地區生產總值及社會消費品零售總額,并在此基礎上建立預測模型。結果表明,模型可以較為準確地預測出江蘇省主要內河港口的貨物吞吐量,該模型擬合是有效的。
【關鍵詞】 主成分分析;內河港口;貨物吞吐量;影響因素;預測
0 引 言
內河港口是在河流、湖泊、水庫等水域內建造的港口。內河港口與沿海港口一樣,在綜合運輸網中充當“車站”的作用,是運輸網絡的節點,其對于水路運輸而言具有非常重要的作用。內河港口貨物吞吐量是指一段時期內經水運輸出、輸入港區并經過裝卸作業的貨物總量,是反映內河港口生產經營活動成果的重要數量指標,也是衡量該地區城市建設和發展的量化參考依據。[1]內河港口的發展將促進港口城市的繁榮,城市的繁榮又為港口貨運提供有力的支撐,港口與城市之間具有相輔相成、協調發展的關系。此外,隨著我國水路運輸業的發展,內河港口在綜合運輸網絡中的作用也越來越突出,正確預測內河港口貨物吞吐量對港口城市的發展十分重要。
影響內河港口貨物吞吐量的因素有很多,不僅有港口自身因素,還有港口腹地經濟因素。正確選擇指標對預測江蘇省內河港口貨物吞吐量十分重要。近幾年來,針對內河港口貨物吞吐量的研究不多,且大多是依靠經驗來選取變量的,但這樣的做法很可能由于經驗的偏誤而遺漏主要的影響因素,從而使得模型出現偏差。因此,本文在前人的研究基礎上,選取2007―2015年影響江蘇內河港口貨物吞吐量的指標數據,采用主成分分析法提取影響江蘇內河港口貨物吞吐量最主要的幾個因素建立預測模型,為預測江蘇內河港口貨物吞吐量提供重要參考。
1 建立模型
主成分分析法融匯了“降維”思想:利用線性組合的方法,將多個指標變成少數幾個綜合指標,使相關的指標化成不相關的指標,將問題簡單化,在減少計算量的同時避免了由于信息重復所引起的虛假性。
設n個樣品,x1,x2,…,xp-1,xp代表n個樣品中各個樣品觀測的p項變量,得到初始數據陣為
X==(x1,x2,…,xp)(1)
式中: xi=(x1i,x2i,…,xpi)', i=1,2,…,p。
利用矩陣X的x1,x2,x3,…,xp這p個變量作線性組合,可得:
(2)
此外,主成分分析的步驟如下:
(1)建立樣本矩陣;
(2)標準化初始數據;
(3)建立相關系數矩陣;
(4)根據特征值計算出方差貢獻率及累計方差貢獻率;
(5)求因子載荷矩陣:先取累計方差貢獻率大于一定數值的主成分,然后求出所取的主成分的因子載荷矩陣,其中數值視解釋精度而定,此處定為85%;
(6)求每個指標的綜合得分:由因子載荷矩陣乘以主成分的方差貢獻率可計算出綜合得分,指標的綜合得分可較全面地反應其影響程度[2]。
2 實證分析
2.1 指標選擇依據及數據來源
根據江蘇內河港口實際情況,選取2007―2015年可能影響江蘇內河港口貨物吞吐量的指標數據(見表1),其中包括總人口x1、地區生產總值x2、第二產業值x3、第三產業值x4、進出口總額x5、貨運量x6、社會消費品零售總額x7、泊位個數x8、泊位長度x9。
2.2 主成分分析
2.2.1 計算方差貢獻率
為了消除量綱的影響,首先對數據進行標準化處理,其次對標準化處理后的數據求其方差百分比及累計方差貢獻率,結果見表2。由表2可以看出:第一主成分方差貢獻率為82.833%,特征根為7.455;第二主成分方差貢獻率為12.351%,特征根為1.112。前兩個主成分的累計貢獻率為95.184%,特征根也均大于1,滿足特征值大于1或累計方差貢獻率達到85%以上的提取原則,因此選取前兩個主成分,剩余可舍去。
2.2.2 計算因子載荷矩陣
為了使3個主成分可以充分代表9個指標的信息,依據所提取的主成分計算因子載荷矩陣,結果見表3。
2.2.3 計算各項指標的綜合得分及排名
在主成分分析中,每個指標的綜合得分及排名狀況可以直觀地反映該指標影響江蘇內河港口貨物吞吐量的程度。指標的綜合得分可由主成分因子載荷乘以相應的貢獻率求出,具體結果見表4。由表4得知,綜合得分排名前3的指標分別為第二產業值、地區生產總值、社會消費品零售總額,表明這3個指標對江蘇省內河港口貨物吞吐量的影響最大的因素,因此在預測江蘇省內河港口貨物吞吐量時要著重考慮。
2.3 吞吐量預測
根據主成分分析結果,以第二產業值、地區生產總值、社會消費品零售總額為自變量,運用SPSS 14.0軟件建立預測模型。
由可決系數及F統計量(見表5)可知,調整后的可決系數為0.994,表明該模型對數據擬合優度較高。由于顯著性<0.001,可以判斷出所建立的方程是顯著的并且自變量與因變量之間具有顯著的線性關系。
因此,可建立江蘇省內河港口貨物吞吐量預測模型:
y=3.087.725 + 0.358 z1 + 6.085 z2 0.746 z3(3)
式中: z1代表地區生產總值; z2代表第二產業值; z3代表社會消費品零售總額;y代表內河港口貨物吞吐量。
江蘇內河港口貨物吞吐量預測結果見表6。從表6可知,除了2008年外,模型預測值與真實值之間的誤差均小于3%,表明該模型的擬合是有效的。
2.4 結 論
由以上分析得知,第二產業值、地區生產總值及社會消費品零售總額對江蘇省內河港口貨物吞吐量的影響最大,原因在于:
(1)在江蘇省第二產業中,建筑業發展迅速,每年總產值都以20%以上的速度發展,使得江蘇省成為全國同行公認的建筑大省。建筑業的發展帶動了江蘇省對建筑材料的需求,建筑材料需要通過內河港口進行運輸,因而推動港口貨物吞吐量的發展。此外,江蘇的蘇繡等紡織品很受國內外的歡迎,紡織品需要通過內河港口運往國內外,因而紡織品產量增加的同時也推動了江蘇省內河港口貨物吞吐量的提升,從而帶動內河港口的發展。
(2)地區生產總值可以直接反映港口城市的經濟發展狀況,港口城市經濟發展繁榮給港口貨運提供了有力的支撐。江蘇省地理位置優越、經濟發達,2016年GDP達77 388.28億元,在省級GDP排名中穩居第2。發達的經濟為江蘇省內河港口的發展營造了良好的環境,給江蘇省內河港口貨運提供了有力的支撐,促進了內河港口貨物吞吐量的提升。
(3)生活必需品等一般消費品是內貿集裝箱的主要貨物,在促進港口貨物吞吐量增長方面會起到一定的促進作用;但是在模型中,社會消費品零售總額的系數估計值為負數,這是由于江蘇省內河港口集裝箱使用量不能很好地滿足社會消費品的需求,還需進一步加大集裝箱的使用力度。集裝箱的推廣使用不僅可以降低貨物運輸過程中的損失、節省貨物轉運裝卸的時間,而且還可以大大降低運輸成本,為江蘇省內河港口發展帶來更大的機遇。
3 結 語
采用主成分分析法提取出影響內河港口貨物吞吐量最主要的3個因素,打破在研究內河港口貨物吞吐量影響因素時憑借經驗選取變量的傳統思想;以主成分分析結果為基礎建立預測模型,為內河港口進一步發展提供有力的模型數據支撐,打破在研究內河港口貨物吞吐量時只單一地研究影響因素或只單一地進行預測分析的傳統思維。以江蘇省內河港口為例進行預測分析,結果表明模型可以較準確地預測江蘇內河港口貨物吞吐量。
對港口的外部影響因素有很多,如政策的調整、國際環境的改變等都會對內河港口貨物吞吐量造成一定的影響,因此該方法較適用于中短期研究,對于研究長期內河港口貨物吞吐量還需進行進一步的分析和論證。
參考文獻:
[1] 真虹.港口管理[M].2版.北京:人民交通出版社,2009.
[2] 張萍,張守國.江蘇沿海港口吞吐量影響因素及預測分析[J].水運工程,2011(10):63-65.