曹 瑩,陳 旭,張躍博,龔 正
(湖北省交通規劃設計院股份有限公司,湖北 武漢 430051)
天門港位于湖北省中南部、漢江下游、江漢平原腹地的天門市境內,沿江上溯至襄陽,順江而下至漢口,是湖北省的重要港口。其地理位置優越,東與孝感市的漢川、應城接壤,北與荊門市的京山、鐘祥毗鄰,南面和西面隔漢江與仙桃、潛江、荊門相望,水陸交通發達。改革開放以來,天門港吞吐量持續增長,對當地社會經濟、產業布局等發揮著重要的支撐作用。對天門港吞吐量進行精準預測,可為后續的社會經濟發展提供科學的寶貴意見。
劉枚蓮,等[1]將BP神經網絡預測模型應用在北部灣港口吞吐量預測上,證明了與多元回歸模型相比,BP神經網絡預測模型精準度更高。李怡瑩[2]在BP神經網絡的基礎上,引入了寬度學習系統,對連云港吞吐量進行建模預測,發現引入寬度學習系統后,與原網絡相比,不僅神經網絡的學習時間大大減少,且訓練效果更加出色。單玉隆[3]通過遺傳算法優化神經網絡以及ARIMA模型兩種方式對GDP進行預測,通過比較分析得到遺傳算法改進神經網絡比起傳統的ARIMA模型的精度更高。石美娟[4]通過對上海市社會固定資產投資進行分析,利用ARIMA 模型對其進行預測,分析了預測方法的優勢和缺點。夏麗[5]將粗糙集理論引入回歸分析中,利用屬性約簡理論解決多重共線性問題,同時利用ARIMA 模型對區域用電量進行組合預測,具有良好的預測效果。
本文選取與港口吞吐量密切相關的因素,以天門港為例,采用BP神經網絡模型和ARIMA模型組合預測,結合2010-2019年實際數據(2020-2021年受新冠疫情、特大洪水影響,港口機構整合等外部條件限制,天門市無營運的貨物港口,2022-2023年港口又處于建設期,因此剔除2020-2022年非正常數據),預測天門港2023-2026年的港口吞吐量,并驗證其效果。
BP神經網絡算法將多種單一信息分布式存儲后協同處理,一般包含按照其梯度下降的原則,利用梯度搜索方法,從誤差反向傳播訓練至前段多層網絡,使實際與期望輸出值的誤差均方差最?。黄渌惴ê诵陌跋騻鞑ズ头聪騻鞑ィ斢嬎阏`差輸出時按從輸入到輸出的方向進行,而調整權值和閾值則從輸出到輸入的方向進行[6]。BP神經網絡模型示意圖如圖1所示。具體可分為兩個過程:

圖1 BP神經網絡模型示意圖
(1)網絡狀態初始化,確定輸入因素、輸出量、網絡層數和網絡節點個數。
(2)學習過程,包括向前計算和向后學習。
從輸入層到中間層的數學關系為:
從中間層到輸出層的數學關系為:
其中:ym和yj分別表示輸入層和中間層的輸入,yt表示預測結果值,μjm和λoj表示輸出層和中間層的網絡權重,μj和λo是中間層和輸出層的最大限制;n和l為節點數,fI和fo為激活的函數。
ARIMA(p,d,q)模型基礎原理是時間序列預測,包含自回歸過程(AR)和移動平均過程(MA)兩部分。其計算公式為:
式中:φ1,φ2,φ3…,φp為自回歸系數;p是自回歸階次;θ1,θ2,θ3…,θq是移動平均系數;q是移動平均階次;{ }ε是白噪聲序列,通常用于模型有效性檢驗。
當q=0 時,該模型成為AR(p)模型:
當p=0 時,該模型成為MA(q)模型:
ARIMA模型的具體建模步驟如下:
選取近10年吞吐量數據,運用單位根檢驗時間序列的平穩程度。如果為平穩的時間序列,則判斷是否為白噪聲序列,識別是自回歸、移動或移動平均回歸模型;通過自相關與偏相關估計值序列的圖形判斷在5%的顯著水平下,模型的自相關系數和偏相關系數不為零的個數,從而大致判斷該序列應選擇的具體模型[7]。通過估計與識別的殘差檢驗,確定模型的有效性;最后通過檢驗和比較,完成現狀與未來走勢的預測。ARIMA預測模型流程如圖2所示。

圖2 ARIMA預測模型流程圖
選用擬合優度方法對兩種預測進行簡單組合,以擬合誤差最小附以最大權重,其計算公式如下:
式中,sei為第i個模型的標準誤差。
再對組合預測結果進行平穩性檢驗,計算預測的誤差,利用BP神經網絡最大的訓練次數和最大誤差不斷調整相關參數,得到殘差優化后的港口吞吐量模型,最終得到ARIMA-BP神經網絡組合預測的港口吞吐量預測模型。組合預測流程圖如圖3所示。

圖3 組合預測流程圖
港口吞吐量的影響因素較多,根據近年來的觀測,選取天門市的第一產業總產值、第三產業總產值、社會固定投資額、地方財政收入和外貿進出口總額指標作為港口吞吐量預測模型的主要影響因素,見表1。

表1 港口吞吐量預測的主要影響指標表
2.2.1 數據預處理。采集天門港主要影響因素2010-2019年的各項數據,具體見表2。為適應模型仿真要求,對數據進行標準化處理,采用歸一化方法將數據限制在區間[0 ,1] 以內。歸一化處理后的數據見表3。

表2 天門港2010-2019年各影響因素及港口吞吐量統計表

表3 天門港2010-2019年各影響因素及港口吞吐量統計表歸一化處理后數據
2.2.2 網絡學習。將BP神經網絡算法中訓練次數設定為T=60 000 次,學習效率設定為L=0.035,誤差閾值定位E=0.65*10(-3),輸入變量個數為INPUT=6,輸出為OUTPUT=1,隱藏層神經元個數為H=8。將2010-2018年的數據作為訓練樣本,2019年的數據作為測試樣本。圖4為訓練樣本的訓練過程誤差圖??傻?,結果整體誤差率在0.076%。

圖4 預測誤差
通過樣本訓練后,確定了本次研究的BP 網絡預測模型,將測試樣本帶入訓練得到的模型中,得到的結果如圖5所示。

圖5 擬合效果圖
從擬合效果來看,2010-2018年的實際值與模擬值均接近,總誤差在0.076%以內,而2019年的吞吐量實際數據為99.70 萬t,經過BP 神經網絡的預測值為99.78萬t,表明可作后續預測所使用的模型。
2.2.3 預測結果。對天門市2023-2026 年的港口吞吐量進行預測,首先要對輸入層的5個變量進行大致預測,通過分析第一產業總值、第三產業總值、全社會固定資產投資、外貿進出口總額、地方財政收入5個經濟指標的歷年數據變化,采用二次指數平滑方法對這5 個指標進行預測,求得這5 個指標對應的2023年的預測值為:89.18 億元,280.01 億元,444.83 億元,16 984 萬美元,36.87 億元;2024 年的預測值為:90.12億元,282.21億元,451.23億元,17 231萬美元,37.76億元;2025年的預測值為:96.73億元,332.05億元,498.65 億元,18 923 萬美元,43.23 億元;2026 年的預測值為:103.51 億元,392.80 億元,531.33 億元,20 113萬美元,50.22億元。同樣,將上述預測數據進行標準化處理后得到2023 年的輸入量為(1.121 394 26,1.167 985 132,0.932 596 574,1.081 268 478,1.146 573 212);2024 年的輸入量為(1.139 169 322,1.188 885 245,0.944 497 334,1.097 268 889,1.172 602 74);2025 年的輸入量為(1.357 681 719,1.458 640 895,1.094 979 69,1.243 042 991,1.386 692 759);2026 年的輸入量為(1.803 194 116,1.825 896 545,1.396 462 046,1.412 317 093,1.768 782 778)。將處理后的數據輸入到已經生成好的BP神經網絡中,輸出的值再進行反標準化處理后得到2023-2026 年天門市港口吞吐量的預測值為:126.74萬t、137.66萬t、157.23萬t和170.48萬t。
2.3.1 時間序列特征分析。借助計量經濟學軟件EVIEWS進行統計分析,天門港港口吞吐量隨時間的變化呈現出明顯的正相關趨勢,是典型的非平穩時間序列,需要先對吞吐量數據進行平穩化處理,繪制折線圖如圖6所示,對其單位根進行ADF檢驗(如圖7所示),可得為平穩序列,取d值為1。

圖6 天門港港口吞吐量一階差分折線圖

圖7 單位根檢驗
2.3.2 模型的建立和檢驗。如圖8所示,差分后序列的自相關系數在滯后一階波動歸于零,在偏相關函數中,滯后一階后也同樣歸于零,較為平穩。由分析結果可見,可建立ARIMA((1,2,3,4),1,(1,2))的模型,經比較其調整后的R2,ARIMA(4,1,2)為最大,因此選取此模型為最優模型進行測算。

圖8 ARIMA檢驗參數估計結果
在Eviews中操作得到的殘差序列如圖9所示。通過對殘差序列進行白噪聲檢驗,殘差序列為白噪聲序列,殘差序列參數檢驗如圖10所示。

圖9 殘差序列

圖10 殘差序列參數檢驗結果
2.3.3 結果預測。利用ARIMA(4,1,2)模型對天門港港口吞吐量進行預測,原數據經過差分后得出預測值與原數值比較以及誤差分析。具體如圖11 所示。

圖11 擬合效果圖
從預測結果可知,2010-2018年的實際值與模擬值基本接近,整體誤差為0.266%;2019年吞吐量實際數據為99.7萬t,經過ARIMA模型的2019年吞吐量預測值為99.97萬t,可作為后續預測模型使用。
經計算,將BP神經網絡模型和ARIMA模型的標準誤差0.076%和0.266%代入式(6)可得其權重分別為0.71和0.29,從而得到最終預測值見表4。

表4 組合預測結果 (單位:萬t)
通過計算,BP 神經網絡模型的誤差為0.076%,ARIMA 模型誤差為0.266%,組合預測模型的誤差為0.072%,組合預測的誤差較小,預測的精度最高。不同預測模型誤差對比見表5。

表5 不同預測模型誤差對比分析
本文組合運用了BP 神經網絡預測與ARIMA 預測對天門港2023-2026 年的港口吞吐量進行預測。其中,BP神經網絡預測綜合考慮了天門港從屬天門市的各項社會經濟指標,從多個維度對港口吞吐量進行預測,更多考慮了其他因素對于港口吞吐量的影響,因此預測出的數據與考慮因素關系較大,聯動性較強。ARIMA預測則更多考慮數據自身的規律性,通過對數據進行處理,進而開展后續的預測。通過組合預測,結合兩種預測方法短期預測的優勢,將誤差控制在0.072%,未來可應用于短期水路貨運量預測。