李許峰 成高立 羅雅瓊 史小麗
(1.陜西高速機械化工程有限公司 西安 710038; 2.長安大學公路學院 西安 710064)
在公路養護市場化改革的過程中,養護預算編制的準確性和及時性是科學制定養護投資計劃的基礎。對公路養護資金測算進行有針對性地定量化研究,對實現養護費用的科學化、規范化管理具有較大的理論和現實意義。目前高速公路日常養護費用估算主要是根據養護預算定額計算各單項資產養護活動的費用總和確定的,這種估價方法需要預先確定各養護活動的工程量,再分別乘以其單價,匯總后得出總價。
目前國內對高速公路養護工程量的預測主要是通過分析影響養護費用的因素,建立養護費用或工程量與影響因素的數學模型,影響因素的分析過程常采用定性分析法[1-5]或定量分析法[6-7],常用模型包括多元回歸分析模型、BP神經網絡、灰色系統理論模型。部分學者著眼于探索路面使用性能與公路養護造價之間的關聯性[8],文獻[9]用層次分析法對歷年路面使用性能指數PQI重新標定,采用灰色模型GM(1,1)預測短期PQI值,得出路面使用性能指數下降程度(100-PQI)與單位里程小修工程量呈線性關系。文獻[10]建立路面狀況指數與破損率之間的關系,并擬合工程量,對坑槽類破損效果較好。文獻[11-12]采用灰色理論GM(1,1)模型預測高速公路養護成本;文獻[13]使用時間序列分析的ARMA(1,1)模型對養管資金做出預測。
由于高速公路小修范圍寬廣、細目眾多,現階段研究更多聚焦于具有顯著影響因素的小修細目(如路面小修細目),或者直接以日常養護費用這一總體性指標作為分析對象;前者使小修預算在編制過程中出現部分細目工程量無據可依的狀況,后者太過籠統,不夠精細化。事實上,有些細目其小修工程量并不受具體因素的影響,而是在運營過程中自然衰減呈現出隨機性的變化特征;本文以此類小修細目為研究對象,對這些隨時間變化的小修工程量引用python中的statsmodels庫采用ARIMA模型進行時間序列分析,試圖探尋此類小修細目工程量的變化規律。
某高速公路雙向路基長度256.618 km,路面面積3 740 827.23 m2,橋梁雙幅長度25 355 m,橋涵長31 457 m,波形梁鋼護欄總長536 m。現有2004-2021年期間每年平均日交通量(AADT)、標準軸載當量軸次(ESAL)、重車交通量(HT)、重車比例(HR)、特大橋比例、交通事故次數和各養護細目小修工程量數據。
對于高速公路小修工程量的逐年變化,首先會考慮是否與交通條件有關,在此借助SPSS軟件運用雙變量相關性分析方法研究小修工程量的影響因素。相關性分析要求數據服從正態分布,對于不滿足正態分布的數據取對數,取對數之后再進行相關性分析。以波形梁鋼護攔板更換(二波)小修細目為例,對工程量與通車年限(OA)、AADT、ESAL、HT、HR進行皮爾遜相關性檢驗(皮爾遜系數為2個變量之間的協方差和標準差的商)。表1為相關性檢驗結果。

表1 相關性檢驗
由相關性檢驗表第一行可知,工程量與通車年限、年平均日交通量、標準軸載當量軸次、重車交通量、重車比例均無顯著相關關系,即波形梁鋼護攔板更換(二波)工程量的變化與項目記錄交通條件無關。
歸納發現,標志標線的維修養護、伸縮縫維修、路肩與邊坡的防護與清理、排水設施新建與養護、護欄零部件更換等小修細目并無具體的影響因素。對于這些細目養護工程量的預測,不能依賴因變量與自變量的關系建立回歸模型,因此將目光放在時間序列分析上,研究工程量隨時間的變化規律。
時間序列分析通常用于對某一指標按一定順序排列而成的數列進行研究分析,揭示數據本身蘊含的內在規律,進行短期預測。常用的時間序列模型有自回歸模型(AR模型)、移動平均模型(MA模型)、自回歸移動平均模型(ARMA模型)和自回歸綜合移動平均模型(ARIMA模型)。ARMA模型是前2種模型的組合,其三者原始時間序列均為平穩序列,ARIMA模型將非平穩序列轉化為平穩序列后再進行剩余建模步驟。平穩序列即時間序列的均值和方差不發生明顯變化。本文實例中無具體影響因素的小修細目工程量時間序列經平穩性檢驗后為非平穩序列,因此選用ARIMA(p,d,q)模型建立工程量與時間的關系。
ARIMA(p,d,q)模型是一種時間序列建模方法,其建模的基本思想是對非平穩的時間序列用d次差分(時間序列在t時刻與(t-1)時刻的差值)使其成為平穩序列,再用ARMA(p,q)模型對該平穩序列建模,之后經反變換得到原序列。式(1)為ARIME(p,d,q)的一般表達式。
yt=?1yt-1+?2yt-2+…+?pyt-p+
ut-θ1ut-1-θ2ut-2-…-θqut-q
(1)
式中:?1,?2,…,?p為自回歸系數;θ1,θ2,…,θq為移動平均系數;{u}為誤差白噪聲,服從均值為0、方差為σ2的正態分布;{y}為原始時間序列差分后的平穩序列。
將歷年小修工程量按等間隔的時間先后順序組成時間序列,對于缺少數據的情況,采用插值法或借助移動趨勢線補齊。當預測高速公路某年的小修工程量時,截取該年度以前的小修工程量作為時間序列。
平穩性即要求經由樣本時間序列得到的擬合曲線在未來的一段時間內仍能順著現有的形態“慣性”地延續下去,且序列的均值和方差不發生明顯變化。對時間序列進行平穩性檢驗的目的是根據其平穩性建立與其相適應的時間序列模型。ADF檢驗即判斷含有高階序列自相關的序列是否存在單位根:如果序列平穩,就不存在單位根;否則,就會存在單位根。所以,ADF檢驗的H0假設是存在單位根,如果得到的顯著性檢驗統計量Test Statistic小于置信度(10%,5%,1%)的臨界值Critical Values,則對應有(90%,95%,99%)的把握來拒絕原假設,即序列平穩。
當經過檢驗確定是平穩序列之后的數據并非都能值得建立模型,只有符合動態規律性,即數據之間存在一定的相依性,歷史數據對未來的發展有一定的影響才值得去建立模型并做出預測。純隨機性檢驗就是檢驗數據是否值得建立模型的一項重要步驟。在進行純隨機檢驗之前,先引入純隨機序列,純隨機序列是指序列值彼此之間沒有任何相依性,過去的數據行為對未來的發展完全沒有影響。
從統計學角度來看,當時間序列為純隨機序列時,則表示該序列沒有任何分析的價值。Python白噪聲檢驗返回值lb_pvalue為基于卡方分布的p統計量,當p值小于0.05時表明序列為非白噪聲序列。
p、d、q是ARIME(p,d,q)模型的3個關鍵參數;d為差分次數,可由時間序列經平穩性檢驗和純隨機性檢驗后確定;p、q為階數,即當前時間節點的值與前p、q個歷史值相關,階數的確定需根據自相關圖(圖1)和偏自相關圖(圖2)判斷。

圖1 自相關圖
自相關函數(autocorrelation function,ACF)反映了t時刻和(t-k)時刻小修工程量yt、yt-k的相關性;k為滯后階數,即當前時刻的值與前k個時間點的值有關。自相關圖顯示沿x軸的滯后階數及y軸上的自相關系數(-1~1之間)。自相關系數實際上反映的不僅是yt、yt-k兩者的相關性,還有yt-k+1、yt-k+2、…、yt-1對yt-k的間接影響。
偏自相關函數(partial autocorrelation function,PACF)是剔除中間(k-1)個變量的間接影響后,yt-k與yt的直接相關性。長條狀渲染為95%的置信區間。
通過函數的自相關圖和偏自相關圖,可以確定出該模型的階數,然后進行參數估計及顯著性檢驗。表2為ARIMA(p,d,q)模型階數確定表。

表2 ARIMA(p,d,q)階數確定表
圖1表示自相關圖2階截尾,圖2表示偏自相關圖2階拖尾。若原始序列是平穩序列,模型則為MA(2);若序列是經d次差分后的平穩序列,模型則為ARIMA(d,2)。
為了檢驗ARIMA模型預測方法的有效性,對依托工程高速公路2021年的小修工程量進行預測,并與實際值對比檢驗。以更換護欄螺絲、維修收水口(C25混凝土)、波形梁鋼護攔板更換(二波)3個養護細目為例,表3為各年度小修細目工程量匯總表。

表3 小修工程量匯總表
當預測2021年的小修工程量時,取2020年及以前的數據作為時間序列。表4、表5為小修細目工程量時間序列平穩性檢驗和白噪聲檢驗結果。

表4 時間序列平穩性檢驗結果表

表5 時間序列白噪聲檢驗結果表
確定差分階數d后,根據d階差分序列的自相關圖和偏自相關圖,確定p、q值。表6為更換護欄螺絲、維修收水口(C25混凝土)、波形梁鋼護欄板更換(二波)小修工程量模型系數表,表7為小修工程量預測值與實際值對比結果。

表6 模型系數表

表7 預測值與實際值對比表
由于誤差項是不確定的,所以沒有具體的函數表達式,statsmodels庫可直接得到預測值。
由表7可知,預測值與實際值的絕對差異較小,表明用時間序列模型進行預測的有效性;相對誤差受到基數大小的影響,可作為輔助指標對預測結果進行判定。
小修工程量的合理確定對日常養護預算編制具有十分重要的作用。通過對某高速公路的小修工程量數據分析,得出以下結論。
1)需采用定量化分析方法研究確定各小修細目是否具有影響因素。
2)當小修細目不具有顯著的影響因素時,采用時間序列分析法預測小修工程量是一種可靠的方法。
3)不同養護細目需分別建立時間序列模型,且其模型不是一成不變的;因此需要及時更新積累的年度數據,用新數據加入后反映的趨勢來預測未來年度的變化情況。
4)養護過程中數據的積累非常關鍵,從數據中挖掘出信息并用于決策,才能體現用數據進行養護管理的理念。