李鑫
(中路高科交通檢測檢驗認證有限公司,北京 100088)
《“十四五”現代綜合交通運輸體系發展規劃》中提到:“交通運輸是國民經濟中具有基礎性、先導性、戰略性的產業,是重要的服務性行業和現代化經濟體系的重要組成部分”。隨著養護需求激增,國內外不斷探索新的檢測技術、檢測設備,探索科學的決策方法,研發新型環保養護材料,建立了集快速檢測、科學決策、養護設計一體化的全流程現代養護決策制度體系。
養護規模增大促進了路面自動化檢測技術的快速發展,檢測手段也從傳統的人工檢測發展到路面快速智能檢測與人工檢測相結合的方式。本文通過市場上主流的路面智能檢測設備所采集的車轍、平整度、跳車、構造深度等數據,探索分析4種指標之間的相關性。
該項目使用的路面測試設備可在正常行駛過程中采集路面車轍、平整度、跳車、構造深度指標。4個指標的測試結果均以10m為單位計算。在選定的路面上分兩組測試,隨機選取其中一組數據做測試組,用來分析各個指標之間的相關性,另一組數據則作為對比組。
依據現行《公路技術狀況評定標準》(JTG 5210-2018)對試驗指標開展計算分析及評價。
本文采用Pearson相關系數分析定量變量之間的關系,數值大小表示關系的強弱程度,范圍從0到1變化,符號“±”表示關系的方向即正相關或負相關。公式定義為:兩個連續變量(X,Y)的Pearson相關性系數ρ(X,Y)等于它們之間的協方差Cov(X,Y)除以它們各自標準差的乘積(ρX·ρY):

測試組的相關性結果計算如表1所示,RD代表車轍深度,IRI代表國際平整度指數,SMTD代表構造深度,PB代表路面跳車。從表1中可知IRI和PB存在很強的正相關,其他指標之間的相關性較弱。

表1 測試組各指標相關性

圖1 測試組各指標散點矩陣圖
測試組各指標散點矩陣如圖1所示,可以看出各個變量間的二元關系。例如,隨著RD的變化IRI、SMTD、PB基本保持不變,圖中顯示為一條直線。各指標顯著性檢驗結果如表2所示。

表2 各個指標之間顯著性檢驗
假設上述各指標的相關度為0,預計在2.2的16次方中IRI和PB的相關性只會有不多于1次的機會產生0.675的樣本相關度??紤]到這種情況發生的可能性極低,因此拒絕原假設,說明IRI和PB的相關性結果不是偶然因素導致的。相反,另外幾組指標間的相關性P大于0.05,這些指標相關性的結果很可能是偶然因素導致的,不具有統計學意義。
該研究使用OLS法通過自變量來預測因變量,通過自變量的加權預測量化的因變量。OLS回歸擬合模型的公式如下:

上述公式中,
計算后得到簡單線性回歸等式:

Pr(>|t|)對應的回歸系數P顯著不為0,觀察預測曲線后,在簡單線性回歸模型中添加變量的冪提高回歸預測精度,添加二次項、三次項后的多項式回歸等式為:

在Pr(>|t|)項中,各項回歸系數都很顯著,多項式模型的方差解釋率增加了3.8%。通過計算相對權重發現,IRI在預測變量中所占權重最大,達到49.63%。
兩個模型預測值與實測值的對比如圖2所示。
兩種PB預測值和PB實測值的趨勢基本保持一致,但部分預測數據與實測相比出現了不同程度的偏差。診斷兩種回歸模型,結果如圖3所示。

圖2 實測值與預測值對比

圖3 fit_4和fit_5兩種模型殘差圖
圖3中左側的兩幅Q-Q圖顯示,兩種模型除了個別點偏離了直線且落在置信區間外,剩余都落在置信區間內。其中兩幅Q-Q圖中都出現了3號點,查看測試數據與預測數據對比后發現,兩種模型都低估了該點的值。圖3中右側的兩幅柱狀圖中添加了正態曲線和核密度曲線,兩幅圖中同樣顯示殘差出現了偏移和離群值點,多項式回歸模型(fit_5)除了最右側的點離群外,殘差比較好地服從正態分布。
通過Durbin-Waston檢驗判斷殘差的獨立性。計算發現簡單線性回歸模型(fit_4)的p值顯著,說明有自相關性,殘差項之間不獨立;多項式回歸模型(fit_5)的p值不顯著,說明殘差項之間獨立,無自相關性,其結果如表3所示。

表3 殘差獨立性檢驗
通過成分殘差圖分析因變量和自變量之間的線性關系,簡單線性回歸模型(fit_4)和多項式回歸模型(fit_5)都呈現出較好的線性關系,如圖4所示。結果說明用線性模型擬合該組數據是合適的,比較兩種模型發現,添加了多項式后線性擬合更加充分。

圖4 fit_4、fit_5對各因素回歸的成分殘差圖
同方差性的檢驗結果顯示簡單線性回歸模型(fit_4)和多項式回歸模型(fit_5)的檢驗結果均滿足方差不變假設,但建議對模型(fit_4)冪次變換,其結果如表4所示。

表4 同方差性檢驗結果
fit_4和fit_5模型影響如圖5、圖6所示,可知圖中有離群點,例如3號點、175號點、200號點;48號點、49號點、50號點有高杠桿值;48號點、49號點、51號點是強影響點,刪除部分點會對模型的回歸系數有所影響。是否保留上述特異點需根據業務需求綜合判斷,該研究結合實際業務需求,保留以上特異點。

圖5 fit_4模型影響圖

圖6 fit_5模型影響圖
該研究的預測模型有兩個,但在其他相關性分析中或許有許多預測模型。因此需比選出預測精度更優的模型。通過AIC信息準則權衡預估模型的復雜度及擬合數據的優良性,推薦AIC值較小的模型,結果如表5所示。

表5 AIC信息結果
分別采用簡單線性模型(fit_4)和推薦模型(fit_5)預測對比組數據,預測結果如圖7所示。

圖7 對比組數據實測值與預測值
從對比組PB的預測結果來看,總體趨勢保持一致。但還有部分數據無論是簡單線性模型還是多項式擬合模型都沒有擬合到位,模型還需不斷完善。
本文結果表明,檢測設備采集的樣本中平整度和跳車呈現出很強的正線性相關;車轍-平整度、車轍-構造深度、車轍-跳車、平整度-構造深度、構造深度-跳車之間的相關性結果很可能是偶然因素導致的,不具有統計學意義;通過計算發現多項式回歸模型比簡單線性模型擬合效果略好;通過OLS擬合的兩種模型均有一定適用性,但還需不斷完善。