宋萍,車軍輝,國婷婷,施尚永



摘要:利用環膠州灣(青蘭高速起始段及膠州灣大橋)14個高速交通氣象觀測站逐5 min監測資料,統計分析了冬季環膠州灣高速路面低溫(路面溫度t<0 ℃)出現頻率、出現時間特征及其與氣象要素的相關性。結果表明:冬季環膠州灣高速路面結冰風險普遍較高,空間分布上呈現西南高東北低的特點;最低路面溫度日變化趨勢與最低氣溫基本一致,全天各小時最低路面溫度均高于小時最低氣溫;14:00氣溫、路面溫度和18:00相對濕度與次日路面最低溫度呈正相關,18:00風速與次日路面最低溫度呈負相關。經過參數調優的支持向量機(support vector machine,SVM)模型預報路面溫度t≤0 ℃準確率達到87.78%,高于多元線性回歸模型,并在獨立性檢驗中得到了驗證,對實際預報服務具有指導意義。
關鍵詞:膠州灣;路面低溫;支持向量機;多元線性回歸
中圖分類號:P49? ? ? 文獻標志碼:A? ? ? ?文章編號:2096-3599(2023)03-0000-00
DOI: 10.19513/j.cnki.issn2096-3599.2023.03.004
Climatic characteristics and SVM forecast model of subfreezing road temperature on the expressways around Jiaozhou Bay
SONG Ping1,2, CHE Junhui 1,2, GUO Tingting 1,2, SHI Shangyong3
(1. Key Laboratory for Meteorological Disaster Prevention and Mitigation of Shandong, Jinan 250031, China; 2. Shandong Meteorological Service Center, Jinan 250031, China; 3. Florida State University, Florida 32306, USA)
Abstract: The data used in this study is the 5-min observations of 14 traffic weather monitoring stations located at the beginning section of G22 Qinglan Expressway and Jiaozhou Bay Bridge. The frequency and occurrence time of subfreezing temperatures (t<0 ℃) in winter on the expressways around Jiaozhou Bay and their correlations with meteorological variables are statistically analyzed. The results are as follows. The risk of icy roads in winter is generally high in the study area, where the frequency of subfreezing road temperature is higher in the southwest than in the northeast. The diurnal variation of the minimum road temperature follows the same pattern with the minimum air temperature, and throughout the day, the hourly minimum road temperature is higher than the hourly minimum air temperature. The air temperature and road temperature at 14:00, relative humidity at 18:00 are positively correlated with the next-day minimum road temperature, while the wind speed at 18:00 is negatively correlated with it. The prediction accuracy of t≤0 ℃ by the support vector machine (SVM) model with optimized parameters is 86.78%, higher than that by the multiple linear regression model. The improved performance is verified in the test of independence, which offers significant guidance for the application in icy road forecast service.
Keywords: Jiaozhou Bay; subfreezing road temperature; support vector machine (SVM); multiple linear regression
引言
2022年,山東高速公路通車里程突破7 600 km,到2025年,全省高速公路及在建里程將達到10 000 km,基本實現“縣縣雙高速”,惡劣天氣會對高速道路交通安全產生嚴重影響,交通安全指揮、應急處置等氣象服務需求點多、線長、面廣。2021年以來,公安部交管局聯合交通運輸部公路局、中國氣象局減災司在山東開展“一路三方”交通應急聯動處置試點工作和惡劣天氣高影響路段優化提升氣象保障工作,其中道路結冰監測預警是交通氣象應急聯動處置和氣象服務保障中的重點難點。青島—蘭州高速公路,即G22青蘭高速,是中國國家高速公路網編號的東西方向主干線之一;青島膠州灣大橋是國家高速公路G22青蘭高速的起點段,是目前中國北方最長的跨海大橋,是山東高速公路網中的重要組成部分。因此,開展環膠州灣高速路面溫度預報研究對實現山東高速公路安全和暢通運行有重要意義。
有研究表明,道路結冰的先決條件是路面溫度t低于0 ℃[1-3],因此路面溫度是預報道路結冰的一個重要參數。美國及歐洲等國家在路面溫度預報方法研究方面起步較早,已經具備完善的路面溫度監測預報技術[4-5]。加拿大開發的路面溫度預報模型METRo(Model of the Environment and Temperature of Roads)結合觀測和預報數據,能夠實現對路面溫度的長時間預報[6]。Handler等[7]利用隨機森林方法建立網格化的路面低溫概率預報模型,該方法可以把物理模式不易計算的車流量、道路組成以及周邊建筑和地形陰影的影響考慮在內,統計評估顯示預測效果較好。近年來,我國高速公路交通氣象觀測站的布設也已進入高速發展階段,北京、河北、安徽和江蘇等省也都相繼開展路面溫度監測預警與預報技術研究[8-11]。曲曉黎等[12]開展京石高速路面溫度特征及預報模型研究,預報誤差在2 ℃以內的站點占80%。舒斯等[13]統計分析湖北73個含有路面溫度觀測的交通氣象觀測站,得出路面溫度達到0 ℃時的臨界氣溫,進而通過概率模型計算得到結冰起始拐點,指導高速公路及時采取消冰措施。閆昕旸等[14]、田華等[15]和朱承瑛等[16]應用逐步回歸、地表熱量平衡方程以及機器學習等方法建立了山區和滬寧高速最低路面溫度預報模型,預報結果與實況誤差較小,具有實際指導應用意義。袁成松等[17]、劉梅等[18]、李蕊等[19]和史達偉等[20]采用WRF模式、支持向量機和C4.5決策樹算法對滬寧高速及南京、湖北部分地區的的路面溫度進行預測分析,建立了路面高溫及低溫預報模型,對交通氣象業務有重要的應用價值。李蘭蘭等[21]利用泰安交通氣象觀測站逐時觀測資料建立了分季節路面溫度預報模型,最高準確率出現在冬季,達到78.8%。另外,根據山東高速公安交警路上巡查記錄,路面結冰的發生與路段地理地貌有很大關系,水體附近、橋梁、隧道口背陰處是路面結冰高發區。由此可見,利用交通氣象觀測站觀測資料對路面溫度的預報取得了很好的效果,但是路面低溫預報模型的建立有很強的地域性特點,而關于山東沿海地區的高速路面低溫研究還相當缺乏。因此本文利用山東環膠州灣高速交通氣象站觀測資料,通過分析路面低溫發生的時空變化特征,運用支持向量機(support vector machine,SVM)和多元線性回歸(multiple linear regression)方法構建環膠州灣高速路面低溫預報模型,并比較兩種模型的預報效果,擇優應用。
1 資料和方法
研究區域(圖1)為青島南部膠州灣附近,地處山東半島南部,瀕臨黃海,受海洋和陸地氣候共同影響。研究數據來自布設在G22青蘭高速起始段及膠州灣大橋的14個環膠州灣交通氣象觀測站2015—2021年共7 a冬季(12月—次年2月)氣溫、路面溫度、相對濕度、風向和風速等逐5 min的監測資料。本文中對監測資料偏差和缺漏數據進行必要的剔除與訂正。另外,為了保證路面低溫預報檢驗的獨立性,后文中第2節和第3節統計分析和建模中采用2015—2020年6 a冬季數據;第4節模型檢驗中采用2021年1 a冬季數據。
文中主要采用支持向量機(SVM)方法對路面低溫進行預報,并與多元線性回歸預報結果進行對比分析。支持向量機方法是利用核函數將自變量投射到高維空間,并利用二次規劃解出可以分隔兩類事件樣本點的超平面,即求解支持向量,進而根據自變量在高維空間相對超平面的位置來判斷分類,是一種有堅實理論基礎的小樣本學習方法。與傳統的神經網絡學習方法基于經驗風險最小化(以訓練誤差最小化為優化目標)準則不同,支持向量機方法實現了結構風險最小化原理(以訓練誤差作為優化問題的約束條件,以置信范圍最小化為優化目標)[22]。支持向量機方法中誤差懲罰參數C是對結構風險和經驗風險的折中,C越大越趨向于對訓練集全分對的情況,這樣會出現訓練集測試時準確率很高,但泛化能力弱;C值小,容錯能力增強,泛化能力較強[23]。如圖2所示,經過參數的調優,支持向量機學習結果是可以按照結構風險最小化原理的要求,從很多超平面P1中得到最優的超平面P0,既能將兩類樣本正確分開,又能使分類間隔最大,使得支持向量機方法的分類性能和泛化能力要好于傳統的分類方法[24]。由于高斯核函數(又稱徑向基函數,Radial Basis Function,RBF)具有較強的非線性映射能力,因此本文采用RBF作為核函數,其公式如下:
,
其中:為核函數的寬度,核函數參數決定了樣本空間至特征空間的一種映射關系。因此,需要根據實際應用對誤差懲罰參數C和核函數進行優化,以保證模型的最佳預測效果[25]。
多元線性回歸是最常用的統計分析方法,主要是根據最小二乘法原理,由歷史數據統計得到多個自變量與因變量之間線性的經驗關系。
實心點和空心點—兩類樣本。
2 環膠州灣高速路面低溫時間特征及影響因子分析
2.1 路面低溫出現頻率
當統計時段內出現最低路面溫度低于0 ℃記為出現1次;依此計算各個站點統計時段內路面低溫總次數,除以統計時段總日數,則得到各個站點路面溫度低于0 ℃的平均頻率。同樣求出最低路面溫度低于?2 ℃和低于?5 ℃的頻率。
由圖3來看,研究區域內0 ℃以下的路面低溫出現頻率整體較高,說明環膠州灣冬季路面結冰風險普遍偏高。不同強度路面低溫空間分布具有一定的相似規律,路面低溫頻率呈現出西南高東北低的特點。14個站路面溫度低于0 ℃的頻率最小值為46.65%,該值出現在膠州灣北側的D0403;低于0 ℃的頻率最大值達到85.50%,該值出現在膠州灣西側的D0407。14個站路面溫度的平均值達到63.50%。14個站路面溫度低于?2 ℃頻率和低于?5 ℃頻率最小值也都出現在D0403,分別為17.84%和3.90%,最大值也都出現在D0407,分別為59.67%和21.93%。
2.2 路面溫度及低溫發生的時間變化特征
特征選擇是機器學習過程中重要的一步,關乎最終模型性能的好壞,而且路面溫度與時間變化有很大關系,所以建模之前對每個站的路面溫度及低溫發生的時間變化特征進行分析討論,選擇最優的自變量與因變量。首先,通過對所有站點數據求平均得出環膠州灣高速各時次平均小時最低氣溫和平均小時最低路面溫度(后文簡稱最低氣溫和最低路面溫度);其次,計算每小時最低路面溫度低于0 ℃的出現頻率及各時次最低路面溫度為一天中最低值的頻率。
由圖4a可以看出,最低路面溫度和最低氣溫日變化趨勢基本一致,全天各時次最低路面溫度均高于最低氣溫,最低路面溫度最大值出現在13:00,早于最低氣溫1 h,并且二者差值在高值區(12:00—15:00)較大,最大差值達到3.81 ℃;最低路面溫度和最低氣溫最小值都出現在07:00,都低于0 ℃,且差值不大。由圖4b來看,站點日最低路面溫度出現的時間段相對集中,其中接近90%的最低路面溫度出現在06:00—08:00;降到0 ℃以下的頻率最小值4.05%出現在14:00,18:00之后開始明顯變大,最大值53.60%出現在07:00,變化起伏較大,且與平均低溫的日變化趨勢相反。冬季日落時間在18:00之前,與降到0 ℃以下的頻率增大時間一致,由此可見太陽輻射對環膠州灣高速路面溫度有重要影響。為了保證預警的時效性,并且考慮夜間路面結冰對道路安全的重要影響,結合路面低溫時間分布特征,最終,利用14:00—18:00的氣象變量建立模型預報18:00—次日13:00(后文簡稱“夜間到次日”)路面低溫發生情況。
2.3 路面低溫與氣象要素的相關性
支持向量機是二分類模型,因此使用夜間路面溫度是或否達到0 ℃以下作為因變量,多元線性回歸模型可使用夜間到次日最低路面溫度作為因變量。
在選擇模型的自變量時,自變量與因變量的物理關系和統計學上的關聯性都需要考慮,因此對路面低溫與氣象要素的相關性展開分析。表1給出氣溫、路面溫度等6個氣象要素與夜間到次日最低路面溫度的相關關系以及顯著性水平檢驗結果。計算結果表明14:00氣溫、14:00路面溫度和18:00相對濕度與次日最低路面溫度相關性較好,相關系數都超過0.4,并且都通過了顯著性檢驗。14:00—18:00的變溫反映了溫度的下降程度,溫度下降速度越快越容易出現路面低溫,相關系數結果表明,變溫與夜間到次日最低路面溫度為正相關,但是相關系數較小,相關性較弱。而18:00風速與夜間到次日最低路面溫度呈現負相關,即風速越大出現路面低溫的可能性越小,這可能與研究區域的海洋性季風氣候特點有關,冬季平均海面溫度高于陸面,11:00—18:00以海風為主[26-28],因此18:00的風速越大,夜間到次日最低路面溫度出現低溫的概率反而越小。
相關系數僅反映兩個變量自身均值起伏變化的一致程度,鑒于支持向量機方法的分類特性,還需要討論根據夜間是否出現低溫所區分的兩組自變量之間是否具有顯著差異,只有當兩組自變量存在差異時,才有可能反過來對是否出現低溫進行預報。首先將6組自變量分別按夜間是否出現低溫各分為兩組,選取其中4個變量的兩組概率密度(圖5)進行對比舉例說明。由相應結果可見,氣溫、路面溫度等相關系數較高的要素分組概率密度存在顯著差異,即通過這些變量可以對夜間是否出現低溫進行一定程度的區分,而相關系數為負的風速兩組差異表現為不顯著。在建立模型時,應綜合上述相關性分析和差異檢驗的結果來選擇自變量。
3 環膠州灣高速路面低溫預報模型
3.1 自變量組合
按照相關性大小設計了4種不同的自變量組合(表2)。組合A包含兩種溫度變量白天的溫度數值,組合B包含兩種溫度變量與相關性較大的相對濕度,組合C包含所有相關性為正的變量,組合D包含全部6個變量,這樣既可以對比出非溫度類變量、變溫等因素對預報效果的影響,也可以討論自變量與因變量的相關性對預報效果的影響。
3.2 模型參數調優
在環膠州灣14個站 2015—2020 年冬季數據中篩選出6 720組有效樣本。為了避免各個因子之間量級差異,首先,對自變量進行歸一化處理;其次,由于SVM分類性能受核函數及參數影響較大[29-30],因此選擇交叉驗證與網格搜索法進行參數選擇優化。
交叉驗證是將訓練樣本集均分為K組,稱為K折,每次用K?1折樣本為訓練數據,用另一折數據測試,這樣重復K次,一般折數越多,越精確,但是計算的時間會相應增加。網格搜索法是在初步設定的參數變化范圍內,將懲罰因子C和核函數參數γ放在一個規定的空間內,然后設置變化步長,依據擬定的坐標系劃分成等大的網格,針對每組參數進行訓練,直到找到最優的(C, γ)參數值。在本次SVM參數優化過程中,采用RBF核函數,設置C和γ的取值范圍為[0,100],交叉驗證折數K=5,采用交叉驗證網格搜索對所有自變量組合進行參數尋優,當C=32,γ=0.6時,模型準確率最高。
3.3 預報結果對比
兩種統計預報模型經過參數調優后的擬合率及預報準確率如表3所示。為與支持向量機模型進行平行比較,其中多元線性回歸方法的擬合率與準確率是將其直接預報的夜間最低路面溫度值轉換為“t>0 ℃”與“t≤0 ℃”兩類,再與實際觀測到的類別進行對比。由結果可見,兩種預報模型的最高預報準確率均出現在包含白天氣溫、路面溫度、變溫以及相關性較大的濕度的C組,并且高于包含所有變量的D組,表明白天的溫度和變溫對于夜間路面低溫發生的預報很重要,而且自變量并非越多越好,在建模時還是應該盡量選擇與因變量關聯性比較好的自變量。同時結果中也分別給出了夜間路面溫度“t>0 ℃”與“t≤0 ℃”時的預報準確率,這是因為我們不僅需要關注某個模型總體的預報準確率,更要關注這個模型錯報的部分是漏報還是空報,從風險管理的角度來看,低溫發生被漏報帶來的危害更大。C組中兩種模型的預報準確率都達到了84.00%以上,其中支持向量機模型總體預報準確率為87.30%、路面溫度t≤0 ℃的預報準確率為87.78%,都略高于多元線性回歸,因此在環膠州灣高速站點中,經過參數優化的支持向量機模型是更優的預報選擇。
4 路面低溫預報效果檢驗
通過對環膠州灣高速站點路面低溫出現時間特征及影響因子分析,利用支持向量機模型,建立了環膠州灣高速路面低溫預報模型。為進一步檢驗模型的預報效果,利用2021年冬季(2021年12月—2022年2月)數據建模,自變量采用表2中準確率最高的方案C,每個站點測試樣本數為90個。因為D0401、D0410和D0411站2021年冬季數據缺測,因此在檢驗中剔除。由11個站點檢驗結果來看,模型整體預報準確率高于80.00%,其中膠州灣西北側部分站點路面溫度t≤0 ℃的預報準確率超過90.00%,說明模型具有一定的實際應用價值和服務意義。
5 結論
本文利用環膠州灣(G22青蘭高速起始段及膠州灣大橋)的14個高速交通氣象觀測站2015—2021年共7 a冬季(12月—次年2月)氣溫、路面溫度、相對濕度、風向和風速等逐5 min的監測資料,統計分析了環膠州灣高速路面低溫出現頻率、出現時間特征以及與氣象要素的相關性,基于支持向量機和多元線性回歸建立了環膠州灣高速路面低溫(路面溫度t≤0 ℃)預報模型,并對模型預報效果進行對比檢驗,得出以下主要結論:
(1)冬季環膠州灣高速路面結冰風險普遍較高,路面低溫的最大頻率達到85.5%,空間分布上呈現西南高東北低的特點。
(2)對各站點數據求平均得出,小時最低路面溫度和小時最低氣溫日變化特征基本一致,全天中小時最低路面溫度均高于小時最低氣溫。
(3)在路面低溫與氣象要素相關性分析中發現,環膠州灣高速14:00氣溫、路面溫度和18:00相對濕度與夜間到次日最低路面溫度呈現正相關關系,且相關性較好,而18:00風速與夜間到次日最低路面溫度相關系數為負值。
(4)兩種統計模型最高預報準確率均出現在包含氣溫、路面溫度、相對濕度、空氣變溫和路面變溫的自變量組合中,其中經過參數調優的支持向量機模型準確率較高,路面溫度t≤0 ℃預報準確率達到87.78%,并在獨立性檢驗中得到了驗證,對實際預報服務具有指導意義。
最后,本文僅使用交通氣象觀測站點數據作為模型的輸入參數,未考慮天氣學變化、天空狀況等對路面溫度預報的影響,下一步將針對以上不足開展深入研究。
參考文獻:
[1] 董天翔,包云軒,袁成松,等.三種統計預報模型在江蘇省道路低溫預警中的應用[J].氣象科技,2018,46(4):773-784.
[2] 王可心,包云軒,朱承瑛,等.隨機森林回歸法在冬季路面溫度預報中的應用[J].氣象,2021,47(1):82-93.
[3] 鄒蘭軍,劉姝,陸勤靜.基于神經網絡的路面溫度模型與結冰潛勢研究[J].公路,2022,67(10):409-414.
[4] KARSISTO V, NURMI P, KANGAS M, et al. Improving Road weather model forecasts by adjusting the radiation input[J]. Met Apps,2016,23(3):503-513.
[5] MARCHETTI M, KHALIFA A, BUES M. Methodology to forecast road surface temperature with principal components analysis and partial least-square regression: application to an urban configuration[J]. Adv Meteorol,2015:1-10.
[6] CREVIER L P, DELAGE Y. METRo: a new model for road-condition forecasting in Canada[J]. J Appl Meteor, 2001,40(11):2026-2037.
[7] HANDLER S L, REEVES H D, MCGOVERN A. Development of a probabilistic subfreezing road temperature nowcast and forecast using machine learning[J]. Wea Forecasting, 2020,35(5):1845-1863.
[8] 曾峰,蔣勇.路面實測溫度的隨機性預估模型研究[J].公路,2016,61(10):1-8.
[9] LIU B, YAN S, YOU H L, et al. Road surface temperature prediction based on gradient extreme learning machine boosting[J]. Comput Ind,2018,99:294-302.
[10] 馮蕾,王曉峰,何曉鳳,等.基于INCA和METRo的江蘇省路面高溫精細化預報[J].應用氣象學報,2017,28(1):109-118.
[11] 曲曉黎,武輝芹,張彥恒,等.京石高速路面溫度特征及預報模型[J].干旱氣象,2010,28(3):352-357.
[12] 曲曉黎,齊宇超,尤琦,等.基于METRo模型的冬奧高速公路示范站路面溫度臨近預報方法[J].干旱氣象,2020,38(3):497-503.
[13] 舒斯,熊守權,陳英英,等.湖北省高速公路道路結冰預警模型[J].氣象,2019,45(11):1589-1599.
[14] 閆昕旸,王小勇,達選芳,等.甘肅高速公路山區段路面溫度特征及其預報模型[J].干旱氣象,2018,36(5):864-872.
[15] 田華,吳昊,趙琳娜,等.滬寧高速公路路面溫度變化特征及統計模型[J].應用氣象學報,2009,20(6):737-744.
[16] 朱承瑛,謝志清,嚴明良,等.高速公路路面溫度極值預報模型研究[J].氣象科學,2009,29(5):645-650.
[17] 袁成松,嚴明良,王秋云,等.滬寧高速公路高溫預警指標及預報模型的研究[J].氣象科學,2012,32(2):210-218.
[18] 劉梅,尹東屏,王清樓,等.南京地區冬季路面結冰天氣標準及其預測[J].氣象科學,2007,27(6):685-690.
[19] 李蕊,牛生杰,汪玲玲,等.三種下墊面溫度對比觀測及結冰氣象條件分析[J].氣象,2011,37(3):325-333.
[20] 史達偉,耿煥同,吉辰,等.基于C4.5決策樹算法的道路結冰預報模型構建及應用[J].氣象科學,2015,35(2):204-209.
[21] 李蘭蘭,宋永鵬,韓國泳.泰安高速公路路面溫度特征及預報模型[J].山東氣象,2016,36(2):58-63.
[22] 李元誠,方廷健,于爾鏗.短期負荷預測的支持向量機方法研究[J].中國電機工程學報,2003,23(6):55-59.
[23] 史朝印,呂震宙,李璐祎,等.結構失效概率計算的ASVR-MCS方法[J].機械工程學報,2019,55(24):260-268.
[24] 祁亨年.支持向量機及其應用研究綜述[J].計算機工程,2004,30(10):6-9.
[25] 焦業峰,王艷,紀志成.基于BLP-ALO-SVM的風電功率短期預測方法[J].系統仿真學報,2022,34(12):2535-2545.
[26] 邱曉暖,范紹佳.海陸風研究進展與我國沿海三地海陸風主要特征[J].氣象,2013,39(2):186-193.
[27] 郭麗娜,馬艷,于慧珍.青島沿海地區大風特征及其預警評估[J].海洋氣象學報,2022,42(2):90-98.
[28] 房云龍,鄭標,趙鐵成,等.青島流亭機場海風特征分析及對飛行的影響[J].海洋氣象學報,2018,38(4):115-121.
[29] 奉國和.SVM分類核函數及參數選擇比較[J].計算機工程與應用,2011,47(3):123-124.
[30] 孫志剛,王國濤,高萌萌,等.參數優化支持向量機的密封電子設備多余物定位方法研究[J].電子測量與儀器學報,2021,35(8):162-174.