楊溪源,李彥哲
(蘭州交通大學自動化與電氣工程學院, 蘭州 730070)
近年來,我國鐵路事業迅猛發展,隨著列車運行速度的不斷提高,鐵路運營安全成為人們關注的熱點。鐵路運營安全主要包括:列車車體安全、信號與通信系統安全、調度指揮安全等[1-2]。其中,脫軌作為列車車體安全考慮因素之一,容易受大風等自然災害的影響[3-4]。在大風環境及風口區域的高路堤、丘陵等特殊路段中,由于列車氣動性能惡化,導致列車穩定性受到嚴重影響,大大增加列車脫軌的可能性[5],因此,對鐵路風速預測研究,顯得尤為重要。
國外,文獻[6-7]提出在鐵路沿線建立擋風墻、列車外形優化等的方法,一定程度上解決了大風對高速列車運行的影響,但是有一定的局限性;文獻[8]根據列車運行沿線歷史風速數據以實現外推估計的風速預測研究,該方法簡單、實時性好,但預測精度不高;國內,文獻[9-11]針對鐵路沿線風速短期預測,學者分別利用時間序列分析理論和神經網絡等方法進行預測研究,很好的提高了風速預測精度,但存在神經網絡初始權值和選擇訓練數據樣本不易確定等缺陷,基于此,支持向量機法等機器學習型算法應運而生,以結構風險最小化為目標的SVM預測模型較神經網絡模型具有較高的精度,這在一定程度上克服了神經網絡在鐵路短期風速預測中的劣勢[12],但是SVM模型仍存在核函數選擇條件苛刻需遵循Mercer條件,核函數較多且其值的選取對SVM模型的預測精度有著較大的影響。在此,本文根據新型計算機算法相關向量機核函數選擇靈活無需遵循Mercer條件,核參數的設置數目少的特點,利用差分進化算法在參數優化方面的優勢,采用交叉算子可自適應調整的自適應差分進化算法,并混合了模擬退火算法對最優參數進行二次優化,提出了基于自適應混合差分進化相關向量機(Self-Adaptive Hybrid Differential Evolution-Relevance Vector Machine, SAHDE-RVM)的鐵路短期風速預測模型,通過實例對預測模型進行驗證,并與現有模型的預測結果進行對比分析。
相關向量機(Relevance Vector Machine, RVM)是一種基于貝葉斯框架的算法[13]。與傳統的SVM相比,RVM具有高稀疏性,僅有核參數的設置,核函數的選擇靈活,無需滿足Mercer條件等優點,在回歸預測方面有著良好的應用價值。
本文使用RVM進行回歸預測,建立RVM回歸預測模型。給定訓練樣本的輸入集X={x1,x2,x3,…,xn,}與相應的輸出集T={t1,t2,t3,…,tn},其中n為樣本個數,設ti為目標值且有ti∈R。輸出值ti的函數模型可表示為
ti=y(xi,w)+εi
(1)
式中,εi表示高斯白色噪聲,且εi服從分布εi~N(0,σ2),則p(ti|xi)=N(ti|y(xi,w),σ2)。RVM模型的輸出可表示為非線核函數的組合,核函數無需滿足mercer條件。RVM的回歸預測模型為
(2)
式中,wi為加權系數;K(x,xi)為核函數;N為樣本數量。
對于獨立分布的輸出集ti的似然估計為
(3)
式中,Φ=(Φ1,Φ2,…,ΦN);Φi=(1,K(xi,x1),…;K(xi,xn))T(i=1,…,N)。
由稀疏貝葉斯原理定義的權值參數為零的高斯先驗分布為
(4)
式中,αi為先驗高斯分布的超參數;α=(α0,…,αN)T。每個獨立的超參數αi控制著權參數wi的先驗分布,使相關向量機模型具有稀疏性。
由式(3)、式(4)根據貝葉斯原理計算權值矢量w的后驗分布
N(w|μ,∑)
(5)
式中,μ=σ-2∑φTt,∑=(A+σ-2φTφ)-1,A=diag(α0,α1,…,αN)。
由式(5)可知,若要確定權值矢量w需對超參數α、σ2進行確定。用貝葉斯框架計算超參數的似然分布
(6)
式中,C為協方差且C=σ2I+ΦA-1ΦT。

(7)

(8)
式中,uj是第j個后驗平均權值;γj=1-αjMjj(γj∈[0,1]);Mjj為權值協方差矩陣Σ的對角線元素。
RVM學習過程中,首先初始化式(7)、式(8)中的兩個參數,并通過更新迭代公式不斷更新計算兩個超參數,當模型中的參數均達到最大訓練次數時,更新計算停止,此時得到的α與σ2為最優值。若給定系統一個輸入值X*,則輸出的概率分布為
N(t)(t*|y*,σ2)
(9)
y*=uTΦ(X*)=uMPΦ(X*)
(10)

(11)

Storn R和Price K于1995年提出了差分進化算法(Differential Evolution,DE),DE是一種使用實數矢量編碼的群體智能化的優化算法,其原理類似于遺傳算法。DE具有強大的易用性、魯棒性和全局搜索能力,已有大量的文獻證明DE算法的優越性高于遺傳算法、蟻群算法等智能算法[14]。DE通過對群體中的個體分別進行變異、交叉、選擇等操作獲取最優個體,從而得到最優值。但DE算法仍然具有易早熟,較難搜索到全局最優解等缺陷,鑒于此,本文采用一種自適應混合差分進化算法(Self-Adaptive Hybrid Differential Evolution,SAHDE)[15-17],該模型可自適應調整DE的交叉概率算子CR,在算法的初期保持種群的多樣性的同時提高其全局搜索能力,并引入了模擬退火算法,該算法具有較強的搜索能力可對獲取的最優解進行二次搜索,SAHDE算法可解決DE算法早熟收斂,優化算法的全局所搜能力。差分進化算法的操作步驟如下。
(1)變異操作:DE算法由多種變異操作方法,本文選用如下方法進行變異操作。
xm=xbest+F[(x1-x2)+(x3-x4)]
(12)
隨機挑選出4個父代個體,分別記為x1,x2,x3,x4;xbest是父代中的最優個體;xm為變異產生的變異個體;F為變異率(F∈[0,1.2])。
(2)交叉操作:選取兩個個體xi和xm進行交叉操作,交叉操作后生成的新個體為xc,具體的操作方法如下式
j=1,2,…,D
(13)
其中,rand()表示[0,1]之間的隨機函數,randr(i)∈{1,2,…,D}為隨機產生的整數;D為優化變量的維數;CR為交叉率(CR∈(0,1))。

(14)


(15)
CR0為交叉算子CR的初值,CR的值根據上式自適應調整,初始值CR0較小,而后其取值逐步增大,此時算法具備一個優秀搜索算法所具備的能力,與傳統DE相比具有更好的性能。
DE種群的多樣性會導致其早熟收斂。為了進一步提高算法的搜索效率,本文使用模擬退火算法對SAHDE產生的當前最優個體進行二次搜索。在SAHDE當中,選定當前最優個體為初始個體,既y0=xbest初始溫度選定為T0,產生新個體的方式如下所示
yr+1,j=yr,j+ηε(xjmax-xjmin)
j=1,2,…,D
(16)
式中,r為模擬退火算法的迭代次數;yr為r次迭代后產生的新個體;η為控制擾動幅度;ε為服從均值或正態分布的隨機變量;xjmax、xjmin分別為第j維優化變量的取值范圍。