于惠鈞, 張錦圣, 劉建華*, 彭慈兵, 劉麗麗, 龔事引
(1.湖南工業(yè)大學(xué)軌道交通學(xué)院, 株洲 412007; 2.湖南鐵道職業(yè)技術(shù)學(xué)院智能控制學(xué)院, 株洲 412012;3.湖南鐵路科技職業(yè)技術(shù)學(xué)院鐵道供電與電氣學(xué)院, 株洲 412000)
軌道交通列車的牽引/制動(dòng)控制性能取決于輪軌接觸行為,而軌面狀態(tài)是影響輪軌接觸行為的關(guān)鍵因素,通過有效識(shí)別軌面狀態(tài)可為列車高性能控制提供關(guān)鍵依據(jù)[1-4]。目前,軌面狀態(tài)識(shí)別方法主要以人工經(jīng)驗(yàn)判斷為主,效率低、實(shí)時(shí)性差等問題長(zhǎng)期存在,難以滿足高性能控制需要。傳統(tǒng)深度學(xué)習(xí)方法的引入有望提高軌面狀態(tài)識(shí)別精度,但需要平衡數(shù)據(jù)支撐,受天氣情況復(fù)雜多變等因素制約,部分軌面狀態(tài)樣本量偏少,導(dǎo)致軌面狀態(tài)樣本存在類別分布非均衡現(xiàn)象。非均衡分布的軌面狀態(tài)數(shù)據(jù)會(huì)造成模型偏向?qū)W習(xí)多數(shù)類別的特征,而對(duì)少數(shù)類樣本學(xué)習(xí)不足,進(jìn)而導(dǎo)致顯著的識(shí)別誤差[5]。
目前,針對(duì)非均衡數(shù)據(jù)的分類方法主要有數(shù)據(jù)層面和算法層面兩種[6-7]。前者通過對(duì)抗網(wǎng)絡(luò)[8-9]合成樣本或重采樣(欠采樣、過采樣)[10-11]方法改變類別數(shù)據(jù)分布,降低各類別樣本的數(shù)量差距,但對(duì)抗網(wǎng)絡(luò)或過采樣方法可能導(dǎo)致模型對(duì)合成的重復(fù)樣本過擬合,欠采樣又可能丟失潛在的價(jià)值特征信息[12-13];后者通過修改學(xué)習(xí)過程提高分類器對(duì)少數(shù)類的敏感性,保留樣本的全部初始特征信息,其中包含集成學(xué)習(xí)和代價(jià)敏感學(xué)習(xí)等。集成學(xué)習(xí)方法根據(jù)非均衡數(shù)據(jù)構(gòu)建多個(gè)具有差異性的分類器,并按照一定方式整合分類器的識(shí)別結(jié)果以提高總體準(zhǔn)確率,但該方法存在多個(gè)分類器訓(xùn)練時(shí)間長(zhǎng)、基分類器類型和數(shù)量選擇困難等缺陷[14]。代價(jià)敏感學(xué)習(xí)通過引入代價(jià)敏感系數(shù),增大訓(xùn)練過程中對(duì)少數(shù)類別錯(cuò)分的懲罰代價(jià),提高分類器對(duì)少數(shù)類的分類精度[15-18]。例如,Zhang等[19]通過自適應(yīng)差分進(jìn)化算法優(yōu)化訓(xùn)練數(shù)據(jù)集上的誤分類成本,得到總代價(jià)最小的進(jìn)化代價(jià)敏感深度置信網(wǎng)絡(luò);Peng等[20]提出一種新型雙向門控循環(huán)單元,并將其與代價(jià)敏感主動(dòng)學(xué)習(xí)策略相結(jié)合,應(yīng)用于非均衡數(shù)據(jù)分類。但上述方法較少考慮同類別中每個(gè)樣本重要性對(duì)分類結(jié)果的影響,且易犧牲多數(shù)類別的分類精度,整體效果提升有限。
為此,現(xiàn)提出一種基于注意力網(wǎng)絡(luò)和代價(jià)敏感學(xué)習(xí)的模型來(lái)解決非均衡數(shù)據(jù)下的軌面狀態(tài)識(shí)別問題。借助遷移學(xué)習(xí)將均衡數(shù)據(jù)的特征遷移到非均衡數(shù)據(jù),緩解數(shù)據(jù)非均衡引起的學(xué)習(xí)偏倚問題[21-22],減少訓(xùn)練時(shí)間;針對(duì)軌面狀態(tài)存在區(qū)域小、分散以及特征提取網(wǎng)絡(luò)提取特征信息不充分的問題,在骨干網(wǎng)絡(luò)ResNet18中添加卷積注意力機(jī)制(convolutional block attention module,CBAM)[23],加強(qiáng)網(wǎng)絡(luò)對(duì)軌面有效特征區(qū)域的注意力,提高軌面狀態(tài)識(shí)別精度;針對(duì)軌面狀態(tài)樣本類別分布非均衡問題,采用改進(jìn)的影響平衡損失函數(shù)(influence-balanced loss,IB Loss),根據(jù)每個(gè)樣本對(duì)決策邊界的影響自適應(yīng)地為樣本分配不同的權(quán)重,減輕困難樣本中多數(shù)類樣本對(duì)決策邊界的影響。最后在不同的非均衡比下對(duì)所提方法進(jìn)行驗(yàn)證與分析。
結(jié)合株洲車輛段鐵路線紅旗路段軌面狀態(tài)數(shù)據(jù)的實(shí)際情況,將軌面分為干燥、潮濕、油污3種狀態(tài)。重點(diǎn)針對(duì)非均衡軌面狀態(tài)數(shù)據(jù),構(gòu)造基于注意力網(wǎng)絡(luò)和代價(jià)敏感學(xué)習(xí)的軌面狀態(tài)識(shí)別模型,如圖1所示。

圖1 模型結(jié)構(gòu)框圖
在圖1所示的模型框圖中,遷移學(xué)習(xí)模塊通過預(yù)訓(xùn)練模型在目標(biāo)任務(wù)中進(jìn)行優(yōu)化,實(shí)現(xiàn)均衡數(shù)據(jù)集的特征轉(zhuǎn)移。特征提取模塊由骨干網(wǎng)絡(luò)ResNet18與CBAM機(jī)制組成,通過在通道和空間維度上加強(qiáng)網(wǎng)絡(luò)對(duì)有效特征的學(xué)習(xí)能力,減少特征提取中產(chǎn)生的冗余特征信息,以輸出更具全局信息的特征;軌面狀態(tài)識(shí)別模塊采用改進(jìn)的IB損失函數(shù),通過每個(gè)樣本對(duì)決策邊界影響大小的反比重新加權(quán)損失實(shí)現(xiàn)反向傳播,以更好地指導(dǎo)網(wǎng)絡(luò)學(xué)習(xí)軌面狀態(tài)特征,得到更精確平滑的決策曲線。
在軌面狀態(tài)數(shù)據(jù)集中,非均衡的樣本分布導(dǎo)致特征提取網(wǎng)絡(luò)對(duì)少數(shù)類樣本特征學(xué)習(xí)不充分,甚至偏向?qū)W習(xí)多數(shù)類特征。為緩解這一負(fù)面影響,引入遷移學(xué)習(xí)方法,即首先在平衡數(shù)據(jù)集上對(duì)特征提取網(wǎng)絡(luò)ResNet18進(jìn)行預(yù)訓(xùn)練,在準(zhǔn)確率收斂且學(xué)得平衡樣本特征分布后,保存預(yù)訓(xùn)練模型參數(shù)。然后創(chuàng)建一個(gè)目標(biāo)網(wǎng)絡(luò)CBAM-ResNet18,該目標(biāo)網(wǎng)絡(luò)復(fù)制預(yù)訓(xùn)練模型中除輸出層以外的模型設(shè)計(jì)和參數(shù),以作為軌面狀態(tài)圖像特征提取器。其次為目標(biāo)網(wǎng)絡(luò)添加輸出大小為軌面狀態(tài)數(shù)據(jù)集類別數(shù)3的輸出層,并隨機(jī)初始化該層的參數(shù)。最后,將目標(biāo)數(shù)據(jù)集即非均衡軌面狀態(tài)數(shù)據(jù)輸入目標(biāo)網(wǎng)絡(luò)中,并通過調(diào)節(jié)特征提取網(wǎng)絡(luò)的參數(shù)獲取數(shù)據(jù)底層特征,以保證模型能夠有效遷移,從而提高模型的準(zhǔn)確率和泛化能力[24]。
考慮到軌面狀態(tài)分類任務(wù)規(guī)模較小且實(shí)時(shí)性要求高的需求,選取可平衡訓(xùn)練效率和網(wǎng)絡(luò)深度的ResNet18作基礎(chǔ)骨干網(wǎng)絡(luò),以保證軌面狀態(tài)特征提取能力及較快的網(wǎng)絡(luò)訓(xùn)練速度。ResNet18網(wǎng)絡(luò)處理軌面狀態(tài)圖像時(shí),未對(duì)各特征通道進(jìn)行權(quán)重區(qū)分,使得無(wú)關(guān)的特征繼續(xù)傳遞,造成特征信息提取不準(zhǔn)確。因此,在網(wǎng)絡(luò)結(jié)構(gòu)中引入CBAM機(jī)制,通過為各特征通道添加權(quán)重信息,充分利用特征圖的通道信息和空間信息,在捕獲整體特征的基礎(chǔ)上重點(diǎn)關(guān)注軌面狀態(tài)區(qū)域的顯著性特征,抑制無(wú)用特征的傳遞,輸出更具軌面狀態(tài)圖像全局信息的精細(xì)特征圖。針對(duì)軌面狀態(tài)有效區(qū)域存在分散和面積較小的問題,CBAM可加強(qiáng)網(wǎng)絡(luò)對(duì)軌面狀態(tài)特征區(qū)域的注意力,有效提取不同大小的軌面狀態(tài)區(qū)域特征,進(jìn)一步提升模型性能。

(1)
(2)
(3)
F1=Mc?F
(4)
式中:σ為Sigmoid激活函數(shù);?為點(diǎn)乘操作。

(5)
(6)
(7)
F2=Ms?F1
(8)
式中:f7×7為大小為7×7的卷積核。
CBAM模塊內(nèi)部結(jié)構(gòu)特點(diǎn)可避免卷積乘法帶來(lái)的高計(jì)算量,具有通用性強(qiáng)和可移植性高的優(yōu)勢(shì),該模塊能夠直接嵌入卷積操作后或殘差塊中,與卷積神經(jīng)網(wǎng)絡(luò)一起進(jìn)行端到端訓(xùn)練[25-26]。由于所提出的方法采用預(yù)訓(xùn)練模型,為了不改變ResNet18的網(wǎng)絡(luò)結(jié)構(gòu)以便使用預(yù)訓(xùn)練參數(shù),CBAM模塊不能加在殘差塊中,而是加在網(wǎng)絡(luò)的第一層卷積和最后一層卷積之后。
代價(jià)敏感學(xué)習(xí)的優(yōu)化目標(biāo)在于最小化分類器分類錯(cuò)誤的總代價(jià),而非簡(jiǎn)單的減少分類錯(cuò)誤率。傳統(tǒng)代價(jià)敏感方法對(duì)同類樣本賦予相同權(quán)重,但一些關(guān)鍵樣本對(duì)模型參數(shù)確定貢獻(xiàn)更大,對(duì)決策邊界形成更具有影響力。針對(duì)這一問題,研究者提出根據(jù)樣本分類難度重新加權(quán)樣本的方法[27],該類方法降低了易分類樣本的權(quán)重,并為困難樣本分配更多的權(quán)重。但由于軌面狀態(tài)數(shù)據(jù)集較小,ResNet18的高容量足以記憶整個(gè)訓(xùn)練數(shù)據(jù),根據(jù)樣本分類難度或損失重加權(quán)的方法會(huì)導(dǎo)致網(wǎng)絡(luò)對(duì)位于多數(shù)類和少數(shù)類重疊區(qū)域的困難樣本過擬合。Park等[28]提出一種新的影響平衡損失函數(shù)(IB損失函數(shù)),根據(jù)每個(gè)樣本對(duì)決策邊界的影響自適應(yīng)地為樣本分配不同的權(quán)重,以減輕決策邊界對(duì)多數(shù)類的過擬合,創(chuàng)建更平滑的決策曲線。衡量樣本重要性的影響函數(shù)IB(x;ω)表達(dá)式為
IB(x;ω)=‖f(x,ω)-y‖1‖h‖1
(9)
式(9)中:f(x,ω)為模型;y為標(biāo)簽值;h=[h1,h2,…,hL]T為隱藏特征向量,為全連接層的輸入。
結(jié)合式(9)得到IB損失函數(shù)為
(10)

在非均衡軌面狀態(tài)數(shù)據(jù)集中,多數(shù)類樣本入侵到少數(shù)類中,并在困難樣本中占據(jù)主導(dǎo)地位,致使決策邊界復(fù)雜化并向少數(shù)類區(qū)域移動(dòng)。通過調(diào)整困難樣本的權(quán)重有助于形成更加平滑準(zhǔn)確的決策邊界,但權(quán)重調(diào)整效果受到數(shù)據(jù)集特性、模型結(jié)構(gòu)以及具體實(shí)現(xiàn)方式等多種因素的影響。采用的軌面狀態(tài)數(shù)據(jù)集呈現(xiàn)非均衡分布的特點(diǎn),并且樣本數(shù)量相對(duì)較少,不宜采用類加權(quán)項(xiàng)λk。為更有效地利用IB損失重加權(quán)軌面狀態(tài)樣本訓(xùn)練損失,提出一種新的類加權(quán)項(xiàng)βk,βk表達(dá)式為
(11)
新的類加權(quán)項(xiàng)βk通過調(diào)整軌面狀態(tài)圖像標(biāo)簽頻率對(duì)損失權(quán)重的影響,增加軌面樣本的整體權(quán)重,以此避免過度降低邊界樣本中多數(shù)類的權(quán)重。同時(shí),βk通過減緩多數(shù)類別損失最小化的速度來(lái)進(jìn)一步緩解樣本總體非均衡分布引起的決策邊界偏差問題,從而減輕非均衡軌面狀態(tài)數(shù)據(jù)集對(duì)模型性能的影響,提高決策邊界的準(zhǔn)確性和穩(wěn)定性。
2.1.1 數(shù)據(jù)集介紹
實(shí)驗(yàn)使用的數(shù)據(jù)集來(lái)源于株洲車輛段鐵路線紅旗路段,包括油污、潮濕、干燥3種軌面狀態(tài)圖像141張。由于CCD相機(jī)采集的原始圖像包含大量背景信息和噪聲干擾,增加了模型識(shí)別的難度,為此針對(duì)軌面狀態(tài)數(shù)據(jù)集進(jìn)行預(yù)處理操作,其中包括中值去噪、幾何校正、軌面區(qū)域圖像提取等,從而提高網(wǎng)絡(luò)的魯棒性和識(shí)別精度。為解決訓(xùn)練樣本過少的問題,采用隨機(jī)上下翻轉(zhuǎn)、隨機(jī)左右翻轉(zhuǎn)、隨機(jī)調(diào)整亮度、隨機(jī)調(diào)整對(duì)比度等數(shù)據(jù)增強(qiáng)方法擴(kuò)充數(shù)據(jù)集,得到1 454張軌面狀態(tài)圖像,圖像增強(qiáng)效果如圖2所示。為便于網(wǎng)絡(luò)訓(xùn)練、測(cè)試,將圖像重構(gòu)為256×256像素大小。最后,以4∶1的比例對(duì)自建數(shù)據(jù)集進(jìn)行近似劃分,得到訓(xùn)練集1 154張,測(cè)試集300張,軌面狀態(tài)數(shù)據(jù)集如表1所示。

表1 軌面狀態(tài)數(shù)據(jù)集分布

圖2 數(shù)據(jù)集增強(qiáng)效果
2.1.2 實(shí)驗(yàn)配置
實(shí)驗(yàn)基于 Windows10 操作系統(tǒng),運(yùn)行環(huán)境配置如下。
(1)處理器:AMD Ryzen 5 5600H Six-Core Processor。
(2)運(yùn)行內(nèi)存:16 G。
(3)顯卡:NVIDIA GeForce RTX 3050。
(4)CUDA版本:cuda = 11.1。
(5)代碼運(yùn)行環(huán)境:python3.7,torch = 1.8.1,torchvision= 0.9.1,scikit-learn= 1.0.2。優(yōu)化器采用SGD;衰減系數(shù)(weight decay)為0.000 2;動(dòng)量系數(shù)(momentum)為0.9;批次大小(batchsize)為8;訓(xùn)練迭代次數(shù)(epoch)為200次;開始時(shí)的學(xué)習(xí)率設(shè)置為0.1,在50和100個(gè)epoch后下降0.1倍;隨機(jī)種子為42;超參數(shù)α為1 000。
2.1.3 評(píng)估指標(biāo)
為合理評(píng)估所提方法的分類性能,實(shí)驗(yàn)采用準(zhǔn)確率(accuracy, Acc)和召回率(recall,R)兩個(gè)指標(biāo)。其中,準(zhǔn)確率表示所有預(yù)測(cè)正確的樣本數(shù)占總樣本數(shù)量的比例,召回率表示正確被模型預(yù)測(cè)為正例的樣本數(shù)占全部實(shí)例為正樣本的比例。兩個(gè)指標(biāo)計(jì)算公式分別為
(12)
(13)
式中:TP為真陽(yáng)性(true positive),表示將正類預(yù)測(cè)為正類數(shù);FN為假陰性(false negative),表示將正類預(yù)測(cè)為負(fù)類數(shù);FP為假陽(yáng)性(false positive),表示將負(fù)類預(yù)測(cè)為正類數(shù);TN為真陰性(true negative),表示將負(fù)類預(yù)測(cè)為負(fù)類數(shù)。
為驗(yàn)證本文方法解決非均衡軌面狀態(tài)識(shí)別的性能,需要對(duì)建立的數(shù)據(jù)集進(jìn)行非均衡處理,即每個(gè)類的訓(xùn)練樣本數(shù)量從最大的多數(shù)類到最小的少數(shù)類呈指數(shù)下降。將第k類中所選樣本的數(shù)量設(shè)為nkμk,其中μ∈(0,1),nk為第k類樣本的原始數(shù)量,μ為非平衡比的倒數(shù),而非平衡比ρ定義為ρ=maxk{nk}/mink{nk}。最后,通過實(shí)驗(yàn)評(píng)估提出的方法在不同的非均衡比率下(ρ=50、100、200)的分類性能。
訓(xùn)練過程分為兩個(gè)階段:標(biāo)準(zhǔn)訓(xùn)練和微調(diào)訓(xùn)練。在標(biāo)準(zhǔn)訓(xùn)練階段,采用標(biāo)準(zhǔn)交叉熵?fù)p失函數(shù)CE形成初始決策邊界。微調(diào)訓(xùn)練階段使用改進(jìn)的IB損失函數(shù)降低困難樣本中多數(shù)類樣本的權(quán)重,減輕其對(duì)決策邊界的過擬合,以平滑分類器。兩個(gè)階段的過渡時(shí)間設(shè)置為模型訓(xùn)練損失開始收斂時(shí)期,即總訓(xùn)練輪數(shù)的一半,100 epoch。
2.3.1 消融實(shí)驗(yàn)
為驗(yàn)證不同改進(jìn)措施對(duì)網(wǎng)絡(luò)ResNet18識(shí)別性能的影響,在相同的實(shí)驗(yàn)環(huán)境和軌面狀態(tài)數(shù)據(jù)集下設(shè)計(jì)4組實(shí)驗(yàn),結(jié)果如表2所示。由于測(cè)試集每類樣本數(shù)一致,樣本總體召回率在數(shù)值上與準(zhǔn)確率相等。

表2 消融實(shí)驗(yàn)
由表2可知,改進(jìn)1使用ResNet18預(yù)訓(xùn)練模型,以緩解非均衡軌面狀態(tài)數(shù)據(jù)帶來(lái)的模型性能下降問題,相對(duì)于原模型,改進(jìn)1準(zhǔn)確率、召回率提升了9.33%。改進(jìn)2在此基礎(chǔ)上引入CBAM機(jī)制,增強(qiáng)網(wǎng)絡(luò)的特征提取能力和全局信息感知能力,對(duì)比改進(jìn)1準(zhǔn)確率、召回率提升4.00%。改進(jìn)3更進(jìn)一步引入改進(jìn)的IB損失函數(shù),實(shí)現(xiàn)自適應(yīng)分配樣本的誤分類代價(jià),進(jìn)一步提升網(wǎng)絡(luò)處理非均衡數(shù)據(jù)的性能,相較于改進(jìn)2準(zhǔn)確率、召回率提升了3.34%。因此,在原始ResNet18模型中添加的每一項(xiàng)策略都可發(fā)揮積極作用,表明所提出的網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)是合理有效的。
2.3.2 召回率實(shí)驗(yàn)
在非均衡分類問題中少數(shù)類具有更高的分類價(jià)值,為驗(yàn)證所提方法在提高少數(shù)類別召回率方面的優(yōu)越性,同時(shí)可不過多犧牲多數(shù)類別召回率,在3種非均衡比(P為50、100、200)下進(jìn)行實(shí)驗(yàn),結(jié)果如圖3所示。

圖3 召回率
圖3中,CE作為基線,是指標(biāo)準(zhǔn)交叉熵?fù)p失函數(shù);IB+CB[29]是指損失函數(shù)的權(quán)重部分使用CB損失函數(shù)中的有效樣本數(shù),而非IB損失函數(shù)中的類重加權(quán)項(xiàng)λk。分析圖3可知,在3種不同的非均衡比條件下,基線方法CE在少數(shù)類別的召回率最低,識(shí)別效果最差,表現(xiàn)出嚴(yán)重的學(xué)習(xí)偏移問題,而其他的三個(gè)對(duì)比方法IB[28]、Focal[30]、IB+CB在少數(shù)類別的召回率雖有不同程度的提升,但相比之下,本文方法提升程度最高,優(yōu)于其他方法。同時(shí),本文方法未改變訓(xùn)練樣本的初始分布,可以保留樣本全部特征信息,因此可以有效維持多數(shù)類的分類召回率,整體軌面狀態(tài)識(shí)別效果得到顯著提高。
2.3.3 對(duì)比實(shí)驗(yàn)
為驗(yàn)證本文方法在非均衡軌面狀態(tài)識(shí)別任務(wù)中的分類性能,基于自建軌面狀態(tài)數(shù)據(jù)集,在3種不同的非均衡比下將所提方法與CE、IB、Focal、IB+CB 4種對(duì)比方法進(jìn)行總體性能對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表3所示,同時(shí)繪制訓(xùn)練過程中各方法的損失函數(shù)值變化曲線如圖4所示 (以非均衡比100為例)。

表3 對(duì)比試驗(yàn)(準(zhǔn)確率/召回率)

圖4 損失值變化曲線圖
由表3可知,在3種不同的非均衡比例下,本文方法在軌面狀態(tài)數(shù)據(jù)集上的分類準(zhǔn)確率(召回率) 均優(yōu)于其他對(duì)比方法,分別為96.00%、90.67%、86.33%。具體來(lái)說,非均衡比為50時(shí),與CE、Focal、IB、IB+CB方法相比,所提方法的準(zhǔn)確率(召回率)分別提高10.67%、7.00%、2.00%、2.67%;非均衡比為100時(shí),所提方法的指標(biāo)分別提高10.00%、2.34%、7.34%、3.34%;非均衡比為200時(shí),所提方法的指標(biāo)分別提高13.33%、3.00%、7.00%、7.33%。上述實(shí)驗(yàn)結(jié)果證明了所提方法在不同的非均衡比場(chǎng)景下的適用性和優(yōu)越性。
由圖4可知,本文方法在訓(xùn)練過程中表現(xiàn)出損失起始值最小和收斂速度最快的特點(diǎn),表明本文方法可節(jié)約大量的時(shí)間成本,并減輕計(jì)算機(jī)的硬件壓力,提高模型訓(xùn)練效率。
聚焦于非均衡樣本下的軌面狀態(tài)識(shí)別問題,提出一種基于注意力網(wǎng)絡(luò)和代價(jià)敏感學(xué)習(xí)的識(shí)別方法,并通過實(shí)驗(yàn)對(duì)所提方法進(jìn)行驗(yàn)證,得到結(jié)論如下。
(1)為緩解非均衡軌面狀態(tài)樣本訓(xùn)練給特征提取網(wǎng)絡(luò)造成的學(xué)習(xí)偏見問題,該方法結(jié)合遷移學(xué)習(xí)思想,在均衡樣本特征分布后,將非均衡樣本輸入目標(biāo)網(wǎng)絡(luò)進(jìn)行微調(diào)以獲得軌面狀態(tài)底層特征;使用ResNet18為骨干網(wǎng)絡(luò),引入CBAM機(jī)制進(jìn)行雙維度的自適應(yīng)特征優(yōu)化,在提升模型運(yùn)行效率的同時(shí)強(qiáng)化網(wǎng)絡(luò)對(duì)軌面狀態(tài)區(qū)域的注意力。
(2)為解決軌面狀態(tài)數(shù)據(jù)非均衡分布問題,改進(jìn)IB代價(jià)敏感損失函數(shù),根據(jù)每個(gè)樣本對(duì)決策邊界的影響自適應(yīng)地分配不同的樣本權(quán)重,創(chuàng)建更加平滑的決策曲線。
(3)實(shí)驗(yàn)結(jié)果表明,與Focal等方法相比,所提方法在軌面狀態(tài)識(shí)別準(zhǔn)確率、訓(xùn)練速度等方面均表現(xiàn)出了優(yōu)越性。