辛靖宇,徐偉昊,趙子亮,郭 斌,朱慶林
基于深度學習的交通標志識別
辛靖宇,徐偉昊,趙子亮,郭斌,朱慶林
Xin Jingyu,Xu Weihao,Zhao Ziliang,Guo bin,Zhu Qinglin
(山東科技大學交通學院,山東青島266590)
圖像識別技術是無人駕駛實現的關鍵,交通標志識別是圖象識別的重要研究方向。選用MATLAB的AlexNet深度神經網絡模型,通過遷移學習對交通路標數據集進行訓練,將訓練結果與傳統的局部二值模式和方向梯度直方圖進行對比,得到AlexNet模型的交通路標識別準確度為98.79%,后兩者分別為86.3%、97.6%,AlexNet模型更優。
圖像識別;深度學習;機器學習;深度神經網絡模型
交通道路標志識別在輔助駕駛和無人駕駛技術中發揮著重要作用。無人駕駛仍須遵守交通法規,而交通標志是交通法規的直接體現,如何準確快速地識別交通標志對于提高無人駕駛的安全性和合法性具有重要作用。
交通標志的圖像識別本質上是一種分類問題,當前所用的傳統方法主要有最近領域法、決策樹分類法、人工神經網絡、支持向量機[1-3],每種方法各具優勢,但各自缺點也明顯。最近鄰域法花費時間較長、實時性差;決策樹分類法識別速度快,但誤識率相對較高;人工神經網絡的抗干擾能力差、結果不穩定;支持向量機所提取的圖像特征點較多,準確率較高,但識別時間長、速度慢[4-6]。
本文在上述方法的基礎上,考慮現實應用場景中對于交通標志圖像識別準確率和識別速率的要求,提出基于深度學習算法的交通標志圖像智能識別方法,在常規深度學習的識別模型基礎上進行遷移學習,并分別與傳統機器學習的局部二值模式和方向梯度直方圖特征提取算法進行仿真對照測試,結果顯示所提出的方法在識別準確率、識別速率方面較后兩者均有較明顯提升,滿足圖像識別現實場景的應用要求,縮短識別時間,可實現實時識別。
AlexNet為ImageNet 2012圖像識別挑戰賽冠軍,其網絡結構為8層:5層卷積層、2個全連接隱藏層和1個全連接輸出層,其使用網絡激活函數ReLU(Rectified Linear Unit,修正線性單元)使神經網絡更好地解決復雜的非線性問題,并在池化層之后添加LRN(Local Response Normalization,局部響應歸一化層),在隱藏全連接層前加入Dropout層,以此提高整個網絡的泛化能力[7]。該模型具有雙GPU(Graphics Processing Unit,圖形處理器)并行計算、LRN標準化層、重疊池化、ReLu激活函數、Dropout、數據增強等技術特點。
綜上,本文選用AlexNet對數據集進行訓練,并與LBP(Local Binary Patterns,局部二值模式)、HOG(Histogram of Oriented Gradient,方向梯度直方圖)進行準確率對比。
對AlexNet模型進行遷移學習,刪除其最后一個全連接層,將其余部分作為數據集的固定特征提取器,保留前5個卷積層和相應池化層以及3個全連接的參數,其他參數采用隨機初始化,最后一層為用于分類的Softmax層,其原理如圖1所示,利用所提取的特征訓練一個分類器實現模型遷移[8],其神經元個數為被分類任務數據集的圖像類別數量。

圖1 Softmax層工作原理
我國交通標志數量較多,為符合現實生活場景的識別條件以及滿足模型訓練對于圖像模糊度、光照條件變化的要求,所選用的交通標志數據集為Chinese Traffic Sign Database,其中共包括6 164幅交通標志圖像和58個標志類別,部分圖像如圖2所示。圖像分為訓練數據庫和測試數據庫兩個子數據庫。訓練數據庫包括4 170幅圖像,測試數據庫包括1 994幅圖像。從訓練數據庫和測試數據庫中共挑選2 199幅圖像和30個交通標志類別,具體類別及代號見表1。

圖2 交通標志圖像選取示例

表1 交通標志類別及代號
模型訓練時采用分批輸入方式,每次輸入10幅交通標志圖像。訓練模型的參數設置采用SGDM(Stochastic Gradient Descent with Momentum,動量隨機梯度下降)優化器,初始學習效率為0.000 1,進行3輪學習,每輪迭代219次,共計迭代657次,同時每進行兩次迭代后進行一次驗證,并將每一次的測試數據作為下次的訓練數據。
AlexNet模型識別交通標志的迭代準確率曲線如圖3所示,曲線在迭代0~70次處斜率最大,即準確率增長最快;曲線在迭代70~180次處斜率逐漸減小,模型準確率緩慢上升;曲線在迭代180次后出現波動變化,最終迭代準確率為98.79%。

圖3 準確率-迭代次數曲線
AlexNet模型的識別損失率趨勢線如圖4所示,總體為減小趨勢,并且隨著迭代次數增加趨于收斂。在迭代0~70次處損失曲線下降速度最快,后續迭代中,下降速度有所減緩,損失率最終收斂于1.21%。

圖4 損失率-迭代次數曲線
通過遷移學習對AlexNet模型自帶的物體識別類型進行改進,將原來識別1 000種物體改進為識別上文所述30種交通標志。改進后對于交通標志識別的準確率為98.79%,損失率只有1.21%,模型計算速度也有提升,用時17 min 完成了3輪周期共計657次迭代。
LBP是一種針對灰度圖像進行局部紋理特征提取的描述算子,以×窗口或圓形窗口的中心像素為閾值,與窗口范圍中的其他部分進行比較得出特征值,原理如圖5所示,在半徑為1、2的圓型區域中分別分布8個、12個采樣點。
由于LBP算子具有旋轉不變性,所以LBP模型具有旋轉不變性和灰度不變性,另外,LBP算法計算速度較快,所需的灰度值可以通過在圖5窗口的小鄰域內進行比較得到,使得在復雜的實時條件下分析圖像成為可能[9]。由于LBP算子具有灰度不變性,則將圖像旋轉后,再進行灰度化處理,發現無論正方形區域還是圓形區域,采用LBP算子采集周圍區域數值,之后進行旋轉,將最小值作為最終結果,其與旋轉照片所得結果相同,所以LBP對于方向并不敏感。所采用的灰度圖對光照有一定要求,若光照不均勻則不能正確反映圖像特征。

圖5 LBP原理
LBP算法關于KNN (K-Nearest Neighbor,最鄰近分類)模型對給出的2 199張交通標志的識別正確率為86.3%,此過程平均用時43 min。由圖6(a)ROC(Receiver Operating Characteristic Curve,接收者操作特性曲線)可知,當前KNN模型的假正率為0%,真正率為70%;由圖6(b)混淆矩陣可知,正確率100%的類別有12、17、20、29、30。

圖6 基于LBP的KNN模型訓練結果
HOG也是對于局部紋理特征提取的算法,首先將圖像進行灰度化處理,并將周圍劃分為區域像素進行梯度數值求解,得到局部歸一化的梯度方向直方圖,并據此構成特征[10]。HOG將統計得到的圖像局部區域的梯度方向信息作為該局部圖像區域的表征。
如圖7所示,Block為檢測目標畫面中的一個滑框;Cell為Block的下級,是用于分割畫面的窗口,且不可移動;HOG Bins表示直方圖區間。將整個圖片劃分為若干Cell,避免因有效值稀疏而帶來運算量大和受噪聲干擾的問題。另一方面,HOG在計算梯度前會對圖像進行歸一化處理,其對于圖像的幾何、光學形變均具有較為優秀的不變性。

圖7 HOG原理

圖8 基于HOG的KNN模型訓練結果
但由于HOG所采集的特征維度較多,所以采集的數據量大,數據處理難度較大,運算速度較慢、實時性較差,通常與降維方法搭配使用;另一方面,HOG難以處理遮擋問題,并且當人體動作或物體方向改變幅度過大時也不易檢測出來。
HOG算法關于KNN模型對給出的2 199張交通標志的識別正確率為97.6%,此過程平均用時20 min。由圖8(a)ROC可知,當前KNN模型的假正率為0%,真正率為96%;由圖8(b)混淆矩陣可知,正確率100%的類別有3、7、8、9、11、12、13、14、17、19、20、24、26、30。HOG對交通標志識別的正確率較LBP有明顯提高。
通過以上對比分析可以發現,改進的AlexNet模型相較HOG算法與LBP算法的KNN模型,不論在交通標志識別準確率方面還是交通標志識別效率方面均有提升,深度學習模型AlexNet相比LBP及HOG機器學習算法具有較大優勢。
隨著深度學習模型的不斷發展,在今后交通標志識別相關研究中,可以重點關注模型輕量化和便捷性,進一步提高模型識別的精度和速度,增強識別的穩定性。
[1]董娜,劉欣宇,吳愛國. 基于人工蜂群的新型圓形交通標志識別算法[J]. 天津大學學報(自然科學與工程技術版),2019,52(6):585-593.
[2]張興國,劉曉磊,李靖. BP神經網絡下的限速交通標志實時檢測識別[J]. 西安電子科技大學學報,2018,45(5):136-142.
[3]甘露,田麗華,李晨. 基于融合特征和BP網絡的交通標志識別方法[J]. 計算機工程與設計,2017,38(10):2783-2787,2813.
[4]徐巖,王權威,韋鎮余. 一種融合加權ELM和AdaBoost的交通標志識別算法[J]. 小型微型計算機系統,2017,38(9):2028-2032.
[5]劉亞辰,陳躍鵬,張賽碩. 融合式空間塔式算子和HIK-SVM的交通標志識別研究[J]. 交通運輸系統工程與信息,2017,17(1):220-226.
[6]李春祥,張浩怡. 基于混合多變量經驗模態分解和極限學習機的非平穩過程預測[J]. 上海交通大學學報,2020,54(4):376-386.
[7]李欽巖,孫鵬,韓虹. 基于改進的AlexNet的車輛顏色識別[J]. 警察技術,2021(4):57-60.
[8]許益喬,楊虹,張占月. 一種基于AlexNet遷移學習模型的空間目標ISAR像識別方法[J]. 兵器裝備工程學報,2022,43(5):210-219.
[9]魏祥坡,余旭初,張鵬強. 聯合局部二值模式的CNN高光譜圖像分類[J]. 遙感學報,2020,24(8):1000-1009.
[10]宋思蒙,錢勇,王輝. 基于方向梯度直方圖屬性空間的局部放電模式識別改進算法[J]. 電工技術學報,2021,36(10):2153-2160.
2022-10-24
1002-4581(2023)02-0035-04
U463.67+4
A
10.14175/j.issn.1002-4581.2023.02.009