999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于交叉熵的CNN交通標志識別方法研究

2018-02-12 17:29:35陳玉婷張鳳瑜
軟件導刊 2018年12期

陳玉婷 張鳳瑜

摘要:為了彌補經典LeNet-5卷積神經網絡模型在交通標志識別中易發生過擬合的不足,克服其識別準確率與訓練效率較低的缺點,采用GTSRB德國交通標志數據集,并對數據集進行擴充,使訓練集數量達到6 312 649張,同時對經典LeNet-5卷積神經網絡模型在激活函數、池化策略、隨機丟棄及網絡結構等方面進行改進,使用基于交叉熵的梯度下降算法對模型的誤差反向傳播過程進行優化。實驗結果表明,改進后的模型較改進前在識別準確率與訓練效率上都有所提高,識別準確率最高可達97.04%。因此,基于交叉熵的卷積神經網絡不僅能夠提高模型的交通標志識別準確率,有效防止過擬合,還能夠提升網絡訓練效率。

關鍵詞:交通標志識別;卷積神經網絡;交叉熵

Research on CNN Traffic Sign Recognition Method Based on Cross Entropy

CHEN Yu?ting,?ZHANG Feng?yu

(School of Information Science & Technology, Northeast Normal University, Changchun 130117,China)

Abstract:In order to make up for the shortcomings of the classic LeNet?5 convolution neural network model in traffic sign recognition and overcome the shortcomings of the recognition accuracy and low training efficiency, the data set of GTSRB German traffic sign is used and the data set is expanded to make the number of training setup to 6 312 649. The classical LeNet?5 convolution neural network model is improved in the aspects of activation function, pooling strategy, random discarding and network structure, and the algorithm of gradient descent based on cross entropy is used to optimize the error back propagation process of the model. Through the related experiments, the improved model has improved the recognition accuracy and training efficiency compared with the improvement, and the recognition accuracy reaches 97.04%. The convolution neural network based on cross entropy can not only improve the recognition accuracy of traffic signs recognition, effectively prevent overfitting, but also improve the training efficiency of the network.

Key Words:traffic sign recognition;convolution neural network;cross entropy

0?引言

近年來,智能交通決策系統得到了迅速發展,其能夠識別交通標志信息并作出下一步決策,從而輔助甚至代替駕駛員駕駛,減輕駕駛員的駕駛壓力,同時可對駕駛員的違規駕駛行為作出提醒,進而減少交通事故發生[1]。交通標志在道路交通中扮演著重要角色,其能夠直接指導駕駛員在行車過程中的行為。目前,汽車上普遍安裝了行車記錄儀,可以通過其采集道路交通信息,獲取交通標志,并進一步識別出交通標志的所屬種類。隨著城市的發展,道路交通安全設施日趨完善,交通標志的種類也日益豐富[2],因此對交通標志識別的泛化能力也有著較高要求。

隨著機器學習、深度學習[3]等人工智能技術的不斷發展與應用,在很多方面都取得了較好的應用效果,也有越來越多學者將卷積神經網絡算法引入到識別問題中。交通標志識別系統涉及多個領域[4],如模式識別、圖像處理、人工智能等,其識別過程一般包括檢測與識別兩部分。檢測過程一般利用交通標志的色彩、形狀等特征,檢測出包含交通標志符號的區域,然后通過相關技術判斷是否為感興趣區域[5];識別過程是先對感興趣區域進行預處理,如圖像歸一化,然后提取圖像特征并判斷是否為交通標志,以及所屬的交通標志類別[6],進而識別出交通標志。本文側重于研究交通標志的識別過程。目前,卷積神經網絡在交通標志識別方面存在著一些不足,如訓練過程冗長、識別準確率較低、網絡容易產生過擬合現象、網絡泛化能力不足等。因此,本文旨在利用淺層次卷積神經網絡,達到縮短訓練過程、提升網絡識別準確率的目的。

1?卷積神經網絡

卷積神經網絡(Convolutional Neural Networks,簡稱CNN)是在20世紀80年代后期發展起來的,在過去幾年中,有關卷積神經網絡的論文數量呈爆炸式增長,也取得了相當多的研究成果。卷積神經網絡主要應用于以下幾個方面:①圖像、視頻中的對象識別。如Facebook中的好友面孔標記、Snapchat中給圖像添加濾鏡等;②自然語言處理方面。如谷歌助理、亞馬遜Alexa語音識別等;③游戲方面。“AlphaGo”在圍棋領域首次戰勝了人類的世界冠軍。與神經網絡的研究相同,CNN的靈感來源于自然界,特別是人腦中的視覺皮層。視覺皮層中的神經元集中在圖像不同大小的斑塊上,從而在不同層次獲得信息,如果計算機可以利用該方式工作,即可能擁有類似大腦的識別圖像能力[7]。

卷積神經網絡的輸入為原始圖像[8],通過各層之間直接的信息處理與傳遞達到分類目的。圖1為卷積神經網絡基本結構。

卷積神經網絡結構主要分為3部分:卷積、池化與全連接網絡。

輸入為原始圖像,之后為卷積層(Convolution Layer),它是卷積神經網絡特有結構,卷積層需使用激活函數加入非線性因素,因為線性模型的表達能力不夠[9]。在卷積神經網絡的一個卷積層中,一個神經元只與相鄰層部分神經元連接,包含若干個特征平面(Feature Map),同一特征平面中的神經元共享同一權值,這里權值是指卷積核[10]。卷積核的初始化形式一般是隨機的,在網絡模型的不斷訓練過程中學習到恰當的權值。共享權值是卷積神經網絡的特點,其優點是減少了網絡層與層之間的連接,從而減少了網絡參數數量,同時也降低了出現過擬合的風險[11]。

在卷積層之后是池化層(Pooling Layer),池化也稱為子采樣,根據特定規則進行池化以降低特征平面維度,可有效防止過擬合問題。池化層也是卷積神經網絡的特有結構,但其沒有激活函數。卷積層與池化層的組合在卷積神經網絡中可出現多次,迭代次數根據具體應用場景與模型需要進行確定[12],卷積與子采樣簡化了模型復雜度[13]。

在若干卷積層與池化層組合之后是全連接層,全連接層的每一節點都與上一層的所有節點相連,用來將之前提取到的特征綜合起來進行分類輸出,在整個網絡中起到“分類器”的作用。

2?基于交叉熵的CNN網絡模型構建及優化

2.1?模型構建

LeNet-5卷積神經網模型已在手寫字體識別方面取得了很好的應用效果[14],但該網絡模型在交通標志識別問題中的分類效果仍不夠理想。因此,本文對經典的LeNet-5模型進行改進,對其網絡結構、參數設置等部分進行調整,主要改進方法有如下幾種:

(1)采用sigmoid激活函數。該函數可以將輸出結果映射到(0,1)區間,計算導數也非常方便。

(2)全連接層加入隨機丟棄。將LeNet-5模型中最后一層卷積層定義為全連接層,網絡的全連接層數為兩層,并在全連接層加入隨機丟棄。隨機丟棄的使用不僅能夠減少網絡參數數量,還能提升網絡訓練準確率。

(3)最后一層為softmax層。softmax回歸可用于多分類問題,其可將結果映射到(0,1)區間內,并將輸出結果轉化為概率問題。

因此,本文在原有LeNet-5神經網絡的基礎上改進了網絡模型結構,改進后的網絡模型架構如圖2所示。?其中,部分網絡參數設置如下:

(1)池化策略。在池化層中,常用池化策略有最大值采樣[15]、均值采樣與隨機采樣3種。根據相關理論,均值采樣能夠保留更多背景信息,而最大值采樣能更多地保留紋理信息,隨機采樣介于兩者之間,在平均意義上與均值采樣相似,在局部意義上與最大值采樣近似[16]。由于交通標志識別問題側重于對交通標志本身的識別,而忽略了背景因素,所以本文采用最大值采樣方法進行池化。

(2)權重初始化。在開始訓練網絡之前,網絡中的權重等參數是不確定的,需要根據實際訓練情況初始化參數。在訓練過程中,通常希望網絡能夠盡快收斂,而且輸出結果能夠具有較高準確率。因此,需要控制權重參數初始值范圍,使網絡輸出結果能夠盡量控制在希望的范圍內。本文權重初始化使用標準正態分布,以均值為0、方差為1進行隨機初始化,生成截斷正態分布的隨機數。截斷分布是在標準正態分布基礎上對其加以限制,從而使生成的數據在一定范圍內[17]。標準正態分布生成的數據范圍為負無窮到正無窮,但截斷式正態分布生成的數據在均值-2倍方差與均值+2倍方差范圍內。隨機產生的值不能偏離平均值的2個標準差范圍,如果超出則將其舍棄并重新獲取。偏置使用常量初始化函數,設置為0。

(3)Dropout隨機丟棄。在一批數據迭代時,每次更新參數前,隨機從全連接層中暫時去掉一部分隱藏層神經元。Dropout隨機丟棄并不是將這些神經元永久性刪除,以后不再使用,而是在下一批數據迭代前,模型恢復成最初的全連接模型,然后隨機去掉部分隱藏層神經元,迭代更新權值W與偏置值b,但是隨機去掉部分隱藏層后的殘缺全連接層與之前的殘缺全連接層是不同的。本文中所使用的Dropout值為0.5,Dropout能夠在一定程度上減少計算量,提升網絡識別率。

2.2?模型優化

在理想情況下,人們通常希望神經網絡能夠快速從錯誤中學習,以獲得更好結果,但在實踐過程中效果往往不如人意。當使用二次代價函數作為損失函數時,其函數可表示為?C=(y-a)2?2?,F假設神經元輸入為a,訓練輸入為x=1,目標輸出為y=0。如果使用權重及偏置表達該損失函數,有a=σ(z)。σ()表示激活函數,其中z=wx+b,則將x、y帶入后,權重與偏置的偏導數為:

從以上公式可以看出,權重與偏置的偏導數只與σ′(z)函數有關。

交叉熵可以在神經網絡的反向傳播過程中作為損失函數,在網絡權重更新中起到一定作用。用p表示樣本真實標記分布,q表示網絡模型訓練后預測標記的分布,交叉熵損失函數用來衡量p與q?的相似性。交叉熵損失函數還能避免sigmoid在梯度下降過程中出現學習速率降低的問題。Sigmoid函數圖像如圖3所示。

由圖3可以看出,圖像兩端sigmoid函數的曲線趨于水平,也即是說在激活函數?σ(z)的值等于1或0時,σ′(z)的值會很小,從而導致Cw與Cw的值也非常小,所以學習速率緩慢[18]。因此,本文引入交叉熵代價函數。

假設需要訓練一個網絡,網絡輸入為x?1,x?2,…,其對應權重為w?1,w?2,…,偏置值為b,則神經元輸出為a=σ(z),其中z=∑?jw?jx?j+b是輸入的帶權和,則該網絡的交叉熵代價函數可定義為:

其中,n為訓練數據總數,對所有輸入樣本x進行求和,y為標簽真實值(目標輸出),則w權重參數梯度為:

其中,σ(z)-y表示輸出值與真實值之間的誤差,σ′(z)=σ(z)(1-σ(z)),則在w權重參數的梯度公式中,σ′(z)被消除。所以,當σ(z)-y的值越大,誤差則越大,梯度值也越大,權重參數w調整則會越快,因此訓練速度也會更快。同理,計算偏置值b的梯度為:

因此,將二次代價函數更換為交叉熵損失函數,可避免因?σ′(z)?飽和帶來的學習率下降問題,從而提升學習效率。

3?實驗與分析

3.1?實驗設計

實驗分為兩個階段:網絡訓練階段與網絡測試階段。訓練階段將樣本批量輸入到網絡中,通過向前學習與誤差反向傳播對網絡權重等參數進行訓練,以獲得更好的網絡模型;測試階段將測試樣本輸入到訓練好的網絡中,測試網絡訓練效果,整體流程如圖4所示。

3.2?GTSRB德國交通標志數據集

本文使用GTSRB德國交通標志數據集進行訓練,GTSRB是2011年國際神經網絡聯合會議(IJCNN)舉辦的多級單一圖像分類挑戰賽中使用的數據集,為會議上公布的旨在為各類交通標志分類算法提供公開比較平臺的一個交通標志數據庫[19]。GTSRB專注于分類問題,數據集中的圖像大多沒有背景,因而比較適合本文的研究方向。GTSRB數據庫中的交通標志圖像全部從自然場景中采集得到,共有43類標志,其中訓練集有39 209幅圖像,測試集有12 630幅圖像,合計共51 839幅圖像[20],訓練集與測試集比例大致為4∶1。

為了豐富訓練數據集,提升網絡泛化能力與識別準確率,對原有數據集進行擴充。擴充采用圖像旋轉與平移兩種變換組合方式,變換后圖像大小不變,空缺部分用黑色填充。將旋轉角度控制在[-10°,10°]范圍內,負數表示逆時針旋轉,正數表示順時針旋轉,每旋轉1°定義一張新圖像;將平移控制在2個像素之內,分別在上、下、左、右4個方向進行平移,每平移一個像素定義一張新圖像。在生成數據集時,將旋轉與平移進行組合變換(旋轉+平移)生成新圖像,圖像變換效果如圖5所示。

圖5(a)為原始圖像,經過向下平移2像素并順時針旋轉10°變換為圖5(b)。因此,通過旋轉與平移的組合變換,原數據集中的一張圖像可演變出(10*2)*(2*4)=160張圖像。經過圖像變換,將訓練樣本集擴充為39 209*160=6 273 440張圖像,再與原GTSRB數據訓練集構成新的訓練集,共6 273 440+39 209=6 312 649張圖像。

3.3?結果對比

3.3.1?基于交叉熵的梯度下降算法優化前后對比

將網絡損失函數的最小值設為0,將網絡迭代次數設置為13 000次,目的在于排除網絡到達誤差閾值內而提前結束訓練的情況,以便于觀察損失函數在迭代次數增加時損失值的變化情況。

首先,使用傳統的平方差函數作為訓練損失函數,在訓練過程中,每迭代500次測試一次網絡的loss值與識別準確率。輸出使用平方差代價函數時,網絡loss值與準確率變化情況如圖6所示。

從圖6(a)中的loss值變化情況可以看出,網絡在第11 000次迭代以前的loss值不斷發生變化。其中,在4 000次內迭代時,loss值迅速下降,網絡收斂速度較快,在4 000~11 000次迭代時,網絡收斂減慢,但loss值也在下降;大約在11 000次后,loss值趨于零且網絡收斂。同時,網絡識別準確率的變化幅度也很小,使用平方差函數的網絡經過訓練,在13 000次迭代內達到的最高準確率為96.61%。

將平方差函數換成交叉熵,測試在sigmoid激活函數下該優化策略對網絡的影響。使用基于交叉熵的梯度下降算法,網絡loss值與準確率變化情況如圖7所示。

從圖7(a)中可看出,基于交叉熵的梯度下降算法在2 000~2 500次迭代前,loss值下降迅速;在2 500~10 000次迭代時loss值也在下降,網絡收斂趨于緩慢;在10 000次迭代后loss值趨于零,網絡收斂。使用基于交叉熵的梯度下降算法的網絡經過訓練,最高識別準確率達97.04%。

基于交叉熵的梯度下降算法使網絡誤差值增大,從而增大了梯度。參數w調整得越快,訓練速度也越快。改進的梯度下降算法較改進前能夠使網絡提前收斂,如果在訓練中設置一定誤差閾值,訓練迭代次數將會更少。實驗表明,基于交叉熵的梯度下降算法能夠使網絡收斂加快。

3.3.2?網絡改進前后對比

由圖8可知,在13 000次迭代內,LeNet-5模型對擴充后的GTSRB交通標志數據集的識別準確率相對較低,最高識別率為93.73%。隨著迭代次數增加,在訓練到12 000次左右達到最高識別率。本文改進后的模型在10 000~11 000次迭代之間收斂,且最高識別率為97.04%,說明改進后的模型能夠提升識別準確率。相比于改進前的LeNet-5模型,其對擴充后的GTSRB數據集識別準確率提升了3.31%,并且能夠加快網絡訓練速度,使網絡提前收斂,表明改進后的模型增強了網絡識別能力。

4?結語

本文在經典LeNet-5模型基礎上,使用基于交叉熵的卷積神經網絡模型,實現了一種高性能的交通標志識別算法。通過在德國交通標志數據集上進行實驗,實驗結果表明,改進后的模型相比于原模型具有更高的識別率,提高了網絡泛化能力,有效減少了過擬合現象,同時降低了網絡迭代次數,提升了訓練效率,改進后模型的識別準確率最高可達97.04%。通過對基于交叉熵的卷積神經網絡在交通標志識別方面的研究發現,在本文構建的模型中使用交叉熵作為損失函數,能夠使網絡提前收斂,并且在一定程度上提升了識別準確率。在今后的研究中,可以使用更深層次的網絡進行研究,深層次網絡對圖像特征的表達能力更強,并能進一步提升識別準確率,但深層網絡意味著更多的網絡參數,訓練時間也將更長,因此可以考慮使用交叉熵作為損失函數,進一步研究其對訓練速度的提升效果。

參考文獻:

[1]?畢建彬.道路交通事故的人因分析與駕駛員可靠性研究[D].北京:北京交通大學,2012.

[2]?王昔鵬.復雜場景下的交通標志識別技術研究[D].合肥:合肥工業大學,2017.

[3]?劉建偉,劉媛,羅雄麟.深度學習研究進展[J].計算機應用研究,2014,31(7):1921?1942.

[4]?齊飛.交通標志識別技術研究[D].北京:北京交通大學,2013.

[5]?榮慕華.道路交通標志識別研究現狀[J].群文天地,2012(2):273.

[6]?秦飛.交通標志實時檢測與識別技術研究[D].重慶:重慶大學,2011.

[7]?吳正文.卷積神經網絡在圖像分類中的應用研究[D].成都:電子科技大學,2015.

[8]?李彥冬,郝宗波,雷航.卷積神經網絡研究綜述[J].計算機應用,2016,36(9):2508?2515,2565.

[9]?張雪洪,杭曉敏,胡洪波.計算機在生命科學中的應用[M].上海:上海交通大學出版社,2003.

[10]?宋光慧.基于遷移學習與深度卷積特征的圖像標注方法研究[D].杭州:浙江大學,2017.

[11]?方寧,周宇,葉慶衛,等.基于無監督學習卷積神經網絡的振動信號模態參數識別[J].計算機應用,2017,37(3):786?790,822.

[12]?姜伶俏.基于卷積神經網絡的盲車牌識別算法研究[D].大連:大連海事大學,2017.

[13]?CSDN博客.卷積神經網絡[EB/OL].http:∥m.blog.csdn.net/article/details? id=52644511.

[14]?張慶輝,萬晨霞.卷積神經網絡綜述[J].中原工學院學報,2017,28(3):82?86,90.

[15]?JI S W, XU W, YANG M, et al. 3D convolutional neural networks for human action recognition[J]. Pattern Analysis and Machine Intelligence. IEEE Transctions on, 2013,35(1):221?232.

[16]?彭勁璋.面向交通標志識別的卷積神經網絡研究[D].北京:北京交通大學,2017.

[17]?CSDN博客.采用TensorFlow的截斷式正態分布生成數據[EB/OL].http:∥blog.csdn.net/weixin_40271376/article/details/79488267.

[18]?CSDN博客.關于神經網絡中的代價函數——交叉熵的由來[EB/OL].http:∥blog.csdn.net/yqljxr/article/details/52075053? _t_t_t=0.13459043968053863.

[19]?范延軍.基于機器視覺的先進輔助駕駛系統關鍵技術研究[D].南京:東南大學,2016.

[20]?唐睢睢.交通標志識別算法研究[D].北京:北京交通大學,2014.

主站蜘蛛池模板: 99视频精品在线观看| 久久综合一个色综合网| 亚洲无码视频一区二区三区| 国产成人精品男人的天堂| 亚洲第一在线播放| 欧美性色综合网| 国产性生交xxxxx免费| 欧美成人国产| 又大又硬又爽免费视频| 91久久偷偷做嫩草影院| 久热99这里只有精品视频6| 国产亚洲欧美在线视频| 97国产精品视频人人做人人爱| 免费人成视网站在线不卡| 国模沟沟一区二区三区| 国产丝袜啪啪| 国产在线视频导航| 免费一级毛片| 亚洲天堂首页| 影音先锋丝袜制服| 欧美在线一二区| 久久精品只有这里有| 国产亚洲视频在线观看| 亚洲一区黄色| 亚洲永久免费网站| 亚洲成人网在线播放| 欧美在线视频a| 色九九视频| 国产麻豆va精品视频| 午夜限制老子影院888| 国产地址二永久伊甸园| 亚洲日本精品一区二区| 激情无码字幕综合| 亚洲精品成人7777在线观看| 日本精品视频| 国产9191精品免费观看| 国产高清自拍视频| 久久精品电影| 在线播放真实国产乱子伦| 激情无码视频在线看| 亚洲视频免| 欧美专区日韩专区| 99在线视频免费| 天天婬欲婬香婬色婬视频播放| 久久77777| 久久久久亚洲av成人网人人软件| 永久免费精品视频| 伊人成人在线视频| 区国产精品搜索视频| 啪啪啪亚洲无码| 亚洲一级毛片免费观看| 天天综合网亚洲网站| 婷婷丁香在线观看| 日韩 欧美 小说 综合网 另类| 亚洲国产无码有码| 亚洲三级网站| 中文字幕66页| 亚洲av日韩av制服丝袜| 国产欧美亚洲精品第3页在线| 欧美激情,国产精品| 亚洲人成亚洲精品| 亚洲小视频网站| h网址在线观看| 亚洲av无码人妻| 中文字幕在线欧美| 91麻豆精品国产91久久久久| 国产精品主播| 国产成人毛片| 91小视频在线观看| 中文字幕啪啪| 国产成人毛片| 乱人伦视频中文字幕在线| 青青草原国产av福利网站| 日韩国产 在线| 免费国产高清精品一区在线| 日本不卡在线| 欧美成人一区午夜福利在线| 亚洲国产欧美目韩成人综合| 性视频久久| 国产高清又黄又嫩的免费视频网站| 国产青榴视频在线观看网站| 国产区人妖精品人妖精品视频|