劉永雪, 李海明
(上海電力大學 計算機科學與技術學院, 上海 200090)
在車牌號識別模型中,傳統的神經網絡模型輸入層的每一個神經元代表一個車牌號圖片中提取出的像素值。但這種模型用于車牌號識別存在若干問題,一是每相鄰兩層的神經元都是全相連,產生大量參數,使模型訓練時間受到限制;二是堆疊更多的層次導致訓練時間指數倍增長,訓練效果受到限制。尤其是汽車車牌號的位置受外界環境因素影響較大,因此傳統的神經網絡已不能有效解決以上這些問題。這就需要運用卷積神經網絡(Convolutional Neural Network,CNN)來操作。CNN使用了共享卷積核,可以毫無壓力地處理高維數據,快速訓練,使得采用多層神經網絡變得容易,從而提高識別準確率。
在圖像識別領域的每一個重大突破無一不是用到了CNN。CNN可以直接將圖像數據作為輸入,不僅無需人工對圖像進行預處理和額外的特征提取等復雜操作,而且以其特有的端到端的特征提取方式,避免了圖像變形產生的特征提取不夠精確等問題[1]。
但是CNN也存在一些缺點,比如訓練時間長或者模型準確率不夠高的問題,采用梯度下降算法很容易使訓練結果收斂于局部最小值而非全局最小值,池化層可能丟失大量有價值的信息,從而忽略局部與整體之間的關聯性。為了使CNN更適用于實際應用,使用分層生成模型來處理高維圖像以達到較高的準確率[2]。卷積是神經網絡的核心計算之一,其計算復雜,模型運行大部分時間都耗費在卷積過程中,因此優化卷積計算來改進模型具有可行性?!?br>