999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

端對端的基于移動嵌入式端的車輛動態實時細粒度分類方法

2017-12-07 07:44:15林皞張琳
現代計算機 2017年30期
關鍵詞:分類特征檢測

林皞,張琳

(上海海事大學信息工程學院,上海201306)

端對端的基于移動嵌入式端的車輛動態實時細粒度分類方法

林皞,張琳

(上海海事大學信息工程學院,上海201306)

卷積神經網絡算法在物體分類與目標識別方面的具有非常好的魯棒性。提出一種端到端的新型的輕量級卷積神經網絡結構,針對目前神經網絡進行了結構壓縮;一種級聯形式多模型聯合檢測方法,完成小范圍的追蹤滿足實時檢測準確度;采用中心對齊的思想來對特征進行一致性統一,大大降低噪聲提高檢測的準確度。

卷積神經網絡;輕量級;級聯形式;特征一致性

0 引言

基于圖像處理的車輛類型識別技術是智能交通系統(IntelligentTransportSystem,簡稱ITS)中的一項非常重要的技術,同樣在計算機視覺應用領域中占有重要地位。本文提出一種基于手機等移動嵌入式終端的車輛品牌細粒度分類方法;采用基于實時視頻流的信息獲取方式,實現了自動的進行車輛品牌的識別、包括車型(小轎車,SUV,小貨車、客車和貨車)生產廠家(寶馬,奔馳,大眾…)具體型號(寶馬 x3,x5,5系,7系,大眾 cc,寶來,捷達...)。

現有的車輛類型識別技術中,主要集中于對車輛類型進行分步識別,例如首先對車輛款式進行分類,比如分類為大型、中型及小型三類,或者轎車、貨車、客車三類;然后依據車輛品牌類別及年款進行分類,例如大眾、寶馬、奧迪,依據這些識別結果得出車輛的整體類型信息,例如大眾帕薩特2007款,這種車輛類型識別方法操作復雜,計算量大,耗時較長,耗資較高。另外,目前車輛款式的識別方法需要保證車輛整體輪廓的清晰度以便檢測車輛的實際尺寸大小,因此該方法較難實現。另外對于現有的車輛類型識別技術,其中多數應用到了傳統的特征提取方法,例如梯度方向直方圖、局部二值模式紋理,在分析判別時大多采用了支持向量機(SupportVector Machine,簡稱SVM)方法。這些方法的使用具有局限性,例如在清晰場景下這些方法都有較高的識別率,但是在模糊場景下,例如因天氣變化、光線變化所引起的圖像模糊、夜間場景等場景下往往識別率較低;另外一般選取車輛的正面圖像(車頭、車尾)進行品牌識別,由于車輛外觀表觀形式復雜,因此對所檢測的車輛與攝像機的拍攝距離、拍攝角度有著嚴格的要求。

對于車型識別算法,常用的方法種類比較多,例如基于模板匹配、統計模式等。例如名稱為[1]“基于靜態圖片的自動套牌車檢測方法(申請號:201310397152.5)”的中國發明專利申請公開的技術方案”中,提取靜態圖片中車輛前部圖片,確定車頭燈、散熱器、品牌和保險杠區域;提取車輛圖片的特征,并采用隨機子空間分類器集成方法合并圖片特征;根據車頭燈、散熱器、品牌和保險杠信息確定車輛品牌。名稱為[2]“基于圖像的車輛品牌識別方法和系統(申請號:201310416016.6)”的中國發明專利申請公開的技術方案”中,通過檢測車牌在輸入圖像中的位置;根據車牌位置計算多個車輛部件位置;從該多個車輛部件位置的每一個抽取特征向量;以及對所抽取的特征向量進行分類并輸出車輛的品牌信息,該特征向量包括外形特征和形狀特征。上述車輛品牌型號的識別方法,通過提取車輛的特征進行識別,檢測率低誤報較多,同時速度慢,無法滿足實時要求。

本文主要的研究內容和貢獻如下:

(1)針對車臉以及車尾設計出一種新型的輕量級卷積神經網絡結構,該模型以完整與部分的車臉與車尾圖像作為輸入,得到車臉以及車尾的整體特征;在移動手機端以及嵌入式端,在正常光照下,不受復雜的環境的干擾,可對292種常見車型進行端對端實時的細粒度檢測與識別;

(2)針對車輛車型識別提出一種級聯形式多模型聯合檢測方法:在一個車輛二分類模型的基礎上將二分類模型特征輸出結果分別作為車臉模型的輸入進行結果的聯合判斷給出最終結果。

(3)本文采用中心對齊的思想:采用目標檢測的方法對訓練集中的車輛進行定位之后再裁剪進行訓練,在檢測端也采用先定位再識別的方法,這樣就對輸入與輸出進行了中心對齊,比原始非對齊的車臉圖像識別率高了35%;最終在移動端實時可對292種常見車輛達到89%的識別正確率。

1 一種新型的輕量級多姿態深度卷積神經網絡

基于深度卷積神經網絡的物體識別方法,因為其識別準確度遠遠超過傳統的基于局部特征的方法,并且魯棒性很強不受場景等噪聲因素變換的影響,在物體識別的方向上慢慢的成為主流。但是神經網絡算法的計算量常常需求很大,對硬件的計算能力要求很高;因為在嵌入式以及手機端的硬件與高性能主機相差很大所以網絡結構需要適量的修改。

針對車臉以及車尾的圖像也使用卷積神經網絡來對其提取特征,并提出了一種新型的輕量級深度卷積神經網絡結構;本節詳細的介紹了這種網絡結構的設計以及調參方法。

1.1 網絡設計思想

模塊的設計思想是將三種經典的網絡設計思想進行融合。

(2)GoogleNet[4]中的 inception Module結構;采用分支結構,通過多尺度的多樣化的特征融合;增加了網絡對不同尺度的適應性,類似于Multi-Scale的思想。在計算機視覺中,接觸對靈長類神經視覺系統的研究,Serre使用不同尺寸的Gabor濾波器處理不同尺寸的圖片;inception Module表達能力更強的同時也大大降低參數量以及過擬合的情況。

(3)ResNet[5]中的 ResidualUnit殘差結構;

允許原始input信息直接傳輸到后面的層中;原因是因為在不斷加深神經網絡的深度時,會出現一個Degradation的問題,及準確率會上升之后然后到達飽和,再持續增加深度則會導致準確率下降;那么后面加上幾個y=x的全等映射層,起碼誤差不會增加;假定神經網絡某段結構的輸入input為x,期望輸出為H(x),如果我們直接把x傳到輸出作為初始結果,那么此時我們需要學習的目標就是 F(x)=H(x)-x,這就是一個殘差學習單元(Residual Unit)及學習的目標改變了,不再是學習一個完整的H(x)而是output與input的差別H(x)-x及殘差;傳統的卷積層或全連接層在信息傳遞時,或多或少的存在信息丟失,殘差結構保證了信息的完整性同時也簡化了訓練的難度。

1.2 卷積神經網絡模型

網絡結構中,主要包含了“input”,“conv”,“BN”,“relu”,“ELU”“pool”,“shortcut”,“linear”,“output”節點。其中“input”與“output”節點代表數據的輸入與輸出,每一層的開始的“input”代表把上一層的數據作為輸入,第一層的輸入為原始彩色3通道的車臉與車尾的圖像,每一層的“input”節點代表該層數據的輸出。“conv”節點代表卷積操作,在卷積操作中,每一個kernel也就是一個卷積核可以提取input的一種特征,多個卷積核可以提取多種特征呢。”BN”節點代表正則化操作,正則操作主要作用是防止“梯度彌散”,將權重分布歸一到一個正態分布上,同時可以加快訓練的速度,提高模型的精度。“relu”節點代表非線性映射操作,在alexnet誕生之前CNN采用的是sigmoid或tanh函數來做映射,但是relu可以增強稀疏性加速收斂(附圖)如果卷積計算的output小于0則等于0,否則保持原來的值不變。“ELU”節點代表另一種非線性操作,但是相對“relu”更加的平滑,可以加速收斂并提高準確度。與“relu”不同的是,ELU擁有負值,允許他們以更低的計算復雜度將平均單位激活推向更加接近0的值;“pool”節點代表池化操作(降采樣),主要目的是對卷積特征進行降采樣,降低計算的復雜度的同時也降低過擬合的風險,“pool”主要分為兩種,最大(max pooling)或平均值(average pooling)池化;“shortcut”節點代表 ResNet里面的殘差結構;“linear”節點相當于權重的線性組合起到特征融合的作用與全連接層類似。

該CNN結構總共包含5層,由3個不同的模塊組成(如下圖所示)

圖1

圖2 模塊1

模塊1的設計采用簡化版的兩種不同的inception modual級聯形式;

模塊1的input為原圖片:3×224×224,進入第一個分支:

左分支:卷積層包含13個kernel,每個kernel為3×3,stride為 2,padding為 1,output:13×112×112;

右分支:一個 2×2的最大池化,output:3×112×112;

Join:進行通道數的合并輸出:16×112×112;

進過BN正則化以及relu非線性變換之后進入第二個分支:

左分支:第一個卷積層包含32個kernel,每個kernel為 3×3,stride為 2,padding為 1,output:32×56×56;進過BN正則化以及relu非線性變換之后,直連第二個卷積層包含 32個 kernel,每個 kernel為 3×3,stride為 1,padding為 1,output:32×56×56(使得特征的學習能力更強)。

右分支:卷積層包含32個kernel,每個kernel為1×1,stride為 2,output:32×56×56;

add:維度上進行累加;之后進行relu變換output:32×56×56。

圖3 模塊2

模塊2的設計采用ResNet中的Residual Unit殘差單元:

Input為模塊 1的 output:32×56×56;

第一個卷積層包含32個kernel,每個kernel為3×3,stride為 1,padding為 1,output:32×56×56

第一個卷積層包含32個kernel,每個kernel為3×3,stride為 1,padding為 1,output:32×56×56;殘差模塊為 32×56×56;output:32×56×56。下面是 6個模塊 2的直連最終的 output:32×56×56。

圖4 模塊3

模塊3的設計采用Inception Modual與Residual Unit相結合的級聯模式:

第一個分支:(Inception Modual)

Input為第二層的 output:32×56×56;

左分支:第一個卷積層包含64個kernel,每個kernel為 3*3,stride為 2,padding為 1,output:64×28×28

第二個卷積層包含64個kernel,每個kernel為3×3,stride為 1,padding為 1,output:64×28×28。

這里使用了ELU代替relu作為激活函數。

右分支:卷積層包含64個kernel,每個kernel為1×1,stride為2(這里使用不同的卷積核提取特征之后加以融合,豐富特征的多樣性)output:64×28×28。

第二個分支:(ResidualUnit)

Input:64×28×28

第一個卷積層包含64個kernel,每個kernel為3×3,stride為 1,padding為 1,output:64×28×28

第二個卷積層包含64個kernel,每個kernel為3×3,stride為 1,padding為 1,output:64×28×28,殘差模塊:64×28×28,output:64×28×28,下面直連 5個模塊 2,最終 output:64×28×28。

圖5 模塊4

模塊4的設計在模塊2與模塊3的基礎上加上了最終的輸出處理:

第一個部分結構為模塊3,第二部分為模塊2,區別在于將relu激活函數替換成了ELU激活函數。Input為第三層的 output:64×28×28。

進入模塊3 Inception結構:左分支:第一個卷積層包含 128個 kernel,每個 kernel為 3×3,stride為 2,pad-ding為 1,output:128×14×14第二個卷積層包含 128個kernel,每個 kernel為 3×3,stride為 1,padding為 1,output:128×14×14。右分支:卷積層包含 128個 kernel,每個 kernel為 1×1,stride為 2,output:128×14×14;

進入模塊 3 Residual Unit結構:input:128×14×14,第一個卷積層包含128個kernel,每個kernel為3×3,stride為 2,padding為 1,output:128×7×7;

進入模塊 2結構:input:128×7×7;第一個卷積層包含 128個 kernel,每個 kernel為 3×3,stride為 1,padding為 1,output:128×7×7;avgpool層 stride為 7×7,output:128×1×1;linear層 output:128×1×1,最終經過 softmax輸出長度為292的向量。

此網絡結構經過層層的多樣化的特征提取以及特征融合,最終將車臉圖片從224×224變為7×7的大小,相當于原始圖像的1/32;訓練集擁有13w張292類不同角度的車臉圖像,驗證集為4w張292類不同角度的車臉圖像,準確度Top5_accuracy為97%,Top_1_accuracy為91%;模型大小為6.8MB。

結構中的參數都是基于大量的實驗得出的,其中最重要的是每一層中卷積核的個數,在調試參數的過程,具體參數可通過可視化模型來調整。可視化是指將不直觀的層與層變換后的結果參數轉化為直觀的數字圖像。

數據流是指圖像數據在CNN結構中的流動狀態,在本網絡中數據主要經過卷積和池化以及Inception Modual的concat,Residual Unit殘差融合四種操作。觀察數據流可視化的結果可調整模型中feature map的數量,如果發現數據流可視化結果中有大量相似或者無意義的圖像,說明feature map數量太多,這時候應當減少filter的個數,如果發現數據流可視化結果中的圖像都各不相同,這時候可適當的増加feature map的個數,直到選出滿足的參數。

Feature maps代表對圖像提取特征,一個filter代表對圖像提取一種特征,多個Feature maps代表對圖像提取多個特征。低層的Feature maps代表邊緣,紋理,顏色等基礎局部特征,高層的Feature maps代表抽象之后的全局特征,在Feature maps可視化的結果中,有些核會表示成特別有意義的圖案,例如橫線、豎線、曲線,邊緣輪廓,線面組合等,如果在可視化卷積的結果中沒有發現含有明顯圖案的圖像,說明CNN結構設計不夠完善,可適當調整CNN結構組成例如添加Inception結構增加特征提取的多樣化從而增強模型的表述能力。

1.3 數據可視化

由于網絡相對復雜只提取一部分進行說明:

圖6 CNN模型輸入

圖7 模塊1的第一個卷積層的結果

將圖1作為CNN模型的輸入。該CNN結構第一層卷積有13個filters,所以原始輸入圖片對應13個feature maps,并且13個feature maps都各不相同,說明CNN訓練得到的13個核提取的特征都各不相同,有些核提取的橫的邊緣,有些filter提取邊緣,有些filter分割背景。

圖8 為第一層模塊1第二個分支中第一個卷積結果

該卷積層具有32個filters,32個feature maps各不相同,相比于第一個分支中的結果更加的抽象且有代表性

2 級聯形式多模型聯合檢測方法

本文提出一種級聯形式的多模型聯合檢測方法:通過目標檢測模型(本文使用tiny-yolo)對目標進行定位并將定位之后裁剪的圖像送入上文中分類網絡進行識別。

圖10

訓練集使用tiny-yolo[6]進行預處理;對于視頻動態實時檢測與靜態圖片檢測最大的區別在于鏡頭捕捉遠近以及采集器抖動的情況,這對于分類模型的影響是巨大的;在檢測時使用tiny-yolo進行目標定位是為了統一與訓練集的特征標準做到圖像的中心對齊,這樣可與將抖動以及鏡頭遠近的情況通過定位的方式解決;同時也使得待檢測目標填充整張圖片,大大地降低背景以及干擾物的噪聲。

圖5 為未經裁剪的圖像

圖6 為tiny-yolo裁剪過后的圖像

3 統一特征標準級聯模型有效性實驗

使用tiny-yolo統一訓練集與測試集的標準之后,分別對20000幀實時車臉街拍視頻進行了測試準確度有接近38%的提升。

3.1 實驗目的

證明圖像對齊操作能提高最后分類正確率。正確分類是指目標圖像中的車臉識別為正確的車型,錯誤分類是指目驚圖像中的車臉識別為其他車型。

3.2 實驗方案

同時對各種經典卷積神經網絡算法進行了對比,測試框架為tensorflow1.0,測試硬件平臺為iPhone6。對齊方式采用tiny-yolo進行裁剪對齊,EasyNet為本文介紹的輕型CNN模型;

實驗1:將非對齊數據和對齊數據輸入inceptionV1模型比較分類正確率Top5_error與Top5_error1以及單幀時間

實驗2:將非對齊數據和對齊數據輸入vgg16模型比較分類正確率Top5_error與Top5_error1以及單幀時間

實驗3:將非對齊數據和對齊數據輸入EasyNet模型比較分類正確率Top5_error與Top5_error1以及單幀時間

3.4 實驗結果

從表1中可以看出,對于實時街拍車臉視頻,對齊后的數據比不對齊的數據分類器得到的準確率至少高將近35%。證明車臉對齊操作對分類正確率有著至關重要的作用。

實時性以及模型大小也是本文考慮因素之一。

Tiny_yolo+EasyNet的級聯網絡聯合識別在20000幀實時車臉街拍視頻上的表現,Top5_error為94%,Top_1_erro為89%,單幀時間為0.69s;

在50000張靜態各個角度的292類車臉測試圖片上的表現 Top5_accuracy為 96%,Top_1_accuracy為90%;

表1

模型大小為6.8MB滿足手機等嵌入式存儲環境。

4 結語

本文主要介紹了實時動態基于輕量級多姿態的卷積神經網絡的車臉識別方法;動態視頻識別檢測的難點在于采集器采集圖像的遠近以及抖動情況會對卷積神經網絡的識別產生較大的影響,本位采用定位加識別的方法對動態視頻圖像進行統一化處理,將其與訓練集進行對齊大大的改善了動態識別的精度;同時也提出一種輕量級多姿態的卷積神經網絡EasyNet滿足實時性、準確性以及嵌入式硬件需求。

[1]張百靈,周逸凡,管文杰.基于靜態圖片的自動套牌車檢測方法:,CN 103679191 A[P].2014.

[2]朱瓏,林晨曦,陳遠浩,等.基于圖像的車輛品牌識別方法和系統:,CN 103488973 A[P].2014.

[3]Simonyan K,Zisserman A.Very Deep ConvolutionalNetworks for Large-Scale Image Recognition[J].Computer Science,2014.

[4]Szegedy C,Liu W,Jia Y,etal.Going deeper with convolutions[J].2014:1-9.

[5]He K,Zhang X,Ren S,etal.Deep ResidualLearning for Image Recognition[C].Computer Vision and Pattern Recognition.IEEE,2016:770-778.

[6]Redmon J,FarhadiA.YOLO9000:Better,Faster,Stronger[J],2016.

End to End Vehicle Real-Time Fine-Grained Identification Method Based on Mobile and Embedded System

LIN Hao,ZHANG Lin
(College of Information Engineering,Shanghai Maritime University,Shanghai 201306)

Convolution neural network algorithm has very good robustness in classification and object detection.Presents a new lightweight end to end convolutional neural network structure that compress the structure;A cascade multiple joint detection method,uses small scales tracking to improve real-time detection accuracy;uses the center alignment to uniform feature,greatly reduces the noise and improve the detection accuracy.

Convolution NeuralNetwork;Lightweight;Cascade;Uniform Feature

1007-1423(2017)30-0012-07

10.3969/j.issn.1007-1423.2017.30.003

2017-05-02

2017-09-10

猜你喜歡
分類特征檢測
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
分類算一算
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
抓住特征巧觀察
主站蜘蛛池模板: 成人无码区免费视频网站蜜臀| www精品久久| 亚洲香蕉在线| 久久福利网| 欧美一区国产| 午夜福利网址| 欧美精品色视频| 99视频在线免费| av一区二区无码在线| 刘亦菲一区二区在线观看| 久久香蕉国产线看观看亚洲片| 日韩高清欧美| 国产精品区视频中文字幕| 国产自无码视频在线观看| 青草视频久久| 久一在线视频| 99在线免费播放| 蜜桃视频一区| 国产精品久久久久久搜索| 亚洲精品国产日韩无码AV永久免费网 | 四虎影视8848永久精品| 中文字幕人妻无码系列第三区| 国产精品色婷婷在线观看| 噜噜噜综合亚洲| 免费在线观看av| 国产无码网站在线观看| 欧美成在线视频| 久久久久夜色精品波多野结衣| 亚洲欧洲天堂色AV| 国产亚洲精品va在线| 国内丰满少妇猛烈精品播| 久久伊人操| 亚洲香蕉在线| 视频国产精品丝袜第一页| 亚洲乱码精品久久久久..| 欧美国产三级| 国产成人久久综合777777麻豆 | AV不卡在线永久免费观看| 亚洲有码在线播放| 久久国产免费观看| 五月天久久综合| 久久美女精品| 四虎亚洲国产成人久久精品| 人人爽人人爽人人片| 91久久天天躁狠狠躁夜夜| 全色黄大色大片免费久久老太| 国产一级特黄aa级特黄裸毛片| 亚洲熟妇AV日韩熟妇在线| 亚洲一区色| 国产精品久久久久久久伊一| 亚洲精品福利网站| 一级毛片免费播放视频| 久久亚洲国产一区二区| 中文字幕中文字字幕码一二区| 996免费视频国产在线播放| 国产在线自在拍91精品黑人| 欧美日韩精品在线播放| 国产精品亚洲一区二区在线观看| 国产一区二区精品福利| 91www在线观看| 在线免费观看a视频| 国产成人精品在线1区| 日本免费一级视频| 漂亮人妻被中出中文字幕久久| 9啪在线视频| 伊人精品成人久久综合| h视频在线观看网站| 国产视频欧美| 国产欧美性爱网| 国产精品永久免费嫩草研究院| 欧美精品一二三区| 久久精品亚洲专区| 成人免费午夜视频| 无码中文字幕乱码免费2| 91久久偷偷做嫩草影院精品| 国产在线98福利播放视频免费| 永久免费av网站可以直接看的 | 亚洲va视频| 国产成人综合网| 综合天天色| 国产免费久久精品99re不卡| 欧美成人精品高清在线下载|