王路杰 徐向華



摘 ?要: 紅外圖像中的行人具備邊緣和亮度兩個顯著特征信息。為了能夠充分利用這兩種信息,在亮度直方圖特征基礎上,提出了一種不同區間大小的亮度直方圖特征。通過統計分析紅外圖像中行人各部件對應的亮度區間信息,確定映射規則,從而構建不同區間大小的亮度直方圖,然后通過與梯度方向直方圖特征相結合,并用于Adaboost模型訓練。該方法提高了行人檢測系統的檢測率。
關鍵詞: 紅外圖像; 行人檢測; 梯度方向直方圖; 亮度直方圖; Adaboost
中圖分類號:TP391.4 ? ? ? ? ?文獻標志碼:A ? ? 文章編號:1006-8228(2015)07-01-03
Pedestrian detection based on infrared intensity information
Wang Lujie, Xu Xianghua
(Hangzhou Dianzi University, Zhejiang Provincial Key Lab of Data Storage and Transmission Technology, Hangzhou, Zhejiang 310037, China)
Abstract: The pedestrian in the infrared images has two significant features that are edge and intensity. In order to take full advantage of the two information, based on the HOI(Histogram of Intensity) feature, the DBHOI(Different Bin Histogram of Intensity) feature is proposed. Through the statistics and analysis of the intensity information of pedestrian in the infrared image, the DBHOI descriptor determines the mapping rules, and then constructs an intensity histogram with different size of bins. Combined with the HOG(Histogram of Oriented Gradient) descriptor, the DBHOI descriptor is used to train Adaboost model. This method improves the detection rate of the pedestrian detection system.
Key words: infrared images; pedestrian detection; histogram of oriented gradient; histogram of intensity; Adaboost
0 引言
近些年來,基于視覺的行人檢測一直是計算機視覺的一個研究熱點[1-2]。基于紅外成像的行人檢測方法對不同環境下的行人檢測具有一定的適應性。目前,紅外行人檢測技術[3-5]主要基于機器學習的方法,其中主要涉及特征提取和分類器訓練。在特征提取階段,由于紅外圖像中的行人本身具有兩個明顯的信息:邊緣信息和亮度信息,因此大多數的特征構造是依據這兩個信息進行的,比如梯度方向直方圖(Histogram of Oriented Gradient,HOG)[6]、亮度直方圖特征(Histogram of Intensity,HOI)[7]等。為了消除特征單一帶來的誤檢,將HOG與HOI進行特征融合[7]是一種有效方法。HOI特征描述紅外圖像中的亮度信息,但是沒有利用行人亮度信息分布相對穩定的特點。本文通過統計紅外圖像中行人各部件對應的亮度區間信息,從而確定映射規則,構建不同區間大小的亮度直方圖(Different Bin Histogram of Intensity,DBHOI)特征。然后將該特征與HOG特征相結合構成一個特征描述符,進而從多個角度去刻畫行人與背景之間的區別。本文基于Adaboost學習算法[8]進行模型訓練,最后利用滑窗掃描法進行行人檢測。
1 特征提取
檢測對象——行人包含兩個明顯的信息:邊緣和亮度。其中HOG特征很好地提取了圖像中的邊緣信息。因為人體溫度的變化是在一定范圍內,所以行人的亮度信息也就相對穩定。目前,HOI特征描述符[7]是一個對亮度信息描述較好的特征。
1.1 HOI描述符
HOI特征是一個描述亮度信息的特征。它通過對圖像中的亮度信息進行區域高密度的、重疊的編碼,以此來表征行人與背景之間的區別。HOI特征的構造過程大致如圖1所示。
⑴ 將圖像劃分為多個局部區域,并構建HOI。首先將圖像窗口分割成一個個小的區域,這些小區域叫做“cell”。對于每一個cell,計算cell中每一個像素的灰度值,形成一個局部的一維亮度直方圖。在每一個亮度直方圖中,將灰度值映射到不同區間,并將灰度值的大小作為權重值映射到該區間中。灰度區間的劃分由實驗給出,默認情況下將灰度值范圍劃分為6等份。
⑵ 進行塊(Block)內的歸一化。通過塊區域重疊的方式,使得每一個獨立的cell的信息可以在幾個不同的塊中共享,然后對塊區域內的直方圖進行歸一化。通過塊歸一化處理,提高HOI對行人描述的魯棒性。
⑶ 串聯每一個塊中形成的HOI特征向量。
圖1 ?HOI特征提取的概要流程圖
因為HOI特征對圖像中的局部亮度信息進行了編碼,所以該特征與簡單的亮度灰度值相比具有更強的描述能力。
1.2 DBHOI描述符
HOI特征較好地對紅外圖像中的亮度信息進行了編碼,但也存在缺陷。它只是將灰度值區間進行均等劃分,并沒有考慮行人所具有的剛性特征及身體各部件熱輻射的相對穩定性。因為熱輻射的相對穩定性,使行人各部件形成的亮度具有顯著的特征,即頭部比身體其他部件的亮度都要大,且亮度灰度值非常高。若構造的特征描述符能夠有效的表達該信息,那么將會有效的提高特征描述能力。
為了確定如何劃分灰度值到多個區間中,我們利用四組圖像集合,且所有的圖像來自訓練樣本集。根據樣本集的大小隨機抽取數張并截取人體部件:頭部、肢體上半身、肢體下半身。根據這些圖像的集合,統計出每一個人體部件所具有的相對穩定的灰度均值,具體分布如圖2所示。
圖2 ?人體部件均值分析
DBHOI的提取過程與HOI的提取過程(圖1)類似,不同之處在于第二步中灰度值的映射。根據圖2的實驗結果,我們將灰度值映射到各個不同的區間中。另外根據經驗性的觀察,行人部件中頭部的亮度信息特別明顯,為了獲取該信息劃分了一個區間[230,255],其他的區間分別是[0,103],[103,149],[149,230]。經過這樣的區間劃分,得到亮度直方圖特征具有對行人更強的描述能力。
DBHOI特征描述符的提取過程與HOI的提取過程類似,它不僅保留了原HOI特征描述符所具有的優點,而且在組織亮度信息分布時更好的區分出行人與背景。根據背景與行人的亮度分布信息特點,我們進行不同區間大小的劃分,使得行人與非行人在亮度信息上的差異更加明顯。當環境產生變化時,使用DBHOI特征來描述行人依然具有穩定性,從而提高了行人檢測的魯棒性。
2 基于Adaboost的分類器
為了得到一個具有強分類能力的分類器,我們采用了基于Adaboost學習算法的級聯分類器[8]。一個Adaboost分類器一般有如下形式:
⑴
其中αt為每個弱分類器對應的權重值,ht為弱分類器,T為迭代次數。
在訓練前,每一個樣本被設置一個非負的權重值。在每一次迭代中被錯分樣本的權重值將會被更新,會被設置一個更大的值,在下一次迭代的過程將會更加重視這些樣本。
本文實驗的訓練數據基于17900個樣本,包括正樣本和負樣本,因此每個樣本的初始權重值將會被設置為1/17900。設置的迭代次數分別為32、128、512、2048。首先訓練一個包含32個弱分類器的強分類器,然后用這個分類器進行樣本分類,只有通過了該分類器正確分類的樣本才進行下一個分類器訓練的訓練樣本集。重復上述過程進行迭代,直至產生每層的強分類器。
3 性能評估
為了分析DBHOI特征的描述能力,該特征與HOI特征進行了比較。實驗的硬件環境為Intel Core i5@3.1GHz,4G內存,仿真工具為Matlab R2012a。
3.1 紅外行人檢測樣本集
圖3 ?部分正樣本
利用被動紅外攝像機拍攝了大量實際車載場景下的紅外圖像,并根據Caltech樣本庫的樣本制作標準,建立一個完善的紅外行人樣本庫。訓練集包括1170個正樣本和16730個負樣本;測試集包括100張包含行人的圖像,160張不包含行人的圖像。圖3和圖4是隨機抽取的正負樣本圖像。
圖4 ?部分負樣本
3.2 實驗結果
為了說明在車載紅外行人檢測中,亮度信息對最終的分類算法性能的影響,本文以HOG為基礎特征,分析了在增加和不增加亮度信息特征——DBHOI特征描述符的兩種不同情況下整個行人檢測系統的性能。除此之外,為了說明HOI特征與DBHOI特征,以及兩者在描述能力上的差異,本實驗構造HOI特征、DBHOI特征,然后結合描述邊緣信息的HOG特征,構成不同的積分通道特征,并比較了兩者之間的性能差異。
圖5說明了在沒有亮度信息的情況下,行人檢測系統的檢測率約為35%,而在增加了描述亮度信息的DBHOI特征描述符后,檢測率達到了42%,使得整個系統的性能提升了7%。
圖5 ?有無亮度信息圖
圖6表示在紅外數據集上,用檢測率(=1-missing rate)VS FPPI作為評價標準,對不同亮度信息提取方法的比較。由DBHOI與HOG構成的特征達到了42%檢測率,而HOI只有37%。改進的DBHOI特征相對于原來的HOI特征提升了大約5%的性能。
圖7中a(1)、b(1)與a(2)、b(2)分別是HOI特征與DBHOI特征的檢測結果??梢钥闯觯珼BHOI特征檢測到圖像中更多的行人,當行人與相機的檢測距離增大時,DBHOI特征提取到更多的信息。從b(1)組與b(2)組的最后一張圖像中可以看出,均勻劃分灰度的HOI特征沒能很好的區分其他發熱物體所行人的亮度如汽車的輪子,而DBHOI特征描述了這種區別。
圖6 ?亮度信息進行不同構造方式
圖7 ?DBHOI特征與HOI特征效果比較
4 結束語
本文提出了一個完整的針對紅外車載場景下的行人檢測方法。其主要的貢獻在于,針對紅外圖像中行人的特點,詳細分析了有無亮度信息以及不同亮度信息構造方式對最終行人檢測性能的影響。并改進了HOI特征描述符存在的不足之處,提出了DBHOI描述符。實驗表明,紅外圖像中的亮度信息是一個非常重要的信息,并且DBHOI特征的構造方式提高了行人檢測系統的性能。
參考文獻:
[1] Dollar P, Wojek C, Schiele B. Pedestrian detection: An evaluation
of the state of the art[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2012.34(4):743-761
[2] O'Malley R, Glavin M, Jones E. A review of automotive infrared
pedestrian detection techniques. Signals and Systems Conference[C]. Galway:IEEE, R,2008:168-173
[3] Olmeda D, Premebida C, Nunes U. Pedestrian detection in far
infrared images[J]. Integrated Computer-Aided Engineering,2013.20(4):347-360
[4] Dollár P, Appel R, Belongie S. Fast feature pyramids for object
detection[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2014.36(8):1532-1545
[5] Brehar R, Vancea C, Nedevschi S. Pedestrian detection in infrared
images using aggregated channel features. 2014 IEEE International Conference on Intelligent Computer Communication and Processing (ICCP)[C]. Cluj Napoca: IEEE, R,2014:127-132
[6] Dalal N, Triggs B. Histograms of oriented gradients for human
detection. IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR) [C]. San Diego, CA, USA:IEEE 2005:886-893
[7] 朱聰聰,項志宇.基于梯度方向和強度直方圖的紅外行人檢測[J].
Computer Engineering,2014.40(12).195-204
[8] Viola P, Jones M J. Robust real-time face detection[J].
International journal of computer vision,2004.57(2):137-154