周劍宇, 梁 棟, 唐 俊
(安徽大學 電子與信息工程學院,安徽 合肥 230601)
目前人體目標檢測方法主要分為三大類:DPM法[1,2]、深度學習法[3]、決策森林法[4,5]。這三類方法在行人檢測方面都能夠獲得比較好的結果。本文提出基于決策森林的方法。文獻[6]中梯度方向直方圖(histograms of oriented gradients,HOG)特征的提出,為近年來的人體目標檢測提供了最為有效的特征。HOG特征[7~10]能夠通過邊緣的方向密度分布較好地描述出目標的輪廓信息。文獻[5]提出積分通道特征(integral channel feature,ICF)的概念,將HOG特征通道與3個顏色特征通道以及一個梯度幅值特征通道結合在一起,通過計算各個通道上的積分圖像,在保證檢測效果的同時,能夠獲取更快的速度。文獻[4]則提出了一種基于ICF的優化算法,即聚合通道特征(aggregation channel feature,ACF),根據自然圖像中尺度不變性的特性,利用鄰近尺度進行快速特征金字塔的多尺度計算。文獻[5]提出,對低階特征進行濾波提取出高階特征,將高階特征輸入增強型決策森林,達到較好的檢測效果。
本文提出了一種基于先驗知識的人體檢測方法。不同于文獻[7]的使用整個行人檢測器用于區域建議,提出了使用人體上半身檢測器。實驗表明,所提方法提升人體檢測器的性能。
Haar-like特征是檢測中常用的二階特征,在計算機視覺領域內Haar-like特征經常用于人臉檢測。但是將傳統的Haar-like特征與傳統的一階通道特征結合在一起去訓練人體檢測器時,并不能很好提升檢測器的檢測效果。受到Haar-like特征在人臉檢測中取得較好的結果的啟發,嘗試在ACF檢測方法的基礎上,加入二階的Haar-like特征來進行人體檢測。
通過觀察可以發現,在遮擋現象不可避免時,上半身以及頭部被遮擋的往往能夠保持較好的輪廓特征。針對此現象,根據人體身形中頭部以及肩膀部分所形成的投影特點,設計了一個人體上半身模型。隨后,根據該模型提供的先驗知識,設計了一個基于人體上半身特點的Haar-Like特征模板族。
首先,根據人體上半身的投影特點,可以設計一個人體形狀模型。然后,使用不同大小尺寸的模板在這個上半身模型上進行滑動,據此能夠生成若干個不同的Haar-Like特征。模板族及部分不同大小的模板示例如圖1所示。

圖1 特征模板示例
為了方便計算以及提高運算效率,所設計的人體模板均勻分割成相同大小的矩形塊。每一個矩形塊將對應于一定的權重,此權重則將用于二階特征的計算。
根據梯度向量生成人體模型的邊緣圖以及分割效果如圖2所示。

圖2 人體模型的邊緣圖以及分割效果
如圖2所示,可以通過分割結果圖清晰地看出,整個人體上半身模型可以看成3個部分:頭部、上半身以及背景。這三個部分在圖像中具有不同的顏色或者紋理特征。在給不同部分中的每一個矩形塊設置不同的特征權重之后,將這些矩形塊的特征權重則與上文提到的不同大小尺寸的模板相結合,構成提出的人體檢測器的先驗知識。通過實驗結果可以發現,該先驗知識能夠有效提高檢測器的魯棒性。
在對圖像進行分割計算時,將圖像分割成60像素×60像素大小的圖像塊,而文中提出的二階特征提取及計算都是在這一系列圖像塊的基礎上進行的。再將這些圖像塊以6像素×6像素大小為計算單元進行劃分,劃分所得的每一個計算單元則與上文所述的一個矩形塊相對應。
根據1.1中所設計的人體上半身模型以及特征模板族的概念,通過將每個矩形塊權重賦予不同尺寸的模板中,即可得到特征模板族。
1)特征模板為一列固定高和寬的矩形框。所有的矩形框的寬度為1~4個計算單元,高度為1~3個計算單元,據此可以算得12個不同的尺寸大小矩形框。利用這些不同尺寸的矩形框滑動人體上半身模型,就可以生成一組Haar-Like特征。
特征模板尺寸大小符合如下條件
M={(w,h)|w≤Wmax,h≤Hmax,w,h∈N+}
(1)
式中M為模板所有尺寸的集合,w為模板的寬度,h為模板的高度,Wmax為模板的寬度上限,Hmax為模板的高度上限。
2) 人體上半身模型是由3個部分構成:頭部、上半身、背景。i表示矩形塊在人體上半身模型中的橫坐標,j表示其縱坐標,P(i,j)為矩形塊在模型中的位置。人體模型內矩形塊的權重符合等式
(2)
式中W(i,j)為人體上半身模型內,位置坐標為P(i,j)矩形塊的的權重。Phead,Pbody,Pbackground分別為人體半身模型中頭部、上半身和背景區域包含的所有矩形塊位置坐標。
由1.1節可知,人體上半身模型被分割成了若干個矩形塊,而每個矩形塊對應某一特定的權重,所以,當模板矩形框滑過模型時,該矩形框內每個矩形塊的權重構成了一個Haar-Like特征。最后生成的每一個特征模板都符合如下條件
F={(m,Wf)|m∈M,Wf∈R2}
(3)
式中m為該Haar-Like特征的尺寸大小,Wf為尺寸大小為m特征模板矩陣。
在計算Haar-Like特征之前,先對全圖進行聚合通道特征的提取。聚合通道特征包含10個通道的特征,10個通道分別是:LUV顏色的3個顏色通道特征,1個梯度幅度的通道特征,6個方向的梯度直方圖的通道特征。在得到10個通道的特征之后,分別對這些特征進行Haar-Like特征的提取。單個Haar-Like特征的具體計算步驟如下:
1) 將聚合通道特征的每一個通道的特征圖分割成60像素×60像素大小的圖像塊。
2) 使用Haar-Like特征模板通過滑窗的方式提取該圖像塊上每一個位置的Haar-Like特征值。Haar-Like特征圖上位置(x,y)對應的權重矩陣計算方式
W(x,y,w)=Fmodel(m)?C(x,y,m)
(4)
式中m為該Haar-Like特征的尺寸大小,Fmodel(m)為尺寸為m的某一個特征模板,特征模板Fmodel(m)中,權重為1的計算元是增性算子,權重為-1的計算元是減性算子,權重為0的計算元是是中性算子。C(x,y,m)為聚合通道特征圖上起始位置為(x,y)尺寸為m的矩形區域。?表示的是兩個相同尺寸矩陣逐個元素相乘運算,W(x,y,m)為Fmodel(m)與C(x,y,m)兩個矩陣內元素逐個相乘的結果,即為特征圖坐標為(x,y)處的權重矩陣。
3) 根據每一個位置的權重矩陣,計算出整個Haar-Like特征圖,特征圖上每一個位置的特征值的大小與該位置上權重矩陣的關系
(5)
式中F(x,y,m)為Haar-Like特征圖上位置為(x,y)上,尺寸大小為m的某一個Haar-Like特征值。sum(Wadd(x,y,m))為該Haar-Like特征內增性算子在W(x,y,m)對應位置權重的和。sum(Wdec(x,y,m))為該Haar-Like特征內減性算子在W(x,y,m)對應位置權重的和。中性算子對應的一階特征值則不做處理。Numadd和Numdec則分別為該Haar-Like特征內增性算子以及減性算子的個數。
根據基于上半身先驗知識的Haar-Like特征能夠較好的描述人體上半身的特點,為了更好地獲得檢測效果,引入基于上半身先驗知識的Haar-Like特征與ACF特征來提高檢測器的準確性。
利用訓練所得的兩個檢測器,具體的檢測過程
1)提取出測試圖像的ACF特征以及Haar-Like特征;
2)再分別對提取到的兩類特征進行滑窗,將滑窗得到的檢測塊送入對應的特征檢測器進行檢測;
3)檢測塊被檢測出包含行人的被標記為候選框,即bbshaar和bbsacf;bbshaar是Haar-Like特征檢測器檢測結果的邊界框,bbsacf是ACF特征檢測器檢測結果的候選框。
4)將bbshaar和bbsacf疊加在一起得到BBS,之后對BBS使用非極大值抑制原理,獲得最終的檢測結果。
實驗所使用的數據集為INRIA數據集。該數據集中訓練正樣本共有614張,共計2 416個行人,測試集有正樣本288張,共計1 126個行人。訓練負樣本有1218張,測試負樣本有453張。樣本的尺寸大小都為64×128。在Haar-Like的特征提取過程中,使用訓練正樣本標注的上一半圖像作為訓練數據。在檢測過程中,將Haar-Like特征檢測器檢測出的邊界框的高度乘以2,寬度保持不變作為最后的邊界框結果。
Haar-Like特征檢測器的訓練分為4個階段進行,4個階段分別使用了16,64,256和1 024個弱分類器,并且決策樹的深度都為4。在訓練的第一個階段,使用隨機生成的10 000負樣本;而用于訓練的總負樣本數則不超過50 000個。
文中設計的人體半身模型大小為6×6個計算單元,特征模板的大小從1×1個計算單元到4×3個計算單元。根據設計的不同尺寸對人體半身模型進行滑窗提取,一共可以獲得100個Haar-Like特征模板。當使用該Haar-Like特征模板族對大小為60像素×60像素的圖像進行特征提取時,一共可以提取出71 620個特征。
為了保證算法的檢測效果,在實驗過程當中,實驗使用了相同的訓練樣本以及測試樣本,對ACF,pAUCBoost[13],HOG-LBP[12],ChnFtrs[5]和本文方法的檢測效果進行了對比實驗。在實驗中,使用召回率、平均對數漏檢率、漏警率和PR曲線對檢測器的檢測效果進行評估。從實驗對比結果可以看出使用級聯的檢測算法有著較好的檢測結果。5種檢測方法的召回率結果對比如表1所示。

表1 本文算法與其他算法對比 %
5種算法對比實驗的PR曲線結果如圖3(a)所示。
通過對ACF,pAUCBoost,HOG-LBP,ChnFtrs與本文方法的比較,可以看出:在結合了Haar-Like特征之后,檢測器的檢測效果有一定程度的提升,本文方法的召回率提高到了94.57 %。相比于傳統的ACF算法,本文提出的方法召回率提升了大約2 %,平均對數漏檢率降低了0.63 %。而相比于ChnFtrs算法,本文提出的方法召回率提升了大約2.89 %,平均對數漏檢率降低了4.53 %。
如圖3(b)所示,通過對檢測結果的PR曲線和ROC曲線的觀察以及對其召回率和平均對數漏檢率的分析,可以看出:在結合了基于先驗Haar-Like特征檢測器具有更好的檢測精度。本文算法檢測效果如圖4所示。

圖3 5種算法的PR和ROC曲線

圖4 本文方法檢測效果示意
考慮ACF算法中只提取了顏色和梯度的特征,本文設計了結合基于先驗知識的Haar-Like特征的人體檢測方法。能夠根據人體上半身的輪廓特點,增強檢測器對人體特征的描述能力。實驗結果表明:結合基于先驗知識的Haar-Like特征的檢測方法能夠彌補ACF特征對人體輪廓描述的不足,從而能夠對檢測結果有一定的提升。