趙亞琴 蔣林權 陳 越 孫一超
(南京林業大學機械電子工程學院 江蘇 南京210037)
本文提出一種新的多尺度紋理描述子,用于與背景顏色相似,且表面平坦的前景運動像素提取,并提高算法對光照的魯棒性。本文的主要創新點如下:(1) 由于LBP紋理提取算法無法有效描述表面紋理缺乏的前景對象,而背景和前景顏色相似,顏色特征又不能應用,因此本文利用非下采樣小波變換的平移不變性,構建多尺度LBP紋理特征描述子,不僅能夠揭示背景和前景像素的紋理特征的微小不同,而且達到降噪的目的;(2) 不同于已有文獻的LBP直方圖特征提取方法,本文的多尺度LBP特征向量用一個8×n(n是小波子圖的數目)位的二進制向量表示,海明距離被用作計算背景圖像和前景圖像的同一坐標的兩個像素的紋理相似度,提高了算法運算速度;(3) 本文提出一個從像素級到塊級的多粒度對象跟蹤算法,在候選像素檢測級,閾值被自適應地調整以便改善算法對環境變化的魯棒性,在像素塊級,統計特征用于減少噪聲的影響。
1.1.1 非下采樣小波分解


圖1 非下采樣小波變換結構圖
1.1.2 非下采樣小波變換描述子的定義

(1)
式中:pk為p(i,j)的第k(k=1,2,…,8)個近鄰點。
在有幣的區塊鏈項目中,激勵機制是否有效取決于項目的代幣是否可支付,例如:比特幣的可支付來自社區內的認同。眾所周知,有一萬個比特幣換取披薩的事情,那么為什么是一萬個不是五千個呢?我們可以推測持有比特幣的一方用電費來衡量自己獲取的比特幣在當時的價值,披薩的銷售者一方面必然是比特幣社區的成員,一方面還可以用電費衡量披薩的價值,于是你情我愿之下,才會有這樣的一筆交易。我們特別推測了披薩店主應該是比特幣社區的成員,或可以說是比特幣的粉絲;否則,這筆交易是不會發生的。所以我們認為認同是支付的前提。如果項目的參與者對項目不認同,可支付性降低,激勵機制失效,那么這個項目就很難有效地運行。

(2)
式中:
(3)
因此,得到一個以像素海明距離為元素的矩陣HM(t)。
1.1.3 前景像素檢測
對于矩陣HM(t)的每個元素HM(i,j,It),用下式計算坐標位置(i,j)的均值:
(4)
如果像素(i,j)滿足下列條件,則該像素被判斷為背景像素:
(5)
式中:α1和λ1為調整參數,設為1.5≤α1≤2.5和14≤λ1≤20。圖2所示為運動前景顏色與背景相似的4個視頻幀。從圖2可以看出,出現了前景像素丟失,而且一些背景像素也被錯誤地識別為前景像素,因此,本算法將視頻幀劃分為像素塊,計算像素塊的LBP統計特征。

圖2 像素級前景像素檢測結果(第1行為原始視頻幀,第2行為本文算法的檢測結果)
分析圖2結果,不難看出,雖然前景的輪廓被很好地提取,但是有一些前景像素并未被檢測出,導致前景目標中有一些小的孔洞。為了填充這些孔洞,本文采取基于像素塊級的劃分策略。
定義3像素塊的LBP特征將矩陣HM劃分成16×16的非重疊像素塊,對于當前幀It的海明距離矩陣HM(t)的每個16×16的像素塊,像素塊的LBP統計特征定義為:
(6)
式中:HM(It,n)為當前幀It的第n個像素塊的海明距離,用式(7)計算:
(7)
如果當前塊滿足下列條件,則該像素塊被判斷為背景塊:
(8)
式中,NP_B(n)為當前塊中判斷為背景的像素數目,α2和λ2為調整參數,設為1.1≤α2≤1.3和60≤λ2≤90。
目前,沒有文獻研究與背景顏色、紋理相似的前景目標檢測問題,實驗視頻共8個,為了驗證算法的性能,分別在室外(前5個視頻)、室內(后2個視頻)拍攝,還有文獻[11]提供的1個包含多目標的保護色視頻,如圖3所示。

圖3 實驗原始視頻
文獻[1-3]在前景檢測時運用了LBP提取局部紋理,但是本文的實驗視頻的前景圖像紋理平坦,文獻[1-3]的算法無法取得好的實驗效果,因此,本文中并未給出這2種算法的實驗結果。GMM(高斯混合模型)[12]是一種公認的效果較好的前景檢測算法。通過對36種背景減除算法的實驗發現,對于本文研究的保護色視頻目標檢測和保護色視頻前景對象檢測,文獻[13]方法(LOBSTERBGS算法)和文獻[14] 方法(SuBSENSEBGS算法)也取得了較好的效果。本文算法和這3種算法檢測結果如圖4所示,原始視頻幀見圖2。從圖4可以看出,第1~2行是GMM算法的檢測結果,第3~4行是LOBSTERBGS算法的檢測結果,第5~6行是SuBSENSEBGS算法的檢測結果,第7~8行是本文算法的檢測結果。對于與背景顏色、紋理相似的視頻而言,GMM算法存在前景像素檢測不完整的問題;LOBSTERBGS算法對光照變化的魯棒性較差;SuBSENSEBGS算法主要存在陰影適應性差的問題,且對于多目標視頻(Video8),視頻中存在2輛汽車,而SuBSENSEBGS算法只檢測出來1輛車。


本文采用TPR和TNR評價前景檢測算法的性能,7個實驗視頻的TPR和TNR值如圖5所示。從圖5可看出,本文算法對于8種視頻都取得了較高的TPR值和FPR值,本文算法的TPR值和TNR值明顯高于GMM算法。對于包含陰影的視頻(Video6、Video7),SuBSENSEBGS算法把陰影像素錯誤地檢測為前景像素,FPR值很低;對于包含光照變化很大的視頻(Video5、Video8),LOBSTERBGS算法會把光照變化大的圖像區域一些背景像素檢測為前景像素,因此,TNR值很低;對于視頻中包含晃動幅度很大的對象(樹)的視頻(Video8),本文算法、GMM算法和LOBSTERBGS算法把一部分樹枝葉錯誤地檢測為前景,雖然SuBSENSEBGS算法沒有將晃動樹葉檢測為背景,但是在去除干擾運動對象的同時,沒有檢測出視頻中的1輛運動的汽車,導致TPR值低,結果還有待于進一步提高。

(a)

(b) 圖5 本文算法和3種算法的TPR和TNR
本文研究了與背景顏色相似、紋理缺乏的運動目標的檢測這一挑戰性問題,提出了前景像素檢測的LBP新的局部紋理描述子,定義了其像素級和像素塊級的相似度,并采用非下采樣小波變換分解原始圖像,對頻率子圖進行LBP像素塊級紋理提取。實驗結果表明本文提出的算法對于包含動態背景像素、陰影和光照變化較小等環境變化,都取得了較好的效果。但是對于包含光照變化很大的視頻,本文算法的檢測結果還有待改進。