蔣琦,肖遙
(西華大學計算機與軟件工程學院,成都 610039)
相關濾波器擁有速度快、良好退化性、平移不變性等優點,被廣泛應用于計算機視覺領域[1]。相關濾波器總體分為兩種類別,其中一種為合成判別函數濾波器,具有代表性的是文獻[2]提出的最優權衡綜合判別函數濾波器(Optimal Trade-off Synthetic Discriminant Function,OTSDF)。另一種類型為最優相關輸出濾波器,例如文獻[3]提出的平均合成精確濾波器(Average Synthetic Exact Filter,ASEF)和文獻[4]提出的最小輸出誤差平方和濾波器(Minimum Output Sum Of Squared Error,MOSSE)。文獻[5]對相關濾波器算法進行拓展,把支持向量機(Sup?port Vector Machine,SVM)與相關濾波器融合,提出了最大間隔相關濾波器(Maximum Margin Correlation Filter,MMCF)。MMCF 利用SVM 的分類和泛化能力,進一步提升了濾波器的性能。但是,SVM 在建立分類超平面時僅考慮邊界上的樣本點[6],使MMCF 構建濾波器忽略了樣本的整體分布信息,易受噪音樣本干擾。
針對MMCF 的問題,受文獻[6]的啟發,本文提出了最小類內方差相關濾波器(Minimum Class Variance Correlation Filter,MCVCF)。MCVCF 訓練時兼顧大間隔原理和邊界樣本信息,將樣本類內離散度引入相關濾波器,同時利用SVM 的泛化性能及相關濾波器的定位分類能力,使獲得的響應更符合實際情況,借此提高濾波器的檢測、分類性能。
MMCF 結合了SVM 及相關濾波器,通過一個平衡參數來聯合兩個部分。設有一數據集D={(xi,yi)|i=1,…,N}?Rd×N,MMCF 的模型如下:

其中,w是分類超平面法線及濾波模板的向量形式,?代表互相關運算,λ是平衡參數,C是懲罰系數,ξi是松弛變量,這里xi位于目標中心位置,yi是樣本標簽,b是偏置量,ci是與樣本有關的常量。MMCF 將部分作為分類標準作為定位標準。
在分類問題中,SVM 試圖找到具有最大間隔的分類超平面,其間隔的定義為類邊界樣本到超平面的最小距離,僅這樣定義使SVM 只考慮了邊界樣本點。針對這一弊端,文獻[6]提出了最小類內方差支持向量機(Minimum Class Variance Support Vector Machine,MCVSVM)[6]。設一訓練樣本集,分別屬于2 類,其模型如下:

其中,Sw是類內散度矩陣,其定義如下:

其中,mA是A類的均值,且xj屬于A類。設輸入圖像維度為d,則Sw大小為d×d。MCVSVM 較好地解決了SVM 未考慮樣本分布信息的問題[6],因此可將這種方法的思想應用到改進MMCF 中。
MMCF 結合了SVM,但是SVM 在建立分類超平面時未利用樣本的分布信息,使MMCF 也繼承了這一弊端,易受噪音樣本干擾。為了解決上述問題,在文獻[6]的啟發下,本文提出了MCVCF 相關濾波器,其模型如下:

其中,ci是一個與樣本標簽有關的常量,當樣本屬于正樣本時,ci=1,當樣本屬于負樣本時,ci=0,旨在構造的響應輸出正樣本為高頻,而負樣本響應為0。λ用于平衡MCVCF 中分類標準部分及定位標準部分的比重,且取值范圍是(0,1]。Sw具體構造形式如式(3)所示,其利用計算類內數據的離散度來存儲數據樣本的分布信息。標簽yi=1 表示樣本屬于正樣本,yi=-1 表示樣本屬于負樣本。MCVCF 充分考慮數據樣本的分布信息,引入數據類內的樣本離散度,使MCVCF 不易被樣本中的噪音影響,并結合支持向量機的大間隔原理,能夠提高濾波器的性能。
根據相關定理,相關濾波器中的互相關運算可通過傅里葉變換轉換到頻域中變換為相乘,能夠提高運算速度。借鑒文獻[5]的求解方法,將模型轉換到頻域并利用對偶問題進行求解,再轉換回空間域得到濾波器。
我們將MCVCF 的兩部分分別進行轉換。MCVCF的定位標準部分變換如下:

其中,d是xi的維度,是對角線元素為xi所有元素的對角矩陣,分別是xi、w、gi經過傅里葉變換轉換到頻域的數據。另外,d是一個常數,對濾波器并不會造成影響,所以忽略掉頻域中的可改寫為:


借鑒文獻[5]的方法,我們對MCVCF 的分類標準部分進行空間域到頻域的轉換,可在頻域內構造MCVS?VM,式(2)則轉換為如下形式:是A類 在 頻 域 的 均 值 ,且? 屬于A類。

完成對MCVCF 的兩部分到頻域的轉換,便可得到式(4)的頻域形式:


其中,αi,βi為 Lagrange 乘子,且αi,βi>0??汕蟮闷鋵ε紗栴}:

其中,α=[α1,...,αN]T??赏ㄟ^序列最小優化算法(Sequential Minimal Optimization,SMO)來求解此對偶問題。解得對偶問題的Lagrange 乘子向量α*,MCVCF在頻域中的可由下式求得:

w?*是頻域中的濾波器,可利用二維傅里葉逆變換將其轉換到空間域中得到實際能應用的濾波器W*。
為了探討參數對MCVCF 模型的影響以及濾波器的目標檢測性能,這部分將進行目標檢測實驗。MCVCF中影響模型的主要參數有懲罰系數C以及平衡因子λ,此外,還將在目標檢測實驗中引入閾值D值,其也是人工設置的值并能影響最終結果。我們利用魚類檢測實驗來探討這些參數對MCVCF 性能的影響,并與最大間隔矢量相關濾波器[7](Maximum Margin Vector Correlation Filter,MMVCF)、零混疊大間隔相關濾波器[8](Zero-Alias?ing Maximum Margin Vector Correlation Filter,ZAMMCF)、MOSSE、OTSDF、MMCF 進行比較。
這個實驗使用的是NOAA 漁業的Labeled fishes in the wild[9]魚類數據集,其擁有1329 張含有魚類的照片和3167 張不含魚類的照片,其中包含魚類的照片尺寸大多是1024×768,而不包含魚類的圖像尺寸各不相同。由于較多數圖像中的魚類并不清晰,所以實驗中剔除了這部分圖像。我們從包含清晰魚類的圖像中隨機選出80 張作為測試樣本,剩下的包含清晰魚類的圖像作為正樣本,而清晰的不包括魚類的圖像作為負樣本。在訓練過程中,由于圖像的大小不一,不便于實驗,因此將正負樣本均改變成60×60=360 維像素的圖像。在測試過程中,我們將會把檢測結果與ground truth 作對比,得到與ground truth 框的重疊率O以計算檢測準確率。O體現了檢測框與真實情況下框的重合程度,將重疊率O與設定閾值D進行比較,便可在數值上判斷出是否檢測到目標,檢測到目標的圖像數與所有圖像的比值便是檢測準確率。
不同C、λ和設定的D值下的實驗結果如表1 所示。從實驗結果可看出,λ值對MCVCF 的檢測結果影響較小,在λ=1 即只利用了MCVSVM 分類標準部分時,檢測準確率下降得比較明顯。并且與C值對MCVSVM 效果影響較大的情況[6]不同,C值對MCVCF的影響比較小。

表1 不同參數下的檢測結果(%)
表2 是不同λ值在固定D=0.3,C=1 時各種算法魚類檢測的準確率。能夠看出,在所有設定λ值下,本文算法的檢測結果都是最優,且MCVCF 對λ值的變化并不敏感。在 0.5 ≤λ≤ 0.7 時,MCVCF 檢測準確率相較最好。但當λ=1 即只應用了MCVCF 的MCVSVM時,實驗結果則較差。這也充分表明了MCVCF 不僅相對于其他濾波器有很大提升,對比MCVSVM 也有更好的檢測結果。

表2 不同λ 值的檢測結果(%)
圖1 給出了在不同D值固定參數C=1,λ=0.6 的情況下各種算法的檢測準確率變化。可以看出所有D值下MCVCF 的檢測準確率都更高。這說明相比于MMCF 和其他相關濾波器,MCVCF 在這個數據集上的檢測準確率更高。

圖1 不同D 值的各種濾波器的檢測準確率
圖2 是魚類檢測圖像中的一個實例,其中紅色框是MCVCF 的檢測框,藍色框是MMCF 的檢測框,黃色框是ground truth 框。能夠明顯看出MCVCF 的檢測框與真實情況下的檢測框重合度更高,這也說明MCVCF在充分利用了樣本的分布信息后,使檢測結果更接近真實情況,提高了檢測效果。

圖2 MCVCF、MMCF、ground truth的檢測框
表 3 給出了固定D=0.3,λ=0.8,C=1 時各種算法的檢測準確率的比較。可以看出MCVCF 利用了數據分布信息后,這種參數情況下魚類檢測實驗中取得了比MMCF 和其他濾波器更好的檢測結果。

表3 相同D 值的檢測結果(%)
人臉識別是當今計算機領域的研究熱點[10],為了進一步檢驗相關濾波器的分類能力,我們將進行人臉識別數據集的實驗。
人臉識別實驗采用的是AR 人臉數據集,包含120個人的3120 張圖像,擁有明顯的光照表情變化,同時還有戴眼鏡、帶圍巾的明顯遮擋變化,每張像素為40×50。為了實驗的公平性,每次實驗隨機挑選每一類的[5,10,15,17,20]張圖像作為訓練集,剩下的作為測試集。實驗結果如表4 所示。AR 數據集的實驗重復進行40 次取平均值為最終識別率。和上文類似,與上文提及的 MOSSE、OTSDF、MMVCF、ZAMMCF、MMCF 進行對比,MCVCF、MMCF、MMVCF、ZAMMCF 固定參數C=1,λ=0.6,OTSDF 固定參數λ=0.6。
表4 給出了六種算法在AR 人臉數據集分別進行人臉識別實驗的結果。在AR 人臉數據集的實驗中,在樣本較多時MCVCF 的識別率都是最優。綜合可見,MCVCF 在樣本數量較為充足的情況下,平均識別率相比其他濾波器尤其是MMCF 更高,這表明充分利用樣本的分布信息是有效的,針對MMCF 進行的改進取得了較好的效果。

表4 不同濾波器在AR 數據集上的平均識別率及標準差(%)
針對MMCF 未考慮樣本分布信息的問題,本文提出了最小類內方差相關濾波器MCVCF。與MMCF 不同的是,MCVCF 不僅利用了大間隔原理,同時還應用了類內分布情況,使相關濾波器充分考慮樣本的整體分布信息,獲得的響應值更符合真實樣本情況。通過目標檢測和人臉識別兩種類型的實驗表明,MCVCF 相比MMCF 和其他傳統相關濾波器在檢測準確率和平均識別率上均得到了提高。由于本文算法在計算類內散度矩陣和求解對偶問題上時間花銷較大,下一步的研究方向是如何提高濾波器的訓練速度,減少訓練時間。