徐廣飛
摘 要:近年來,稀疏表示分類(SRC)方法在圖像識別中受到越來越多的關注。SRC方法將測試樣本分在最小重構誤差所對應的類別中,這種決策方法對SRC的稀疏原理不是最優的。為了從稀疏編碼系數中得到鑒別性更強的信息,本文提出一種新的決策規則——“系數和”規則。在Yale數據庫和MNIST數據庫上的實驗結果表明本文提出的方法要優于原始SRC方法。
關鍵詞:稀疏表示分類;圖像識別;系數和規則;MNIST數據庫
1 引言
圖像識別是計算機視覺和模式識別領域內廣泛研究的分類問題之一,最近稀疏表示分類[1](SRC)方法在人臉識別中得到應用并取得很好的識別效果。SRC利用了人臉圖像的線性子空間結構并將人臉識別問題看做是一個稀疏表示問題。具體來說,給定一個測試樣本,SRC首先得到該樣本在所有訓練樣本構成的字典上的稀疏系數,然后利用稀疏系數和每類訓練樣本重構樣本,最后將該測試樣本分在最小重構誤差對應的類別中。隨后又有很多改進的SRC方法來提高其性能,并被應用到其它機器學習問題中。
2 稀疏表示分類算法
SRC算法的流程如下:
⑴輸入:由C類訓練樣本組成的矩陣A=[A1,A2,…,Ac]∈Rm×n,測試樣本y∈Rm;
⑵將y和A的列向量單位化;
⑶求解:
(或者求解 );
⑷計算殘差 ;
⑸輸出:測試樣本的類別
3 系數和規則
在文獻[2]中,提出通過稀疏系數可以反映數據間的相似性。因此我們提出使用系數和(sum of coefficient,SoC)進行決策:
4 實驗驗證及分析
本節中,我們通過實驗來驗證“系數和”(SoC)規則的性能,對比方法為原始SRC算法。使用的圖像庫為Yale人臉庫和MNIST數據庫。在對圖像進行分類前,我們使用PCA對樣本進行降維。SRC通過求解(2)式得到稀疏系數,然后進行分類,誤差容忍度ε設為0.005。
4.1 Yale人臉庫
Yale數據庫由15個人,每人11張圖像組成,分辨率為121×160,灰度級為256。實驗中我們隨機選擇每個人的4幅圖像組成訓練樣本,其余為測試樣本。隨機選擇3次,取3次的正確識別率均值。不同特征維數下的識別率如表1所示。
4.2 MNIST手寫體數據庫
MNIST手寫數字庫中共有60,000個訓練樣本和10,000個測試樣本,包含0-9這10個數字的不同手寫體圖像,圖像大小為28 28。實驗中我們選擇每類的25幅圖像作為訓練樣本,另外25幅圖像為測試樣本。不同特征維數下的識別率如表2所示。從表中數據可以看出使用SoC后算法的性能提高了1%-2%,這表明基于系數的決策可以更好地利用稀疏性。
4.3 實驗結果及討論
⑴在Yale人臉庫和MNIST手寫體數據庫上我們提出的系數和決策規則的性能均優于原始算法的性能,這說明基于系數的決策規則對稀疏表示分類是較優的。
⑵實驗結果也表明兩個最大的系數和的比例要比兩個最小的重構誤差的比例要大,這解釋了SoC識別率高的原因,因此SoC更具有鑒別性。
5 總結及展望
受稀疏系數可以反映樣本間相似性的啟發,本文中我們提出一種新的決策規則—“系數和”規則,它更具有鑒別性并能充分利用稀疏性來進行分類。在Yale人臉庫和MNIST手寫體數據庫上的實驗證明了“系數和”規則的有效性。
[參考文獻]
[1]Wright J.et al.Robust face recognition via sparse representation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence(ISSN: 0162-8828),2009,31(2):210-227.
[2]Elhamifar E.,Vidal R..Sparse subspace clustering[C]// Computer Vision and Pattern Recognition,2009.CVPR 2009.IEEE Conference on.IEEE,2009:2790-2797.