向順靈(廣西民族大學信息科學與工程學院,廣西南寧,530006)
?
論訓練樣本集結構和稀疏表示分類算法的關系
向順靈
(廣西民族大學信息科學與工程學院,廣西南寧,530006)
摘要:近年來,基于表示法的人臉識別技術主要都集中在約束條件和字典學習。很少有研究用樣本數據特征來確定基于表示分類算法的性能。本文定義了結構離散度,表示樣本集的結構特征。實驗結果表明,具有較高的結構離散度的集合能讓一個分類算法獲得更高的識別率。
關鍵詞:模式識別;人臉識別
在基于標準的分類算法中,訓練樣本集的整除是影響分類結果的重要因素。標準也是衡量樣本集可分性的重要指標。在不同的公共人臉數據庫中,許多實驗表明,標準在基于稀疏表示分類方法上不是有利的。事實上,樣本集的過度聚集包含了高類內離散度(within-class scatter),因此,這個樣本集的稀疏表示能力將嚴重減弱,低類內離散度中的一組樣本向量集通常不能跨越高類內離散度中的更大向量空間。例如,兩個樣本集中的一個樣本的離散度明顯高于單個樣本;那么兩個樣本的稀疏表示能力比單個樣本強。這個事實就可以解釋為什么當訓練樣本越多,基于稀疏表示的分類算法能獲得較高的識別率。
因此,樣本高類內離散度對基于稀疏表示的分類算法是有益的。設人臉圖像的調整大小為,像素值為。人臉圖像空間是有限距離。隨著樣本類內離散度(within-class scatter)的增加,樣本類間離散度(between-class scatter)隨之減少。最后,我們假設訓練樣本集,其中代表的是第類數據集,表示類的數量,是類樣本的數量。定義如下:
總樣本集的類內離散度的定義:

圖1 結構離散的曲線和不同人臉數據的識別率

樣本集的類間離散度的定義:

其中表示樣本集中類的均值,是總樣本集中所有訓練樣本的均值。而且,樣本集的結構離散度定義為:

以上分析得出樣本結構離散度中高類內離散度可能是影響SRC算法性能的原因。下面通過實驗分析進一步驗證這個結論。
為了進一步驗證結構離散和基于稀疏表示分類算法之間的關系,我們選用AR;FERET;extended Yale B作為人臉基準數據集。實驗表明訓練樣本集的增加超過某個固定值時,大多數基于稀疏表示分類的識別率不可能明顯的提高。本文從人臉基準數據集中選擇2到4個樣本。
實驗環境為:Window XP,隨機存取存儲器(Ramdom Access Memory,RAM)大小為:3.25GB;CPU頻率為:3.16GHz,使用的軟件為:MATLAB。結構離散作為水平軸,正確的識別率作為垂直軸。如圖1所示:
圖1中的直線是擬合線,對應的是有序對集的線性回歸;曲線是訓練樣本集SSD的識別率變化,圖1可看出結構離散越高,分類算法得到越高的正確識別率。因此,可以得到結論:訓練樣本集中的結構離散度越高對基本稀疏表示的識別算法越有利。
本文通過實驗分析得到訓練樣本集中的結構離散越高,基于稀疏表示的分類算法的識別率越高。正確的識別率是人臉識別中重要的標準。選擇合理的訓練樣本集數量和高結構離散可以有效地提高正確識別率。
參考文獻
[1]D.Lowe.Distinctive image features from scale-invariant key-points.International Journal of Computer Vision.2004,60(2): 91-110.
[2]T.Ojala,M.Pietikainen,and D.Harwood. A comparative-study of texture measures with classi cation based on feature distributions.Pattern Recognition,1996,29(1):51-59.
[3] Wright,J.,Yang,A.,Ganesh,A.,Sastry,S.,Ma, Y.: Robust face recognition via sparse representation. IEEE Transactions on Pattern Analysis and Machine Intelligence,2009,31(2): 210-227.
[4] Martinez,A.:The ar face database.CVC Technical Report 24 (1998)
[5] A.P.J.Phillips,H.Moon,P.J.Rauss,S.Rizvi, The FERET evaluation methodology for face recognition algorithms,IEEE Transactions on Pattern Analysis and Machine Intelligence,2000,22 (10):1090-1104.
[6]L.Chen,H.Man,A.V.Nefian.Face recognition based on multiclass mapping of Fisher scores.Pattern Recognition 38(2005):799-811.
向順靈(1989-),女,碩士研究生,研究方向為圖像處理、視頻處理;
Relationship between the representation-based classification algorithm and structure of the training sample set
Xiang Shunling
(School of information science and engineering, Guangxi University For Nationalities, Nanning, Guangxi 530006)
Abstract:In recent years,representation-based face-recognition techniques are focus mainly on constraint conditions and dictionary learning. Few researchers study which sample data features determine the performance of representation-based classification algorithms.we define the structure-scatter degree, which represents the structure features of training sample sets, said structure characteristics of sample set. Experimental results show that sets with a higher structure scatter more likely allows a classification algorithm to obtain a higher recognition rate.
Keywords:Pattern recognition;Face recognition
通訊作者:向舜然(1987-),男,講師,重慶市城市管理職業學院
作者簡介
中圖分類號:TP319
文獻標識碼:A
人臉識別已經發展成為計算機視覺領域中一個活躍的研究課題,其中子空間方法(subspace method)主要是將高維數據向低維特征空間轉變。在這個過程中,將原來樣本中的信息嵌入到少量的特征向量中,這其中包括一些對分類有利和不利的信息。因此有了局部特征提取的方法,如尺度不變特征變換(Scale invariant feature transform,SIFT),局部二值特征(local binary pattern,LBP),基于稀疏表示的分類(Sparse Representation-based Classification, SRC)對人臉分類有較好的效果。但是經過實驗分析,在同一人臉數據庫中,不同的訓練樣本集可能會引起相同的算法,并得到完全不同的識別率。最直觀的原因就是不同的訓練樣本集中的不同結構分布,從而影響算法性能。