利潤霖
(中國石油大學(華東) 計算機與通信工程學院, 青島 266580)
面向人臉識別的判別低秩字典學習算法①
利潤霖
(中國石油大學(華東) 計算機與通信工程學院, 青島 266580)
人臉識別是計算機視覺和模式識別領域的一個研究熱點, 有著十分廣泛的應用前景. 人臉識別任務在訓練樣本和測試樣本同時包含噪聲的情況下存在識別精度不高的問題, 為此本文提出一個新的判別低秩字典學習和低秩稀疏表示算法(Discriminative Low-Rank Dictionary Learning for Low-Rank Sparse Representation, DLRD_LRSR).本文方法在模型中約束每個子字典和稀疏表示低秩避免噪聲干擾, 并引入了判別重構誤差項增強系數的判別性. 為驗證算法的有效性, 本文在3個公開人臉數據集上進行了實驗評估, 結果表明與現有字典學習算法相比, 本文算法能夠更好的解決訓練樣本和測試樣本同時存在噪聲的人臉識別問題.
字典學習; 低秩矩陣恢復; 人臉識別; 增廣拉格朗日乘子算法
經過幾十年的發展, 稀疏編碼已經變成一項熱門課題, 被神經系統學科、信息理論、信號處理等相關領域的專家所研究[1-5]. 字典學習通常用于對信號進行稀疏編碼, 通過一個完備字典中的少部分元素線性組合實現對樣本的重構. 在計算機視覺領域中, Olshausen和Field[1]于1996年提出了一個關于對人類視覺系統細胞感受野建模的方法, 首次提出稀疏和過完備圖像表示的概念. 在此基礎上研究者提出許多字典學習算法并成功地應用于人臉識別[4,6], 圖像分類[7,8], 子空間聚類[9], 圖像恢復[10], 運動分割[11]等領域.
Wright et al.[4]提出了一種基于稀疏編碼的分類算法(SRC), 該算法將訓練樣本組成的矩陣作為字典, 通過優化重構誤差求取樣本的稀疏表示并用于分類. 為了提高SRC算法的性能, 許多研究者對其做出了改進[12-14],雖然這些算法都具備了很強的魯棒性, 但是在訓練樣本過多的情況下會得到維數過高的字典, 從而導致空間和時間代價的增加. 為了避免字典維數過大的問題,一些低維字典學習的方法先后被提出. KSVD[15]在字典學習過程中依據誤差最小原則, 對誤差項進行SVD分解, 選擇使誤差最小的分解項作為更新的字典原子和對應的原子系數. 利用KSVD算法得到的字典對樣本重構可以得到理想的效果, 但是該方法只關注于稀疏表示和字典原子對原始樣本線性重構的誤差大小, 并沒有將字典的判別性考慮在內. 在KSVD的基礎上, Mairal et al.[8]通過在目標函數中加入判別重構約束增加稀疏表示的判別力. Zhang和Li et al.[16]提出了用于人臉識別的判別KSVD算法(D-KSVD), 該方法將線性分類器融入了目標函數, 最終的目標函數可通過KSVD的求解方法對字典和分類器進行共同學習. 在此基礎上, Jiang et al.[17]提出LC-KSVD算法, 通過在目標函數中加入標簽一致約束項, 增強字典的判別性. Lee et al.[18]和Wang et al.[19]提出了一種特殊的判別準則去學習過完備的字典,有效地降低了計算的復雜度. Yang et al.[20]根據費舍爾準則構建了一種判別重構誤差約束, 并將字典定義為多個子字典的組合, 在迭代更新過程中減少類內的重構誤差和類間重構增強字典判別力. 上述算法可以學習得到具有判別力的字典, 但是這些方法適用前提是圖像不存在噪聲(如KSVD、LC-KSVD)或者是圖像訓練圖像不存在噪聲(如SRC), 在訓練樣本和測試樣本同時存在噪聲的情況下, 訓練數據存在噪聲使得字典訓練難度的增加, 極大影響分類的結果, 本文對比實驗中也證實了這一點, 針對這一問題, 研究者提出了基于低秩表示的字典學習方法.
低秩矩陣恢復的方法在這幾年里得到了迅速的發展[21-23], Wright et al.[24]提出的RPCA算法通過低秩矩陣恢復和填充算法框架尋找數據潛在的低秩結構, 得到強魯棒性的低維表示. 由于其魯棒特性, RPCA成功地被運用于背景去除[25], 目標檢測[26], 目標跟蹤[27]等領域. 在圖像分類中, Chen et al.[28]利用低秩矩陣恢復去除訓練樣本中的噪聲, 在人臉識別任務中獲得了強魯棒性的結果. Liu et al.[29]提出了低秩表示算法(LRR),LRR算法通過優化得到能夠與字典對樣本進行重構的低秩矩陣. 利用低秩矩陣LRR在子空間分割中有著非常理想的性能. 基于LRR算法, 一系列面向圖像分類的字典學習方法先后被提出. Ma et al.[30]提出了判別低秩字典學習算法(DLRD_SR), 通過在目標函數中加入對子字典的低秩約束, 有效抑制了訓練樣本存在噪聲的干擾, 學習得到干凈的低秩字典, 并在訓練樣本與測試樣本同時存在噪聲的人臉識別實驗中得到了顯著的效果. 為了增強DLRD_SR算法的字典判別性, Li et al.[31]將費舍爾判別準則融入目標函數, 提出了面向圖像識別的判別低秩字典學習算法(D2L2R2). Zhang et al.[32]提出結構化低秩表示算法, 通過在LRR的目標函數中加入稀疏表示的結構化正則項得到具有判別力的低秩表示, 該方法并沒有在字典更新階段加入有效約束, 針對這個缺陷, DLR_DL算法[33]在字典更新階段加入低秩約束, 增強了字典對樣本的表達能力. 然而文獻[32,33]在稀疏編碼過程中忽視了類內聚合以及類間區分能力.
現有的基于低秩表示的方法雖然能夠有效處理訓練樣本和測試樣本同時存在噪聲的問題, 但是忽略了稀疏編碼和字典更新過程中判別性約束的統一性,DLRD_SR和DLR_DL在稀疏編碼過程中都沒有采取有效措施深入挖掘樣本類內聚合以及類間區分能力, 而LSLRR是在字典更新過程中忽視了字典的判別性約束. 對此, 本文提出一個新的判別低秩字典學習方法,在編碼階段約束稀疏表示低秩并加入新的判別約束確保稀疏表示更具判別力; 在字典更新階段, 通過約束子字典低秩讓學習到的字典更加干凈和緊致; 本文算法通過逐類更新子字典和以及低秩稀疏表示的方式, 有效提高了訓練類內的聚合力以及類間的區別力. 不同于DLRD_SR算法, 本文算法編碼過程中加入判別約束并約束稀疏表示低秩, 從而讓學習到的低秩稀疏表示具有更高的判別力. 與DLR_DL相比, 本文方法在編碼和字典更新過程中使用了統一判別重構誤差約束, 能夠更好的保留原始數據中結構信息. 實驗結果證明, 與現有字典學習算法相比, 本文提出的DLRD_LRSR算法在存在噪聲的人臉識別任務中具有更好的性能表現.
1.1 低秩矩陣恢復
假設矩陣X可以被分解為兩個矩陣, i.e., X=A+E,A為低秩矩陣, E為稀疏噪聲矩陣. 低秩矩陣恢復旨在找到一個低秩的A近似表示X. 低秩矩陣恢復可以視為以下優化問題:

λ為噪聲矩陣E權重參數. 因為求解(1)是一個NP-hard的問題. 為了能夠求解問題(1), 文獻[24]證明了在矩陣A為低秩且E為稀疏矩陣情況下, 問題(1)可以等價于:

1.2 低秩表示
在圖像分類問題中, 可以認為相同類別的樣本特征來自同一子空間, 而不同類別的樣本特征分別來自不同子空間. 文獻[29]證實了存在一個低秩的矩陣可以揭示樣本之間的成員關系, 并提出了低秩表示算法(LRR),可以公式化為:

1.3 低秩字典學習
文獻[30]提出了低秩字典的算法(DLRD_SR),DLRD_SR通過約束子字典低秩, 在訓練字典的過程中減少訓練樣本存在噪聲的影響進而學習到干凈的低秩字典. 給出一組數據, Xi為i類的樣本, c為樣本類別的數量, d為特征的維數, N為訓練樣本的總數. X中可能會包含噪聲, 如遮擋, 像素缺失以及光照陰影等. 低秩矩陣恢復可以將受噪聲干擾的矩陣X分解為一個低秩組合矩陣DZ和一個稀疏的噪聲矩陣E, i.e., X=DZ+E. 假設字典包含c個子字典, 其中K為字典的維數大小, Di為類i子字典.為低秩稀疏表示, Z可以表示為DLRD_SR算法模型可以公式化為:

Zi為Xi相對于字典D的稀疏表示, Zi,j為Xi相對于字典Dj的稀疏表示,. 文獻中實驗結果證明DLRD_SR能夠很好處理人臉識別任務中存在噪聲的問題.
受到相關工作啟發, 本文提出一種新的用于人臉識別的低秩字典學習算法, 減少存在訓練樣本中的噪聲干擾, 學習干凈字典以及具有判別力的低秩稀疏表示. 通過約束每個子字典和稀疏表示低秩, 有效減少噪聲干擾, 并在編碼過程中加入新的判別重構誤差項, 增強低秩稀疏表示的判別力. 實驗表明本文算法有以下優點:
1)本文方法通過約束每個子字典低秩, 有效減少噪聲的干擾, 獲得干凈緊致的低秩字典. 低秩字典能夠有效提高稀疏表示的判別力.
2)引入判別重構誤差項, 逐類更新子字典和以及低秩稀疏表示, 增強了字典和低秩稀疏表示的判別力,提高了分類精度.
為了解決人臉識別任務中存在噪聲的問題, 本文提出一個新的判別低秩字典學習算法. 本文的模型可以表示為:

Zi可以進一步表示為, 其中Zji為子字典Dj相對于Xi的低秩稀疏表示. 假設Xi為未受噪聲干擾的樣本, 則樣本能夠被字典和稀疏表示重構,所以有, 因此我們約束和最小化(為Frobenius范數), 而矩陣的元素值也應接近于零, 從而使的值最小化. 由此, 定義判別重構誤差項為:

加入重構誤差項, 本文的模型可以表示為:

本文的模型可以通過迭代優化字典D和低秩稀疏表示Z求解, 具體步驟在第3節中提出.
為了求解公式(7)的優化問題, 可以將模型優化分解為兩個子問題: 首先, 固定字典D以及對逐個進行更新, 合并所有Zi可以獲得低秩稀疏表示矩陣Z; 然后固定逐個更新子字典Di. 通過迭代這兩步最終可以得到最優化的低秩字典D.
3.1 更新X
假設字典D固定, 原始的目標函數(7)可以視為稀疏編碼問題, 固定逐個進行更新, 可以通過求解以下問題來實現:

為在不受噪聲的影響的情況下得到低秩稀疏表示.本文在判別重構誤差項中加入噪聲項Ei.為了求解公式(10)引入兩個輔助變量H和W, 可以化為以下等價形式:

這個優化問題可以通過增廣拉格朗日乘子方法[38]求解, 將公式(11)轉化為以下增廣拉格朗日函數:

式中, 〈A,B〉=trace (ATB); Y1、Y2、Y3為拉格朗日乘子; μ為正數懲罰因子. 通過逐個更新H, Zi, W, Ei來求解問題(11), 算法1歸納了求解的過程.


3.2 更新D
得到優化系數Z后, 固定然后對Di逐個進行更新. 當Di更新后, Xi相對于Di的稀疏表示Zii也應得到更新. 可以得到以下目標函數:

公式(20)可以通過依次更新L, Zii, J, Di, Ei來求解,算法2歸納了求解問題(19)的過程. 由于在更新字典時需要對字典的列向量單位化, 不能保證算法2能夠收斂,因此需要設置最大迭代次數, 但是在實驗中, 算法2總能在到達最大迭代次數之前就能得到收斂的結果. 在實驗中, 我們使用KSVD對訓練樣本進行訓練, 得到的字典作為本文算法的初始字典. DLRD_LRSR算法的整體流程在總結在算法3中.


3.3 分類器
通過算法3, 我們可以得到優化的判別低秩字典和訓練數據X對應的低秩稀疏表示Z. 測試數據Xtest對應的表示Ztest可以通過求解以下優化問題得到:

我們可以通過設置公式(11)中的參數γ1為零使用算法1求解公式(26)得到測試樣本的低秩稀疏表示.
本文使用多元線性嶺回歸模型[27]訓練分類器:


本文在Extended Yale B[39], UMIST[40], AR[41]三個人臉數據集上對DLRD_LRSR進行了評估. 為了測試算法的性能, 本文方法與當前流行的字典學習算法進行比較, 并分別在光照變化、像素缺失、均勻分布噪聲、和塊遮擋的情況下測試算法的魯棒性.
在實驗中我們發現參數γ1, γ2, β1, β2, β3取值的大小對結果影響很小, 因此將它們的值都設置為1. 其他參數分別通過5-fold交叉驗證得到: 對于Extended Yale B數據集λ1=5, λ2=0.09, λ3=2; 對于AR數據集 λ1=10,λ2=0.2, λ3=5; 對于UMIST數據集 λ1=10, λ2=0.2, λ3=4.
4.1 Extended Yale B數據集
Extended Yale B數據集包含38人的共2414張正臉圖像, 分別在不同光照條件下拍攝, 每張圖像分辨率為192×168像素, 每個人分別有59-64張圖像. 本文首先將原始圖像按照1/8的比例下采樣得到504維的特征向量,為了測試算法在像素缺失情況下的魯棒性, 從每張圖像(包括訓練和測試樣本)隨機選取一定比例的像素點并用255取代其像素值, 圖1展示了處理后的圖像樣本示例. 每次實驗隨機從每個人的臉部圖像中隨機挑選32個樣本作為訓練集, 剩下的部分作為測試集. 本文方法分別與SRC[4]、KSVD[15]、LC-KSVD[17]、DLRD_SR[30]和LSLRR[32]算法進行對比. DLRD_LRSR和對比方法中的KSVD、LC-KSVD、DLRD_SR學習得到的字典每類包含20個原子, 共760個原子. SRC選取所有的訓練樣本作為字典, 包含1216個原子. 分別重復實驗10次取平均值作為實驗結果.

圖1 Extended Yale B數據集5%像素缺失示例
表1對不同算法識別結果進行了比較, 可以看到SRC、KSVD和LC-KSVD的準確率隨著噪聲比例的增加而急劇下降, 而SRC得到比KSVD、LC-KSVD更高的識別結果. 證實了它們都不能很好處理噪聲問題, 而SRC因為可適用于測試圖片存在噪聲的場景, 因此得到更高的識別結果. 而本文算法DLRD_LRSR與LSLRR、DLRD_SR在噪聲存在的情況下擁有比其他方法更好的魯棒性, 這說明了低秩約束擁有良好的抑制噪聲影響的能力. 本文算法在不同比例的像素缺失實驗中的準確率均大于DLRD_SR和LSLRR的識別結果, 0%~20%之間, 缺失率越高, 差距越明顯, 甚至在20%像素缺失的情況下的識別結果高于LSLRR 9.46個百分點, 展示了DLRD_LRSR處理訓練樣本存在噪聲問題的顯著性能, 說明了DLRD_LRSR約束子字典和稀疏系數低秩有效降低了噪聲干擾, 重構誤差項能夠保留噪聲樣本之間的判別性, 顯著提高存在噪聲情況下的識別精度.

表1 Extended Yale B數據集像素缺失實驗識別率(%)
4.2 UMIST人臉數據集
UMIST人臉數據集包含26人共564張人臉圖像. 數據集中所有圖像分辨率為112×192像素. 在本次實驗中,測試本文算法在隨機噪聲以及塊遮擋情況下的魯棒性.選擇每個人的前20張圖片用于實驗, 并從中隨機挑選一半圖像作為訓練集, 剩下則作為測試集. 每張圖像下采樣為24×21像素. 隨機噪聲實驗中, 圖像被添加10%~50%的均勻噪聲. 遮擋實驗中, 用10%~50%的隨機圖像塊遮擋圖像的隨機位置. 圖2展示了兩種噪聲的示例. 本文算法分別與SRC、KSVD、LC-KSVD、DLRD_SR、LSLRR進行對比, 所有算法訓練得到的字典維度大小均為訓練樣本個數.

圖2 UMIST數據集圖像示例: 第一行為添加隨機噪聲的圖像, 第二行為添加塊遮擋的圖像
表2列出了不同比例塊遮擋下的識別率, 表3則為不同比例均勻噪聲下的識別率. 可以發現在表2和表3中SRC、KSVD和LC-KSVD的準確率隨著噪聲比例的增加而急劇下降, 而SRC得到比KSVD、LC-KSVD更高的識別結果, 表現出了與實驗一相同的性質. 在多數情況下, DLRD_LRSR擁有比其他方法更高的準確率,特別在50%均勻噪聲和50%塊狀遮擋比例下, 本文算法分別比LSLRR提高了1.11和0.78個百分點, 充分說明了通過約束子字典和稀疏表示低秩, DLRD_LRSR在訓練過程中能夠有效降低了噪聲干擾, 因此在存在高遮擋和高隨機噪聲的場景下擁有比其他算法更高的性能.實驗結果證明了本文算法中的低秩稀疏表示在存在隨機噪聲和塊遮擋的人臉識別任務中具有顯著的效果.

表2 UMIST數據集塊遮擋實驗識別率(%)

表3 UMIST數據集均勻噪聲實驗識別率(%)
4.3 AR數據集
AR數據集包含126人超過4000張的正臉圖像. 每個人26幅圖像, 分為2組, 每組每人13張, 其中未受遮擋的圖像7張, 受太陽眼鏡和圍巾遮擋的圖像各有3張, 這些圖像的拍攝時間間隔為2周. 每組圖像分別反映了人臉的表情、光照以及遮擋(墨鏡或圍巾)的變化. 在實驗中, 選用了包含50個男性目標和50個女性目標的子集,并將原始圖像下采樣到25×20像素, 圖3展示了AR圖像示例, 本文算法在Sunglasses、Scarf以及Mixed三個實驗中與其他方法進行比較, 三個實驗設置與文獻[33]一致. 本文算法分別與SRC、KSVD、LC-KSVD、DLRD_SR、LSLRR和DLR_DL[33]進行對比, 所有算法訓練得到的字典維度大小均為訓練樣本個數. 每個實驗分別重復實驗10次最后求平均值作為本文方法的最后結果.

圖3 AR數據集圖像示例
表4列出了DLRD_LRSR與其他方法在AR數據集上的實驗結果. 可以看出, SRC、KSVD和LC-KSVD算法并不能很好地解決遮擋問題, 而SRC仍比KSVD和LC-KSVD有著更高的識別結果. 與DLRD_SR、LSLRR和DLR_DL算法相比, 本文算法有了很明顯的提升, 在Sunglass、Scarf和Mixed場景中分別比DLR_DL提高了3.72、4.76和5.92個百分點, 證明了本文算法能夠有效的處理AR數據集中存在的光照、表情以及遮擋的問題, 并且在越復雜的場景(太陽鏡遮擋比例大約20%,圍巾遮擋比例大約40%, Mixed兩者皆有)下DLRD_LRSR越能有顯著的表現.

表4 AR數據集實驗識別率(%)
本文提出了一種用于人臉識別的新的判別低秩字典學習和低秩稀疏表示算法. 首先, 為了增強字典的判別力, 本文引入了判別重構誤差項, 通過最小化類內重構誤差以及類間重構生成低秩稀疏表示; 其次, 分別約束每個子字典和稀疏表示低秩減少了訓練樣本中存在噪聲的干擾, 最終得到干凈的字典. 本文在3個公開人臉數據集上的實驗證明了本文提出的DLRD_LRSR算法在光照變化、隨機噪聲、像素缺失以及遮擋的情況下具有較強的魯棒性. 由于在求解的時候采用了增廣拉格朗日算法, 本文算法和大多數低秩方法一樣, 存在計算效率不高的限制, 因此效率更高的低秩矩陣恢復的求解方法是我們未來要開展的工作.
1Olshausen BA, Field DJ. Emergence of simple-cell receptive field properties by learning a sparse code for natural images.Nature, 1996, 381(6583): 607–609. [doi: 10.1038/381607a0]
2Candes EJ, Romberg J, Tao T. Robust uncertainty principles:Exact signal reconstruction from highly incomplete frequency information. IEEE Trans. Information Theory,2006, 52(2): 489–509. [doi: 10.1109/TIT.2005.862083]
3Donoho DL. Compressed sensing. IEEE Trans. Information Theory, 2006, 52(4): 1289–1306. [doi: 10.1109/TIT.2006.871582]
4Wright J, Yang AY, Ganesh A, et al. Robust face recognition via sparse representation. IEEE Trans. Pattern Analysis and Machine Intelligence, 2009, 31(2): 210–227. [doi: 10.1109/TPAMI.2008.79]
5Elad M. Sparse and Redundant Representations: From Theory to Applications in Signal and Image Processing. New York: Springer, 2010.
6Wright J, Ma Y, Mairal J, et al. Sparse representation for computer vision and pattern recognition. Proc. IEEE, 2010,98(6): 1031–1044. [doi: 10.1109/JPROC.2010.2044470]
7Yang JC, Yu K, Gong YH, et al. Linear spatial pyramid matching using sparse coding for image classification. Proc.IEEE Conference on Computer Vision and Pattern Recognition, 2009. Miami, FL, USA. 2009. 1794–1801.
8Mairal J, Bach F, Ponce J, et al. Discriminative learned dictionaries for local image analysis. Proc. IEEE Conference on Computer Vision and Pattern Recognition, 2008.Anchorage, AK, USA. 2008. 1–8.
9Elhamifar E, Vidal R. Sparse subspace clustering: Algorithm,theory, and applications. IEEE Trans. Pattern Analysis and Machine Intelligence, 2013, 35(11): 2765–2781. [doi:10.1109/TPAMI.2013.57]
10Mairal J, Elad M, Sapiro G. Sparse representation for color image restoration. IEEE Trans. Image Processing, 2008,17(1): 53–69. [doi: 10.1109/TIP.2007.911828]
11Rao SR, Tron R, Vidal R, et al. Motion segmentation via robust subspace separation in the presence of outlying,incomplete, or corrupted trajectories. Proc. IEEE Conference on Computer Vision and Pattern Recognition, 2008.Anchorage, AK, USA. 2008. 1–8.
12Yang M, Zhang L, Yang J, et al. Robust sparse coding for face recognition. Proc. 2011 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Providence, RI,USA. 2011. 625–632.
13Huang JZ, Huang XL, Metaxas D. Learning with dynamic group sparsity. Proc. 12th International Conference on Computer Vision. Kyoto, Japan. 2009. 64–71.
14Yuan XT, Liu XB, Yan SC. Visual classification with multitask joint sparse representation. IEEE Trans. Image Processing, 2012, 21(10): 4349–4360. [doi: 10.1109/TIP.2012.2205006]
15Aharon M, Elad M, Bruckstein A. rmK-SVD: An algorithm for designing overcomplete dictionaries for sparse representation. IEEE Trans. Signal Processing, 2006, 54(11):4311–4322. [doi: 10.1109/TSP.2006.881199]
16Zhang Q, Li BX. Discriminative K-SVD for dictionary learning in face recognition. Proc. 2010 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). San Francisco, CA, USA. 2010. 2691–2698.
17Jiang ZL, Lin Z, Davis LS. Learning a discriminative dictionary for sparse coding via label consistent K-SVD.Proc. 2011 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Providence, RI, USA. 2011.1697–1704.
18Lee H, Battle A, Raina R, et al. Efficient sparse coding algorithms. Advances in Neural Information ProcessingSystems 19, Proc. Twentieth Annual Conference on Neural Information Processing Systems, Vancouver. British Columbia Canada. 2006. 801–808.
19Wang JJ, Yang JC, Yu K, et al. Locality-constrained linear coding for image classification. Proc. 2010 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). San Francisco, CA, USA. 2010. 3360–3367.
20Yang M, Zhang L, Feng XC, et al. Fisher discrimination dictionary learning for sparse representation. Proc. 2011 IEEE International Conference on Computer Vision (ICCV).Barcelona, Spain. 2011. 543–550.
21Candès EJ, Li XD, Ma Y, et al. Robust principal component analysis?. Journal of the ACM (JACM), 2011, 58(3): 11.
22Candes EJ, Plan Y. Matrix completion with noise. Proc.IEEE, 2010, 98(6): 925–936. [doi: 10.1109/JPROC.2009.2035722]
23Candès EJ, Recht B. Exact matrix completion via convex optimization. Foundations of Computational Mathematics,2009, 9(6): 717–772. [doi: 10.1007/s10208-009-9045-5]
24Wright J, Ganesh A, Rao S, et al. Robust principal component analysis: Exact recovery of corrupted low-rank matrices via convex optimization. Advances in Neural Information Processing Systems. Vancouver, British Columbia, Canada. 2009. 2080–2088.
25Cui XY, Huang JZ, Zhang ST, et al. Background subtraction using low rank and group sparsity constraints. Fitzgibbon A,Lazebnik S, Perona P, et al. Computer Vision-ECCV 2012.Berlin Heidelberg, Germany. 2012. 612–625.
26Shen XH, Wu Y. A unified approach to salient object detection via low rank matrix recovery. Proc. 2012 IEEE Conference on Computer Vision and Pattern Recognition(CVPR). Providence, RI, USA. 2012. 853–860.
27Zhang TZ, Ghanem B, Liu S, et al. Low-rank sparse learning for robust visual tracking. Fitzgibbon A, Lazebnik S, Perona P, et al. Computer Vision-ECCV 2012. Berlin Heidelberg,Germany. 2012. 470–484.
28Chen CF, Wei CP, Wang YCF. Low-rank matrix recovery with structural incoherence for robust face recognition. Proc.2012 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Providence, RI, USA. 2012.2618–2625.
29Liu G, Lin Z, Yu Y. Robust subspace segmentation by lowrank representation. International Conference on Machine Learning. Haifa, Isreal. 2010. 663–670.
30Ma L, Wang CH, Xiao BH, et al. Sparse representation for face recognition based on discriminative low-rank dictionary learning. Proc. 2012 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Providence, RI, USA.2012. 2586–2593.
31Li LY, Li S, Fu Y. Learning low-rank and discriminative dictionary for image classification. Image and Vision Computing, 2014, 32(10): 814–823. [doi: 10.1016/j.imavis.2014.02.007]
32Zhang Y, Jiang ZL, Davis LS. Learning structured low-rank representations for image classification. Proc. 2013 IEEE Conference on Computer Vision and Pattern Recognition.Portland, OR, USA. 2013. 676–683.
33Nguyen H, Yang WK, Sheng BY, et al. Discriminative lowrank dictionary learning for face recognition. Neurocomputing, 2016, 173: 541–551. [doi: 10.1016/j.neucom.2015.07.031]
34Rodriguez F, Sapiro G. Sparse representations for image classification: Learning discriminative and reconstructive non-parametric dictionaries. Minnesota, USA: University of Minnesota. 2008.
35Pham DS, Venkatesh S. Joint learning and dictionary construction for pattern recognition. Proc. IEEE Conference on Computer Vision and Pattern Recognition, 2008. CVPR 2008. Anchorage, AK, USA. 2008. 1–8.
36Mairal J, Ponce J, Sapiro G, et al. Supervised dictionary learning. Advances in Neural Information Processing Systems. Vancouver, British Columbia, Canada. 2009.1033–1040.
37Yang JC, Yu K, Huang T. Supervised translation-invariant sparse coding. Proc. 2010 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). San Francisco, CA,USA. 2010. 3517–3524.
38Lin ZC, Chen MM, Ma Y. The augmented lagrange multiplier method for exact recovery of corrupted low-rank matrices. arXiv preprint arXiv:1009.5055, 2010.
39Lee KC, Ho J, Kriegman DJ. Acquiring linear subspaces for face recognition under variable lighting. IEEE Trans. Pattern Analysis and Machine Intelligence, 2005, 27(5): 684–698.[doi: 10.1109/TPAMI.2005.92]
40Graham DB, Allinson NM. Characterising virtual eigensignatures for general purpose face recognition.Wechsler H, Phillips PJ, Bruce V, et al. Face Recognition.Berlin Heidelberg, Germany. 1998. 446–456.
41Martinez AM, Benavente R. The AR face database.Technical Report 24. Barcelona, Spain: CVC, 1998.
Discriminative Low-Rank Dictionary Leaning For Face Recognition
LI Run-Lin
(College of Computer &Communication Engineering, China University of Petroleum, Qingdao 266580, China)
Face recognition is active in the field of computer vision and pattern recognition and has extremely wide-spread application prospect. However, the problem that both training images and testing images are corrupted is not well solved in face recognition task. To address such a problem, this paper proposes a novel Discriminative Low-Rank Dictionary Learning for Low-Rank Sparse Representation algorithm (DLRD_LRSR) aiming to learn a pure dictionary. We suggest each sub dictionary and sparse representation be low-rank for reducing the effect of noise in training samples and introduce a novel discriminative reconstruction error term to make the coefficient more discriminating. We demonstrate the effectiveness of our approach on three public face datasets. Our method is more effective and robust than the previous competitive dictionary learning method.
dictionary learning; low-rank matrix recovery; face recognition; ALM
利潤霖.面向人臉識別的判別低秩字典學習算法.計算機系統應用,2017,26(7):137–145. http://www.c-s-a.org.cn/1003-3254/5917.html
2016-11-18; 收到修改稿時間: 2017-01-16