人臉表情是一種重要且自然的情緒表現(xiàn)形式,因而人臉表情自動(dòng)識(shí)別也是人機(jī)和諧交互的重要基礎(chǔ)。近三十年來,人臉表情識(shí)別(FER)研究一直是人工智能領(lǐng)域的一個(gè)熱點(diǎn)
。近些年,隨著深度學(xué)習(xí)技術(shù)發(fā)展,FER研究從實(shí)驗(yàn)室限制條件下的表情樣本逐漸轉(zhuǎn)移到了現(xiàn)實(shí)世界(自然)表情圖像。自然表情圖像復(fù)雜多變,如光照強(qiáng)度、頭部姿態(tài)變化、有無遮擋物等,導(dǎo)致表情識(shí)別的難度增加
。
FER是一個(gè)典型的多分類任務(wù),每一個(gè)樣本必歸屬某一個(gè)類別,且只屬于一個(gè)類別。Softmax Loss (SL)是一種交叉熵?fù)p失,經(jīng)過Softmax變換,每一個(gè)樣本最終輸出對(duì)應(yīng)多個(gè)類別的概率值(相對(duì)概率)。SL通過優(yōu)化預(yù)測(cè)概率與目標(biāo)概率之間的誤差,會(huì)持續(xù)拉高正確類別的概率和降低錯(cuò)誤分類的概率。在多分類問題上,SL直觀、易理解,而且反向求導(dǎo)簡潔,是FER領(lǐng)域應(yīng)用最廣泛的一種監(jiān)督函數(shù)。
SL盡力把不同類別樣本特征在角度空間分開,在SL監(jiān)督下學(xué)習(xí)到的深度特征的區(qū)分度不夠好
,因此研究者們對(duì)SL進(jìn)行了改進(jìn)
。針對(duì)SL的改進(jìn)技術(shù)主要分兩類:一類是改變SL本身(即SL的變體),例如人臉識(shí)別領(lǐng)域中的ArcFace
、Normface
和CosFace
等;另一類是增加約束項(xiàng)協(xié)同SL一起工作,如Center loss(CL)
和Island Loss(IL)
等。
分類任務(wù)有個(gè)共同原則,深度特征的區(qū)分度越高越好,即不同類別樣本特征之間的距離(差異性)越大越好。現(xiàn)有技術(shù)主要通過減小類內(nèi)距離和增大不同類之間的距離兩個(gè)方面來提高特征區(qū)分度。
CL采用中心聚類思想,減小同類樣本之間的歐式距離,有效降低類內(nèi)變化。……