周輝
(中國石油大學(華東)計算機與科學技術學院 青島 266580)
得益于深度學習[1~3]的發展,人臉識別技術有了突破式發展。由于深度學習是數據驅動的方法,數據集的質量直接影響識別算法的精度。不幸的是,目前幾個比較常用的公共人臉識別數據集(CASIA-WebFace,MS1M,CelebA)都存在著樣本不均衡的問題,一般數目比較少的類稱之為UR數據(Under Represent Data)。幾乎在所有的人臉數據集中都存在UR 數據,這就使得在訓練網絡的過程中,通過網絡得到的數據分布不均衡,從而影響到網絡整體的識別性能。雖然目前人臉識別方向發展已經比較成熟,甚至都投入了商用,但是訓練中遇到的樣本不均衡數據始終制約著人臉識別,無法進一步提高人臉識別精度。早期的解決方法是直接去掉UR 數據類別,只對樣本數據多的類別進行訓練。但是這樣做會造成訓練數據不足,嚴重削弱網絡的泛化能力;另一種常用做法是通過歸一化權重的方式,強行將正常類別和UR 數據類別對應的權重向量歸一到同一均衡數據分布中,但會造成決策邊界傾斜[4],使學習得到的分布與實際的分布差異較大,影響最終識別效果;此外,還可以將UR 數據里的圖片通過旋轉、平移、縮放等仿射變換方式得到新的和原圖相似的圖片,將這些圖片和原圖一起送入網絡訓練:這類方法被稱作顯式數據增強,但是增強得到的數據與真實數據分布存在較大差異,所以這種顯式數據增強對網絡整體效果的提升并大。近年來,隱式數據增強作為一個處理樣本不均衡問題的新方法逐步受到人們關注。……