999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于ArcFace框架的課堂環境下人臉識別算法設計

2021-08-27 06:38:22洪宇軒
計算機技術與發展 2021年8期
關鍵詞:人臉識別深度檢測

洪宇軒

(南昌航空大學,江西 南昌 330063)

0 引 言

高校的課堂出勤率一直是高校對學生重點考核指標之一,文獻[1-2]中闡述了課堂的出勤率對學生學習效率的影響。很長一段時間以來,課堂考勤主要是由人力來完成的,然而,無論是老師點名還是紙質版的考勤不僅浪費課堂時光而且都無法對學生起到良好的監督作用。

在文獻[3]中,作者實現了讓學生在教學樓特定區域內通過手機人臉識別完成課堂考勤,但是這種方法依舊不能避免學生利用虛擬定位或代簽等系列作弊手段完成課堂考勤。在文獻[4-5]中,作者利用教室入口處的視頻攝像頭針對上課學生的人臉進行識別完成課堂考勤,但是僅用這種方法在實際運用層面上會遇到很多問題,例如打卡造成的走廊擁堵等。如此可見,近年來課堂環境下的人臉識別系統需求也日益增長。

近年來,隨著互聯網的飛速發展,深度學習在人工智能技術上取得了顯著的進展,在人臉識別的場景中尤為突出。目前,國內很多公司的人臉識別技術取得了很好的商用效果,根據2019年FRVT(face recognition vendor test)最新競賽結果來看,中國格靈深瞳公司取得了非常優秀的成績,在FRVT的四個子任務分別為簽證照片(Visa)、嫌疑人照片(Mugshot)、非約束自然環境人臉照片(Wild)、非約束環境下兒童照片(Child)中,格靈深瞳最終獲得一項全球第一(非約束自然環境人臉照片)、兩項全球第四(嫌疑人照片,非約束環境下兒童照片)及一項全球第五(簽證照片)的優異成績,如果僅計入國內參賽廠商,格靈深瞳則分列兩項第一和兩項第二,其各個子任務的準確率都高達99%以上。

這也證明了國內在研究人臉識別等深度學習技術上,取得了重大的進步,也為深度學習在國內進一步普及奠定了一定的基礎。雖然針對約束性場景下的人臉識別已經達到了商用程度,但是在自然場景中,人臉會受到很多因素的影響,比如上述說的人臉姿態、光照不均等因素,都造成了識別上的困難。因此研究一種針對于自然場景下的人臉識別方法就顯得尤為重要,并且具有實際意義。其中,文中要研究的自然場景以課堂為主要背景。

文中設計了可以用于課堂環境下的人臉識別系統,即在教室的內部安裝攝像頭來進行人臉識別。但是因為人臉識別系統極其依賴人臉檢測的性能,教室內學生數量多,教室內空間大,教室內不同位置的光線分布存在差異以及學生在上課時的面部姿態也不一致[6-9]。這些客觀因素都導致了內攝像頭得到的一張圖片中可能是十分復雜的,它可能有眾多且姿勢各異的學生并且光線分布不均勻,要檢測出這樣一張圖片的所有學生的人臉,無疑是一項技術挑戰,如果人臉檢測的性能不佳,勢必會導致遺漏掉部分已經來上的同學,準確性會大打折扣。

近些年來,深度學習在人臉識別方面有了很大的進展,針對自然場景下的人臉識別,研究者進行了長期研究并有了實質性的進展。一般而言,人臉識別系統涵蓋人臉采集、人臉檢測對齊、人臉識別模塊等,優化其中任意一個模塊對于人臉識別準確率的提高都具有重要意義。文獻[10]提出了一種Multi-task的人臉檢測框架,該框架使用了三個CNN,分別為P-Net、R-Net和O-Net,并將它們級聯,但其環境的適應性較差、漏檢率較高;后來由Redmon J等人提出的YOLO系列[11-13]算法是端到端目標檢測算法,此系列算法對于人臉的檢測速度有很大的突破。文獻[14]提出了一種相比于MTCNN算法更簡單并且檢測更快速的高精度人臉關鍵點檢測算法(PFLD),在主流數據集上的精度表現達到最高。

在人臉識別算法上,DeepFace[15]是由Facebook于CVPR2014年發表的,首度采用了深度學習方法在精度上超越了非深度學習方法Tom-vs-Pete classifiers[16]、high-dim LBP[17]等,主要用于人臉驗證,是深度學習人臉識別的奠基之作。FaceNet[18]是Google于CVPR2015年發表的,提出了一個對識別、驗證、聚類等問題的統一解決框架,即它們都可以放到特征空間里做,需要專注解決的僅僅是如何將人臉更好地映射到特征空間。考慮到深度學習的網絡復雜程度已經很高,研究者們便開始了對損失函數優化的研究,其中SphereFace[19]提出了將Softmax loss從歐幾里得距離轉換到角度間隔,增加決策余量m,限制||W||=1和b=0。ArcFace[20]在SphereFace基礎上進行了改進,提高了類間可分性同時加強類內緊度和類間差異,取得了更高的識別準確率。

其中,基于ArcFace的人臉識別技術采用的是Resnet網絡結構做人臉關鍵點檢測,但是對自然場景下的人臉識別精確度不高,會影響人臉識別的性能。為了解決上述問題,文中旨在設計一種新的人臉識別系統,增加了圖像增強算法,融合了Mask R-CNN目標檢測算法,以提升整套系統的識別能力。

1 課堂環境下的人臉圖像增強算法

圖像增強算法常見于對圖像的亮度、對比度、飽和度、色調等進行調節,增加其清晰度,減少噪點等。圖像增強往往經過多個算法的組合,完成上述功能,比如圖像去噪等同于低通濾波器,增加清晰度則為高通濾波器,當然增強一幅圖像是為最后獲取圖像有用信息服務為主。一般的算法流程為:圖像去噪、增加清晰度(對比度)、灰度化或者獲取圖像邊緣特征或者對圖像進行卷積、二值化等。

文中之所以加入圖像增強算法,是因為在課堂環境下采集到的人臉圖像可能會受到光線、人物運動等因素的影響,人臉圖像很容易不清晰,從而導致識別準確率不高。為了解決這此問題,在1993年文獻[21-23]就提出了模糊集,后來文獻[24-25]基于此提出了改進的方法,基于上述文獻,文中提出了新的圖像增強算法。

依據文獻[21-25]所提的算法,利用線性變換把圖像映射到模糊域,線性變換公式如下:

(1)

其中,xa表示3×3圖像區域的最小值,xb表示3×3圖像區域的最大值,t表示圖像像素值的補償因子,xij表示圖像像素值。

圖像增強算子公式為:

O(uA(x))=

(2)

其中,O表示圖像輸出,m和n均表示常數,且m=n=0.5。

為了恢復圖像的信息丟失,文中通過公式(3)進行恢復:

xij=uA(xb-xa)+xa+η

(3)

其中,η是像素補償因子。

那么,文中的圖像增強算法的步驟為:

(1)通過公式(1)把圖像映射到模糊域;

(2)通過公式(2)對圖像進行非線性變換;

(3)進行圖像恢復運算。

2 融合Mask R-CNN目標檢測算法

目標檢測,也叫目標提取,是一種基于目標幾何和統計特征的圖像分割,它將目標的分割和識別合二為一,其準確性和實時性是整個系統的一項重要能力。尤其是在復雜場景中,需要對多個目標進行實時處理時,目標自動提取和識別就顯得特別重要。

隨著計算機技術的發展和計算機視覺原理的廣泛應用,利用計算機圖像處理技術對目標進行實時跟蹤的研究越來越熱門,對目標進行動態實時跟蹤定位在智能化交通系統、智能監控系統、軍事目標檢測及醫學導航手術中手術器械定位等方面具有廣泛的應用價值。文中之所以加入目標檢測是因為課堂環境下存在面部遮擋,可以通過目標檢測算法,先檢測出學生的身體輪廓,再進行面部識別,在一定程度上可以大幅提高準確率。

其中,Mask R-CNN[26]是2017年提出的,實際上是Faster R-CNN的另一種形式,是將Faster R-CNN[27]與FCN(fully convolutional network)[28]相結合,組合成一個可以同時進行目標檢測和實例分割的多任務框架。Faster R-CNN采用的都是two-state步驟,即先找出RPN(region proposal network),之后對其找到的每個RoI(region of interest)進行分類、定位、并找到binary mask。這與當時其他先找到mask然后再進行分類的網絡是不同的。Mask R-CNN算法的創新之處在于提出RoIAlign方法代替了RoIPool[29]方法,采用雙線性插值實現了像素級別的對齊。

Mask R-CNN是一個實例分割(Instance segmentation)算法,可以用來做“目標檢測”、“目標實例分割”、“目標關鍵點檢測”。

Mask R-CNN算法步驟:首先,輸入一幅待處理的圖片,然后進行對應的預處理操作;然后,將其輸入到一個預訓練好的神經網絡中(ResNeXt等)獲得對應的feature map;接著,對這個feature map中的每一點設定預定的ROI,從而獲得多個候選ROI;接著,將這些候選的ROI送入RPN網絡進行二值分類(前景或背景)和BB回歸,過濾掉一部分候選的ROI;接著,對這些剩下的ROI進行ROIAlign操作(即先將原圖和feature map的pixel對應起來,然后將feature map和固定的feature對應起來);最后,對這些ROI進行分類(N類別分類)、BB回歸和Mask生成(在每一個ROI里面進行FCN操作)。

總之,Mask R-CNN是一個非常靈活的框架,可以增加不同的分支完成不同的任務,可以完成目標分類、目標檢測、語義分割、實例分割、人體姿勢識別等多種任務。Mask R-CNN算法的優點是訓練速度十分快,訓練花費的時間短,所以選擇其作為檢測課堂環境下學生人體的算法。之所以在檢測人臉之前需要先進行人體檢測,是因為加入人體檢測可以大大降低因面部遮擋以及其他因素造成的面部信息不足而引起的漏檢情況發生概率。

3 基于ArcFace的人臉識別系統流程

近年來,隨著硬件計算能力的大爆發,在高性能計算的支持下深度學習有了革命性的進步,在互聯網大數據的保證下深度學習有了源源不斷的動力,優秀的網絡結構被不斷提出,深度學習技術已被推向時代浪潮。

在深度學習的分支領域,計算機視覺領域中,人臉識別技術的發展依然是工業界、學術界重點關注的對象,深度卷積神經網絡也得到人們的高度關注。卷積神經網絡是深度神經網絡的一種具有代表性的算法,包含卷積計算及深度結構。卷積神經網絡與傳統神經網絡具有相同的特征,都屬于分層網絡模型,其通過改變傳統神經網絡中層的計算形式與功能而來。

人們熟知的神經網絡結構共分為輸入層、隱藏層和輸出層三部分。其中輸入層是用于接收和傳遞信息;隱藏層隨處理問題的復雜度不同,包含的神經元連接數目也不同,一般具有一個或多個層面,主要是用于處理輸入信息;輸出層輸出結果是輸入信息在神經網絡中傳遞、分析及權衡的結果,該層輸出能夠體現出機器對事物的認知。每個層之間由有一個或多個神經元連接,相鄰神經元之間互為連接,并將信息送入激活機制中處理,從而形成神經網絡結構,在ResNet于2015年被提出后,越來越多優秀的網絡基于ResNet進行優化更新也已取得卓越的成就,而在網絡結構進一步升級優化有困難的情況下,研究者逐步將目光轉向損失函數這一指揮棒上。

在引言中提到了ArcFace,它是在SphereFace原有的基礎上進行的改進。提出了一種新的用于人臉識別的損失函數:additive angular margin loss,基于該損失函數訓練得到人臉識別算法ArcFace(開源代碼中為該算法取名為insightface,二者意思一樣,接下來都用ArcFace代替)。ArcFace的思想(additive angular margin)和SphereFace以及不久前的CosineFace(additive cosine margin)有一定的共同點,重點在于:在ArcFace中是直接在角度空間(angular space)中最大化分類界限,而CosineFace是在余弦空間中最大化分類界限,這也是為什么這篇文章叫ArcFace的原因,因為arc含義和angular一樣。除了損失函數外,該文的作者還清洗了公開數據集MS-Celeb-1M的數據,并強調了干凈數據對實驗結果的影響,同時還對網絡結構和參數做了優化。

總體來說,ArcFace這篇文章做了很多實驗來驗證additive angular margin、網絡結構設計和數據清洗的重要性,角度間隔比余弦間隔在對角度的影響更加直接,則與cos(mθ)和cos(θ-m)相比,ArcFace可以獲得更具辨識性的深度特征,提高了類間可分性同時加強了類內緊度和類間差異。文中基于ArcFace人臉識別系統流程如圖1所示。

由圖1可見,該系統流程先利用教室內部的攝像頭進行視頻幀的提取,利用提取到的圖像首先進行圖像增強處理,接著利用Mask R-CNN目標檢測技術進行初步的人體輪廓檢測,緊接著使用ArcFace人臉檢測,最后利用檢測到的人臉數據與后臺數據進行對比,完成課堂考勤。

圖1 人臉識別系統流程

4 實驗結果分析

實驗部分采用了文中的改進算法與課堂考勤中常用的人臉檢測算法(Voila-Jones[30]、MTCNN[31]、Tiny-Face[32])進行精度和速度上的差異對比。數據集使用了同一間教室的100余張圖片,且采集方式暫時為人工拍攝,并對每一張圖片內的學生人臉和人體進行訓練驗證。實驗結果如圖2所示。

圖2 某圖的四種算法檢測結果

基于實驗結果得出,Tiny-Face算法的檢測結果是很好的,只是漏檢了部分面部信息被遮擋的同學,其余基本都被檢測出了。而Voila-Jones和MTCNN算法的檢測結果差強人意,而文中算法的檢測結果由于Tiny-Face,除了極個別幾乎完全被遮擋同學未被檢測出,其他學生都被檢測到了。從該實驗結果可以得出,文中提出的融合Mask R-CNN目標檢測算法的方案可以起到降低漏檢率的作用。

為了評價該系統的可靠性,定義兩個指標分別為平均識別率(TPR)和誤識率(FPR):

表1為文獻[12-13]與改進后系統的TPR和FPR對比,由其可知,改進的方法TPR得到了一定的提高,錯誤率最小。可以得出,該方案在保證降低漏檢率的同時,提高了系統的識別準確率。

表1 改進系統與SphereFace系統和ArcFace系統與改進系統的TPR和FPR對比

5 結束語

基于ArcFace框架提出了一種課堂環境下人臉識別系統,此外分別加入了圖像增強技術以及Mask R-CNN目標檢測技術,輔助其在課堂環境下增加檢測的準確率以及降低漏檢率。研究表明,該方法能夠有效地解決人臉漏檢的問題,為課堂環境下的人臉識別技術研究提供了一種新的方案,具有一定的實際意義,并得出以下結論:

(1)在課堂環境下,結合了圖像增強算法以及目標檢測算法的方法確實比單純的ArcFace框架識別率要高,也降低了漏檢率;

(2)雖然該改進算法確實比原算法效率好,但是系統在一定程度上也存在不足,比如容易引起誤識別,有時會把非人體的目標框選進去。

因此,在未來的研究工作中,將想方設法改進算法,降低錯誤的概率,并且融合學校先前已經建設的學生宿舍人臉識別通道和門禁系統,并具備完善的學生人臉庫數據,學校的教務系統具備各班級的課表數據以及教室上課學生詳細名單等先行條件,給整套系統進行改進以及完善,也希望在未來的研究中能做到更好。

猜你喜歡
人臉識別深度檢測
人臉識別 等
作文中學版(2022年1期)2022-04-14 08:00:34
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
深度理解一元一次方程
揭開人臉識別的神秘面紗
學生天地(2020年31期)2020-06-01 02:32:06
深度觀察
深度觀察
深度觀察
小波變換在PCB缺陷檢測中的應用
主站蜘蛛池模板: 精品国产中文一级毛片在线看| 自拍亚洲欧美精品| 精品一区二区三区中文字幕| 久久婷婷国产综合尤物精品| 日韩高清无码免费| 日本欧美成人免费| 韩日无码在线不卡| 18禁黄无遮挡网站| 欧美日韩在线国产| 国产成人AV大片大片在线播放 | 亚洲AV无码久久精品色欲| 色综合久久无码网| 好久久免费视频高清| 无码中文字幕精品推荐| 亚洲精品中文字幕无乱码| 精品伊人久久久久7777人| 国产极品嫩模在线观看91| 午夜成人在线视频| 日韩午夜福利在线观看| 久久窝窝国产精品午夜看片| 好紧好深好大乳无码中文字幕| 国产欧美视频在线| 欧美成人午夜在线全部免费| 成年片色大黄全免费网站久久| 婷婷亚洲最大| 国产精品嫩草影院av| 亚洲无限乱码一二三四区| 日韩在线影院| 青草精品视频| 久久无码av三级| 91精品综合| 亚洲成a人在线观看| 香蕉色综合| 亚洲自偷自拍另类小说| 亚洲AⅤ波多系列中文字幕| 国产精品欧美在线观看| 欧美一级爱操视频| 亚洲91精品视频| 久久精品无码国产一区二区三区| 日本五区在线不卡精品| 亚洲男人天堂网址| 免费无码又爽又刺激高| 色爽网免费视频| 久久综合色天堂av| AⅤ色综合久久天堂AV色综合| 在线免费a视频| 国产在线一区视频| 高清免费毛片| 欧美性精品| 国产精品三级av及在线观看| 免费一级成人毛片| 国产不卡网| 99在线视频网站| 狼友av永久网站免费观看| 精品欧美一区二区三区久久久| 亚洲综合专区| 久久精品一卡日本电影| 国产呦视频免费视频在线观看| 国产成人一区二区| 四虎永久在线| 她的性爱视频| 久久香蕉国产线看观看精品蕉| 一本一本大道香蕉久在线播放| 白浆免费视频国产精品视频| 性欧美在线| 美女内射视频WWW网站午夜| 日韩国产黄色网站| 伊人大杳蕉中文无码| 大香伊人久久| 日本黄色不卡视频| 亚洲国产中文在线二区三区免| 国产精品三级专区| 亚洲中文无码h在线观看| 在线观看精品国产入口| 欧美高清国产| 国产一区二区福利| 欧美激情二区三区| 尤物精品视频一区二区三区| 亚洲第一极品精品无码| 超碰免费91| 色老二精品视频在线观看| 日韩在线播放欧美字幕|