韓其凱 李易 楊然 王超群
摘要:人工智能已經成為后互聯網時代的發展路徑和方向,國家出先后出臺了五個人工智能創新平臺。可以說,人工智能的春天即將到來了。與此同時,我們致力于將人工智能技術推廣普及,對如何將人工智能技術進行實際的落地應用進行了積極的探索與實現。依托于深度學習和計算機視覺的相關技術,我們開發了口罩佩戴識別檢測系統。采用了基于瀏覽器-服務器端和基于客戶端兩方面的部署。瀏覽器端和客戶端相結合,實現了人工智能技術的落地應用,具有實用性和潛在的商業價值。該項目已部署至網站hanqikai.com,進行實際的運行測試,并不斷進行維護。
關鍵詞:人工智能 計算機視覺 深度學習
引言 人臉識別,在過去一年里是人工智能技術的代名詞,紅遍大江南北,無論是鐵路客運大廳,還是校園出入口,都能見到其身影。然而,公共場合佩戴口罩,已經成為人們必須遵守的規定。當大家紛紛戴上口罩,攝像頭背后的它便罷工待斃,再不識其人了。但是人工智能之所以強大,在于其迭代與自我進化的空間無限,我們利用人工智能領域的深度學習和計算機視覺技術,進行了口罩佩戴檢測系統的開發。該系統可以對人群中的人臉是否佩戴口罩的情況進行識別檢測,從而幫助檢測人員有效排查各類人員,提高了工作效率。這說明,人工智能作為強有力的工具,將更好的服務于社會大眾。
1 ?項目構建及其部署
在目標檢測的算法模型上,我們采用端到端的目標檢測算法—YOLOv4。端到端指的是輸入圖像的特征,輸出的是最后分類得到的結果。對于二階段的目標檢測網絡,該網絡的基本思想是先將圖像進行各個維度的卷積提取圖像的特征,然后進行目標區域的搜索,將搜索到的含有物體的框進行匯總,再將這些框分別進行物體的分類,最后完成對圖片中物體的檢測。對比這兩種目標檢測算法,我們可以得知,單階段的目標檢測算法具有較快的檢測速度,因為輸入圖片經過一次檢測便可以輸出結果。對于二階段的網絡RCNN系列,需要先進行目標區域的搜索,再進行物體的分類,顯然這種算法不適合實時性的目標檢測工作,但優點是識別精度高,適用于比較看重識別效果的場景。由于口罩佩戴的識別需要有比較快的識別速度,自然要使用單階段的目標檢測算法。因此我們采用了YOLOv4目標檢測算法作為口罩識別的核心算法。
該目標檢測網絡的結構大體分為主干特征提取和特征處理兩大部分,其中主干特征提取是對圖像進行不同維度的特征提取。YOLOv4由CSPDarknet53作為主干特征提取網絡,抽取圖像中各個維度的特征,抽取的特征從低維到高緯,構成特征金字塔,最后抽取的特征金字塔送入YOLO-Head網絡進行預測以及解碼。
YOLO Head層利用或得到的特征進行預測,在特征層的利用部分,提取多特征層進行目標檢測,一共提取三個特征層,分別位于中間層,中下層,底層。 針對每一個特征層存在三個先驗框。因此,可以獲得三個特征層的預測結果。但是這個預測結果并不對應著嘴中的預測框在圖片上的位置,還需要解碼才可以完成。解碼的過程就是將每個網格點加上對應的橫軸偏移量和縱軸偏移量,加完之后的結果就是預測框的中心,然后利用先驗框和偏移量計算出預測框的長和寬,這樣便可以得到整個預測框的位置了。在計算損失的時候,將預測出的包含物體的框和我們手工標注的框進行對比,求出兩種框的偏移量,將偏差算到損失函數中去,然后經過神經網絡的反向傳播不斷減小損失值,最終訓練出理想的神經網絡模型。
數據集方面,我們采用的數據集為WIDER_FACE數據集以及大量自己采集的數據集。戴口罩類的圖像通過網絡爬蟲爬取獲得,沒有戴口罩的圖像是WIDER_FACE數據集、VOC2007數據集進行拼湊而成。將YOLOv4目標檢測算法加載到集成開發環境Pycharm中,加入訓練數據及其標簽,寫好訓練腳本,就可以利用算法進行口罩佩戴模型的訓練。
在訓練好識別模型以后,接下來考慮的就是如何將該項目部署落地的問題。我們采取了兩方面的部署措施,第一個是將該系統通過服務器和瀏覽器部署到web端,第二個部署方案是直接部署到本地客戶端。使用服務端-瀏覽器進行訪問時,可以將圖片或者視頻通過前端頁面接口傳輸到服務器上,再將結果回顯到頁面中。適用于對圖片或視頻中的人流進行檢測。前端頁面效果及其識別接口請訪問http://hanqikai.com。本地客戶端時可以直接調用攝像頭進行檢測識別,適用于對出入口閘機進行檢測,通過捕捉攝像頭的視頻流進行檢測。經過實際測試,服務器端和客戶端都取得了較好的識別結果。
2 ?分析總結
在我們的項目探索中,選擇合適的網絡模型對于項目起著核心作用。我們對比了多種網絡模型,最終選擇YOLOv4目標檢測網絡作為口罩佩戴識別檢測項目的核心檢測算法。在訓練自己的網絡模型中,我們使用了python網絡爬蟲技術在網絡上爬取了大量人臉數據集進行手工標注,并采取Mosaic數據增強方法。通過這個方法不僅豐富了數據集,而且豐富了檢測物體的背景,在最后訓練出的模型效果中,新模型取得了非常好的效果。
在實現了口罩識別檢測系統之后,下一步計劃將該項目與計算機硬件的相關模塊結合,實現根據是否佩戴口罩進行出入口的自動控制,并向排查檢測人員發出警報信息。同時實現口罩佩戴的檢測以及數據庫系統的匹配。有效幫助排查檢測人員進行全面檢測,讓人工智能技術服務于社會,推動人工智能技術生活化,進而使生活智能化。
參考文獻:
[1](美)Martin T. Hagan.神經網絡設計[M].戴葵,譯. 北京:機械工業出版社,2002.9:6-12.
[2]李航.統計學習方法[M].1版.北京:清華大學出版社,2012:6-8.
[3] Joseph Redmon. YOLOv3: An Incremental Improvement [J]. CVPR, 2016(1).
[4] Alexey Bochkovskiy. YOLOv4: Optimal Speed and Accuracy of Object Detection[J]. CVPR, 2020(1).
[5](美)弗朗索瓦·肖萊. Python深度學習[M].張亮,譯.北京:人民郵電出版社,2018.8:5-7.
曲阜師范大學 ?山東 ?日照 ?276800