宋文迪
(北方民族大學 計算機科學與工程學院,寧夏 銀川 750000)
隨著現代化進程的發展,高層的樓房日益增多,電梯的運用也越來越廣泛。將人工智能相關技術運用在電梯中,是推動城市現代化建設的重要一環。計算機視覺作為人工智能的基礎之一,研究目標是使計算機具有對圖像的認知能力。計算機視覺是通過對圖片或視頻進行處理,以得到人們需要的特征或者信息。
電梯作為人們日常生活經常使用的運輸設備,隨著電梯的普及程度以及使用頻率的增加,出現運行故障的次數也隨之增加,容易引起一系列的安全事故。因此,降低運行故障帶來的危害,提高電梯故障的應急處置能力刻不容緩。部分小區或建筑人流量過大,需要大量電梯同時工作運行。結合電梯工作特性,如果能夠實時的對電梯轎廂內進行人員檢測,就能夠有效的在發生斷電等危險情況時,根據各個電梯有人無人狀態,電梯轎廂內人數,調整救援順序,避免電梯內無人而導致的無效救援。
目前電梯中主要應用紅外探測技術識別有人無人狀態。在紅外線探測器中,熱電元件通過判斷是否有人體移動來釋放電壓信號,之后通過分析電壓信號的波形來識別。該方法能夠有效的排除諸如爆米花噪聲一類的噪聲影響,但對于其他波形較大的噪聲信號效果就會受到影響[1]。
但是電梯如果長時間持續運行,會產生大量噪聲信號,而導致傳感器誤判,在試點運行中,電梯黑匣子易受噪音干擾。這就需要一種可靠性高,不易受環境影響的人員檢測技術。
目前應用在電梯上的人員檢測方法較少,大多應用在施工升降機。傳統的人員檢測方法有人工識別以及電子設備計數,隨著計算機視覺的發展,不少基于計算機視覺的方法被用于電梯轎廂的人員檢測中。基于頭部特征的算法也被應用于電梯和升降機人員檢測上,但大多方法對攝像頭位置要求較為固定,頭部如有遮擋物也會大幅度降低識別精度[4]。Dalal 和Triggs 在2005 年提出HOG 的概念[5],HOG 描述行人特征效果較好,被大量應用于人員檢測中。文獻[6]首次提出了小邊(Edglet)的概念。也有一些文獻將運動特征加入到行人檢測中,然后與圖像的靜態特征相結合用于檢測行人,這種方法對于運動中的行人有較好的檢測效果,但是針對電梯轎廂中靜止不動的人員就不太適用。
目前國內外基于特征提取算法的人員檢測主要分為三類,分別為基于特征、基于區域和基于模板匹配的人員檢測。
基于特征的人員檢測算法是先提取目標的有效特征,然后根據提取的特征檢索圖片,與圖像信息中目標進行匹配,從而實現目標檢測,所以提取目標特征是關鍵,一個好的目標特征可以有效提高檢測效率,減少算法的誤判率,提高識別精度。基于特征的人員檢測算法一般將目標的某個或某部分或多個特征作為提取目標,這樣的好處在于,假如識別目標被遮擋或者有重疊部分,只要還有部分特征可以被提取出來,就仍可以完成目標的識別。這種算法的難點怎么用同一特征集合表示檢測物體的不同狀態。如果使用較多的特征集合表示,系統的錯誤率將增加,并且算法計算量也將增加。
基于區域的人數識別算法一般通過分割區域確定一個略大于目標的矩形或其他不規則形狀模板,分割方法有人為分割和圖像分割,最后對模板區域內通過紋理、形狀等特征或者彩色圖像的顏色信息對目標進行檢測。這些傳統算法中依照膚色區域、幾何區域或者角點信息的方式進行人員檢測識別具有很好的參考價值,但都易受環境影響,比如與膚色差別較小的環境色彩,或者背景中有與提取的幾何信息類似或相同的形狀物體。
基于模板匹配的人員檢測采用通過模板匹配來識別跟蹤的方法。與幾何特征匹配相類似,模板匹配是通過預設特定的形狀模板信息,與待處理的圖像進行匹配比較,通過匹配相似度進行識別檢測的算法。
深度學習算法作為一種機器學習,在處理復雜模式識別問題上有著顯著的效果,通過對視頻圖像信息進行處理,達到人們想要的效果。深度學習在許多目標識別領域已經取得了不錯的成果。20 世紀80 年代,Geoffrey Hinton 等人首次提出了深度學習的概念,深度學習是通過多層的神經網絡模擬人腦的學習過程,每層神經網絡都通過多個神經元對輸入數據學習以最終提取更加抽象準確的特征數據,并把輸入以特征數據來表示[7]。大量學者開始研究深度學習并大規模在各個方向進行應用,數字圖像處理領域的圖像分類、目標檢測、目標定位和語義分割等都開始使用卷積神經網絡,并且有效地提升了識別效果;語音識別和自然語言處理領域也都通過深度學習算法得到了飛快的發展。
深度學習在人員檢測方面精度很高,但是深度學習需要大量的數據樣本進行訓練,而且樣本訓練對配置要求也特別高,訓練時間也比較長,需要投入大量成本。在運行時其強大算力開發板不能提供,而云計算通訊費用成本太高,如果投入一個好的單片機,對企業來說與現有設備相比,成本也很增加很多。所以這就需要傳統算法與電梯轎廂實際環境相結合,研究出一種實時性好、精度高、穩定性好、占用低的人員檢測方法。