郭 俊,寧志勇,王亞濤,江 龍,董曉燚
(1.北京同方軟件有限公司,北京 100083;2.同方股份有限公司,北京 100083)
建設(shè)施工是城市和地方經(jīng)濟(jì)發(fā)展的基礎(chǔ),2020 年全年建筑業(yè)產(chǎn)值達(dá)到72 996 億元,在疫情背景下增長了3.5%[1]。建筑施工行業(yè)屬于勞動(dòng)密集型、安全事故頻發(fā)的高危行業(yè),這類施工項(xiàng)目普遍具有建設(shè)周期長、參與人員多、工地面積大、作業(yè)面復(fù)雜、人員地域分布廣泛、作業(yè)環(huán)境多變、施工機(jī)械設(shè)備多、交叉作業(yè)等特點(diǎn),建設(shè)施工過程常常引發(fā)諸多安全隱患,帶來巨大的人員傷亡和財(cái)產(chǎn)損失[2]。隨著中國建筑工程項(xiàng)目的增多,每年的事故起數(shù)以及死亡人數(shù)也隨之增加,據(jù)相關(guān)統(tǒng)計(jì),2015—2019 年中國建筑施工領(lǐng)域共發(fā)生安全生產(chǎn)事故3 275 起,死亡3 840 人[3]。
面對當(dāng)前國內(nèi)施工安全生產(chǎn)形勢,國家政府高度重視安全生產(chǎn)工作的開展,近年來,依次出臺了諸多綱領(lǐng)性指導(dǎo)文件,推進(jìn)中國建筑業(yè)信息化持續(xù)轉(zhuǎn)型,為建筑業(yè)改革發(fā)展指明方向和路徑。如2020-07-28,住房和城鄉(xiāng)建設(shè)部等13 部門聯(lián)合印發(fā)了《關(guān)于推動(dòng)智能建造與建筑工業(yè)化協(xié)同發(fā)展的指導(dǎo)意見》,明確指出以數(shù)字化、智能化升級為動(dòng)力,不斷創(chuàng)新、突破核心技術(shù),加大智能建造在建筑業(yè)各環(huán)節(jié)的應(yīng)用,要求加快大數(shù)據(jù)、人工智能、物聯(lián)網(wǎng)應(yīng)用,以新技術(shù)、新業(yè)態(tài)、新模式推動(dòng)建設(shè)行業(yè)信息化變革。
在當(dāng)今新興信息技術(shù)飛速發(fā)展的大背景下,智慧工地體系作為傳統(tǒng)安全管理轉(zhuǎn)型升級方式應(yīng)運(yùn)而生,主要任務(wù)是依托各種先進(jìn)的人工智能、物聯(lián)網(wǎng)、互聯(lián)網(wǎng)及BIM(Building Information Modeling)等信息化管理手段,對施工現(xiàn)場的數(shù)據(jù)和信息進(jìn)行收集、分析及處理,實(shí)現(xiàn)作業(yè)現(xiàn)場的系統(tǒng)高效管理[4]。但是,智慧工地系統(tǒng)在安全監(jiān)測方面尚處于感知階段,仍然存在明顯不足,如監(jiān)測手段比較傳統(tǒng)、單一。雖然針對施工現(xiàn)場的盲區(qū)安裝了大量的監(jiān)控?cái)z像機(jī)以便進(jìn)行可視化管理,還是主要以傳統(tǒng)的安防監(jiān)控工作方式,由人工通過肉眼對大量視頻影像進(jìn)行分析判斷,及時(shí)發(fā)現(xiàn)安全隱患存在局限性,且基于機(jī)器視覺的監(jiān)測方法應(yīng)用偏少,并與深度學(xué)習(xí)等智能化手段結(jié)合不足[5]。
本文將人工智能(Artificial Intelligence,AI)計(jì)算機(jī)視覺作為施工安全監(jiān)測應(yīng)用的智能化手段的切入點(diǎn)。首先,強(qiáng)調(diào)了AI 機(jī)器視覺技術(shù)應(yīng)用于智慧工地安全監(jiān)測的必然性;其次,詳細(xì)介紹了以AI 視頻大數(shù)據(jù)驅(qū)動(dòng)的工地智能化安全監(jiān)測平臺體系;然后,研究了AI 在智慧工地安全監(jiān)測中的具體應(yīng)用效果,并提出需要進(jìn)一步研究的問題;最后,希望在今后的施工安全管理中,能夠科學(xué)、全面、有效地將人工智能技術(shù)與其他技術(shù)手段融合運(yùn)用。
AI 人工智能是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)學(xué)科。目前人工智能技術(shù)領(lǐng)域的探究及應(yīng)用主要集中在圖像視頻識別、語音辨識、自然語言理解等。并已在諸多行業(yè)領(lǐng)域產(chǎn)生了革命性影響,廣泛、深入地應(yīng)用于安防、醫(yī)療、自動(dòng)駕駛、金融等行業(yè),然而,在建筑施工領(lǐng)域應(yīng)用還遠(yuǎn)遠(yuǎn)不夠,尚處于初步探索階段。
立足于AI 計(jì)算機(jī)視覺技術(shù)應(yīng)用,主要圍繞算力、算法、數(shù)據(jù)、場景及服務(wù)5 大要素,其中,場景是AI應(yīng)用的先決條件,在建筑行業(yè)動(dòng)態(tài)施工監(jiān)控過程中存在場景,如工人進(jìn)入作業(yè)區(qū)沒有佩戴安全帽、未按施工規(guī)定要求穿反光背心,在臨邊及腳手架作業(yè)未掛安全帶,工人處于施工機(jī)械設(shè)備施工半徑范圍、工地基坑邊緣未設(shè)置防護(hù)柵欄,作業(yè)區(qū)發(fā)現(xiàn)明煙明火等,為避免安全事故發(fā)生,亟待需要利用智能化手段,快速識別出這類安全隱患。基于視頻圖像的AI 視頻分析技術(shù)可以解決施工安全管理的這類難題,不僅可以識別施工人員的狀態(tài)、人員行為、物料、危險(xiǎn)環(huán)境等信息,還可以進(jìn)行預(yù)先設(shè)定危險(xiǎn)區(qū)域、危險(xiǎn)時(shí)間、危險(xiǎn)操作行為等,對出現(xiàn)安全隱患的狀態(tài)進(jìn)行提前告警,確保施工安全[6],因此,通過運(yùn)用AI 視頻分析技術(shù)加強(qiáng)施工安全監(jiān)測勢在必行。
當(dāng)前,國內(nèi)外業(yè)內(nèi)許多學(xué)者已對基于AI 的智慧工地施工安全預(yù)警與管理進(jìn)行大量探究,如FANG 等[7]利用Faster R-CNN 方法自動(dòng)檢測施工現(xiàn)場人員是否佩戴安全帽,且驗(yàn)證了該算法在施工現(xiàn)場的各種視覺條件下檢測的有效性;熊若鑫等[8]在施工現(xiàn)場動(dòng)態(tài)且雜亂場景下,建立避免干擾的數(shù)據(jù)集并搭建好模型,實(shí)現(xiàn)對施工現(xiàn)場人員姿態(tài)的實(shí)時(shí)檢測;高寒等[9]利用卷積神經(jīng)網(wǎng)絡(luò)搭建雙模單高斯模型,然后使用攝像頭獲取施工現(xiàn)場圖像,并使用搭建好的模型進(jìn)行施工人員侵入行為判別,豐富了施工安全管理手段;任中杰等[10]將計(jì)算機(jī)視覺與火災(zāi)預(yù)警結(jié)合,建立定量化煙火預(yù)警模型并在實(shí)際場景下模型驗(yàn)證,得到較為準(zhǔn)確的結(jié)果;CHEN等[11]提出了一種基于深度學(xué)習(xí)的多尺度特征提取的安全帶檢測算法,并主要應(yīng)用于復(fù)雜道路背景;LUO 等[12]采用自主研發(fā)的深度學(xué)習(xí)模型框架自動(dòng)估算在施工現(xiàn)場視頻中機(jī)械設(shè)備的狀態(tài),進(jìn)而評估施工現(xiàn)場的安全狀況。
在施工現(xiàn)場安全隱患識別研究方面,雖然現(xiàn)有AI視頻分析技術(shù)及應(yīng)用已取得一系列成果,但目前還是一些特定化的基礎(chǔ)研究,大部分僅限于特定場景下的一些碎片化的安全監(jiān)測運(yùn)用,面對施工現(xiàn)場多變的復(fù)雜場景,沒有形成體系化的智能化安全隱患管理研究,以及規(guī)模化的人工智能實(shí)際應(yīng)用或落地應(yīng)用效果不佳。基于此,充分利用工地現(xiàn)有視頻攝像頭及移動(dòng)端獲取的視頻圖像,圍繞施工現(xiàn)場作業(yè)人員的不安全行為、物的不安全狀態(tài)和重要環(huán)境區(qū)域的不良條件,開展以AI 視頻大數(shù)據(jù)技術(shù)驅(qū)動(dòng)的工地智能化安全監(jiān)測平臺研究應(yīng)用顯得尤為必要。
安全隱患視頻大數(shù)據(jù)是指涉及施工場地安全隱患的視頻與圖像格式的數(shù)據(jù),按照其來源主要分為攝像機(jī)監(jiān)控視頻、人工移動(dòng)巡檢圖像、無人機(jī)巡視錄像、移動(dòng)機(jī)器人回傳視頻數(shù)據(jù),其中攝像機(jī)監(jiān)控視頻是主體,安全隱患視頻大數(shù)據(jù)同樣具有大數(shù)據(jù)的“4V”基礎(chǔ)特性,即大容量(Volume)、多樣性(Variety)、速度快(Velocity)和價(jià)值高(Value)。
數(shù)據(jù)規(guī)模容量巨大。根據(jù)中國建筑業(yè)協(xié)會發(fā)布的《2020 年建筑業(yè)發(fā)展統(tǒng)計(jì)分析》數(shù)據(jù),房屋施工面積149.5 億m2,比上年增長3.68%,增速比上年提高了1.36%。為確保工地施工過程中的人員、設(shè)施安全,需要部署大量的視頻監(jiān)控點(diǎn)位,按照工程項(xiàng)目建筑面積每增加2 萬m2,應(yīng)增加1 個(gè)監(jiān)控點(diǎn)位估算,2020 年全國建筑工地視頻監(jiān)控資源約有75 萬多路,以當(dāng)前常用的單路1 080P 網(wǎng)絡(luò)攝像機(jī)為例,1 個(gè)月內(nèi)產(chǎn)生的視頻文件大小就超過TB 級,可以想象到2022 年末,全國建筑工地近百萬的攝像頭產(chǎn)生的海量視頻監(jiān)控?cái)?shù)據(jù)將以幾何級數(shù)遞增。
數(shù)據(jù)文件分辨率編碼格式多樣化。原始視頻圖像有標(biāo)清、高清、超高清(4 K),一般情況下視頻數(shù)據(jù)需要保存3 個(gè)月以上,數(shù)據(jù)冗余度很高,需要壓縮編碼后才能傳輸和存儲,典型的編碼格式主要有:適用于低碼率、高實(shí)時(shí)性的遠(yuǎn)程監(jiān)控應(yīng)用場景的H.264、H.265 標(biāo)準(zhǔn),適用于電纜網(wǎng)絡(luò)、網(wǎng)絡(luò)流媒體場景的MPEG-4 標(biāo)準(zhǔn),適用于移動(dòng)通信、視頻監(jiān)控等場景的AVS及AVS+、AVS2 標(biāo)準(zhǔn)。常見的視頻文件格式有avi、wma、wmv、mpeg、mp4、mov、flv、rmvb、m4v、rm 等,都需要依賴不同的解碼和播放技術(shù)進(jìn)行顯示[13]。
動(dòng)態(tài)快速產(chǎn)生數(shù)據(jù)。不斷增長的數(shù)據(jù)規(guī)模和數(shù)據(jù)動(dòng)態(tài)快速產(chǎn)生要求,必須具備高效的運(yùn)算的資源和實(shí)時(shí)計(jì)算框架,才能實(shí)現(xiàn)與之相匹配的吞吐和實(shí)時(shí)性[14]。適用于并行處理和運(yùn)算的GPU(Graphics Processing Unit)硬件或?qū)S肁SIC(Application Specific Integrated Gircuit)芯片可以強(qiáng)化運(yùn)算能力,同時(shí),采用分布式計(jì)算框架完成視頻大數(shù)據(jù)的處理和分析任務(wù),不僅可以提供高效的計(jì)算模型,還具備高效可靠的輸入輸出(IO)[15],通過這2 種方式以實(shí)現(xiàn)視頻數(shù)據(jù)的快速處理。
包含豐富的信息,具有挖掘價(jià)值。視頻中包含有大量人、物、場景和行為信息,視頻數(shù)據(jù)是典型的非結(jié)構(gòu)化數(shù)據(jù),需要實(shí)時(shí)轉(zhuǎn)化為結(jié)構(gòu)化才能解讀施工場景下所涉及的不安全因素,包括施工現(xiàn)場作業(yè)人員的不安全行為、物的不安全狀態(tài)和重要環(huán)境區(qū)域的不良條件。按照《建筑安全生產(chǎn)管理?xiàng)l例》和《建筑施工安全檢查標(biāo)準(zhǔn)》等相關(guān)法律法規(guī),要求施工現(xiàn)場的主要進(jìn)出口、人員進(jìn)出通道、四周圍墻、大型機(jī)械設(shè)備、配電箱周圍、施工作業(yè)面、材料加工區(qū)域、臨邊洞口、基坑邊緣、危險(xiǎn)源存放處、腳手架等易發(fā)生安全隱患的地方需要設(shè)置視頻監(jiān)控點(diǎn)位[16],具體如表1 所示。將建筑工程龐大的視頻數(shù)據(jù)資源,轉(zhuǎn)化為這些豐富的、高價(jià)值的安全隱患結(jié)構(gòu)化數(shù)據(jù),存儲一年甚至更長時(shí)間,將為智慧工地安全管理應(yīng)用提供大數(shù)據(jù)的輔助手段。

表1 監(jiān)控場景安全隱患樣表
安全隱患視頻大數(shù)據(jù)的誕生,將驅(qū)動(dòng)智慧工地人工智能安全監(jiān)測視頻分析應(yīng)用平臺的建設(shè),主要解決視頻監(jiān)控在復(fù)雜場景下實(shí)時(shí)性、高精度的應(yīng)用問題。
視頻大數(shù)據(jù)驅(qū)動(dòng)的人工智能安全監(jiān)測平臺建設(shè)涉及眾多的專業(yè)技術(shù),采用的是層次化、模塊化體系結(jié)構(gòu),以開放的姿態(tài),打造開放的生態(tài)環(huán)境,確保平臺各項(xiàng)服務(wù)和功能的可復(fù)用性、靈活性、擴(kuò)展性。該平臺體系架構(gòu)由底層到上層共分為4 層,分別為視頻大數(shù)據(jù)采集中心、視頻大數(shù)據(jù)存儲計(jì)算中心、視頻大數(shù)據(jù)分析中心,該部分為平臺的核心層,即人工智能計(jì)算機(jī)視覺算法集模塊,最頂層是面向用戶層的智慧應(yīng)用。
視頻采集中心通過采集來自IP 攝像機(jī)、硬盤錄像機(jī)、流媒體平臺、邊緣機(jī)器人等設(shè)備的實(shí)時(shí)視頻流,或通過手機(jī)移動(dòng)端、無人機(jī)傳回的錄像及圖片數(shù)據(jù),提供統(tǒng)一的視頻接入服務(wù),包括GB/T 28281—2011(國家標(biāo)準(zhǔn)聯(lián)網(wǎng)接口協(xié)議)、ONVIF/PSIA 協(xié)議、TMP/RTSP以及私有化的SDK 協(xié)議,對1 080P/25(FPS)視頻進(jìn)行編解碼,并支持對數(shù)據(jù)協(xié)議的轉(zhuǎn)換、數(shù)據(jù)預(yù)處理和控制數(shù)據(jù)傳輸?shù)取?/p>
視頻大數(shù)據(jù)計(jì)算中心對采集的實(shí)時(shí)視頻流、錄像等離線文件進(jìn)行分布式計(jì)算,視頻數(shù)據(jù)的實(shí)時(shí)處理及計(jì)算能力是影響平臺應(yīng)用價(jià)值的關(guān)鍵因素,視頻大數(shù)據(jù)分布式計(jì)算主要采用批量計(jì)算技術(shù)和大數(shù)據(jù)流計(jì)算技術(shù),大數(shù)據(jù)批量計(jì)算技術(shù)是先存儲后處理,解決大規(guī)模、非實(shí)時(shí)數(shù)據(jù)問題,吞吐量是整個(gè)框架的重要指標(biāo),常用的代表性框架包括MapReduce、GraphLab、Dryad、Spark 等。而大數(shù)據(jù)流計(jì)算是直接處理,更關(guān)注實(shí)時(shí)性,能夠更加快速地為決策提供支持。現(xiàn)今典型代表框架有Storm、Samza、S4、Spark Streaming等[15]。
視頻大數(shù)據(jù)存儲通過應(yīng)用集群化、虛擬化、分布式存儲、數(shù)據(jù)加密技術(shù)等,將視頻圖像非結(jié)構(gòu)化數(shù)據(jù)及通過大數(shù)據(jù)結(jié)構(gòu)化處理后的數(shù)據(jù)進(jìn)行分布式或集中式存儲,通過豐富的數(shù)據(jù)資源池,實(shí)現(xiàn)控制服務(wù)、存儲服務(wù)、流媒體轉(zhuǎn)發(fā)服務(wù)、管理服務(wù),并按需為上層應(yīng)用封裝成API/OCX,對外提供自動(dòng)、靈活的服務(wù)。
視頻大數(shù)據(jù)分析中心采用典型的人工智能機(jī)器學(xué)習(xí)及深度學(xué)習(xí)技術(shù),機(jī)器學(xué)習(xí)屬于數(shù)據(jù)驅(qū)動(dòng)算法,能夠從數(shù)據(jù)中自動(dòng)分析獲得規(guī)律,并對未知數(shù)據(jù)進(jìn)行預(yù)測,常見的機(jī)器學(xué)習(xí)算法包括支持向量機(jī)(SVM)、AdaBoost、樸素貝葉斯算法、決策樹、KNN(K-Nearest Neighbor)等[5]。在傳統(tǒng)的機(jī)器學(xué)習(xí)算法中,需要人為地對數(shù)據(jù)進(jìn)行特征提取,而深度學(xué)習(xí)提供了一種端到端的學(xué)習(xí)范式,整個(gè)學(xué)習(xí)的流程并不進(jìn)行人為的子問題劃分,而是完全交給深度學(xué)習(xí)模型直接學(xué)習(xí)從原始數(shù)據(jù)到期望輸出的映射[17],能夠自動(dòng)找到最具有描述性和明顯的特征。在計(jì)算機(jī)視覺理解上,典型的深度學(xué)習(xí)網(wǎng)絡(luò)代表為卷積神經(jīng)網(wǎng)絡(luò)(CNN),該算法應(yīng)用于對圖像處理越來越精細(xì)化,例如對象檢測、對象跟蹤、動(dòng)作識別、人體姿態(tài)估計(jì)和語義分割等方面,目前典型的網(wǎng)絡(luò)應(yīng)用包括Faster R-CNN、SPP-Net、R-FCN、Mask R-CNN,以及SSD 和YoLo等算法[5]。
實(shí)際應(yīng)用過程中,在基礎(chǔ)算法之上,針對施工現(xiàn)場作業(yè)人員的不安全行為、物的不安全狀態(tài)和重要環(huán)境區(qū)域的不良條件,搭建面向業(yè)務(wù)的應(yīng)用算法模型,并將傳統(tǒng)機(jī)器學(xué)習(xí)與深度學(xué)習(xí)技術(shù)有機(jī)融合,更深層次地達(dá)到視覺理解效果。
智慧應(yīng)用層最終形成“智能監(jiān)測一張網(wǎng)”,24 h 全天侯對重點(diǎn)施工區(qū)域進(jìn)行監(jiān)督識別,提供友好、易用的人機(jī)交互方式,對施工現(xiàn)場不安全因素自動(dòng)報(bào)警,并通過現(xiàn)場大屏、桌面端及移動(dòng)端等方式分發(fā)安全隱患信息,及時(shí)為工地安全員及作業(yè)人員發(fā)送“安全提醒服務(wù)”。視頻大數(shù)據(jù)驅(qū)動(dòng)的人工智能安全監(jiān)測平臺的總體技術(shù)架構(gòu)如圖1 所示。

圖1 人工智能安全監(jiān)測平臺的總體技術(shù)架構(gòu)示意圖
本文擬通過對承建的核工業(yè)某安全生產(chǎn)遠(yuǎn)程智能化監(jiān)控項(xiàng)目的應(yīng)用實(shí)踐,項(xiàng)目采用充分利舊原則,避免重復(fù)建設(shè)視頻監(jiān)控系統(tǒng)。整個(gè)系統(tǒng)覆蓋了18 個(gè)在建工地的300 余路攝像機(jī),建設(shè)“總部-項(xiàng)目部”兩級聯(lián)動(dòng)的AI 視頻大數(shù)據(jù)安全監(jiān)測平臺,實(shí)現(xiàn)了對施工現(xiàn)場未戴安全帽、未穿工服、未戴安全帶、無防護(hù)面罩、翻越護(hù)欄、高處無防護(hù)、缺少防護(hù)網(wǎng)、未拉設(shè)警戒、明煙明火等13 類安全隱患智能化預(yù)警,讓施工現(xiàn)場安全管理從“被動(dòng)監(jiān)督”到“主動(dòng)監(jiān)控”,有效保障了施工現(xiàn)場安全風(fēng)險(xiǎn)的可知可控,大幅度提升了施工安全管理水平,該系統(tǒng)的建設(shè)是一次從“建造”到“智造”的全新探索,為以后的類似工程施工建設(shè)提供了有效的參考和示范。
系統(tǒng)應(yīng)用架構(gòu)采用“云邊端”的管理模式,智能化系統(tǒng)應(yīng)用涉及人員生命財(cái)產(chǎn)安全,對實(shí)時(shí)性要求較高,在更貼近視頻圖像設(shè)備的網(wǎng)絡(luò)邊緣地方進(jìn)行實(shí)時(shí)運(yùn)算,所謂邊緣計(jì)算是在貼近用戶側(cè)的網(wǎng)絡(luò)邊緣執(zhí)行計(jì)算的一種集網(wǎng)絡(luò)、計(jì)算、存儲為一體的新型分布式計(jì)算模型。該模型將具有計(jì)算能力的設(shè)備和微型數(shù)據(jù)中心部署在更貼近用戶移動(dòng)設(shè)備、數(shù)據(jù)采集器、傳感器等的網(wǎng)絡(luò)邊緣,主要處理邊緣設(shè)備所產(chǎn)生的海量邊緣數(shù)據(jù),在靠近物或者數(shù)據(jù)源頭的網(wǎng)絡(luò)邊緣為用戶提供邊緣智能服務(wù)[18]。
邊緣計(jì)算的主要特點(diǎn)是通過極低延遲提高用戶體驗(yàn)及通過邊緣服務(wù)減少數(shù)據(jù)流量,采用邊緣計(jì)算技術(shù)將會節(jié)省大量的計(jì)算時(shí)間,原則上需要在工地危險(xiǎn)區(qū)域設(shè)置邊緣計(jì)算節(jié)點(diǎn),各節(jié)點(diǎn)AI 計(jì)算需要獲取1 080P高清圖像,單路視頻傳輸所需網(wǎng)絡(luò)帶寬至少為4 M,若上百路實(shí)時(shí)視頻流同時(shí)傳輸至中心計(jì)算將對網(wǎng)絡(luò)帶寬造成巨大壓力。因此,無需將實(shí)時(shí)視頻流都發(fā)送至云端進(jìn)行集中處理,只需將邊端節(jié)點(diǎn)分析后的結(jié)果傳輸至中心平臺后,然后采用大數(shù)據(jù)技術(shù)對海量數(shù)據(jù)進(jìn)行快速加工處理,實(shí)現(xiàn)數(shù)據(jù)的增值應(yīng)用,通過采用該管理模式不僅可以提供更快的響應(yīng)速度,也將降低中心平臺的計(jì)算壓力。
云邊端應(yīng)用架構(gòu)示意圖如圖2 所示。

圖2 云邊端應(yīng)用架構(gòu)示意圖
網(wǎng)絡(luò)邊緣計(jì)算節(jié)點(diǎn)根據(jù)實(shí)際施工現(xiàn)場情況,在各項(xiàng)目部監(jiān)控中心設(shè)置邊緣計(jì)算服務(wù)器,可在施工進(jìn)口及通道、施工作業(yè)面等關(guān)鍵部位及區(qū)域部署終端算法客戶端,通過采用視頻圖像統(tǒng)一采集服務(wù),接入1 080P的視頻圖像數(shù)據(jù),每個(gè)邊緣計(jì)算節(jié)點(diǎn)采用GPU 架構(gòu)的設(shè)備來支持高性能運(yùn)算,然后將分析結(jié)果通過綜合服務(wù)傳輸至AI 中心平臺,平臺提供分布式應(yīng)用服務(wù),支持將各邊緣計(jì)算節(jié)點(diǎn)的分析結(jié)果進(jìn)行存儲、再計(jì)算,并以“一張圖”的直觀方式展示。
系統(tǒng)自主研發(fā)過程中創(chuàng)建了多項(xiàng)創(chuàng)新技術(shù)應(yīng)用,以解決視頻監(jiān)控在復(fù)雜場景下實(shí)時(shí)性、高精度應(yīng)用問題。提出了一款輕量級高速度低消耗深度學(xué)習(xí)推理框架技術(shù),采用內(nèi)存共享機(jī)制降低計(jì)算網(wǎng)絡(luò)存儲使用量,解決了當(dāng)前深度學(xué)習(xí)應(yīng)用開源框架在推理時(shí)間消耗及內(nèi)存占用巨大的問題,實(shí)現(xiàn)了通過計(jì)算節(jié)點(diǎn)合并降低網(wǎng)絡(luò)運(yùn)行時(shí)耗,大幅度提升了安全隱患檢測效率,為人工智能技術(shù)在核工業(yè)工地智能化安全可控應(yīng)用提供了保障;提出了一種復(fù)雜場景下基于注意力機(jī)制和強(qiáng)化學(xué)習(xí)的圖像目標(biāo)精細(xì)分類方法,通過排除復(fù)雜圖像內(nèi)大量冗余噪聲數(shù)據(jù),解決了環(huán)境復(fù)雜度高、檢測目標(biāo)邊緣模糊、目標(biāo)部分遮擋條件下,特征區(qū)域分類效果不好的問題,提升了在施工現(xiàn)場光照分布不均勻、灰塵較多等復(fù)雜場景下安全隱患檢測的精準(zhǔn)度;提出了一種大焦距監(jiān)控場景下多尺度目標(biāo)的快速精準(zhǔn)識別方法,解決了廣闊空間域內(nèi)多尺度遠(yuǎn)端目標(biāo)及近端差異變大、泛化能力差的問題,降低了施工現(xiàn)場復(fù)雜環(huán)境下安全帽、工服、安全帶等目標(biāo)的誤檢與漏檢問題,提升了大范圍內(nèi)安全隱患檢測精度。
截至2021 年12 月,系統(tǒng)已累計(jì)識別各類安全隱患超過2 206 起,通過結(jié)合大數(shù)據(jù)技術(shù),將施工現(xiàn)場AI 智能預(yù)警與全景監(jiān)控等集中展示和分析(如圖3 所示),實(shí)現(xiàn)了智慧工地施工安全管理可視化,提升了安全監(jiān)管和決策能力,提高了項(xiàng)目各方安全質(zhì)量管理水平。

圖3 施工現(xiàn)場安全生產(chǎn)監(jiān)控一張圖(原型系統(tǒng)模擬)
系統(tǒng)通過采集現(xiàn)場實(shí)時(shí)視頻流圖像,代替人工監(jiān)控值守,24 h 不間斷對現(xiàn)場不安全行為進(jìn)行實(shí)時(shí)監(jiān)督識別,實(shí)時(shí)掌握施工現(xiàn)場安全生產(chǎn)情況(如圖4 所示),及時(shí)發(fā)現(xiàn)隱患,降低施工風(fēng)險(xiǎn)。

圖4 施工現(xiàn)場視頻實(shí)時(shí)監(jiān)測(原型系統(tǒng)模擬)
系統(tǒng)實(shí)現(xiàn)了施工現(xiàn)場的安全隱患在100 ms 內(nèi)完成檢測,10 s 內(nèi)自動(dòng)完成隱患原因分析,準(zhǔn)確率超過90%。當(dāng)系統(tǒng)自動(dòng)完成檢測后,立即以聲光預(yù)警方式發(fā)出提示信息(如圖5 所示),并自動(dòng)顯示安全隱患類型、等級、所屬項(xiàng)目、發(fā)生位置、預(yù)警時(shí)間,自動(dòng)生成預(yù)警時(shí)刻的錄像與處置時(shí)的圖像進(jìn)行對比。同時(shí),可快速調(diào)入該攝像機(jī)處所發(fā)生安全隱患的歷史記錄信息,有助于安全員做出準(zhǔn)確的判斷,系統(tǒng)應(yīng)用具備了較強(qiáng)的威懾力和可追溯性,可以對現(xiàn)場人員安全行為不斷規(guī)范,最大程度降低人員傷亡和財(cái)產(chǎn)損失。

圖5 安全隱患監(jiān)測預(yù)警(原型系統(tǒng)模擬)
對于各類不同的應(yīng)用場景及復(fù)雜的環(huán)境情況,系統(tǒng)具備自適應(yīng)能力,能夠自動(dòng)識別視頻圖像異常(無信號、模糊、抖動(dòng)、花屏、遮擋等),還可以根據(jù)時(shí)間段的不同消除光照、外部條件對智能識別的影響,將檢測誤報(bào)降到最低,通過人機(jī)交互方式自動(dòng)切換相應(yīng)算法,切實(shí)解決實(shí)際應(yīng)用問題,真正實(shí)現(xiàn)人工智能在施工現(xiàn)場安全管理的落地應(yīng)用。
基于人工智能計(jì)算機(jī)視覺在工地安全監(jiān)測中的建設(shè)應(yīng)用仍處于發(fā)展階段,系統(tǒng)雖然在工地重點(diǎn)監(jiān)管區(qū)域?qū)嵺`應(yīng)用過程中做了諸多研究,并形成了較為體系化的應(yīng)用成果,但其普適性推廣仍然受到多方面制約因素,還有諸多不足需要進(jìn)一步研究攻克,具體如下。
因工地環(huán)境復(fù)雜多變,對于大焦距場景下的檢測已取得不錯(cuò)效果,但對于室內(nèi)狹小空間內(nèi)部分近景目標(biāo),無參照目標(biāo),且易受其他物體遮擋,目標(biāo)檢測干擾嚴(yán)重,如地面孔洞檢測,因此對近景目標(biāo)檢測,算法邏輯優(yōu)化還有待進(jìn)一步研究。
深度學(xué)習(xí)需要大量的樣本支持,而通過現(xiàn)場相機(jī)采集的隱患圖片遠(yuǎn)遠(yuǎn)不夠,通過安全員日常巡檢獲得的隱患圖片又因場景視角不同、差距大無法滿足訓(xùn)練要求,如何在樣本不足情況下完成遷移學(xué)習(xí)面臨較大挑戰(zhàn)。
系統(tǒng)雖然采用了一系列技術(shù)創(chuàng)新突破對13類安全隱患進(jìn)行自動(dòng)識別,效果尚可,但還需要進(jìn)一步與人臉識別、人體行為姿態(tài)識別等身份識別技術(shù)相結(jié)合,精細(xì)化目標(biāo)識別檢測預(yù)警還有待進(jìn)一步探索。
人工智能計(jì)算機(jī)視覺技術(shù)的出現(xiàn),為建筑行業(yè)日趨復(fù)雜而繁冗的施工監(jiān)管工作智能化帶來了新的契機(jī)。本文著眼于建筑施工行業(yè)數(shù)字化轉(zhuǎn)型升級亟需解決的安全監(jiān)測問題,緊抓施工現(xiàn)場作業(yè)人員的不安全行為、物的不安全狀態(tài)和重要環(huán)境區(qū)域的不良條件關(guān)鍵要素,在已有人工智能、大數(shù)據(jù)等技術(shù)研究的基礎(chǔ)上,設(shè)計(jì)了AI 視頻大數(shù)據(jù)驅(qū)動(dòng)的施工安全監(jiān)測平臺,實(shí)現(xiàn)了安全隱患的自動(dòng)識別預(yù)警,展示了智慧工地安全管理典型應(yīng)用效果,該科技成果的應(yīng)用在一定程度上豐富了中國建筑行業(yè)安全預(yù)警研究。
未來,在信息技術(shù)飛速發(fā)展的大背景下,將繼續(xù)挖掘并優(yōu)化可替代人工管理的需求及路線,擴(kuò)大AI 技術(shù)在智慧工地項(xiàng)目中的普適性應(yīng)用;同時(shí),將人工智能視頻大數(shù)據(jù)與移動(dòng)互聯(lián)網(wǎng)、BIM、物聯(lián)傳感器設(shè)備、機(jī)器人、無人機(jī)等新興技術(shù)應(yīng)用深度融合,通過對施工現(xiàn)場全方位、全時(shí)段的監(jiān)控,以實(shí)現(xiàn)安全生產(chǎn)過程全面、動(dòng)態(tài)的數(shù)據(jù)采集,以及實(shí)時(shí)、準(zhǔn)確的分析監(jiān)管,提高施工現(xiàn)場安全監(jiān)控和管理的廣度和深度,提升施工建設(shè)安全管理的效率和水平。