榮 明, 陳英杰, 黃 超, 王大川, 原俊峰
(1. 新疆農業大學水利與土木工程學院, 新疆 烏魯木齊 830052; 2. 新疆工程學院安全科學與工程學院,新疆 烏魯木齊 830052; 3. 新疆兵團水利水電工程集團有限公司, 新疆 烏魯木齊 830000)
隧道施工過程中,工作人員安全狀態預警以及報警是保證工程安全的重要環節,近年來也成為了研究熱點。考慮到隧道工程的特殊性,部分研究建立了集智能監控、綜合分析、協同管理和大數據應用于一體的掘進機隧道工程管理大數據平臺,從管理和技術方面為隧道施工領域的大數據平臺設計和開發提供參考,提高隧道掘進機施工效率和智能化管理水平[1]。但是,該類大數據平臺依舊需要專業運維人員依靠工作經驗來進行人機交互,不利于自動化信息管控。為推動信息管理的智能化發展,陳艷茹[2]將遺傳算法和極限學習機進行耦合,采用遺傳算法對基于極限學習機的初始權值和閾值進行優化,大大提高了預測精度,能夠較好地預測不同工況下的結果,這是智能算法在工程安全保障上的結合。
伴隨著理論研究的發展,機器學習、深度學習在工程領域的各項工作中都得到廣泛應用。機器學習方法中有許多可以進行安全檢測的算法技術,其中,單分類支持向量機(OCSVM,one-class support vector machine)具有分類能力強、模型原理簡單等特性。曹惠玲等[3]將單分類支持向量機應用于航空發動機的故障檢測,其能準確而快速地識別故障數據,及時發現發動機運行狀態異常情況。王成等[4]使用2層決策邊界的雙閾值OCSVM算法進行尾流檢測,試驗結果表明在不同信噪比下改進算法的檢測準確率均有提升。高玉峰[5]提出了一種基于單分類支持向量機的設備故障檢測方法,所建立的采煤工作面瓦斯涌出量預測模型的精度高于應用BP神經網絡的預測精度。鄭浩楠[6]通過基于單分類支持向量機的配電通信網流量異常檢測方法,極大地提高了異常狀態檢測效率。在深度學習領域,為有效解決我國傳統的施工現場安全生產管理問題,減少由于施工人員的個人疏忽(如不佩戴安全帽等)造成的重大人員傷亡,秦嘉等[7]提出了一種基于深度學習的安全帽佩戴檢測與跟蹤技術。這種技術是當前工程建筑領域與深度學習技術相結合的一個發展趨勢[8],使用深度學習的算法,自動訓練出一套目標檢測模型,從而提高了工作效率。
目前,在施工現場人員定位、人員屬性及構件識別的研究上,學術界已經有了一系列科研成果。其中,SVM算法在隧道施工現場的安全管理中具有較好的可行性以及泛化能力。在隧道工程領域,基于機器學習的人員保障措施監測方法已被廣泛應用,但已有的研究主要集中于人員安全保護設備的佩戴、人員簡單行為、構件破損度以及變形程度的識別等。這些應用能夠解決特定的安全管理問題,例如: 安全帽佩戴、構件裂縫檢測等,但隧道施工安全管理作為一個復雜的、系統性的工程,需要多方面進行考量以滿足各種安全管理需求。因此,當前的研究具有一定片面性,應針對施工安全管理的特點進行系統、深入研究。對于人員安全,結合隧道內部環境特征,對人員體征進行異常狀態預警更為直接、準確。由于在機械工程、土木工程、航空工程等領域,SVM方法已經有成熟的應用,隧道人員安全檢測屬于一種典型的數據不平衡異常檢測問題,在正常數據的訓練模型情況下異常數據會出現波動現象,而OCSVM模型可以有效解決數據不平衡問題并準確預測出異常狀態。
本文建立了一套基于OCSVM算法的隧道施工人員安全狀態檢測及預警模型并在不同分布特征的數據集上印證模型的精度。同時,考慮異常數據比例對模型的精度影響,進行消融對比試驗。通過橫向對比4種特征情況下的模型準確率,綜合評估模型的性能。
隧道施工人員安全狀態的識別要求能夠快速、高效地檢測出人員生命體征,并對人員的異常健康狀態和所處位置信息及時反饋,從而在意外情況來臨時能夠高效、準確獲得隧道內部環境、人員體征狀態以及人員所處的位置信息,有利于項目管理者和救援工作者選取救援方案,保障有生力量。因此,文章以隧道施工人員體征影響因素和環境因素分析為切入點,結合OCSVM安全預警模型進行智能安全管理,實現智慧工地安全的信息化管控。
單分類支持向量機是一種支持向量機模型[9],通過訓練正常的數據樣本,在特征空間中建立一個最優的超平面,按照間隔值最大化的原則來實現分離訓練樣本和其原點,其算法如圖1所示。

圖1 支持向量分類機

s.t.ωφ(xi)≥ρ-ξi,ξi≥0。(2)

(3)
式中L為目標函數,算法便是對這個函數的優化。通過對上述方程中的變量進行偏微分,可以得到優化問題的對偶形式[11]:
minααTHα;
(4)
(5)
式中:α=[α1,…,αN]T;H為由Hij構成的核矩陣,Hij可表示為
Hij=K(xi,xj)=φ(xi)φ(xj)。
(6)
式中K(xi,xj)為核函數,本文中的核函數為線性核函數和高斯核函數[12]。而對于RBF核函數,僅有一個參數σ需調節,該參數會直接影響到RBF核函數的寬幅,計算公式為:
(7)
通過求解上述二次規劃問題,即可解出α,于是ω和ρ可由式(8)—(9)分別算出[13]:
(8)
(9)
由解出的ω和ρ即可求得一個在特征空間里的決策性超平面。

F(zk)=sign[ωφ(zk)-ρ]。
(10)
通過計算測試樣本zk的決策函數F(zk)來判斷zk與決策超平面的位置關系。若F(zk)=+1時,zk落在決策超平面之內,被分類為正類,即可判斷為正常樣本;若F(zk)=-1時,zk落在決策超平面之外,被分類為負類,即可判斷為異常樣本[11]。算法流程如圖2所示。

圖2 OCSVM模型算法流程圖
基于OCSVM的作業人員安全狀態預測以及預警工作流程如圖3所示。主要分為數據收集、模型搭建、人員安全檢測3個模塊。
工作現場部署的相關傳感設備采集相關數據后,通過數據傳輸方式發送給上位端整理,流程如圖4所示。主要分為數據采集層、數據傳輸層以及數據應用層,主要作用如下:
1)數據采集層。通過體溫心率傳感器、相對位置反饋裝置以及溫濕度傳感器獲取試驗所需的離散數據,再經過數據傳輸層完成傳輸。
2)數據傳輸層。主要由微處理器集成通信和數據傳輸裝置組成,前者優勢在于集成度較高,能夠增加數據傳輸的速率,然后通過WiFi、Zigbee等方式將數據發送給上位機模型。
3)數據應用層。OCSVM模型獲取了發送過來的數據,并且進行實時反饋,完成工作人員安全狀態的檢測以及預警功能;也可以通過傳輸過來的數據對模型進行實時更新。

圖4 數據收集硬件框架
模型搭建步驟如表1所示。

表1 模型搭建步驟
人員安全狀態檢測基本流程如表2所示。
在本文所搭建的模型中,單類支持向量機的數據輸出種類分為2類,即正常情況與異常情況。其中,在輸出預警值方面,本文設定預警閾值為0.78(該閾值根據隧道施工監測數據統計分析和相關專家經驗設定,后續可根據實際情況進一步優化),輸出的精度值大小超過0.78時,表示出現了異常情況,且越接近于1,表示異常情況越明顯。即輸出值在0~0.78表示隧道內情況正常,0.78~1表示隧道內出現了異常情況。

表2 人員安全狀態檢測流程
由于隧道內作業環境相對封閉,現場環境復雜,對不同位置、不同時期的洞內溫、濕度進行分析,篩選合適的特征數據,以便后續搭建基于OCSVM的人員安全狀態識別模型,達到安全預警的效果。
1)在實際作業過程中,若出現了疲勞乏力、意識模糊等癥狀會對施工人員的安全造成威脅,其中體溫與心率能直接反映人員的體征狀態。對所有進入施工現場的人員進行體溫檢測,嚴格做好疫情防控工作,對體溫≥37.3 ℃人員,要及時送至隔離觀察宿舍進一步隔離觀察。由于心率參數對溫度變化的感應十分靈敏,所以容易進行測量和計算,而且測量耗時較少。成人的正常心率為 60~100 次/min,在封閉空間的作業中,若工作人員的心率超出了正常值范圍,需馬上停止工作,防止工作人員的身體和機能發生障礙,從而造成嚴重的工作事故。
2)影響溫、濕度的因素十分復雜,如機械通風、自然空氣、地下水、晝夜及季節變化、施工機械釋放的熱量、地熱、氣壓、風向及風速變化等[17]。溫、濕度不僅可以反映工程施工人員的作業條件,也可以反映隧道結構的安全性。當洞內溫度降低到一定范圍內時,就會直接影響到人體的生理和精神狀態。低溫情況會使人體免疫力下降,引發一系列的疾病,如感冒、哮喘等。洞內的濕度太大,空氣中水汽含量較多,人體排出的汗液不易蒸發,體內散熱不通暢,導致體感溫度升高。高濕環境的作用,使得我們身上的汗水和衣物之間的摩擦力增大。高溫、高濕對隧道內作業人員造成了不利的影響,影響工作效率,甚至可能危及生命安全,增加安全事故的發生率[18]。
3)在隧道施工過程中,施工人員的相對位置對人員安全有著重要的影響,因為不同的施工位置可能會產生不同程度的危險,也有不同的搜救難度。隧道施工區域一般分為洞口區、二次襯砌施工完成區、二次襯砌施工區、防水施工區、仰拱/調平層施工區、開挖及初期支護區。每個區域都有施工人員在活動或者作業,需掌握每個人員在隧道內的位置。人員定位裝置安裝需要確定每個基站的坐標。以洞口為起始點,通過人員在隧道內的位置可以計算出施工人員與掌子面的距離。定位洞內人員距洞口的距離,實時統計隧道內的總人數、各個區域的人員分布等數據。當出現危險時,能準確確定人員距離洞口的位置,便于救援。
本文對相對位置的概念進行形式化定義,對施工人員位置進行區域化定位。距離洞口的距離認定為絕對位置,而依據現場施工情況決定參考位置,本文定義參考位置大小為50 m,如圖5所示。所以相對位置數值=絕對位置/50,進位取整數,其相對位置規則如表3所示。

圖5 相對位置抽象示意圖(單位: m)

表3 相對位置規則
對相對位置進行形式化定義以后,信息收集框架如圖6所示。
信息收集主要包括3個方面,分別是隧道內部環境、位置信息以及施工人員體征。主要測量隧道內部環境的溫、濕度情況,施工人員的人體溫度和心率,位置信息由上述的相對位置定義獲取。因此,評估參數分別是人體皮膚的溫度(包括胸部)、心率、洞內環境溫度、環境濕度以及人體所處相對位置。本文數據來源于新疆奎屯河引水隧洞工程項目,該項目2標、3標、4標引水隧洞工程全長8.195 km,于2020年10月28日開工,計劃于2023年7月1日完工。隧洞工程基本信息見表4。為便于后續試驗過程的描述,本文分別將表中2標、3標、4標所表示的數據定義為數據集1、數據集2、數據集3。

圖6 施工人員信息收集示意
本小節主要對收集的數據進行特征預處理。本文所研究的人員體征數據、隧道內部環境數據及位置信息的描述如表5所示。
本文使用收集的3組工程數據進行訓練,得到隧道人員安全檢測報警模型。數據集特征統計如表6所示。

表4 隧洞工程基本信息

表5 人員安全檢測數據說明
在收集到的數據基礎上,判斷實際人員的安全狀態,并進行人工報警標記,具體標記為2類,即正常狀態
和報警狀態。由于標記數據量較少,故需進行數據增強處理,具體方法是在原始數據的基礎上進行隨機標記并進行微調,即對原始數據進行隨機抖動而類標簽不變化來實現。這樣一來既能保證數據的隨機性,也可以通過線性微調使數據更具真實性,從而增加模型的泛化性。為增加分類器的泛化性,可先沿著分布通過添加一些隨機分布的值來隨機化擾動點,使用增強數據集訓練出來的模型,對于那些未包含在訓練集中的樣本數據點更具有泛化性。如圖7所示,數據增強前正態分布曲線較平滑,而進行數據增強處理后,部分出現了離散點,如圖8所示。

表6 數據集特征說明

圖7 數據增強前的正態分布曲線
1)對于人體體溫數據,在每個數據集中選取7%~10%進行異常值標記,處理方式為在實際數據基礎上添加符合正態分布(-1~2)的增量值。
2)對于人體心率數據,在每個數據集中選取6%~10%進行異常值標記,處理方式為實際數據上添加符合正態分布(-10~30)的增量。
3)對于洞內環境溫度、濕度,選取數據集中7%~10%進行異常值標記。
4)相對位置信息蘊含一定的預警標準意義,故無需構造異常數據。
將所有的數據都進行歸一化處理。數據歸一化處理是一種使用量綱為1的信號處理技術,將具有波函數特征性質的物理數值轉換成與其他波函數特征相互作用的某種相對值,并縮小與這些量值之間的落差[8]。本文選擇的歸一化計算方法為最值歸一化計算方法(mmn,min-max normalization)。最值歸一化計算方法也可簡稱為最高值線性歸一化或離差歸一化,就是對原始數據進行線性變換,使得結果值可以映射在[0,1]或某個自定義數值之間。轉換函數為:
(11)
式中max與min分別是該特征數據集的最大值和最小值。歸一化處理之后的部分數據如表7所示。

表7 數據歸一化
本文通過準確率(accuracy)、精確率(precision)、召回率(recall)、F-score值對基于OCSVM的人員安全狀態識別模型的性能進行評估[19],相關計算公式如下:
(12)
(13)
(14)
(15)
識別結果的混淆矩陣如表8所示。

表8 識別結果的混淆矩陣
為探究增強之后的數據對原數據的試驗結果是否有影響,本小節開展試驗探究。數據增強的主要目的是使得模型訓練效果更好,因此原始數據可能過于平滑或者數據量較少的時候,都會采取合適的數據增強辦法。本文采取控制變量法設計驗證試驗。首先,分別將數據集1、2、3按照訓練集和測試集劃分為8∶2,為驗證數據增強的效果,本文設計如下4個試驗:
1)對3個數據集不進行處理,使用OCSVM模型進行試驗測試。
2)對3個數據集的訓練集部分進行數據增強處理,保持測試集不變,使用OCSVM模型進行訓練和測試。
3)對3個數據集的測試集部分做數據增強處理,保持訓練集不變,使用OCSVM模型進行訓練和測試。
4)對3個數據集的測試集和訓練集均進行數據增強,使用OCSVM模型進行訓練和測試。
4個試驗OCSVM模型的精確率、召回率以及F-score如表9—12所示。

表9 試驗1

表10 試驗2

表11 試驗3

表12 試驗4
由表9—12可以看出試驗4的效果最好,即在訓練集和測試集上都進行數據增強以后,數據的泛化能力更強,所訓練出來的模型性能更好。同時,對比訓練集和測試集結果,模型出現過擬合和欠擬合情況。未進行數據增強的為試驗1,其余試驗2、3、4在結果分析上均保持與試驗1一樣的分析方法,模型在數據集1、2、3上性能均在90%左右,數據增強以后效果更優。
本文主要探究3個不同分布特征的數據集對于模型性能的影響,分別使用人體特征、環境特征、人體-環境以及人體-環境-位置信息特征這4類數據進行人員安全狀態預警試驗,并選擇線性核函數和RBF核函數進行對比試驗。試驗過程中,人體特征數據由體溫和心率組成;環境特征數據由隧道內部環境溫度和環境濕度組成,均是二維數據;而人體-環境特征數據和人體-環境-位置特征數據為多維數據。試驗數據集中,訓練集和測試集比例為8∶2。統計各類數據所訓練的模型的支持向量個數,計算測試集對應的預測準確率,試驗結果見表13和圖9—11。圖9—11中,a、b、c、d分別表示人體特征數據、環境特征數據、人體-環境特征數據以及人體-環境-位置信息特征數據。
經過對比不同采集來源中不同統計分布特征的4類數據試驗結果,可以發現在各數據集合上,OCSVM模型的性能均表現出了良好的狀態,模型準確率均在95%左右。在核函數選擇上,RBF核函數的模型預測準確率要略高于線性核函數的,但各數據集的模型中RBF核函數所產生的支持向量數大部分情況下要多于線性核函數。這說明選擇該核函數的計算復雜度較高,在數據較大時,可以選擇線性核函數進行預處理,初步分類,再使用RBF方法進行最終狀態的報警。

表13 人員安全預警模型試驗結果

圖9 數據集1試驗結果

圖10 數據集2試驗結果

圖11 數據集3試驗結果
本文探究數據為隧道施工人員實際數據,其異常情況數據占總數據量比例較小。在實際工程問題研究中,數據占比直接影響了模型的精度與效率。據此,數據比例及均衡性對模型性能具有一定程度的影響。為探究這種影響關系,將報警狀態值進行一定比例的設置,探究5%~50%比例的數據對模型的影響。試驗數據選取數據集1(新疆奎屯河引水隧洞工程2標),核函數選擇σ=0.125的RBF核函數,分別進行上述4組不同特征數據情況下的試驗,統計測試集在不同比例時的準確率大小,試驗結果如圖12所示。
對比不同預警狀態數據比例試驗,可以看出各類型數據在不同預警狀態比例時預測準確度均在90%上下,異常數據占比在15%以下時,預測準確率優于其他比例。由圖12(d)可知,加入位置信息的OCSVM模型能更好地進行隧道工作人員安全情況預警,并且準確率均在90%以上。
接著,在同一個試驗條件下,對這4種特征信息進行橫向對比,設定異常數據比例為15%,核函數選擇σ=0.125,在數據集1上訓練100個批次,橫向對比試驗效果如圖13所示。
4種特征信息下的模型分類效果均呈現增長趨勢,其中,特征d的模型分類效果領先于其他3種。由此可見,在同一試驗條件下,特征信息越多,模型所表現的分類性能越好。

(a) 人體特征數據

(b) 環境特征數據

(c) 人體-環境特征數據

(d) 人體-環境-位置特征數據
1)本文提出了一種基于 OCSVM 的隧道施工人員安全狀態檢測方法,收集了3組隧洞施工人員體征與環境特征的數據。分別選擇每個數據集中的幾個變量建立對應的OCSVM 安全預警模型,運用模型對測試集的人員安全信息進行檢測。通過對不同特征分布的數據檢測結果進行分析可知,其模型準確率均在90%以上,驗證了OCSVM算法對隧道人員安全信息的預警具有良好的科學泛化能力以及可拓展性。
2)實際收集數據過程中,可能會因為設備和技術手段的原因導致誤差,需在硬件系統中加以改進。
3)通過不同數據比例下的消融試驗可知,在不同預警狀態的數據中,即不同平衡度的數據試驗,模型表現出較好的性能,證明了模型的高效性、精準性。因此,在隧道施工人員安全預警問題中,運用OCSVM可提高工程的自動化水平,節約成本,提高工程效率。
對于隧道人員安全預警問題的研究,下一步可考慮擴充數據特征,多維度進行分類預測。對于用于安全預警的OCSVM算法,下一步研究方向為擴充數據量與數據維度進行試驗,可以結合深度學習模型,完成數據無監督訓練,并與多種機器學習預測分類方法進行比較,更好地服務于隧道工程安全監測預警領域的研究工作。