徐永華,潘玉奇
(1. 金陵科技學院計算機工程學院,江蘇 南京 211169; 2. 濟南大學 信息科學與工程學院,山東 濟南 250022)
實驗室作為科技成果的研究基地,是科學技術研發過程中最為重要的組成部分。由于實驗室中大部分實驗用品都具備易燃易爆特性,所以對實驗室進行有效的火災危險源識別是保證實驗室正常運行的重要手段之一。針對火災危險源的隱蔽性存在形式,提出快速有效的危險源識別方法成為實驗室建設領域亟待解決的問題。
文獻[3]提出基于HFACS的糧食烘干作業危險源辨識方法。該方法通過傳統的辨識方法找出危險源;再使用里森模型對缺失數據進行系統化處理,通過因素分類系統對處理結果進行分析,找出其中的隱形差錯;最后將傳統辨識結果與分析結果進行整合,實現危險源的辨識。該方法由于未能在危險源識別前對數據進行平滑去噪處理,導致該方法的辨識精度不高。文獻[4]提出基于BIM和本體的地鐵基坑施工危險源自動識別方法。該方法首先對危險源的辨識流程進行確定,根據規范模型以及本體模型建立安全本體,最后采集相關數據并導入建立的模型中,實現危險源的可視化辨識。該方法在建立模型時存在誤差,導致辨識結果與實際結果不一致。文獻[5]提出民航不安全事件報告危險源識別模型。該方法首先建立危險源標簽,將其整合為表格形式,選定相應的數據庫;使用LDA模型獲取數據分布概率;最后通過選定的數據庫對模型進行訓練,獲取相應的數據向量并通過相應的分類方法實現危險源的辨識。該方法在計算分布概率時存在問題,所以該方法進行危險源辨識過程中增長系數高。
為解決上述危險源辨識方法中存在的問題,提出基于機器視覺的實驗室火災危險源辨識方法。
首先對實驗室空間范圍內的數據進行全方位采集,建立數據的最小包圍立方體,并將其作為八叉樹的根節點,通過根節點建立若干邊長相同的子節點,其中具有點云數據的節點為黑點,反之則為白點。設定立方體的最小劃分邊長為,若黑體的邊長大于,對子節點進行劃分,直到劃分的子立方體邊長小于或等于時,結束劃分。數據經過劃分后,使用八進制法對該立方體進行數據編碼,過程如下式所示
=-18-1+-28-2+…+8+…+8+8
(1)
式中,數據的八進制編碼為。通過空間劃分以及數據編碼形式對數據的空間位置進行確定,過程如下式所示

(2)
式中,確定的空間位置坐標為(,,),數據在方向的進制編碼為,方向的數據進制編碼為,方向上的數據進制編碼為。基于上述可知,編碼與立方體之間的關系可用=2+2+2進行表示,通過計算可獲取上述數據在各個空間位置中的坐標值,結果如下式所示

(3)
式中,進制編碼為,層數為。
設定實驗室的點云數據集合為,數據的任意采樣點為,鄰域集合為。具體的濾除過程如下:
1)通過八叉樹拓撲關系,構建的鄰域數據集合()。


(4)
式中,數據數量為。
3)通過獲取的數據點云集合計算全局距離平均值與標準方差。
4)通過計算出的領域均值與全局距離平均值以及標準方差進行比較,找出數據離群點并進行濾除處理。
數據離群點濾除后,使用加權的協方差矩陣對數據的集合特征值進行計算。針對數據點云集合中的點,根據近鄰搜索法搜索鄰域集合,使用最小二乘法對面進行擬合處理,過程如下式所示

(5)


(6)
式中,矩陣特征值為,相對應的特征向量為,建立的協方差矩陣為。當<<時,可直接用特征向量進行表示,所以基于Pauly方法對擬合平面的曲率進行定義,過程如下式所示

(7)
將實驗室數據集中的平滑采樣坐標位置設定為′,描述過程如下式所示

(8)
式中,影響因子標記成,數據的平面法向量為,角度閾值標記′,特征向量為,平滑函數為(),時間系數為。最后通過上式計算出實驗室訓練數據樣本集在平面上的投影長度,從而完成數據的平滑去噪。
使用機器視覺中的在線序列極限學習機訓練平滑去噪后的實驗室數據,從而實現實驗室火災危險源的識別。
首先在實驗室數據集中選取一部分的數據開始訓練數據,開展數據的訓練任務,獲取數據的輸出權值與輸出矩陣,在其中加入新的數據樣本進行新一輪輸出矩陣與輸出權值的計算,重復操作上述過程,實現數據的在線學習。
設定實驗室數據集中的危險源樣本數據為,危險源特征信息為,理想的識別結果為,激活函數為(),學習機的輸出表現形式如下式所示

(9)
式中,輸出權值為,數據的訓練結果為()。設定廣義逆矩陣為,當=+時,獲取的矩陣表達形式,結果如下式所示

(10)
式中,廣義逆矩陣為。


(11)
式中,添加新數據的樣本訓練數據為,危險源數據廣義逆矩陣為,迭代次數為,整合系數為,危險源輸出權重為,危險源理想數據識別效果集為。整體學習過程如下:
1)在學習機中輸出相關數據。
2)設定各項初始數據值,開始初始學習。首先隨機選取個數據樣本作為實驗室中的火災危險源,并在其中搜索危險源元素的狀態信息,若存在立即生成輸入權值,反之則通過輸入權值獲取隱藏的節點閾值。
3)通過激活函數獲取原始輸出矩陣。
4)建立廣義逆矩陣,并依據該矩陣獲取數據輸出權重。
5)進行在線學習,依據激活函數獲取更新后的輸出矩陣,以及輸出權值。
6)重復上述流程,直至沒有新數據,輸出訓練結果。
由于機器視覺中的在線序列極限學習機進行火災危險源辨識時,會由于數據的泛化能力影響學習機的自身網絡結構,且輸入權值與偏置項為隨機取值,會發生辨識效果差的問題,所以要使用差分進化方法優化學習機的網絡,從而提高學習機的火災危險源識別泛化能力。
為了更好地完成優化,需使種群在凈化過程中選取相應的變異策略,過程中變異策略的選取概率為,,學習周期為,策略的更新規則如下

2)當>時,,獲取過程如下式所示

(12)
式中,變異策略與代種群生成試驗向量中的進化數量為,,進化中剔除的數據數量為,。變異向量生成后,通過變異向量獲取試驗向量。
優化時,使用均方的誤差定量最小化種群進化的選擇向量,完成學習機網絡優化。過程如下式所示

(13)
式中,最小進化向量為,學習機輸入權重為,危險源特征信息為,偏置項為,理想識別結果為。
1)設定實驗室火災危險源的狀態數據集為,種群迭代次數為,維度用表示,危險源激勵函數設定成()形式,數據的訓練數量為,更新后的數據集大小為。
2)隨機生成實驗室數據種群維度,建立初代種群個體向量。
3)選取最大變異策略,生成變異向量,以及試驗向量,。
4)通過對學習機網絡輸出權值的計算,獲取相應的,對比試驗向量與原數據向量,選取最小進化向量,進入+1代種群,完成學習機結構優化。
5)將平滑去噪后的實驗室數據放入學習機中,通過訓練結果實現火災危險源辨識。
為了驗證上述危險源辨識方法的整體有效性,需要對此方法進行測試。
分別采用基于機器視覺的實驗室火災危險源辨識方法(方法1)、基于BIM和本體的地鐵基坑施工危險源自動識別(方法2)、民航不安全事件報告危險源識別模型(方法3)進行測試;
在進行危險源識別過程中,參考指標的高低會直接影響危險源的辨識效果。所以設定引燃時間、最大熱釋放率以及危險源增長系數為測試指標,采用上述三種危險源辨識方法,將上述三種識別指標分為三個階段,測試三種危險源辨識方法的識別效果。
1)引燃時間
第一階段,將實驗室內采集到的可燃物分為五個組別,采用本文所提方法對數據平滑去噪前后的火災危險源進行識別,對識別過程中五個組別的引燃時間進行測試,測試結果如圖1所示。

圖1 平滑去噪前后引燃時間檢測結果
由于組別的不同,測試出的引燃時間也不相同。整體來看,實驗室數據經過平滑去噪后的引燃時間檢測結果與實際的引燃時間相接近,而未進行平滑去噪的實驗室易燃物引燃時間檢測結果與實際可燃物引燃時間相差較大,這主要是因為本文所提方法再進行平滑去噪過程中,使用了K近鄰搜索法濾除了數據集中的離群點數據,所以本文所提方法在進行數據平滑去噪后,檢測出的危險源引燃時間與實際引燃時間相一致。同時可以側面證明本文所提方法的辨識精度高。
2)最大熱釋放率測試
最大熱釋放率作為火災危險源檢測過程中最關鍵的測試指標,是影響火災危險源辨識的重要因素。第二階段,基于第一階段的測試結果,利用本文所提方法識別數據去噪前后的火災危險源,測試去噪前后危險源辨識過程中的最大熱釋放率,測試結果如圖2所示。

圖2 去噪前后最大熱釋放率檢測結果
分析圖2可知,本文所提方法在數據去噪前的實驗室易燃物最大熱釋放率與實際檢測出的最大熱釋放率之間存在較大差距,而數據平滑去噪后的最大熱釋放率檢測結果與實際最大熱釋放率檢測結果相接近,并且在組別1、2、5中檢測出的結果與實際檢測結果相一致。這主要是因為本文所提方法在數據平滑去噪過程中不僅進行了數據離群點的濾除,還使用加權的協方差矩陣對數據的集合特征值進行計算,完成了法向量的估計,所以本文所提方法在進行數據平滑去噪后檢測出的最大熱釋放率與實際易燃物的最大熱釋放率相接近。
3)增長系數
基于上述測試結果,在測試的第三階段,采用方法1、方法2以及對方法3對危險源進行識別,對三種識別方法識別出的危險源增長系數進行測試,測試結果如圖3所示。

圖3 不同方法的增長系數測試結果
分析圖3可知,檢測次數的增加會提高危險源的增長系數。本文所提方法測試出的危險源增長系數低于其它兩種辨識方法。這主要是因為本文所提方法在進行危險源識別前對數據進行了平滑去噪處理,所以本文所提方法在進行去噪處理后提高了危險源的辨識準確度。
隨著科技的不斷進步,國家對于實驗室的建設要求愈加嚴苛。針對實驗室建設過程中的火災危險源辨識過程中出現的問題,提出基于機器視覺的實驗室火災危險源辨識方法。該方法首先建立實驗室數據集,并對其進行平滑去噪處理;再使用機器視覺中的在線序列極限學習機對平滑去噪后的實驗室數據進行訓練,從而實現實驗室火災危險源的識別。該方法由于在在線序列極限學習機優化過程中出現一定缺陷,今后會針對該項問題繼續優化該危險源識別方法。