楊靜遠,金 珊,韓冬傲,黃家祺,夏小涵
基于指紋定位技術的放射源定位方法研究
楊靜遠1,3,金珊2,韓冬傲3,黃家祺3,夏小涵4,*
(1. 清華大學 環境學院,北京 100084;2. 中國核電工程有限公司,北京 100840 3. 生態環境部核與輻射安全中心,北京 100082;4. 中國聯合網絡通信有限公司智網創新中心,北京 100048)
放射源定位是放射性物質安全監管的重要內容之一。目前基于移動式探測器的定位方案存在應用條件、部署成本、監控時效等諸多方面的挑戰。本文提出一種基于指紋定位技術的放射源定位方法,討論了基于多探測器的放射源指紋定位系統設計方案,建立了基于環境輻射監測系統的仿真模型,設計了基于WKNN和XGBoost的放射源指紋定位算法并進行了實驗仿真。結果表明:在4頂點探測器布置仿真模型中,基于WKNN和XGBoost的算法定位精確度差異不大,定位精度小于25米的精確度分別為89.1%和90.18%,基于XGBoost算法的放射源定位方法實時性較高,運行時間為WKNN算法的7.8%。
放射源定位;指紋定位;WKNN;XGBoost;
隨著新能源的需求和核工業技術的日益普及,放射源安全問題顯得尤為重要。放射源和其他放射性物質的安全監督對核技術專用設備依賴性越來越強。目前,放射性檢測以實時輻射劑量檢測設備為主。測量形式包括以便攜式為主的移動測量和重點輻射場所為主的固定測量。對固定區域的長期監控,必須實時掌握放射性物質/核材料和周圍環境的輻射水平,并在無法迅速控制輻射異常時發出報警[1]。
當前放射性分布式監控主要基于放射學檢測節點的單點測量值。在局部評估輻射劑量分布和放射源定位方面性能較差[2,3]。一些研究人員提出了用于識別伽瑪射線源方向的方法,例如定向伽瑪射線探測器和伽瑪射線定向算法來解決輻射定位問題。但這些方法使用單個檢測器來獲得放射源的方向信息,在定位精度和活動目標上效果較差[4,5]。也有一些文章提出了多探測節點的檢測方法,基于單探測器探測角度等方案來重建放射源活度[6,7]。不過在計算量和精度上都較為復雜,在輻射敏感度探測方面也有所欠缺。
本文提出一種基于指紋定位技術的放射源定位方法。介紹了基于多探測器的放射源定位系統設計、指紋定位技術的基本原理以及不同數據算法的分析處理過程;以通用的核電廠環境輻射監測系統技術參數對某一特定放射源場所建模,模擬計算探測器對整個放射源場所各個區域(參考點)的響應,建立定位指紋數據庫;接下來研究了基于已建立的指紋庫采用不同算法給出的未知源定位效果,并比較了不同算法之間的差異;最后對研究結果進行總結。
目前對于放射源的特性搜尋,往往包括源的類型,核素,種類,用途,數量,活度大小,屏蔽狀況[8]。
核電廠環境輻射監測系統由以下幾部分構成:KRS中央站、環境γ輻射監測站、氣象站、環境監測車、環境介質采樣車和環境信息網系統[10]。常見的環境輻射監測系統主要技術指標如表1所示。

表1 常見的環境輻射監測系統主要技術指標
系統對核電廠周圍的γ輻射水平、特殊元素及氣象數據進行連續監測和記錄,產生大量的測量數據。近年來隨著機器計算和硬件處理性能的提升,機器學習成為模型化處理大數據場景的常用方案之一,在可獲得區域放射特征指紋的情況下,指紋定位可以便捷的發現區域輻射異常,并給出具體定位。通過將探測區域柵格化,在固定位置監測站完成布置之后,每個探測器對每個柵格內的輻射特性參數可以形成關聯數組,在模擬放射源建模以及用實際放射源進行數值修正,可以形成各個柵格的大批量數據采集,進而完成特征指紋庫的建立[11]。
在指紋定位算法中,k近鄰分類算法(以下簡稱“KNN”)和加權k近鄰分類算法(以下簡稱“WKNN”)作為經常使用的定位算法,在很多文章中被提及[12-13]。然而由于源數據的數據漂移,在遇到一些缺失值,以及缺失值處理不當時,這種涉及樣本距離度量模型的機器學習算法很容易導致較差的預測結果。
在數據建模中,經常采用聚集方法通過將成百上千個分類準確率較低的樹模型組合起來,成為一個準確率很高的預測模型。這個模型會不斷地迭代,每次迭代就生成一顆新的樹。但在數據集較復雜的時候,可能需要幾千次迭代運算,這將造成巨大的計算瓶頸。XGBoost是大規模并行提升樹的工具,完成了回歸樹的并行構建,并在原有梯度提升樹算法基礎上加以改進,從而極大地提升了模型訓練速度和預測精度[14]。
本文在基于算法實時性和精確度的考慮上,采用了XGBoost的機器學習算法,完成指紋定位流程,并將其與WKNN定位性能作為對比,來測試不同算法的定位性能。整個指紋定位方案流程圖如圖1所示。

圖1 多探測點的指紋定位方案流程圖
由于放射性物體的特殊性,難以直接布置多物體獲取真實采樣數據。因而在選定區域并固定若干個探測器位置之后,放射源的特征指紋收集需要以大量仿真數據作為填充。本文采用空氣比釋動能計算公式來建立仿真數據,忽略高度的影響,簡化為二維平面模型,并假設其他氣候影響因素為線性影響[15-17]。整個方案可以分為劃定分析區域、清洗數據、柵格區域構建、指紋庫構建、模型參數優化等功能子模塊。
(1)劃定分析區域
固定探測器之后,劃定分析區域是基于放射性定位的前提和基礎,劃定的區域可以為包含廠區范圍的矩形區域,視探測器的工作半徑以及重疊區域而定。由于指紋的特征值生成是基于多探測器探測數值,而探測器覆蓋是不規則的扇形區域,所以劃定的矩形研究區域中相鄰的區域間可能會存在邊緣重疊的現象,不影響指紋獲取。
(2)特征數據選擇
放射源在多探測器的測試結果矩陣作為指紋庫的特征值,在固定探測器的情況下,放射源在各個探測器的探測結果互相關。在仿真過程中,本文采取所有探測器的輻照劑量、風速、濕度、核素作為指紋簽名。考慮到放射源在各探測器的相關性,指紋簽名包含探測能量的互相關矩陣。
(3)清洗特征數據
質量高的源數據可以獲得更準確的模型。每個測試放射點在各個探測器都會有不同探測結果并互相關,因而放射點在多探測器上的結果矩陣將作為采樣的特征數據。
采樣的特征數據的清洗標準主要分為三部分:
1)源數據應有明確的活度值等信息;
2)每條源數據應有大于3個探測器的探測信息;
3)每條源數據不應有比較大的位置漂移,即不會出現明顯的離散值。
根據以上三個條件,對源數據進行清洗,可以使用聚類的方式進行統計特征數據篩選[18-20]。清洗后的數據進行隨機分類,每10條數據中隨機抽取2條數據,作為測試集,剩余用于訓練模型。這樣即完成了用80%數據源用來訓練模型,20%數據源用來測試模型。特征數據清洗流程如圖2所示。

圖2 特征數據清洗流程
(4)區域柵格化處理
根據劃定區域的相對距離,將劃定的區域按(m)×(m)的規格進行柵格的劃分,根據相對的矩形區域的面積把整個區域均勻的劃分為若干柵格,并對每個柵格進行編號。將柵格的編號與位置點經緯度進行對應,這樣可以使得每個柵格都有獨一無二的經緯度屬性和編號屬性。
(5)構建指紋數據庫
根據訓練集放射源數據的位置信息將其與柵格的位置信息作對應,在柵格的編號屬性與經緯度屬性對應的基礎上,將對應的源數據點按位置映射到相應的柵格內。形成特征指紋數據庫如表2所示,后續將根據該數據庫的對應關系進行模型的訓練。

表2 指紋庫特征表格

續表
(6)模型預測定位與修正
利用建立好的模型可以對測試數據進行預測,將預測的結果與實際的放射源位置信息進行比較,可以得到模型預測準確度的量化結果。根據對放射源位置的預測結果,閉環修正訓練模型并調整模型的訓練參數,可以有效的完成模型的校正。
本小節采用放射源的簽名相似性比較來進行位置估計,選擇對比了KNN和WKNN算法。KNN主要思想為通過計算測試簽名和所有訓練簽名的相似度距離,來獲得相似度距離最小的k個訓練簽名,并以k個訓練簽名的坐標平均值作為估計位置。相似度度量一般使用歐氏族距離和曼哈頓距離。WKNN則是考慮到KNN算法簽名的可靠性和優先級,增加了KNN的分量權重而產生的一種演進算法[12,13]。




本小節主要介紹基于XGBoost的放射源定位算法。通過對于位置-多探測器特征數據庫的訓練來形成指紋庫,并通過此模型直接預測放射源的實際位置。
作為一種多決策樹的分類器,XGBoost算法有效利用了放射源的多參特性。其基礎思想為梯度提升決策樹,將基分類器層層疊加,每一層在進行訓練的時候,都會對前一層基分類器樣本給予更高的權重。最后,根據各層分類器結果的殘差和得到最終結果[21,22]。
使用XGBoost的目標函數如下:

XGBoost的目標函數經泰勒展開之后的可以轉化為:

整個學習過程如圖3所示,可以分為回歸樹構建,回歸樹分裂,分裂停止。
(一)回歸樹構建
在指紋學習的過程中,選取logistic損失函數,以指紋特征值構建回歸樹[9]。回歸樹的復雜度和正則項有關,包含了兩個部分:葉節點個數和葉節點得分數的二范數平方。去掉對于目標函數無影響的損失函數和常數部分,目標函數可以轉化為:

的最優解代表的樹結構最好,以上完成了回歸樹目標函數的構建。
(二)回歸樹分裂
對于回歸樹而言,是由每個節點不斷分裂,而形成了整顆樹。在放射源定位中,標簽特征決定了分裂復雜程度。而柵格數目決定分類的數目。在每個節點,需要對標簽字段做處理來進行樹的分裂。
分裂節點的方法采用貪婪算法。從樹深度為0開始,對每一節點都遍歷所有的特征,包括各探測器的活度值,探測器之間的協方差等。之后對于每類特征值,首先按照該特征里的值進行預排序,然后通過線性掃描該特征進而確定最好的分割點,最后在對所有特征進行分割后,選擇的增益最高的特征組。這樣就完成了一次分裂。
當引入的分裂帶來的增益小于設定閥值的時候,忽略該分裂,完成預剪枝。從而降低整體的結構復雜度。
(三)分裂停止
為了限制樹過深,防止過擬合的情況出現。算法設定了分裂閾值,當分裂增益小于分裂閾值時,分裂停止。閾值的值為:

通過XGBoost對原始指紋標簽進行學習后,可以根據異常放射源特征獲取其最大相似坐標,從而完成定位。
本節將對整體進行仿真實現,并相對于原始坐標給出量化的比對指標。仿真參數說明如表3所示。

表3 仿真系統參數
仿真軟件使用基于python的sklearn框架。建模工具采用高德地圖自帶的開放API接口。建模廠區平面模擬圖如圖4所示,選定一個廠區區域對于放射源進行監控。分別對柵格化WKNN定位、柵格化XGBoost定位的指紋定位進行對比,探測器位于園區四個頂點。實驗仿真采用的特征數據包括探測器的輻照劑量、風速、濕度、核素等。
對清洗完的數據進行處理,探測器位置并不影響柵格區域選擇。最小柵格粒度標準以實際探測需求為基準,柵格化后區域如圖5所示。圖中陰影部分為模擬地圖的不同地勢標志,白點為柵格化區域頂點。

圖4 廠區平面模擬圖

圖5 柵格化區域圖


圖6 不同機器學習算法預測結果對比
從預測結果可以看出,在數據較為密集的區域,預測值和實際值表現出比較好的聚類屬性。但是比較稀疏的位置對于預測結果仍然有較大的影響。以預測值和實際值的歐式距離為定位精度,定位精度和定位分辨率定義如下:


稀疏化的過程中,由于柵格元素不足或者數據異常,出現元素被再次清洗的情況,也就是原始數據的深度清洗。因此稀疏化之后對應的數據源,較于之前的數據源會更為集中,定位精度也會提高。但由此可能會帶來區域外的數據誤差或者定位誤差,這些則需要利用修正聚類參數的方法以及足夠數量和實時性的源數據來避免。從定位結果上可以看出。兩種算法在定位精確度上差異不大,而時間上,優化參數后的XGBoost算法計算時間最短,運行時間為WKNN算法的7.8%,實時性最為明顯。訓練模型的預測結果準確度還是符合預期的。
核電廠環境輻射監測系統監測記錄數據為采用大數據智能化分析應用提供了數據支撐。本文結合機器學習對于大數據處理的優勢,介紹了一種適合對固定區域做放射性監控,可以快速發現異常源的多探測器放射源指紋定位方案,重點分析了仿真模型的數據清洗途徑和算法比較,對比了兩種機器學習算法在該場景的定位性能和定位時延的優劣。仿真結果符合預期評估,證實了大數據方案在固定區域定位監測的可行性。未來的工作將集中在指紋庫優化和更多特征指紋提取的方向上,并結合實際地形和氣候因素,進一步提高定位精度。
[1] 張廉,蔡漢坤,楊朦.國際核和放射性事件分級表簡介及在我國核電廠事件中的應用[J].核科學與工程,2019,39(06):945-953.
[2] 李龍,孫征,邵靜,等.俄核動力巡航導彈劑量空間分布研究[J].核科學與工程,2020,40(04):668-676.
[3] 曾志,李君利,賈向紅,等.空間輻射劑量及屏蔽效應研究[J].清華大學學報(自然科學版),2008(03)
[4] Yan Jun Zhang,Wen Sheng Qiao,Jin Ling Wang. The Experimental Study of Lanthanum Bromide Detector in the Gamma Ray Imaging[J].Applied Mechanics and Materials,2013(336)
[5] 譚軍文,左國平,周劍良,等.NaI探測器搜尋γ源定位準直器模擬設計[J].核電子學與探測技術,2015(04)
[6] 左國平,譚軍文,周劍良,等.基于三角圓筒鉛屏蔽NaI探測器的放射源定位研究[J].原子能科學技術,2017(03)
[7] 張振朝,左國平,譚軍文,等.基于三晶體耦合γ射線方向探測器的放射源定位[J].核技術.201 7(10)
[8] 劉新華,李冰,吳德強.位置未知廢放射源的搜尋[J].輻射防護通訊,2002(05):11-16.
[9] 潘自強.放射源安全管理中一些問題的討論[J].輻射防護,2002(05):257-262+268.
[10]安洪振,吳岳雷,李斌.核電廠輻射監測系統的監管要求和技術趨勢[J].核電子學與探測技術,2013(06)
[11] Darshana Wadduwage,U.D.Annakkage.Improving Matrix Pencil and Hankel Total Least Squares algorithms for identifying dominant oscillations in power systems[C]. International Conference on Industrial and Information Systems,2015.
[12]黨小超,馬平川,郝占軍.基于CSI的改進的KNN室內定位方法[J].傳感器與微系統,2019,38(10):51-60.
[13]趙芳.基于參考位置指紋離散程度的WKNN定位方法[J].沈陽工業大學學報,2020.
[14]蔣晉文,劉偉光.XGBoost算法在制造業質量預測中的應用[J].智能計算機與應用,2017(06)
[15]周毅吉,彭玲,楊磊,等.輻照劑量場分布的兩種擬合方法比較研究[J].激光生物學報,2017,26(04):314-320.
[16]曾凡松,伍曉利,李曉燕,等.(60)Co單板源劑量場分布經驗計算公式的建立[J].輻射研究與輻射工藝學報,2012,30(04):198-202.
[17]夏益華.高等電離輻射防護教程[M].哈爾濱:哈爾濱工程大學出版社,2010.
[18] Liu Kaifeng,Lan Yongqi,Li Xiaoling,et al. Development of small molecule inhibitors/agonists targeting STING for disease[R].2020:132.
[19]楊潔,王國胤,王飛.基于密度峰值的網格聚類算法[J].計算機應用,2017(11).
[20] Menghui Gao,Yuchen He,Haosheng Tang,et al. cGAS/ STING:novel perspectives of the classic pathway[J]. 2020,1(1):1-16.
[21] Yue Lili,Yi Zhenping,Pan Jingchang,et al. Identify M Subdwarfs from M-type Spectra using XGBoost[J].2021,225(prepublish):165535-540.
[22]羅春芳,張國華,劉德華,等.基于Kmeans聚類的XGBoost集成算法研究[J].電子技術及信息科學,2020,38(10):12-14.
Study on the Radioactive Source Location Method Based on the Fingerprint Location Technology
YANG Jingyuan1,3,JIN Shan2,HAN Dongao2,HUANG Jiaqi2,YI Zilong2,XIA Xiaohan3,*
(1. School of Environment,Tsinghua University,Beijing 100084,China;2. China Nuclear Power Engineering Co. Ltd.,Beijing 100840,China;3. Nuclear and Radiation Safety Center,Ministry of Ecology and Environment,Beijing 100082,China;4. Center of Smart Network of China United Network Communications Co.,Ltd.,Beijing 100048,China)
The location of radioactive sources is one of the important contents of the safety supervision of radioactive materials. Current positioning solutions based on mobile detectors have many challenges in terms of application conditions, deployment costs, and monitoring timeliness. This paper proposes a radioactive source location method based on the fingerprint location technology, discussed the design scheme of radioactive source fingerprint positioning system based on multi-detectors, established a simulation model based on the environmental radiation monitoring system, designed a radioactive source fingerprint location algorithm based on the WKNN and XGBoost, and carried out experimental simulation. The results show that in the 4-vertex detector layout simulation model, there is little difference in positioning accuracy based on the WKNN and XGBoost algorithms. The accuracy of positioning accuracy less than 25 meters is 89.1% and 90.18% respectively. The radioactive source positioning method based on the XGBoost algorithm has high real-time performance, and the running time is 7.8% of the WKNN algorithm.
Radioactive source location; Fingerprint location; WKNN; XGBoost
TM623.4
A
0258-0918(2021)06-1289-08
2021-03-30
楊靜遠(1988—),寧夏銀川人,工程師,碩士研究生,現從事核電廠電氣儀控設備方面研究
夏小涵,E-mail:sagahan@163.com