徐清越, 左 敏*, 張青川, 何思宇
(1.北京工商大學計算機與信息工程學院,北京 100048;2.農產品質量安全追溯技術及應用國家工程實驗室,北京 100048; 3.食品安全大數據技術北京市重點實驗室,北京 100048)
郭承站[1]研究表明核安全是核能與核技術利用事業的生命線,是國家安全的重要組成部分,是指對核設施、核活動、核材料和放射性物質采取必要和充分的監控、保護、預防和緩解等安全措施,防止由于任何技術原因、人為原因或自然災害造成事故,安全監管工作是非常重要且必須的,因此通過時空分布建模為監管人員的工作安排與調度提供依據是一個值得關注的問題。
在核技術利用設備安全使用上,文獻[2]運用中子噪聲分析技術,對核電站堆芯吊籃梁型震動特性進行研究,為堆芯吊籃早起故障診斷奠定基礎,能夠有效避免因異常振動而導致的事故。
在時空分布模型方面也有一定的研究。文獻[3]利用時空數據模型實現礦山開采的動態監管。文獻[4]提出了改進停車生成率模型與不同建設用地停車時間長度的分布特性結合,描述某一地區總的汽車停放時空分布特性。文獻[5]基于時空數據庫對船舶系統進行時空建模,便于船舶系統中的空間實體在數據存儲分析層中進行表達和處理。文獻[6]從出租車形式軌跡中提取優質客源信息與時空分布規律,為提高出租車運營效率提供科學依據。文獻[7]針對水資源時空分布不均勻度的定量描述難點,基于云模型對水資源時空分布特征進行了定量研究。文獻[8]對太陽輻射的時空分布差異進行了研究。文獻[9]提出了考慮最優時滯因子的高速公路時空模型,解決了高速公路短時交通流預測問題。
但目前在核技術利用輻射安全監管方面沒有建立時空分布模型,這使得監管效率與核利用安全得不到保障。根據監管相關屬性與數據建立核安全監管時空分布模型。
徐志立[10]研究表明,進行監管效果定量評估時,需要從不同層面描述監管風險等級。因此建立核技術利用設備持有單位風險等級劃分模型,可為監管工作的合理安排與有效進行提供依據,為核技術利用設備的安全使用提供保障。
為保障設備的安全使用,核安全監管單位會在一定期限內,對擁有核技術利用設備的單位進行檢查,檢查內容包括輻射安全防護設施與運行情況、管理制度、法規執行情況等。監管不到位可能會增加設備使用風險;過度監管可能會影響設備的使用;監管時間過于集中(或疏散)可能會讓不正當使用設備的單位有可趁之機。
王湘艷等[11]研究表明,單一類型的評價指標受其他不確定性影響較大,需采用多角度的評價體系才能全面準確反映核安全監管的制約因素。因此,研究將圍繞檢查工作的時、空兩大方面設立監管合理性評價指標,即時間均勻度、空間完成度,并按照風險等級的不同在指標計算中適當加入不同的權重,增加模型的復現性與合理性。
定義1檢查發生年總天數Y是指檢查發生的這一年的總天數。
定義2設G為核技術利用安全檢查機構集合,G={G1,G2,…,Gm}。
定義3設C為檢查發生年總檢查工作集合,C={C1,C2,…,Ck},|C|=k指該年內檢查工作總次數,檢查單位Gi檢查發生年總檢查次數為|Ci|。
定義4設K為檢查發生年每輪計算的檢查實際發生日期,K={K1,K2,…,K|C|}。
定義5設S為檢查發生年每輪計算的檢查應發生日期,S={S1,S2,…,S|C|},設S0為每年的第一天,第j次檢查的應發生日期為Sj,Sj=Sj-1+hi,hi為期望間隔。
定義6時間均勻度是指檢查機構執行檢查工作在時間維度上的均勻程度(即工作密集或稀疏程度)。若檢查工作過于集中在某些時期,可能會影響設備的使用,或導致部分核技術利用單位只在這一時期做形式化安全工作,讓檢查工作形同虛設;若檢查工作過于稀疏,即監管不到位,會大大增加核技術利用設備危險使用的可能性,造成嚴重的后果。時間均勻度的具體計算步驟如下。
(1) 計算檢查機構Gi該年檢查工作次數,最均勻的期望間隔:

(1)
(2) 計算檢查實際該發生日期與實際發生日期的第j次單次偏差率fj,循環迭代|Ci|次,得到檢查機構Gi在這一年中所有檢查工作的偏差率:

(2)
(3) 計算檢查機構Gi在檢查發生年中|Ci|次檢查工作的平均偏差率:

(3)
(4) 計算時間均勻度Ui,并將其的值映射為[0,1]上的數,表達檢查均勻程度:

(4)




(5)
定義10檢查工作完成情況是指檢查機構Gi在該檢查發生年中工作的完成情況,即Di中的工作覆蓋率,可表示為

(6)
定義11空間完成度Fi是指檢查機構執行檢查工作完成情況與完成合理狀況的綜合考慮,并將其的值映射為[0,1]上的數,反映檢查工作的完成程度與工作合理程度,為工作安排與調度提供依據,檢查機構Gi的空間完成度表示為


(7)
現采用CNN對核技術利用設備持有單位風險等級分類預測。
CNN是一種自動特征學習與分類的方法,基本結構為輸入層、若干卷積層(convolutional layer)、若干池化層(pooling layer,也稱為取樣層)、全連接層及輸出層[12],優勢在于通過權值共享使網絡中可訓練的參數變少,降低了網絡模型的復雜度,減少過擬合,從而獲得了更好的泛化能力,使得網絡更易于訓練[13],相比于淺層分類器,這種含有多層隱含節點的神經網絡能夠更好地構建數據模型[14]。
結合核技術利用設備持有單位許可證種類(生產、銷售、使用)與范圍(Ⅰ類放射源、Ⅱ類放射源、Ⅲ類放射源、Ⅳ類放射源、Ⅴ類放射源、Ⅰ類射線裝置、Ⅱ類射線裝置、Ⅲ類射線裝置),核素種類、在用放射源總數及各類放射源數量、在用射線裝置總數及各類射線裝置數量等屬性訓練網絡,使其根據輸入屬性自動分類輸出單位對應風險等級(高、中、低3類輸出結果),分別對應年應檢查次數——3次、2次、1次,即對應風險權重分別為3、2、1。
因此定義輸出結果為一個二元組Rout=,s為被檢單位風險等級,p為該單位對應風險權重。


各核技術利用單位風險等級分類后,按照對應風險權重值帶入空間完成度的計算,具體計算步驟如下。

設立以下規則:①當αj>βj時,δj=βj;②當αj<βj時,δj=αj-βj;③當αj=βj時,δj=αj=βj。因此,

(8)


(9)
(3)計算合理系數σ。



(10)
(4)計算空間完成度F權。


(11)
本模型為開創式模型,根據核安全監管特性建立適應模型,為安全檢查工作的安排與調度提供直觀可視化與指標可參考化的決策依據。實驗數據來自環境保護部核與輻射安全中心,以山西省運城市環保局開發科2017年數據為例。
為了更好地證明模型的有效與合理性,實驗將模型輸出指標值與專家評定值進行比較,得出在何種綜合值計算系數下,該檢查單位綜合值與專家評估值最為接近。
定義14設q為實際輸入的指標值計算出的檢查工作指標綜合值,λ1、λ2為綜合值計算權重系數。
根據專家意見,時間均勻度對于監管工作的有效進行起到更加重要的衡量作用,所以在計算綜合指數時,應加大時間均勻度的比重。為了方便后期的比對與統一化管理,將綜合值計算結果歸一化為[0,1]之間的數。綜上,綜合值計算公式如式(12),實驗結果如圖1所示。

(12)

圖1 綜合值對比專家評定值Fig.1 Comparison of comprehensive value and expert rating
結果表明,在綜合值的計算中,λ1的取值在0.6附近(λ2的值在0.4附近)時,計算結果與專家評定值更為接近。


表1 各系數與權重方案計算結果

圖2 各系數與權重方案對比專家評估Fig.2 Comparison of the results of each program with the expert evaluation

獲取多地區多時間段的數據,由檢查管理部門進行手動標注,標注出該時間段內的檢查工作的合理程度,標注完成的數據用來作為判斷指標合理性與有效性的依據,數據與標注人員均來自環境保護部核與輻射安全中心。
設定一個標準來體現本研究評價指標和傳統時空指標及管理部門原本使用的基礎指標之間的性能差異,即評價指標將合理的檢查工作和不合理的檢查工作所映射的評價值的分離程度。將該標準設為分離度(separation),具體地說,設數據集內有n份已標注是否合理的檢查工作,如C合理={C1,C2,…,Ci},C不合理={Ci+1,Ci+2,…,Cn},C=C合理∪C合理。使用各評價指標對每份工作進行評價值的計算,每種評價指標能夠得到一組對應的評價值:
a合理={a1,a2,…,ai},a不合理={ai+1,ai+2,…,an}。


(13)

為防止實驗的偶然性影響,進行多次實驗,最后取分離度的平均值作為實驗結果。實驗結果如表2所示。

表2 指標分離度對比結果
由表2容易看出,傳統的評價指標沒有考慮到特殊領域的特性,評價起來比較單一和籠統,分離度普遍不高,不適合作為核安全監管工作的評價指標;環境保護部核與輻射安全中心原本使用的基礎指標在分離度上稍有提升,但沒有考慮到各核技術利用單位的差異性,無法實現精準管理,不利于核安全監管工作的開展。本研究提出的綜合指標,在分離度上有很大的提高,說明該指標能夠全面地表示出監管工作現在的進行狀況,能夠準確地反映工作安排的時空性問題,能夠幫助核安全監管工作的安排與實時調整,實現有效的量化管理。
針對核安全監管工作安排與調度問題,提出一種基于指標設立于風險等級劃分的時空分布多維度分析模型。時空分布指標為核技術利用監管提供可量化管理手段,并整合企業多屬性對不同風險等級單位采用適應的監管方式。實驗結果表明,所建模型能夠全面規避監管漏洞與片面性,產生直觀易懂的有效工作安排與調度依據,保障核安全高效合理化執行。