王宇健 陳志祥
(1.山東省煙臺生態環境監測中心,山東 煙臺 264001;2.山東省核與輻射安全監測中心,山東 濟南 250000)
環境γ 劑量率監測在輻射環境監測領域有重要意義,可用于積累天然放射性本底水平數據,為異常情況和輻射應急決策提供參考;監測輻射源放射性水平、了解γ輻射變化趨勢,評估輻射源的影響。瞬時γ 劑量率監測、累積γ 劑量率監測是環境γ 劑量率監測常用的監測方式,兩種方法各有特點,互為補充。
目前,對于輻射環境γ 劑量率測量結果準確性的保證多側重于測量過程的質量控制方面,包括規范儀器操作使用方法、按時檢定、繪制質控圖、儀器比對等方法以保證儀器測量穩定性、準確性,以上方法可保證測量結果的可信度。對于測得的數據本身是否在合理水平缺少必要的甄別手段,常通過簡單的數據對比,利用技術人員的經驗判定,這種基于簡單對比和經驗判斷的評價方式,說服力相對有限。也有人采用3σ 判定法則進行異常值判定,該方法使用較為簡單,但檢驗效果較差。所以,找到一種基于統計學的,通過定量計算對γ 劑量率(瞬時、TLD)測量結果進行判定的合理檢驗方法,有助于提升數據質量和輻射環境水平描述的合理性、說服性。
環境統計學作為統計學在環境領域的應用,要求參與統計的測量數據能夠代表總體環境水平,可以通過合理的假設找到一種適合的統計學分布并加以檢驗。按照以上原則,該文對試驗條件設置如下:1)參考《環境空氣質量監測點位布設技術規范(試行)》(HJ 664-2013)和TOPSIS方法,在半徑約10km 范圍內各布設6 個γ 劑量率瞬時和TLD 測量點位,且實驗時間段內點位固定不變,以保證區域覆蓋性和代表性。2)測量全過程、各要素嚴格執行相關標準及質控要求,確保數據真實、可靠,在理論上保證測量數據—檢驗結果—輻射環境水平三者的一致性。3)有一定的測量頻次,且測量時間相對固定,在一定時間段內可積累足夠數量并相對連續的數據以供統計分析,保證統計分布假設與檢驗的準確性;四是γ 劑量率瞬時和TLD 測量同點位、同頻次進行,且數據經過計算轉換均以nGy/h 為單位,作為相對獨立,但理論上又能反映同一對象及其變化趨勢的兩種樣本數據,其樣本間比較結果具有一定的說明性和驗證性;五是本底情況下,環境γ 劑量率瞬時與TLD 測量結果一般相對穩定,出現離群值或整體水平較大波動的原因較易辨識。
同時,作為環境級測量數據,γ 劑量率測量受多種因素影響,在測量過程中也應注意和盡量避免以下問題對測量結果及統計分布的影響:1)TLD 測量過程中重復測量引入的A 類不確定度以及刻度因子引入的B 類不確定度,以及瞬時測量時,遇到施工、修路等本底環境臨時或永久改變等;2)有研究表明,TLD 測量結果在一定程度上受環境溫、濕度影響,具體影響情況為,由于低溫峰和主計量峰部分重疊,熱釋光測量儀在計數前的“退火”階段,難以完全排除低溫峰對測量計數的影響,從而難以排除布片過程中環境溫度對最終測量結果的影響,另外長時間連續降水導致的環境濕度過高對劑量片吸收情況也有影響;3)一般情況下,瞬時γ 劑量率的測量結果減去了宇宙射線響應值,而TLD 難以準確測量宇宙射線響應值而未予去除,因此兩種測量結果存在一定差值(正常情況下瞬時γ 劑量率小于TLD 測量數據),且差值難以準確計量,一定程度上影響二者比對;4)TLD 測量數據反映一個時段γ 劑量率的平均值,瞬時測量數據反映測量當時的γ 劑量率水平,二者趨勢一致,但單點位、單次測量值對比結果僅供參考。
綜上所述,在做好測量過程質量控制的基礎上,可暫時忽略上述不利因素對統計分布假設與檢驗的影響,而認為輻射環境γ 劑量率瞬時和TLD 測量數據具備準確、穩定、連續、受環境本身非輻射水平因素影響較少,且可以積累足夠數量的數據。所以,其數據作為樣本,具有一定的代表性,可視為連續隨機變量,從而對其進行正態分布假設,并對該假設進行檢驗。
正態分布是統計分析中最重要的分布,檢驗一組數據是否服從正態分布通常有3 種方法:計算偏度系數和峰度系數檢驗;夏皮洛-威爾克(S-W)正態分布檢驗(樣本容量較小時);P-P 圖及Q-Q 圖圖形檢驗。該文選擇前兩種定量分析方法進行數據分析,兩種方法的檢驗結果在表達正態分布不同特性方面各有側重,為更全面分析試驗數據的特性,該文同時選用2 種方法進行檢驗。
該文結合試驗數據(瞬時、TLD 各6 組共址測量數據,實驗時間2017 年三季度~2021 年二季度,測量頻次一季度/次,不考慮缺失值情況下單組樣本數量16 個),重點研究統計檢驗方法在γ 劑量率瞬時和TLD 測量結果分析中的應用。監測數據中出現個別缺失值,是環境監測及環境統計學中經常遇到的情況。尤其在TLD 測量中,劑量片經常會因為其布設樹木被修剪砍伐而導致數據缺失。
在某些環境水平分析應用中,為更好體現整體環境的連續水平,且考慮測量數據具有序列特征,常對原始測量數據中一組按照時間排列樣本中的缺失值進行統計學補全:對于單個缺失值,可使用臨近點均值插補,臨近值個數一般選1~3;若測量數據中出現連續2 個缺失值,可進行線性插值插補;若單組樣本首、末位序數樣本出現缺失值,可進行臨近點線性趨勢插補。
需要注意的是,統計學補全的數據相當于人為對該組數據的分布特性加入了一定程度的干擾,會讓該組數據更加符合某種統計學分布,其檢驗結果更傾向于統計學預期。為更直接地說明正態分布假設及其檢驗方法在該試驗中的應用,所以不對缺失值進行補全處理。原始數據見表1。
使用以下2 種方法對表1 中γ 劑量率瞬時與TLD 測量數據的正態分布假設進行檢驗。
計算偏度和峰度系數定量檢驗。偏度是統計數據分布偏斜方向和程度的度量,定義為樣本的三階標準化距,樣本偏度系數如公式(1)所示。


峰度是研究數據分布陡峭或平滑的統計量,定義為四階中心距除以方差的平方減3,樣本峰度系數如公式(2)所示。


以Z 評分判定其是否服從正態分布,Z=偏度系數or 峰度系數/偏度系數標準誤,在α=0.05 的檢驗水平下,如果Z在±1.96 之間,則可以說明數據服從正態分布。
因公式中各參量可直接讀取或通過簡單計算獲取,不再贅述計算過程,計算結果見表2。
夏皮洛-威爾克(S-W)正態分布檢驗。S-W 屬于非參數檢驗,用來檢驗數據是否符合正態分布,樣本容量較小(樣本容量3-50)時適用。具體檢驗步驟如公式(3)所示。


該文中樣本數據假設檢驗顯著性水平α 取0.05,選取點位1 瞬時γ 劑量率為例進行假設檢驗。
作出假設H:點位1 瞬時γ 劑量率數據服從正態分布,備擇假設為H。
a:將歷次測量瞬時γ 劑量率數據從小到大排列成:72.4,73.1,74.4,74.5,77.5,79.5,79.9,80.7,82.7,83.1,85.6,86.0,86.9,93.1,93.6,97.5。
b:查閱GB4882 中a值表a~a分別為0.5056,0.3290,0.2521,0.1939,0.1447,0.1005,0.0593,0.0196,同時計算樣本均值,帶入公式,求得W=0.946。
c:對α=0.05,查表得n=16 時,Z=0.887。
d:由于0.946 >0.887,所以不拒絕正態性原假設H0。
所有點位瞬時及累積γ 劑量率S-W 檢驗結果見表2。
正態分布假設的檢驗結果。從上述兩種正態分布定量檢驗方法對γ 劑量率瞬時和TLD 測量各6 組樣本數據的檢驗情況來看,兩種方法的檢驗結果一致度較高,即:瞬時測量全部6 組樣本數據及TLD 測量點位1、2、3、6 四組樣本數據服從正態分布假設,樣本數據其偏(峰)度系數/偏(峰)度系數標準誤的絕對值均小于1.96 的同時,其夏皮洛-威爾克(S-W)檢驗結果也服從正態分布;TLD 測量點位4、5兩組樣本數據不服從正態分布假設,其中點位4、5 偏度系數/偏度系數標準誤的絕對值均大于1.96,同時點位5 夏皮洛-威爾克(S-W)檢驗W 值小于臨界值。
另外不難看出,雖然TLD 測量點位1、2、3、6 四組數據樣本總體服從正態分布,但也存在一定的“離散”傾向,主要體現在其偏度系數/偏度系數標準誤的絕對值比較接近1.96、夏皮洛-威爾克(S-W)檢驗結果比較接近臨界值。對于不符合正態分布和有一定程度“離散”傾向的樣本數據組,均應懷疑其存在離群值。
對TLD 數據出現的不符合正態分布檢驗的結果進行追溯和分析發現,TLD 測量過程中TLD 測量設備進行過多次校準,以2018 年1 季度為界,在此之前,各點位TLD 數據整體高于后續組內其他數據。經分析TLD 測量設備經校準后刻度因子較高,導致了測量數據整體正態性變差,這也是TLD 各點位出現檢驗結果不符合正態分布或接近臨界值的根本原因,2018 年1 季度重新檢定并使用新的刻度因子后,測量數據整體穩定。

表1 γ 劑量率瞬時與TLD 測量數據(單位:nGy/h)

表2 正態分布假設檢驗結果
雖然γ 劑量率瞬時與TLD 測量有諸多不同之處,外界環境影響以及儀器設備本身穩定性差異必然導致最終測量結果的不同,但二者在同點位較長時間段內測量數據的變化趨勢總體保持一致。
該文對試驗區域內(同點位、同頻次)環境γ 輻射空氣吸收劑量率瞬時和TLD 測量結果進行了正態分布假設與兩種不同方法檢驗,檢驗結果表明,該試驗數據總體質量良好,其中瞬時測量數據的穩定性優于TLD 測量數據,試驗區域內γ 劑量率輻射水平發展趨勢在合理區間內正常波動。另外,可通過繪制瞬時與累積測量數據趨勢圖的方式,進一步驗證二者測量結果的合理性。
該文選用的相關假設、檢驗及相應的數據追溯方法,可以作為對環境γ 劑量率瞬時、TLD 測量數據質量定量評價,以及環境γ 劑量率輻射水平描述的有效手段。通過對數據本身的統計假設檢驗,也對儀器設備的穩定性,運行狀況提供了參考資料。
兩種不同的假設檢驗方法不僅適用于環境γ 劑量率數據分析判定,也可在輻射環境監測的其他項目得以應用,特別是正常情況下監測結果穩定在探測下限(MDC)以上的環境樣品,例如核電基地周邊環境介質中總放射性分析、環境介質中氚、碳-14 的分析等。隨著核電廠放射性流出物的排放,采用兩種不同的假設檢驗方法,可有效甄別一組數據是否存在異常,判別核電廠對周邊輻射環境帶來的影響,為輻射環境相關決策提供資料。