寧莎莎,李璟濤,張懷宇
(國家電投集團電站運營技術(北京)有限公司,北京102206)
新冠肺炎疫情目前在全世界傳播,疫情應對中的應急工作備受關注。核事故由于后果的嚴重性,對于應急工作中事故情況的分析掌握有更高的要求,為了在事故應急情況下為決策者提供及時、準確的技術支持,需要對核應急決策支持與事故后果評價系統的各個模塊的準確性進行驗證,其中大氣擴散模型的驗證比對是其中非常重要的方面。目前驗證評價大氣擴散模型主要的兩個困難是:(1)難以獲得合適的實驗數據集;(2)難以選擇適宜的模型驗證方法。本文針對以上兩個問題,應用目前國際上應用廣泛的KINCAID 示蹤實驗數據集和MVK(Model Validation Kit)模型驗證評價方法,對放射性核素大氣擴散模型ARTM(Atmospheric Radionuclide Transport Model)進行了驗證評價。
早期的示蹤實驗主要有三種類型:(1)大氣示蹤劑可行性研究實驗;(2)定性大氣擴散實驗;(3)大氣擴散參數確定實驗,B.Vanderborght 等在1983年對這些實驗進行了詳細的綜述[1],令人遺憾的是大量的實驗都缺乏定量描述,而此后的示蹤實驗在吸取前人經驗的基礎上對實驗條件和實驗結果進行了相對詳細的定量描述,使大氣擴散模型的統計驗證成為可能。按照實驗規模,大氣擴散實驗分為大尺度大氣示蹤實驗(200 km以上)和中小尺度(200 km以下)大氣示蹤實驗。
大尺度擴散實驗(200 km以上)由于其經費昂貴、實驗設計和協調的復雜性而很少開展。現在能夠應用于驗證大尺度擴散模型的示蹤實驗數據集還不多,其中受到廣泛關注的數據集有:CAPTEX、ANATEX、ETEX[2]。
相對于大尺度示蹤實驗而言,中小尺度的示蹤實驗數據集數量就比較多了。Kincaid 野外實驗是EPRI 煙羽模型驗證與開發項目的一個重要試驗[3],于1980 年至1981 年在美國伊利諾斯州Kincaid 電廠進行,該核電廠的地理坐標為西經89.49°,北緯39.59°。海拔約180 m,周圍是平坦的農場和少量湖泊,地表粗糙度約10 cm。示蹤氣體實驗持續約350 h,示蹤氣體采用SF6,實驗期間SF6從高187 m,直徑9 m 的電廠煙囪釋放,監測器分別布置在距源0.5 至50 km 范圍內的12 條弧線上。數據集中包括了171 h,1 284 組弧線-小時數據,每組數據都設置有質量指數表示數值的可信任程度。
丹麥國家環境研究所(NERI)開發的模型驗證比對工具MVK 中Kincaid 數據集是包含數據最全面、應用最廣泛的數據集,此外還有Indianapolis、Copenhagen、Lillestr?m 三個大氣擴散實驗數據集。放射性核素的大氣擴散可借助常規的實蹤實驗進行驗證,如Ka-Hing Yau 等應用Kincaid 數據集驗證了AUSTAL2000 和 CALPUFF 擴散模型,EPA 將該數據集應用于CALPUFF和其他大氣擴散模型的驗證,Steven R. Hanna 將 其 用 于 ISC3、 ADMS 和 AERMOD 模型的驗證比對,鄒敬等也應用此數據集驗證比對了實時在線核事故決策支持系統系統中RIMPUFF模型的驗證比對[4]。
目前國際上已經開展了一些關于空氣質量模型一般評價方法的討論,但是到目前為止還沒有形成統一的評價方法和模型性能標準。應用統計評價方法分析驗證模型中,MVK工具分析較為常用。
丹麥國家環境研究所(NERI)基于Hanna[5-7]等的定量統計參數方法開發了模型驗證工具MVK(Model Validation Kit)。該工具包包括Kincaid、Indianapolis、Copenhagen、Lillestrom 四個大氣擴散實驗數據集,定量分析程序(BOOT)、殘差分析程序(Residual Analysis)及二維繪圖程序(Sigplot)等。實驗觀測值與模型預測值通過MVK定量統計分析、殘差分析及定性圖形分析的全面比對,可以有效的評價模型的準確性、適用性,揭示模型的錯誤與數據中的壞點。
2.1.1 BOOT程序的統計方法
目前BOOT 程序已經涵蓋了ASTM(American Society for Testing and Materials)的模型評價方法,診斷模型預測值的采用的統計量除平均值(Mean)、標準偏差(Sigma)外,還包括平均偏差(Bias)、比例偏差(FB)、幾何平均偏差(MG)、標準化均方誤差(NMSE)、幾何平均方差(VG)、相關系數(r)及比例方差(FS),這些參數的計算公式如表1所示:

表1 BOOT程序采用的統計量Tab. 1 Statistical quality indicators adopted by BOOT software
式中:CO為觀測濃度;CP為模型預測濃度;σCo為實驗觀測濃度的標準差;σCp為模型預測濃度的標準差,單位均為μg·m-3。
平均偏差Bias定義為預測平均值和觀測平均值的差值,其數值可能是正數也可能是負數。當Bias為正數時,可能表示每一組數據的預測值均大于觀測值,即模型具有高估的趨勢,也可能表示預測值大于觀測值數據對的偏差之和,大于預測值小于觀測值數據對的偏差之和,因此Bias不具備表征模型高低估趨勢的性能。其置信區間可以表示為:
式中:tα取決于t分布的自由度和置信區間的振幅。
FB和MG都是反映系統誤差的統計參數。其中FB 更為常用,主要原因有2 個:(1)FB 是對稱而有界的,可接受范圍在-2(極端低估)到2(極端高估)之間;(2)FB 是一個無量綱數,使用于涉及不同濃度量級比較的研究中比較方便。但對于大部分的空氣污染物來說,其濃度接近于對數正態分布,因此個別的高觀測濃度或預測濃度會對比例偏差FB 產生顯著的影響,而幾何平均誤差MG 由于采用對數的處理方法,對很高的數值就不那么敏感了,但接近于0的濃度值會對MG影響顯著。
NMSE 是表征偏差的統計參量,對觀測值與預測值的差值非常敏感,尤其峰值的偏差對NMSE 的影響更大。一般來說,模型的評價與驗證都是用模型預測值直接與實驗觀測值比對的,但是由于觀測值的不確定性主要來自于大氣的隨機擾動,而模型預測值的不確定性主要來自于模型模擬的物理過程,兩者來源不同,直接比較的方法有可能會得到誤導性的結果,因此有的時候將系統誤差和非系統(隨機)誤差分開考慮是必要的。總的NMSE 可以表示為由系統誤差引起的標準化均方誤差NMSES與由非系統誤差引起的標準化均方誤差NMSEU之和。當非系統誤差為0 時,NMSE 取到最小值NMSES。
類似地,VG 等于由系統誤差引起的幾何方差VGS與由非系統誤差引起的幾何方差VGU之和。
相關系數r是目前模型評價中使用最廣泛的統計量。r為1 時,表示預測值與測量值正相關,即數據對(CO,CP)分布在斜率為正數的直線上;r為-1 時,則直線的斜率為負數;r為0 時,表示預測值和測量值之間沒有線性關系。
α因子表示滿足的數據所占的百分比(不包括(0,0)數據對)。α常取2 和5。FAC 對因為不受數據奇點的影響,是模型評價中最可靠的方法,可以作為消除極端值的工具和提高統計分析結果的方法。
2.1.2 MVK的局限性
MVK 雖然在模型的驗證與評價中得到了廣泛的應用,但其應用仍具有一定的局限性,主要體現在以下幾個方面:
(1)數量有限,只考慮了4 個實驗數據集;(2)僅適用于短程擴散模型;(3)只能處理一些相對簡單的情景,主要適用于在均勻地表環境下單個點源釋放無反應性氣體的情景;(4)沒有明確的解決由觀測濃度的隨機特性所產生的問題,程序只是直接將弧最大濃度和煙羽中心線濃度進行比較;(5)數據集主要關注的是弧最大濃度,只有部分數據集包括可信的側風向積分濃度[8];(6)BOOT 程序采用的統計量中并沒有一個綜合性的統計指標,驗證人員只能根據統計結果得到模型在某一方面的統計評價,而沒有總體的適用性評價。
本文應用MVK 工具,將ARTM 模擬結果與AERMOD 模 型 、 CALPUFF 模 型 及 Kincaid 數 據 集進行比對。AERMOD 模型和CALPUFF 模型是《環境影響評價技術導則大氣環境》(HJ2.2—2008)推薦的大氣擴散模型,已經廣泛應用放射性核素大氣擴散分析[9-12],此外CALPUFF 模型還能應用于核事故水體影響分析中[13]。Kincaid 數據集根據數據質量將數據進行分類,本文采用質量指示數分別為2 和3 的552 組數據進行比對驗證,數據分布在3~40 km范圍內,模擬區域地形平坦。
ARTM 是以德國空氣質量標準推薦的擴散模式AUSTAL2000 擴散模型為基礎來計算大氣中放射性污染物的擴散的,該模型系統主要包括診斷風場模型、霧羽抬升模型、濃度計算模型和核素沉積模型。模型的基本原理是拉格朗日煙團粒子模式,即把每個污染質點當成有標志的質點,粒子的運行軌跡可用下式表述:
式中:X為粒子的三維坐標分量;V為平均風速(u,v,w);V′為湍流脈動速度分量(u′,v′,w′);t為時間序列;Δt為時間步長。
通過釋放大量粒子,計算粒子的軌跡,這些粒子描述氣載污染物在大氣中的遷移擴散。粒子在流場中按平均風輸送,同時又用一系列隨機位移來模擬湍流擴散,這樣就表達了平流和湍流擴散兩種作用,最后由這些粒子在空間和時間上的總體分布估算出污染物的分布[14]。
如圖1 所示,ARTM 模型系統包括診斷風場模型、霧羽抬升模型、濃度計算模型和核素沉積模型。診斷風場模型結合地形和下墊面狀況處理輸入的氣象數據,計算風場。濃度計算模型經過霧羽抬升模型的修正后輸出每個網格的空氣濃度。最后核素沉積模型輸出每個網格的干、濕沉積濃度。
實驗的統計結果列于表2 中,模型預測值與觀測值越接近,則表示模型的預測性能越好。

表2 實驗比對結果Tab. 2 Results of the experiment
表2 中,ARTM 模型的均值偏保守,其他兩個模型均值偏小,這樣的結果不僅與模型本身的屬性有關,與實驗條件也有很大關系,如ARTM 因軟件局限采用了平坦地形模擬,而AERMOD 和CALPUFF 均輸入實際地形數據進行模擬,因此ARTM 的預測結果在數值上會比實際地形略大。一般說來如果模型的統計結果滿足-0.3<FB<0.3,0.7<MG<1.3,NMSE<1.5,VG<4, FAC2>0.5, 則 可以認為模型的模擬結果是有效的[15],ARTM 的統計結果基本達到了這個標準。相關系數Cor 是在檢驗模式預測值有效性中廣泛應用的統計量,描述了兩組變量相對于各自的均值以統一比例增加或減少的程度[16]。ATRM 模型的相關系數值略低,表明觀測值與預測值相對于各自的均值變化的統一程度較差。此外ARTM 模型比例方差數值上與理想值也是比較接近的。
模型預測值和觀測值的對應的散點分布圖如圖2 所示。數據點在圖中呈大致的橢圓形帶狀散布,但一部分點偏離較遠,造成相關系數r值偏低。圖3 為模型分位數圖,分位數圖是將模型預測值與觀測值分別從高到低排序,然后將對應的點打印在圖上,這個圖的意義在于能反映模型的預測趨勢[17]。由圖4 柱狀分析圖可以看出,ARTM 模型柱狀圖0 km~3 km 距離段75%處約指向1.0,表明在該距離段有75%的數據的比值小于1.0。結合圖1反映的預測趨勢,說明ARTM 模型在0 km~3 km 距離段的預測有低估的趨勢,在稍遠處(5 km以外)ARTM 模型的預測值有高估的趨勢。
在大氣擴散模型的驗證評價中,需要結合模型的特點選擇適合的實驗數據集和驗證評價方法。目前國際上應用廣泛的示蹤實驗數據集和模型驗證評價方法中,模型驗證工具MVK(Model Validation Kit)采用了比較完善的統計分析方法和實用的圖形工具,是眾多驗證評價方法中較為規范和成熟的。應用MVK 驗證評價放射性核素大氣擴散模型ARTM 的統計結果表明:ARTM 的模擬結果基本上是可信賴的,3 km 內的預測有低估的趨勢,5 km外的預測有高估的趨勢。
單一數據集只能代表有限的氣象條件,對于模型驗證評價應選取更多的數據集、綜合采用多種驗證評價方法做更廣泛的比對。現有可靠性較高的數據集所能代表的源項、氣象及地形條件仍十分有限,但現場擴散實驗較為昂貴,為大氣擴散模型適用范圍和局限性的深入研究增加了困難,因此開展更多的高質量的示蹤實驗或者風洞實驗用于模型驗證比對也是十分必要的。