雷鎧灰,曹良志,*,萬承輝,曹 泓
(1.西安交通大學 核科學與技術學院,陜西 西安 710049;2.上海核工程研究設計院有限公司,上海 200233)

圖1 換料限制條件原理示意圖Fig.1 Diagram of refueling principle
在核電廠堆芯換料方案設計優化過程中,由于換料方案的樣本空間極大,而傳統的換料方案評價需借助燃料管理軟件完成堆芯三維核-熱-燃耗的耦合計算[1],無法在短時間內篩選出滿足經濟性和安全性要求的堆芯換料方案。因此,為減輕換料方案優化過程中的人力時間投入,快速精確地評估方案的性能具有重要的研究價值。
自20世紀90年代以來,研究者嘗試將人工神經網絡用于堆芯換料參數的快速預測并證明了其具有較好的適用性。但以往的研究[2-4]普遍基于傳統的全連接神經網絡,存在以下問題:學習參數多、組件編碼的大小和形式顯著影響神經網絡的訓練以及預測精度,尤其在組件類型較多時編碼形式的考慮將變得異常麻煩等。同時,全連接神經網絡還存在參數冗余、忽略位置信息等缺陷。
卷積神經網絡可處理類網格結構數據[5],它有效地解決了全連接神經網絡的缺點,被廣泛應用于圖像識別、文檔分析、語言檢測等領域。Jang等[6]對比了卷積神經網絡和全連接神經網絡的預測性能,并采用VGGNet[7]卷積網絡成功預測了堆芯換料方案的循環長度和功率峰因子,證實了卷積神經網絡用于堆芯方案評估的優越性。但Jang等采用的VGGNet結構卷積核尺寸單一且在同等網絡深度下存在學習參數過多、網絡訓練慢的缺點。因此,本文擬采用Inception-ResNet網絡結構[8],在加深網絡深度的同時減少學習參數、抑制梯度彌散等現象,以實現對換料關鍵參數的快速精確預測。作為數值實驗,本文以某二代改進型機組為研究對象,基于工程換料經驗隨機生成堆芯換料方案用于神經網絡訓練,評估本文提出的預測方法的計算效率和精度。
在實際換料過程中,組件所處的位置可分為1/8區域、正1/4線(水平垂直1/4線)和斜1/4線(對角1/4線),從右下1/4堆芯開始,按照逆時針方向依次分別為1/8區域和1/4線進行類型編號0~7。在該堆芯中,1/8區域對稱的有8個組件,1/4線對稱的有4個組件。本文采用壓水堆機組堆芯換料方案設計中的換料規則,生成神經網絡訓練所需的堆芯換料方案的樣本,原理示意圖如圖1所示(組件字母后的數字為區域編號)。其中,關鍵的換料規則如下:1) 處于上一循環1/8區域的乏燃料組件在本循環可放到1/8區域上(如組件C),或拆成兩組分別放到不同1/4線上(如組件B)或同一類(正或斜)1/4線上(如組件A),在拆分和放置時保持上一循環中各組件旋轉對稱和逆時針相對位置不變;2) 位于上一循環1/4線上的乏燃料組件在本循環放置在1/4線上(如組件D);3) 如果中心位置使用1/8區域的乏燃料組件(如組件E),則與被使用組件90°旋轉對稱的另外3個組件不在本循環放置,另外4個組件可在本循環1/4線上放置,放置時仍保持旋轉對稱和逆時針相對位置不變,如果采用上一循環1/4線組件,則其余3個組件不在本循環使用;4) 后備反應性較高的燃料組件周圍應盡量展平功率分布;5) 將后備反應性低的燃料組件卸出堆芯,卸出數目為新燃料組件裝載數目?;谏鲜?條限制條件,以此生成不重復的換料方案。
卷積神經網絡仿照生物響應眼前精確位置圖像的局部感知、掃視等過程,通過設計卷積和池化操作,實現對圖像的特征提取。這種卷積和池化操作使卷積神經網絡具有稀疏連接、參數共享、平移等變和局部平移不變的特點,從而在減少學習參數、降低訓練難度的同時有效地提取了圖像的特征,因此被廣泛用于圖像識別、物體檢測等領域。卷積神經網絡一般由輸入層、隱藏層、輸出層組成,結構如圖2所示。
隱藏層通過卷積核或池化窗口進行計算、平移操作對輸入圖像進行局部特征感知與提取,然后輸出新的特征圖,其中特征圖的通道數為卷積運算使用的卷積核數目。

i,j=1,2,…,n;c=1,2,…,d
(1)


i,j=1,2,…,n;k=1,2,…,d
(2)

經過卷積或池化操作后,特征圖的長寬尺寸要小于原始圖像的,此時可通過填充0以保持操作前后尺寸不變。新的特征圖又會被后續的多個隱藏層逐步提取特征以形成高度抽象化的特征,最后通過整合這些高度抽象化的特征并進行線性運算以獲得輸出層結果。整個網絡的更新由梯度下降算法進行,其算法公式如下:
(3)
式中:n為神經網絡訓練步數;θ為神經網絡學習參數;ε為學習率;m為進行小批量學習時每批數據量;x(i)、y(i)分別為每批數據中第i個樣本的輸入值和目標的真實值;L(x,y,θ)為預測值與真實值之間的損失函數。

圖2 卷積神經網絡結構Fig.2 Structure of convolutional network
在各種卷積網絡結構中,GoogLeNet[9]和ResNet[10]深度卷積網絡憑借優異的性能被廣泛用于圖像識別等領域。其中,GoogLeNet網絡模型具有多尺度特征融合、學習參數少等優點。而ResNet模型通過殘差學習,有效地解決了深度神經網絡難以訓練的問題,為高精度、深層次神經網絡的構建提供了可能。后續研究者將GoogLeNet的Inception結構與ResNet的殘差結構相結合,獲得了訓練速度更快、精確度更高的Inception-ResNet卷積網絡。因此,本文基于Inception-ResNet結構的思想實現對堆芯換料方案關鍵參數的預測。網絡結構如圖3所示。
圖3構建的卷積神經網絡主要分成3大部分:信息初步處理、Inception-ResNet結構和特征整合輸出。其中,信息初步處理部分由Inception-ResNet結構前的卷積層和平均池化層構成,用于處理和提取輸入圖像特征形成新的特征圖;Inception-ResNet結構部分由3個Inception-ResNet結構構成,每個Inception-ResNet結構由子網絡結構-A、網絡結構-B和網絡結構-C組成,這3個子結構均采用了不同尺寸和不同數量的卷積核,以便提取和匯聚不同的非線性特征,網絡結構-B還用了ResNet的“短接”思想,即輸入與輸出直連,以解決網絡深度增加時產生的訓練困難和網絡退化現象;特征整合輸出部分則由全局平均池化層和4層全連接層構成,用于對Inception-ResNet結構部分輸出的特征圖進行特征整合、變換并輸出評估指標。
信息初步處理部分對輸入的1/4堆芯組件布置特征圖像進行各通道方向上的特征整合和特征初步提取形成新的特征圖,然后Inception-ResNet結構部分對新的特征圖進行逐層特征提取、抽象化以及融合形成高度抽象化的方案特征圖。最后,特征整合輸出部分對抽象化后的特征圖在各通道維度上進行特征整合并經過全連接層的特征變化輸出堆芯換料方案的評估預測指標。此外,為防止數據特征在前向傳播過程中出現偏移,導致訓練收斂速度變慢,激活函數采用梯度下降效率高的ReLU(線性整流單元)函數,并在卷積層和激活函數之間進行批標準化操作[11]用于加速神經網絡訓練、降低對參數初始值的依賴程度。
在堆芯換料過程中,組件的關鍵特征參數包括富集度、燃耗深度、歷史可燃毒物棒數和經歷的循環數。因此,本文選取這4個特征參數作為神經網絡的輸入物理量,并基于我國某二代改進型壓水堆第2循環,利用前述換料限制條件隨機生成60 000個不重復的換料方案。以其中1個換料方案為例,其神經網絡輸入可視化效果如圖4所示,其中不同顏色深度代表不同取值大小。
如圖4所示,每個堆芯換料方案對應于1個8×8×4的方案張量x,該方案對應的評估參數y由壓水堆燃料管理程序SPARK[12]計算獲得,并將其作為參考結果用于參數預測的檢驗。
使用SPARK程序完成對生成的60 000個方案的數值計算,由此獲得數據集D={(x1,y1),…,(x60 000,y60 000)}。將數據集中的數據隨機打亂,然后按照12∶1∶2的比例將數據集依次切分成訓練集、驗證集和測試集。其中訓練集數據用于神經網絡的訓練,驗證集數據用于超參數的調優,測試集數據不參與訓練和驗證,僅用于最后評估模型泛化能力。數據集在使用前,為消除數據量綱影響,以加速神經網絡訓練并且提高精度,需對數據集中所有數據做歸一化處理。本文采用Min-Max歸一化方法對各物理量進行處理后,數據輸入格式仍如圖4所示,其公式如下:
(4)
式中:xnorm為歸一化處理后的數據;xdata為原始數據;xmin為數據中的最小值;xmax為數據中的最大值。
Adam算法[13]結合了RMSProp算法和AdaGrad算法[14]的優點,對超參數的選擇具有一定的魯棒性,可實現參數空間的高效搜索,故參數的更新算法采用Adam優化算法,算法中用于矩估計的指數衰減速率參數β1和參數β2分別設置為0.9和 0.999,學習率設置為0.001。實驗采用小批量訓練方法,每次從訓練集中隨機抽取一小批量數據進行訓練,當訓練集中所有數據被使用1次后稱為1輪訓練。

圖3 堆芯換料參數預測網絡結構Fig.3 Network structure of predicting core refueling parameter
對于訓練過程中的模型評價指標和損失函數,實驗采用相對誤差作為實時評價指標,選用均方誤差(MSE)作為損失函數,損失函數公式如下所示:
(5)


圖4 卷積神經網絡輸入量可視化Fig.4 Visualization of convolutional neural network input
神經網絡的訓練基于TensorFlow2.1.0工具包[15],整個實驗在RTX 2060顯卡上完成,實驗設定批數據量為100,每次抽取前隨機打亂。訓練過程相關指標變化如圖5所示,其中均方誤差損失函數將轉化成均方根誤差(RMSE)以方便展示。
由圖5可知,訓練過程中未出現訓練集和驗證集的預測精度明顯分離的過擬合現象,模型能快速收斂,這是因為批標準化方法的引入有效地緩解了深度神經網絡各層輸出結果偏向分布的情況,提高了深度神經網絡的訓練效率,同時它還向神經網絡訓練過程引入了噪聲,起到了網絡正則化效果,有效地抑制了過擬合現象。當訓練到第65輪之后,模型的精度基本收斂,因此在第71輪停止模型訓練并保存其相關參數。
用測試集中的8 000個方案對訓練好的神經網絡進行泛化能力評估。測試結果表明,平均每個方案的預測用時為0.000 5 s。各誤差范圍內方案所占比例分布如圖6所示。
從圖6可知,在預測的8 000個方案中,99.22%的堆芯臨界硼濃度誤差絕對值在3.0 ppm以內,平均誤差為0.86 ppm,最大誤差為6.3 ppm;99.76%的功率峰因子的相對誤差絕對值在3%以內,平均相對誤差為0.54%,最大相對誤差為3.9%;99.87%的核焓升因子的相對誤差絕對值在3%以內,平均相對誤差為0.38%,最大相對誤差為4.7%。此外,對該機組實際采用的第2循環換料方案進行預測結果對比驗證,其結果列于表1,誤差均在工程要求范圍內,這說明模型預測可靠性較高。

圖5 神經網絡相關訓練指標變化Fig.5 Changes of network parameter during training process

圖6 預測結果統計分布Fig.6 Statistical result of network prediction

表1 預測結果對比Table 1 Comparison of prediction results
本文基于Inception-ResNet的卷積網絡結構,提出了反應堆換料方案堆芯關鍵參數快速預測方法。通過在我國某二代改進型壓水堆上的數值實驗表明,本文提出的預測方法具有非常高的預測精度和效率,能減少換料方案優化過程中的人員時間投入,具有非常好的應用前景。作為下一步的研究計劃,擬將結合換料方案優化方法,開展快速堆芯換料方案優化相關的研究。