劉 鋼,李曉東,金軼群,劉 川,羅智斌,謝宙樺,馮鐵玲,黃善鋒
(1.中電四會熱電有限責任公司,廣東 四會 526242;2.西安熱工研究院有限公司,陜西 西安 710054)
工業循環冷卻水在鋼鐵、電力、化工等工業生產過程中發揮著重要的作用,占據了工業用水的50%以上[1-2]。然而,在工業循環冷卻水運行的過程中,循環冷卻水在大氣、凝汽器等換熱器中頻繁循環使用,不斷蒸發濃縮導致循環冷卻水的pH值、堿度、硬度和濃縮倍率等水質指標發生變化,使得循環冷卻水系統存在腐蝕、結垢等問題,導致發電系統的換熱效率下降或腐蝕,影響機組正常運行[3]。因此,對工業循環冷卻水系統運行狀態進行預測并及時處理,就成為火力發電等工業領域中的重要問題[4-5]。為此,本文提出了一種基于深度卷積神經網絡(convolutional neural network,CNN)的循環水系統運行狀態預測方法,該方法根據工業循環水水質特征,搭建了深度卷積神經網絡,該網絡由3個卷積層、3個池化層、2個全連接層組成。深度卷積神經網絡通過多層卷積對水質數據特征進行提取,從而對循環水系統運行狀態進行分類。實驗結果表明,深度卷積神經網絡在工業循環水系統運行狀態預測分類中能達到94%的識別率,具有較強的泛化能力。對解決循環水系統運行狀態預測問題具有重要的意義。
循環冷卻水系統的安全穩定運行對水質等指標有著嚴格的要求,各水質等指標相互關聯,共同作用形成循環冷卻水系統各種運行狀態[6-8]。循環水系統的運行狀態通??煞譃榻Y垢、結垢風險大、腐蝕、腐蝕風險大、殺菌劑過量、抑菌效果差、排放風險大、排放超標、黏泥大和達標10個類別。一旦發現循環冷卻水系統運行狀態不正常如結垢等需及時處理,對循環水運行方式采取措施進行調整,避免影響正常的工業生產。
然而,循環水系統運行狀態無法直接檢測,需利用可測的水質指標進行預測。目前,可測指標主要有18個:pH值、有機磷、酚酞堿度、全堿度、氯離子、余氯、濁度、濃縮倍率、COD、正磷、總磷、硬度、鈣離子、鎂離子、阻垢劑含量、進口水溫、出口水溫、乏汽溫度。在這些指標中,大部分指標之間存在著相互聯系,部分運行狀態與主要指標之間的關系如圖1所示。結垢狀態受多種因素影響,而阻垢劑又在一定程度上同時影響Ca2+、有機膦、腐蝕速率和碳酸鈣垢的形成等,同時碳酸鈣垢又受溫度、Ca2+、有機膦等影響,多種因素呈鏈式影響,并能反映某種運行狀態的情況。

圖1 水質指標關系Fig.1 Relationship diagram of water quality indicators
由圖1可見,若利用主成分分析法(principal components analysis,PCA)對這些指標進行特征提取,會失去一部分原有的數據特征,影響循環冷卻水系統運行狀態預測的準確率[9-10]。而深度卷積神經網絡具有自動抽取數據特征的優點,因此,本文為了完整的保存整個數據特征,提出了基于深度卷積神經網絡的循環水系統運行狀態預測方法,利用循環水冷卻水質等數據的測量值,預測循環冷卻水系統運行狀態。
本文提出的基于深度CNN循環水系統運行狀態預測方法框架如圖2所示。利用卷積神經網絡可以自動提取數據特征和多輸出的特性,將數據直接導入神經網絡進行輸出分類[11]。針對數組數據進行的卷積神經網絡可以參考圖像數據的處理思路,其中循環水水質的18個可檢測指標作為卷積神經網絡的輸入,循環水系統運行狀態的10個類別作為卷積神經網絡的輸出。

圖2 循環水系統運行狀態預測流程Fig.2 Flow chart of operation state prediction for the circulating water system
卷積神經網絡模型示意如圖3所示。由圖3可見,同樣利用卷積核在數據段上的平移卷積進行特征信息的抽取,得到1個一維的特征矩陣,其表達能力強于原始的數據段[12-13];然后對抽取的信息進行池化下采樣,即卷積核在數據段上的平移,池化也是通過在特征信息段上的平移來完成。這里應用最大值池化即對所選中的池化窗口中的數據保留其中的最大值,在保持分類準確率的前提下拋棄部分參數以減少過擬合風險[14]。

圖3 卷積神經網絡模型示意Fig.3 Schematic diagram of the convolutional neural network model
由Alexander Waibel提出的卷積神經網絡在Lecun等人[15]的完善中實現了多層網絡訓練,其復雜度相較于全連接神經網絡更低,運算的參數也更少。卷積神經網絡結構如圖4所示,可以分為輸入層、卷積層、池化層、輸出層[16],其中卷積層和池化層的局部連接。權重共享和池化層的池化下采樣是卷積神經網絡的特點,可有效縮減全連接神經網絡容易過擬合的特性,不對數據中某個數據特別依賴,更全面的對信號進行采樣和特征提取。

圖4 卷積神經網絡結構Fig.4 Architecture of the convolutional neural network
由圖4可見:數據通過輸入層進入卷積層后通過卷積核的不斷平移對原始數據進行特征抽取,由于每次只關注卷積核大小的部分區域就達到了局部連接的效果;然后通過池化下采樣拋棄樣本數據中不重要的數據減少參加運算的參數,有效防止過擬合的發生;最后數據流向全連接層也就是輸出層進行數據權重的匯總并得出輸出結果。
本文提出的卷積神經網絡包含1個輸入層、3個卷積層和3個池化層,最后經過全連接層后進行輸出分類。
模型中各神經元的具體關系如圖5所示。神經元之間相互連接,為了避免整個網絡過度依賴某個神經元即某個特征而形成過擬合,在每層網絡中加入Dropout層隨機使部分神經元不工作,在訓練時這些神經元以某一設定的概率保留,而每次前向通道中工作的神經元都是隨機篩選的,從而減少了訓練過程中對某個或某些神經元的過分依賴。輸出估計值經過softmax層進行優化后進行最終的輸出[17]。

圖5 神經網絡結構Fig.5 Neural network structure
在輸出環節使用交叉熵即損失函數作為評價指標,輸出的預測值通過softmax層進行計算后確定多分類的概率,再利用這個概率進行交叉熵的計算,得到具體的損失函數結果后進行優化從而確定分類的輸出結果。交叉熵和softmax的計算公式為:

式中:p為期望概率輸出;q為實際概率輸出。
在原始數據放入神經網絡訓練之前必須對數據進行處理,以便神經網絡能更高效地處理數據并達到收斂,數據處理過程步驟如下。
1)獲取數據 本文選取水質pH值、總堿性、COD等18個循環水檢測指標作為數據輸入,將相對獨立的10個循環水系統運行狀態和5個目標值,分批次進行獨立訓練。
2)選取研究對象 在數據整理過程中發現循環水水質的結垢腐蝕問題在所有的目標類別中最為突出,數據也相對比較完善,故把結垢腐蝕問題作為本文主要研究對象。
3)劃分數據集 對采樣的數據集進行標記后以7:3比例劃分為訓練集和測試集(即70%的數據用來訓練模型,30%的數據用來測試模型的準確程度),能較有效地保證模型的效果展示。

4)歸一化處理 對數據進行歸一化處理使得各特征處于同一規格,方便后續權重的計算等。歸一化處理公式為:式中:XNi為歸一化結果,其值為[0,1]。以上均為數據預處理部分,之后則將數據輸入到深度卷積神經網絡進行模型搭建。
該實驗數據由某電廠現場采集獲得,部分主要水質指標數據見表1。由于數據量較大,表1只展示了部分數據。

表1 循環水部分水質數據Tab.1 Circulating water quality index data (part)
對數據進行歸一化等預處理后將其劃分為訓練集(70%)與測試集(30%),訓練集用來訓練神經網絡參數,測試集用來測試神經網絡泛化能力。
在訓練中不同的層數和卷積核對模型影響很大,在經過多次模型參數調整后考慮模型復雜度確定了3層深度卷積神經網絡模型,并經過反復實驗可以確定相對較優的超參數和卷積核大小見表2。

表2 卷積神經網絡模型超參數設置Tab.2 Hyperparameter setting of the convolutional neural network model
此次實驗在Python環境下實現,在將循環水所有數據重復1 000次輸入網絡對模型參數進行訓練后獲得最終實驗結果。圖6和圖7分別為BP神經網絡和本文提出的方法在同一訓練集和測試集數據上的表達曲線。

圖6 BP神經網絡模型訓練與測試結果Fig.6 Training and testing results of the BP neural network model

圖7 卷積神經網絡模型訓練與測試結果Fig.7 Training and testing results of the convolutional neural network model
由于循環水數據同時存在多種狀態類別故將其分為5個相對獨立的批次,分別進行模型的訓練,具體有10個情況類別。表3為應用本文方法和BP神經網絡對于10類情況識別的多次訓練平均結果。由表3可見,無論是結垢還是腐蝕或是其他幾類情況,本文方法的識別準確率均優于BP神經網絡。由上述結果可得,本文所提出的基于深度卷積神經網絡的循環水系統狀態識別方法在不需要人工提取特征的前提下,有效解決了數據指標較多時自動提取循環水系統特征并對狀態進行多分類的問題。
目前,工業循環水水質狀態的判斷大多基于現場運行人員經驗進行判斷,過度依賴運行人員的經驗。為提高工業循環水系統運行狀態預測的準確率,本文提出了一種基于深度卷積神經網絡的智能循環水系統運行狀態方法。該方法利用深度學習算法的優勢,在不需要人工提取特征的前提下能夠準確地預測出循環水系統運行狀態。在工業循環水數據多樣性的背景下,提高了水質類別判斷的準確性,降低了對人為判斷的依賴性,提高了工業循環水運行的穩定性。經過電廠的真實數據進行驗證,本文方法具有較好的準確率和泛化能力,對工業循環水系統運行狀態預測和維護工業生產具有重要意義。