許霖風一, 偶國富, 金浩哲
(浙江理工大學 流動腐蝕研究所, 浙江 杭州 310018)
隨著原油資源趨緊,石油化工企業進口含硫和高硫劣質原油比例的逐年增加,延遲焦化成為當今煉油廠渣油尤其是劣質渣油處理的主要方式[1]。但是焦化裝置腐蝕環境不斷惡化,設備、管線的硫腐蝕已經成為影響焦化裝置安穩、長周期運行的主要危害之一[2]。延遲焦化裝置處理原料的硫含量過高,裝置內部管線的濕H2S腐蝕和高溫硫腐蝕已成腐蝕防控重點對象。劉宏波等[3]研究了單相流和多相流中的H2S電化學腐蝕與應力腐蝕開裂,得出了不同H2S濃度下N80鋼的腐蝕規律;Sun等[4]用玻璃細胞實驗分析了X65碳鋼在高、低H2S濃度下形成的表面腐蝕產物,證明不同濃度的H2S會形成不同的金屬表面腐蝕產物;王軍等[5]針對我國高硫原油大型煉油廠設備的H2S腐蝕展開研究,分析了H2S腐蝕的主要影響因素并提出了相關的防護措施。
濕H2S與高溫硫腐蝕的腐蝕速率都與管線內的H2S濃度密切相關,焦化裝置處理原料硫濃度較大,運行過程中產生的H2S在管線死區堆積,與富含水氣的管道發生化學反應,因此裝置受到嚴重的濕H2S腐蝕危害。但是目前尚缺少測量封閉管道內部H2S濃度準確、實時的傳感器;另外,石化企業現場工況運行數據庫的大量歷史數據尚未得到信息挖掘和有效利用。在工業環境中,廣義線性模型如邏輯回歸、偏最小二乘回歸(PLSR)被廣泛應用于過程變量的預測[6],因為此類模型輸入直接,結構簡單,可擴展性強,所以有快速的計算能力與特征保持功能。但是化工現場過程數據往往是高度非線性相關的,PLSR等線性模型無法處理變工況復雜環境下的高度非線性數據[7],而神經網絡在處理非線性數據方面有一定的優勢,如典型誤差反傳神經網絡(BPNN),已被廣泛應用于分類、預測[8]、回歸等領域,然而BPNN算法權重更新較慢,且易陷入局部最小誤差。
因此筆者采用一種單層前饋神經網絡——隨機權神經網絡(RVFLN)作為基礎算法進行優化,提出了小規范權重內隨機權神經網絡(SNRVFL)的數據驅動方法,并集成分析工業現場分布式控制系統(DCS)、實驗室信息管理系統(LIMS)等數據庫長期運行下的歷史數據,建立關于H2S濃度的實時預測模型。最后在前期研究的基礎上,通過分析延遲焦化系統的工藝流程,研究裝置開工線管道的硫腐蝕機理,建立一種基于隨機權神經網絡算法的H2S濃度預測模型,模型的測試效果良好,適用于延遲焦化開工線的H2S濃度預測,為裝置內壓力管道的智能腐蝕防控與腐蝕風險評估提供數據基礎。
某煉油廠2#延遲焦化裝置原料為減壓渣油,其流程如圖1所示。首先原料經過換熱器(E-101A-F)換熱后,進入原料油緩沖罐(D-101),然后由原料油泵(P-101A/B)抽出,經換熱器(E-105A-F)換熱后(301℃)與焦化分餾塔底循環油(360℃)混合(318℃)進入加熱爐進料緩沖罐(D-102)。然后由加熱爐進料泵(P-102A/B)抽出進入焦化加熱爐(F-101A/B)并加熱至500℃,再經過四通閥進入焦炭塔(C-101A-D,圖中僅顯示C-101A/B兩裝置)底部,然后通過2臺焦炭塔進行生產。4臺焦炭塔成對操作,一臺運轉24 h后,分別經過小吹氣、大吹氣、給水、溢流、生焦、清焦等工藝過程,將焦炭從塔底排除,焦炭塔塔頂的氣流繼續進入分餾塔完成循環。停工再生產時,原料通過四通閥從焦炭塔塔底和開工線同時進入塔內進行預熱,其余工況下物料均從焦炭塔底進入。
開工線僅在停工生產時輸入進料預熱,其余工況下混雜著一定濃度H2S的氣體均滯留在開工線管道頂部無法排除,故開工線頂部(圖1中紅框部分)是焦化裝置腐蝕程度最嚴重的區域。停工檢修時拍下的開工線內濕H2S腐蝕形貌圖如圖2所示。
裝置在給水、吹起、溢流、清焦等工藝過程中會產生大量水氣,且開工線內部溫度長期處于30~120℃之間,在此種低溫、潮濕環境下,高濃度的H2S極易引起設備管線的低溫濕H2S腐蝕,腐蝕反應總化學式為:
xFe+yH2S→FexSy+yH2
(1)

圖1 延遲焦化裝置工藝流程圖Fig.1 Flow chart of the delayed coking plant1—Heat exchangers E-101A-F;2—Feed buffer tank D-101;3—Feed pumps P-101A/B;4—Heat exchangers E-105A-F;5—Furnace feed buffer tanks D-102;6—Furnace feed pumps P-102A/B;7—Furnaces F-101A/B;8—Coke drum C-101A;9—Coke drum C-102A;10—Fractionator T-101;11—Recycle oil pumps P-103A/B

圖2 延遲焦化裝置開工線內壁腐蝕照片Fig.2 Picture of corroded start-up pipeline inner wall of a delayed coking unit
電離過程:
Fe→Fe2++2e-, H2S→HS-+ H+
(2)
腐蝕反應式:
HS-+Fe2+→FeS↓+H+, 2H++2e-→H2
(3)
當液相介質呈現一定酸性時,FeS保護膜會被破壞,設備材料表面重新暴露易腐蝕環境中,促進了氫去極化腐蝕反應[9]:
Fe2++H2S→FeS↓+2H+
(4)
這些反應產生的氫離子容易滲入金屬內部四處擴散,當遇到氫陷阱(如在晶界或相界上缺陷、位錯、三軸拉伸應力區等)時,堆積增多的氫離子會重新結合生成氫氣,引起陷阱處的高氫壓力,使金屬在內部產生細微裂紋,進一步加劇腐蝕。
根據以上分析,操作人員根據開工線內部溫度以及H2S濃度來對設備進行腐蝕防控是可行且必要的,但由于濕H2S腐蝕機理復雜,焦化流程冗長且工況變化頻繁,封閉管線內部難以測量,操作人員無法根據實時變化的H2S濃度采取相關防腐措施,因此建立開工線內H2S濃度的實時預測模型具有重要意義。
焦化裝置開工線內H2S濃度受眾多工業過程變量的影響,如果將裝置所有相關的過程數據作為模型的輸入,會造成大量數據信息的冗余,高維度的輸入變量將會大大增加算法的計算量,影響數據的使用效率和運算速率。主成分分析法(PCA)對于處理高維非線性相關數據有較好的表現。因為實際工業相關數據中總是存在噪聲擾動,且高維度的過程變量之間通常存在一定相關性,相關變量之間所反映的某一信息就會有所重疊。因此PCA通過正交變換將原先收集的所有變量,轉化為一組線性不相關的變量,特征值大的相關成分被認為是有效的主要成分,小特征值的相關成分代表信息中的噪音,然后刪除多余重復的變量(關系緊密的變量),建立盡可能少的新變量,從而將獲得的低維主要成分來代替原始變量,達到過濾噪聲、減小維數的目的[10-11]。PCA作為基礎的數學分析方法,在此不再展開介紹。
而在回歸領域中,皮爾遜相關系數(r)通常被采用,表示輸入和輸出之間的相關性。分析兩者之間的關系時,篩選相應特征作為模型的輸入,其公式見式(5)。
(5)

為了降低模型維度,減小計算量,提高運算速率,可采用主成分分析法對4組不同焦炭塔的H2S濃度進行降維,提取主特征;然后用皮爾遜相關系數篩選與輸出相關性大的過程變量,作為模型的輸入。筆者采取工業現場DCS、LIMS數據庫中某一段時間內(大于延遲焦化裝置的生產周期)的焦化裝置實際生產數據,根據延遲焦化裝置實際運行工況,計算了數據樣本中各類數據特征與H2S濃度之間的皮爾遜相關系數,結果如表1所示。

表1 各影響因子與H2S濃度間相關系數(r)分析Table 1 Correlation analysis between correlation coefficient(r) and H2S concentration
T—Temperature;p—Pressure;F—Flow;φ—Volume fraction;TR—Distillation range;OG—Oil gas line;SL—Start-up line;TT—Top of coke drum;TI—Tower inlet;OF—Overflow line;DG—Dry gas;LG—Liquefied gas;R—Residuum;WO—Wax oil;DO—Diesel oil;P—Petrol
由表1可知,開工線溫度、開工線壓力、干氣H2S體積分數、干氣流量、液化氣H2S體積分數、液化氣流量、油氣線總管流量、油氣線總管溫度這8個因子的相關系數絕對值明顯要大于其余影響因子,證明開工線內H2S濃度受此8種因素的影響最大,且開工線溫度一項與H2S濃度的相關系數為負值,說明在低溫情況下H2S濃度反而較高,H2S管道的腐蝕程度也隨之上升,與案例實際腐蝕情況相符。
RVFLN是一種單層隱層前饋網絡(SLFN),最早由Pao和Takefuji于1992年[12]在函數鏈接型神經網絡(FLNN)的基礎上[13]提出的,其性能已經在各種應用領域得到證實。與典型3層BP神經網絡不同,RVFLN的輸入層經過拓展后形成新的隱含層,和原始輸入一起作為新的輸入集進行模型訓練[14]。M維輸入X=[x1,x2,…,xM] 和L維輸出Y=[y1,y2,…,yL]的RVFLN結構如圖3所示。
圖3中iM、hK、oL分別為輸入層、隱含層、輸出層各層節點的值,輸入層原始輸入變量X=[x1,x2,…,xM]經過附著隨機權重后,得到第k個隱含層拓展節點的值為:
(6)
式(6)中,hk表示第k個隱含層拓展節點的輸出值;wmk是連接第m個輸入層節點到第k個隱含層節點的權重;bi,k是第k個隱含層節點的輸入偏置;fk是第k個隱含層節點的非線性拓展函數,其一般使用sigmoid邏輯函數、三角多項式[15]以及切比雪夫多少項式[16]等,sigmoid邏輯函數如式(7)所示。
(7)
在隨機權神經網絡中,wmk、bi,k均在模型初始化時隨機產生且固定不變,無須進行更新。Bartlett[17]和Huang等[18]指出,相較輸入特征直接放入模型用于進行算法訓練,給輸入附著上[0,1]小規范內的權重會使算法有更好的泛化性能,本文中的wmk、bi,k均取[0,1]內的隨機數。結合輸入與隱含層節點的輸出,則圖3中輸出層節點的值(yl)可以表示為:
l∈{1,2,…,L}
(8)
式(8)中,wml、wkl分別為輸入層、隱含層到輸出節點的權重系數;bi,l、bh,l為第l個輸出節點的輸入層、隱含層偏置;g為輸出層節點激活函數,筆者采用sigmoid邏輯函數。由于輸入層到隱含層的權重無需更新,將輸入層和隱含層的節點均視為模型輸入,式(8)可簡寫為:
(9)
因此,為了使算法達到預置誤差要求,只需要更新輸出層的連接權重wj以及輸出節點的偏置bl即可,保證了模型的計算速率。
在經過PCA降維和相關性因子的選取后,建模的具體步驟如下:
(1)首先采用離差歸一化對樣本數據歸一化:
(10)
式(10)中,S為原始樣本集;Smax、Smin是樣本S中每列特征數據最大值、最小值組成的矩陣;Sample表示歸一化后的樣本數據集。然后將樣本隨機地分成訓練集Str、驗證集Sva和測試集Ste,訓練集用于模型訓練,驗證集用于網絡隱含層節點數選取,最后測試集用于評估模型的性能。
(2)隨機產生一組[0,1]之間的拓展權重,連接輸入層節點與隱含層節點;然后將隱含層視為拓展節點,與原始輸入一起構成最終的輸入矩陣I。
(3)初始化輸出層權重W在[-1,1]區間內。
(11)
與實際輸出間的誤差記為E,

(12)
(5)用誤差反傳的方法更新權重W,l是模型的學習率,取l=0.7:
(13)
式(13)中,Wold表示更新前的權重矩陣;Wnew表示更新后新得到的權重矩陣。
(6)判斷更新后的權重是否達到誤差要求,如果達到,記下當前權重,模型建立完成;如果未達到,則繼續進行第(4)步至第(5)步,直到模型滿足要求。
由于4臺焦化塔成對操作流程一致,此章節僅以C-101A焦化塔為考察對象作為示范,建立塔C-101A內的H2S濃度實時在線預測模型。結合2.1節中的影響因子相關系數分析,選取了8個相關性較大的影響因子作為模型的輸入變量,分別為C-101A開工線溫度、C-101A開工線壓力、出口干氣H2S體積分數、出口干氣摩爾流量、出口液化氣H2S體積分數、出口液化氣摩爾流量、油氣線總管流量、油氣線總管溫度;輸出變量為焦化塔C-101A開工線的H2S濃度。其中輸入數據的過程變量均可從現場DCS和LIMS數據庫中采集得到,模型輸出變量H2S濃度數據來自課題組前期開發的測量軟件,部分歷史數據如圖4所示。

圖4 現場測量軟件焦化塔管線內H2S質量濃度變化曲線圖Fig.4 Real historical curve of H2S mass concentration in the coking drum pipeline by field measurement software
為了保持輸入輸出的頻率一致,以輸出變量H2S為最低采樣頻率,從現場數據庫中獲取了一段時間內同時刻的4000組輸入、輸出作為數據樣本,然后利用數據樣本根據2.3節中所給的步驟建立預測模型。采取均方根誤差(RMSE)衡量算法模型,對于H2S濃度的預測精度進行計算,見式(14)。
(14)

當隱含層激活函數選為sigmoid函數時,為了確定隨機權神經網絡最優的隱含層節點數,需要用訓練集和驗證集對算法不同隱含層節點下的擬合程度進行模擬,計算各個隱含節點時算法的最終誤差,模型的誤差隨隱含層節點數的變化關系如圖5所示。
從圖5可知,當隱含層節點小于24時,驗證集誤差和測試集誤差均隨隱含層節點數增加而減小,在此區域算法屬于欠擬合狀態。而在隱含層節點大于24之后,雖然訓練集的誤差依然緩慢變小,但驗證集的誤差開始逐漸增大,模型趨于過擬合狀態,因而確定模型隱含層節點數為24時可取得較好的建模效果,可避免節點過少時的擬合程度欠佳與隱含節點數過多導致的過擬合且降低工作效率,最終建立8-24-1的隨機權神經網絡模型。

圖5 SNRVFL模型H2S濃度訓練集誤差與驗證集誤差隨隱含層節點數的變化關系Fig.5 Variation relationship between errors of the H2S concentration train dataset, validation dataset and numbers of hidden nodes with SNRVFL model
為了驗證所得SNRVFL算法模型在預測焦化裝置開工線H2S濃度方面的快速性與準確性,將建模效果與偏最小二乘回歸(PLSR)、支持向量回歸(SVR)、BP神經網絡(BPNN)進行比較。對比PLSR、SVR、BPNN 3種常用算法模型,測試集的H2S濃度分布計算效果模擬分布圖和殘差值如圖6所示。由圖6可知,顯然SNVRFL模型的H2S濃度預測曲線擬合度最高,PLSR因為處理非線性數據能力較差,預測曲線波動幅度最大,不太適合于H2S濃度的準確預測。對比4種算法的殘差值,SNVRFL前65個測點的殘差在[-1.5,1.5]之間,均在0誤差標準線附近,說明該種算法的預測值最接近運行工況實際值,其預測性能最佳。

圖6 H2S濃度測試集在PLSR、BPNN、SVR、SNRVFL 4種算法下的模擬分布圖和殘差圖(前65個測試點)Fig.6 Analog distribution and residuals for H2S mass concentration testing dataset from PLSR, BPNN, SVR and SNRVFL algorithms (first 65 test points)(a) Analog distribution; (b) Residuals
從算法結構上說,SNRVFL與BPNN均屬于需要更新權重的神經網絡,由于SNRVFL輸入層到隱含層的權重是小范圍內([-1,1])隨機確定的,因而只需要更新鏈接輸出層與其上一層之間的權重即可,迭代速率明顯快于典型的3層BPNN,其比較結果如圖7所示。
最后為了證明算法在精度與速率方面的優勢并非偶然性,隨機打亂初始樣本重新分配訓練集與測試集(交叉驗證),用SNRVFL、PLSR、SVR、BPNN 4種算法模型分別模擬10次,計算各自均方根值(RMSE)與運行時間,結果見表2。

圖7 BPNN與SNRVFL迭代速率比較(隱含層節點數均為24) Fig.7 Comparison of iteration speed between BPNN and SNRVFL(24 hidden layer nodes)

OrderRMSECalculation time/msPLSRSVRBPNNSNRVFLPLSRSVRBPNNSNRVFL111.3757.3758.1077.1341391360413629.7687.5966.9637.05914876592130310.3247.4557.8386.89116924625127410.7897.7418.3247.17711967613284512.0408.1948.2657.35113893587134610.1977.4307.7296.72914901682141711.0067.1627.9147.58214928601135811.9147.8788.4867.23115913579133910.7627.4299.0597.109129576101621012.3077.9387.8027.17813864599149Average11.0487.6208.0497.14414914609153
綜合圖6~7與表2可以看出,SNRVFL較其他3種算法有更好的預測能力和泛化性能,在計算精度上,SNRVFL10次預測的均方根誤差平均值為7.1441,是4種算法模型中最小的,說明SNRVFL對該工況下的H2S濃度預測最精準;而且SNRVFL模型的運算速率也明顯要快于SVR和BPNN,說明SNRVFL模型處理非線性數據的能力很好且有快速實時的預測速率。因而SNRVFL模型的準確快速與全面性使其可用于焦化系統開工線內H2S濃度的在線實時預測。
針對煉油企業延遲焦化裝置管線硫腐蝕嚴重的問題展開研究,分析確定延遲焦化裝置開工線內腐蝕原因為低溫濕H2S腐蝕,基于SNRVFL優化算法建立了延遲焦化裝置開工線內H2S濃度的預測模型,首先對現場DCS、LIMS數據庫采集的各種數據特征進行降維預處理,對比影響因子相關系數大小,結合濕H2S腐蝕機理,提取了影響開工線內H2S濃度的主要因素。然后為提高算法的非線性能力與泛化性能,對特征變量附著小范圍內隨機權重并引入非線性函數拓展模型的輸入特征,用誤差反傳算法對輸出權重進行更新。計算結果表明,與其他算法比較,SNRVFL誤差收斂速率快,運算速率良好(僅次于PLS),預測精度高且具有較好的泛化性能。SNRVFL算法模型效率、準確且全面,故認為此方法可作為延遲焦化裝置開工線內H2S濃度的智能預測模型。