王 杰,陳 博,劉 松,趙明洋,歐陽福生,高 萍
(1.華東理工大學化工學院石油加工研究所,上海 200237;2.中國石化上海高橋分公司)
重油催化裂化(RFCC)可以轉化成汽油、柴油等輕餾分以及部分低碳烯烴[1-2],目前在我國汽油池組成中重油催化裂化汽油約占70%[3]。由于原油中的硫元素多集中于重油餾分中,導致重油催化裂化汽油的硫含量較高,因此催化裂化汽油脫硫技術成為學者們研究的重點[4]。S Zorb技術[5-7]因具有脫硫率高、氫耗低、研究法辛烷值(RON)損失小的優點而被廣泛關注。然而,在某石化企業S Zorb裝置的實際運行過程中,精制汽油的RON平均損失高達1.35。因此,在保證汽油脫硫效果的前提下,降低其RON損失成為該裝置亟待解決的問題。
S Zorb裝置操作復雜、影響因素很多,而且各影響因素之間存在強偶聯性及復雜的線性或非線性關聯關系,因而對S Zorb工藝過程的建模模擬比較困難。人工神經網絡[8]能夠在過程機理不明或復雜情況下尋找系統過程輸入、輸出之間的關系,從而建立數據驅動模型。BP神經網絡模型是目前人工神經網絡應用最廣泛的模型之一。因此,本課題基于該石化企業S Zorb裝置近3年的運行數據,采用BP神經網絡并結合遺傳算法對S Zorb工藝過程進行建模、優化,并通過工業試驗對模型優化效果進行驗證,旨在通過模型優化操作變量而在保證汽油脫硫效果的前提下降低其RON損失。
數據預處理是指從工業裝置采集并整理出與研究目標關聯的高質量數據,為數據挖掘提供基礎;特征選擇是指從大量的物料性質變量和工藝操作變量中選取出用于建模的關鍵特征變量。
構建S Zorb裝置運行過程模型的數據主要包括原料油、吸附劑和產品的性質數據及部分操作變量數據。因此,以國內某石化企業1.2 Mt/a的 S Zorb裝置為研究對象,采集了該裝置2017年4月至2020年5月之間273個變量的數據,變量分類及其數量和名稱見表1。在本研究中,精制汽油產品的RON是模型的輸出變量,其采集頻次為2次/周,因此原料和吸附劑性質變量的取值為產品RON測定時間點對應的運行數據,而裝置操作變量的取值為RON測定時間點前后2 h的平均值。此外,因受到硫分析儀最低檢測限的制約,當硫質量分數低于3.2 μg/g時統一記為3.2 μg/g。最后,得到325組數據樣本。建模時,產品RON和產品硫含量作為目標特征變量,不進行相關性分析。

表1 數據采集的變量類別、變量數及名稱
特征選擇是指從已有特征變量中篩選出部分對目標變量影響顯著性高的變量用于構建模型。本研究采用最大互信息系數、Pearson相關系數等方法,篩選具有代表性和獨立性的建模變量。
1.2.1最大互信息系數
最大互信息系數(MIC)[9]是一種基于信息的無參數探索方式,可以用以度量兩個變量間的線性或非線性相關性,篩選出與產品RON相關性高的特征變量。MIC的取值為0~1,數值越大則表明兩個變量間的相關性越大;反之則相關性越小,甚至無關,對建模的意義也就越小。
除產品RON和產品硫含量外,對271個性質變量和操作變量數據進行歸一化處理,計算其與產品RON間的MIC,結果如表2和表3所示。

表2 性質變量與產品RON間的MIC
由表2可知:在原料和吸附劑性質變量中,變量與產品RON間MIC最大的性質變量為原料RON,說明產品RON主要是由原料RON決定的;再生吸附劑硫含量、碳含量與產品RON間的MIC較小,均低于0.1,說明其與目標特征變量的相關性很小。因此,通過最大互信息系數法篩選出原料RON、原料硫含量、飽和烴含量、烯烴含量、芳烴含量、待生吸附劑碳含量和待生吸附劑硫含量共7個性質變量作為特征變量,用于構建模型。
由表3可知,由于S Zorb裝置的操作變量多達262個,為了避免建模變量過多導致模型過于復雜,以0.3作為操作變量與產品RON間MIC的閾值,選擇變量與產品RON間MIC較大的前30個操作變量作為特征選擇的初步結果。

表3 操作變量與產品RON間的MIC
1.2.2Pearson相關分析
Pearson相關系數(r)法是被廣泛應用于描述變量間線性相關性的一種方法,其取值范圍為|r|≤1,變量間的Pearson相關系數及其相關性如表4所示。

表4 變量間的Pearson相關系數及其相關性
由表4可知:當|r|<0.4時,可以判定變量間的相關性較低,變量的獨立性較強;當|r|>0.7時,變量間的線性相關性較顯著,變量間相互影響。因此,選擇以|r|<0.7為判定界限,當變量間的|r|>0.7時,則剔除對目標變量影響小的變量。
為了減少變量的重復使用和數據冗余,針對MIC法篩選出的7個性質變量和30個操作變量,采用Pearson相關系數法分別分析性質變量間的相關性和操作變量間的相關性,以消除變量間的多重共線性問題,結果見圖1和圖2。

圖1 性質變量間相關性分析

圖2 操作變量間相關性分析
由圖1可知:在性質變量中,飽和烴含量與烯烴含量之間的|r|=0.93,說明二者之間高度線性相關;雖然飽和烴含量、烯烴含量與產品RON的MIC分別為0.314 6和0.257 0,前者大于后者,但根據文獻[10-12]可知,原料烯烴含量對產品辛烷值損失有較大影響,這是因為在加氫精制過程中,烯烴加氫飽和反應是造成產品RON損失的直接影響因素。因此,選擇烯烴含量作為模型的特征變量。
由圖2可知,在操作變量與產品RON間的MIC較大的前30個操作變量中,許多變量間存在高度線性相關性。為防止操作變量間的多重共線性對模型預測過程的影響,需要選擇線性相關性較弱且較容易調節的變量作為輸入特征變量來建立模型。因此,根據操作變量間的相關性分析結果,選擇14個操作變量、7個性質變量為模型輸入特征變量,以產品RON為輸出變量,來構建S Zorb裝置運行模型,結果見表5。

表5 建模變量篩選結果
BP神經網絡[13]是一種多層前饋型網絡結構模型,分為輸入層、隱含層(一層或多層)、輸出層。數據從輸入層輸入,經激活函數變換后進入隱含層,并依次計算進入下一隱含層,直至到達輸出層;同時其誤差也會反向傳遞不斷更新權值和偏置,直至預測結果滿足精度要求為止。
BP神經網絡應用最廣泛的激活函數是ReLU函數[14],如式(1)所示。
ReLU(x) = max(0,x)
(1)
ReLU函數在計算過程中不僅能減小計算量、降低網絡密度,還能緩解數據過擬合現象。
2.1.1隱含層
隱含層神經元的數目是BP神經網絡關鍵因素之一。神經元數目過多,則模型運算時間過長,樣本容易出現過擬合現象;反之,則模型不能很好地學習。因此,建立BP神經網絡模型必須先確定隱含層神經元的數目。其計算經驗式[15]如式(2)所示。
(2)
式中:H是隱含層神經元的數目;m為輸入層神經元的數目;n為輸出層神經元的數目;L是一個可調節的常數,調節區間為 1~10。
將輸入變量和輸出變量的數量代入式(2),可得隱含層神經元數為4~15。因此,可建立21-Y-1結構三層神經網絡模型(Y為4~15),然后將數據樣本導入該模型,在相同的初始權值、偏置和參數下進行模型訓練,計算并比較每個模型運算結果的均方誤差(MSE),結果見表6。當訓練結果MSE最小時,隱含層神經元數即為最佳隱含層神經元數。從表6可知,模型隱含層神經元數目為14時,模型訓練結果的MSE最小,因此產品RON預測模型的最佳三層網絡結構為21-14-1。

表6 隱含層神經元數量與訓練結果MSE的關系
2.1.2BatchNormalization層
Batch Normalization層[16](簡稱BN層)的作用在于保持神經網絡每層的輸入分布盡可能相同,從而加速模型收斂、提高模型的泛化能力。在神經網絡每層輸入前添加BN層進行預處理,可將每層輸入轉換為均值為0、方差為1的標準正態分布;同時,為了增強網絡的表達能力,可通過網絡參數γ和β對該標準正態分布進行縮放和平移,參數γ和β可在網絡訓練過程中由自動學習得到。
將325組數據樣本按照4∶1分為訓練集和測試集,得到260組訓練集數據樣本和65組測試集數據樣本。采用建立的BP神經網絡模型對訓練集樣本和測試集樣本進行模擬運算,分別得到訓練集和測試集的預測結果。BP神經網絡模型的結構和運算參數如表7所示;訓練集和測試集的擬合效果如圖3所示;預測值與實際值的MSE、平均絕對誤差(MAE)、以及預測值與實際值擬合曲線的決定系數(R2)見表8。由圖3和表8可知,訓練集和測試集的MSE和MAE均較小,且二者相近;預測值與實際值擬合曲線的R2均接近1。這說明所建BP神經網絡模型具有良好的預測效果。

表7 BP神經網絡參數

圖3 BP神經網絡模型預測值與實際值的擬合效果★—訓練集; ■—測試集

表8 所建BP神經網絡模型的評價結果
在所建BP神經網絡模型的基礎上,針對具體原料性質不同,可采用智能優化算法優化操作變量,在保證脫硫效果的前提下減少產品RON損失,為S Zorb裝置生產提供指導。在汽油的國Ⅵ標準中,硫質量分數的限制為不大于10 μg/g,為了使裝置在硫含量控制上有較大空間,本研究設定硫質量分數的限制范圍為0~5 μg/g。
目前,應用較廣的智能優化算法主要包括粒子群算法(PSO)、遺傳算法(GA)、模擬退火算法(SA)和蟻群算法(ACO)等。文獻[17]研究表明,GA算法對石油化工過程的優化具有良好的適用性,因而本研究選用GA作為優化算法。GA[18]是一種模仿自然生物進化原理,按照“適者生存”原則尋找最佳生存條件的搜索優化算法,其通過選擇、交叉和變異等算子來完成對全局最優解的尋找。本研究中,設置種群規模數為50、最大迭代次數為200,以產品RON的BP神經網絡預測模型作為適應度函數,將個體產品RON的預測結果作為其適應度,如式(3)所示。
fi=yRON,i
(3)
式中:fi為個體產品i的適應度;yRON,i為個體產品i的RON預測值。
首先,依據個體產品適應度大小選擇較好的個體樣本,按照某種規則遺傳給下一代。其核心在于選擇算子,本研究采用輪盤賭法[19]選擇個體樣本,由式(4) 進行計算。
(4)
式中:pi為個體樣本i被選中的概率;N為種群規模數。
交叉是GA產生新個體樣本的主要運算,決定了GA的全局搜索能力。若樣本中兩個變量隨機交叉可能會導致某些有效基因缺失。一般而言,GA 中的變量交叉的概率為0.6~0.9。由于交叉概率越大,高適應度的個體樣本結構越易被破壞,因而本研究交叉概率取值為0.6[20]。
變異是GA產生新個體樣本的另一種主要運算,其決定了GA的局部搜索能力。一般情況下,GA 中的變量變異概率為0~0.1;通常變異概率的取值較小,本研究變異概率取值為0.01[21]。
在設定GA算法的參數后,以第10組數據樣本為例,在保證產品硫含量達標和其他性質指標不變的前提下對S Zorb裝置操作變量進行優化,從而減小產品RON損失,結果見表9。

表9 部分操作條件優化結果
由表9可見,利用將BP神經網絡模型與GA算法相結合的產品RON優化模型,對第10組數據樣本的14個操作變量進行優化后,S Zorb裝置汽油產品RON損失的降幅達34.67%,優化效果顯著。按照同樣方法對325組數據樣本進行優化,結果如圖4所示。

圖4 325組建模數據樣本的產品RON損失降幅★—RON損失降幅; ——平均RON損失降幅
由圖4可知,在325組數據樣本中,產品RON損失降幅最高達51.93%,產品RON損失平均降幅為33%,產品RON損失降幅大于30%的樣本數超過58%。這表明,利用該優化模型調控S Zorb裝置操作參數,可在保證產品硫含量滿足質量標準要求的同時,有效降低產品RON損失。
為了驗證優化模型對操作參數的優化效果,在保證原料性質穩定的前提下,于2020年9月17日至9月18日將優化模型在某企業S Zorb裝置上進行了工業應用試驗。
(1)2020年9月17日上午8點對原料、產品、待生吸附劑和再生吸附劑進行采樣分析;從裝置控制系統采集06:00—08:00的操作變量數據,并進行數據整定。
(2)考慮裝置實際運行條件限制求,在不調節反應過濾器壓差、原料換熱器管程進出口壓差、反應器質量空速、還原器壓力、反應器頂部與底部壓差、反應系統壓力等6個操作變量的前提下,依據物料性質變量數據,利用產品RON優化模型對其余8個操作變量進行優化、調節。
(3)操作變量優化、調整到位后,分別在當天20:00采樣(樣本1)和次日上午08:00采樣(樣本2),對原料和產品進行分析,計算產品RON損失。
根據原料性質不同,采用產品RON優化模型對8個操作變量優化的結果如表10所示。

表10 8個操作變量的優化結果
工業試驗的產品優化結果如表11所示。由表11可知,在原料性質穩定的前提下,通過產品RON優化模型可以使產品RON損失降低25%,且產品硫質量分數始終小于3.2 μg/g。

表11 模型的優化結果
(1) 以S Zorb裝置的工業數據為基礎,采用MIC和Pearson相關系數,從包括原料油性質、吸附劑性質、產品性質和操作變量在內的273個變量中篩選出了21個輸入變量和1個輸出變量,建立了結構為21-14-1的BP神經網絡產品RON優化模型。該模型預測值與實際值的平均絕對誤差和擬合決定系數分別為0.116 3、0.960 1,說明其具有較好的擬合度和泛化能力。
(2)將所建BP神經網絡預測模型與GA算法結合,優化S Zorb裝置的操作變量,可以顯著降低汽油產品RON損失。工業試驗結果顯示,在保證脫硫效果的前提下,產品RON損失降幅為25%,有效降低了RON損失。