李煒,王曉明,蔣棟年,李亞潔,梁成龍
(1 蘭州理工大學電氣工程與信息工程學院,甘肅蘭州730050; 2 甘肅省工業過程先進控制重點實驗室,甘肅蘭州730050; 3 蘭州理工大學電氣與控制工程國家級實驗教學示范中心,甘肅蘭州730050;4 中國石化蘭州石化分公司油品儲運廠,甘肅蘭州730060)
在成品汽油的生產過程中,油品的質量是影響生產效益的關鍵因素,如何在保證質量的同時實現利益最大化是企業的根本目標。合格的成品汽油是根據各添加組分的實際品質和不同成品油的標號指標,由不同比例的多種組分組成的混合物,嚴格控制其添加量是保證油品質量的關鍵。因此,在汽油調和系統中,建立行之有效的配方模型是確保產品質量與企業效益的關鍵。但是,在實際的工業中,組分油的添加很多依舊是根據成品油標號與原料的組分,基于線性關系進行的搭配,而它們之間并非只有線性關系,這種粗略的線性調和方式,要么造成產品質量過剩,增加企業的生產成本,要么難以保證一次成功率,據2018年某大型煉化企業統計的一次成功率僅為84.5%,造成了資源的嚴重浪費。因此,亟需一種有效的調和配方來改變這種調和模式。近年來,數據驅動技術的發展為解決這一難題提供了新的解決思路,但是由于現有測量技術以及復雜工況的制約,油品的關鍵質量指標辛烷值往往難以實時獲取,而這又是建立調和配方模型的基礎,因此,建立準確的辛烷值預測模型就顯得尤為重要。
近年來許多學者也對此領域開展了相關研究。傳統的對辛烷值的研究主要有兩個方面,一是從分子層面對汽油組分辛烷值的定量結構-性質相關性的研究[1-3],常用方法如拓撲指數法[4]、基團貢獻法[5]。二是以儀器分析為基礎,對各汽油組分、組分吸光度、各組分含量進行分析,利用這些參數對汽油的混合辛烷值進行線性建模分析。如利用主成分分析法和多元線性回歸結合[6]、嶺回歸與多元線性回歸結合[7]、線性預測編碼和多元線性回歸結合[8]、主成分回歸和偏最小二乘回歸結合[9]以及偏最小二乘[10-11]及其變種[12]、拉曼技術[13]等進行建模測定。考慮到變量間的非線性因素,而人工神經網絡對復雜非線性系統較強的處理能力,工程上也將其用于辛烷值的預測,并取得良好的效果[14-18]。
隨著人工神經網絡的廣泛應用,考慮基于梯度下降的BP算法對初始權值的選擇依賴較大,且存在收斂速度慢、容易陷入局部最優等缺點,而進化算法由于具有良好的優化性能,開始廣泛用于各類優化問題之中[19-20],如將GA 和PSO 用于神經網絡參數的優化[21-23],雖然它們解決了神經網絡中的梯度下降問題,但遺傳算法的選擇、交叉、變異等操作使得神經網絡的訓練時間隨著問題的規模及復雜程度指數增長,而其缺乏有效的局部搜索機制,又使得算法在接近最優解時收斂緩慢甚至停滯;PSO 算法仍存在精度低、易發散、種群易早熟導致無法達到最優解等。為了獲得更好的優化效果,許多學者將二者結合起來用于優化問題的求解,但在辛烷值預測中卻少有涉及。雖然結合方法因問題而異,但不外乎串行[24]和并行[25]兩種方式[26],它們或以遺傳算法為主導[27]或以粒子群算法為主導[28]。這些方法盡管對優化性能有了不同程度的改進,但大多仍是以某一算法為主,間接引入其他算法的部分操作,缺乏更為有效的深度融合。
綜上所述,受成品調和配方建模中加氫汽油組分辛烷值的準確預測的需求驅動,本文提出了一種SHPSO-GA用于優化BP網絡(SHPSO-GA-BP)的新方法,并將其用于加氫汽油組分辛烷值的預測。該方法首先將粒子群算法的輸出根據適應度值,分為優劣2 個種群,優的保留,劣的淘汰;然后在粒子群算法中引入遺傳算法的交叉、變異操作,并從產生的新種群中選擇最優的群體用于迭代優化,最后將最優的種群用于優化BP網絡參數。
成品汽油調和是指在非標油中加入多種組分和添加劑,調和成符合客戶要求的國標汽油的技術。調和過程主要以調和配方模型為基礎,根據操作人員輸入的組分油的各項參數,按照已有的模型進行計算,得出一組符合產品指標的調和比例,并換算為組分油流量值,下達給現場操作人員作為初始設定值進行調和。因此,配方作為各組分油添加量的一種預測度量,其模型的準確性對油品質量的提升具有重要意義。
鑒于實際生產工藝需求,建立成品汽油配方模型主要是為了確定醚化汽油、MTBE、車用異辛烷、汽油重芳烴、生成油、乙苯、甲苯、二甲苯以及加氫汽油等9 種組分油的添加比例,其中加氫汽油是主料,其他組分的添加取決于主料的各參數品質。主料受不同原油的影響,其品質參數會有波動,且調和過程非定量的物理混合,考慮其過程的復雜性,通過對現場信息系統可提供的數據及生產調度運行表的分析,成品汽油配方建模需進行兩階段的建模,一是以芳烴含量、烯烴含量、烷烴含量、密度、研究法辛烷值和抗爆系數6 種指標作為輸入,建立加氫汽油調和比例模型;二是以研究法辛烷值、抗爆性、10%蒸發溫度、50%蒸發溫度、90%蒸發溫度、終餾點、蒸氣壓、硫含量、苯含量、芳烴含量、烯烴含量、氧含量、密度、加氫汽油含量14 項指標為輸入,建立醚化汽油、MTBE、車用異辛烷、汽油重芳烴、生成油、乙苯、甲苯、二甲苯8 種組分的調和比例模型。
綜上分析不難看出,在成品汽油調和配方建模過程中,辛烷值貫穿2個階段,但是受現有在線分析技術的制約,建模中的這一關鍵指標研究法辛烷值在已有數據集合中僅是加氫汽油其他品質參數的1/10,但它卻與10%蒸發溫度、50%蒸發溫度、90%蒸發溫度、終餾點、蒸氣壓、硫含量、苯含量、芳烴含量、烯烴含量、密度這10 項指標密切相關,因此,為了更好地利用已有歷史數據,并為后續配方建模奠定基礎,首先須建立加氫汽油組分的辛烷值預測模型,使其在配方建模中具有數據的完整性。
從已有基于BP網絡對辛烷值預測的文獻來看,大多采用單一算法,涉及混合PSO-GA 優化算法的少有,而著眼其他領域對BP 網絡的優化,大多考慮是將GA 的全局性與PSO 的記憶、信息共享能力相結合用于優化問題的求解,無論是并行還是串行,算法之間只是簡單結合,缺乏有效的深度融合。就并行結合而言[28-29],主要采用獨立優化的方式,即首先隨機初始化一個種群,然后分別采用兩種算法同時計算適應度,最后從混合后的種群中取出最好粒子或個體,這種方法一是未真正融合兩者優點,二是增加了算法的復雜度,使得運算時間加長。就串行而言[30-31],一般采用順序結合方式,即將一個種群的進化周期一分為二,進化前期采用一種算法,后期再采用另一種算法。這種結合勢必會出現:進化前期已達到最優解,則進化后期另一算法的引入就顯得無意義,或是進化前期未達到最優解,則后期另一算法的引入,在提高算法精度的同時引起收斂速度慢等問題。因此,從以往的混合算法來看[32-33],仍存在兩個弊端,一是對初始種群未進行有效處理,二是混合算法之間缺乏更優的深度融合。
針對前述PSO-GA 結合存在的缺點,考慮從初始種群產生和算法融合方式兩方面入手進行改進,以更好地將PSO 的快速性、記憶性與GA 的全局性相融合,達到優勢互補進而提高混合算法精度及收斂速度的目的。據此,本文以串行PSO-GA 方法為基礎,對其進行改進,一是采用PSO 對初始種群進行處理,從中選擇優質的種群,棄劣存優;二是將PSO 和GA 有機交替融合,即對種群中的每一代個體,都進行PSO 以及GA 的交叉、變異操作,稱之為SHPSO-GA。該算法的思想和交替過程可以概括為:①首先,采用PSO 產生初始種群,計算適應度值并按升序排序,再依據適應度值大小將種群分為優劣兩個種群,遺棄劣質種群,并在留優種群中找到群體最優適應度值,進而找到個體、群體最優,由此對粒子位置和速度進行更新;②其次,對留優種群引入GA 的交叉操作,以使子代繼承父代優良品質,同時擴大種群多樣性,其后再引入GA 的變異操作,對交叉后的種群再次進行優化,以進一步提升種群多樣性,由此可以產生同劣質種群大小規模相同的子代,將此子代與父代結合,組成新的種群;③再者,計算新種群的適應度值并排序,再次對種群進行留優處理,找到群體、個體最優,并進行粒子位置和速度最優再更新,至此第一代優化結束;④接著,以事先設定的最大迭代次數為依據,對留優種群進一步進行PSO+GA 循環優化,直至找到全局最優;⑤最后,將最優個體作為BP的權值和閾值。至此優化過程結束??梢钥闯觯琒HPSO-GA 算法與現存PSOGA算法的本質差異在于,SHPSO-GA對種群中的每一代個體都進行了PSO+GA 的交替融合式優化,而不像PSO-GA 將PSO 或GA 孤立地局限于優化過程的某一階段。因此,這種通過兩種算法之間的不斷交替來實現二者之間的深度融合,勢必會使PSO 的快速性、記憶性與GA 的全局性等優勢得到更有效的互補,從而為最優個體的獲取提供可能。
SHPSO-GA-BP的建模流程如圖1所示。
具體算法實現步驟如下:

圖1 SHPSO-GA-BP算法基本流程Fig.1 Basic flow of SHPSO-GA-BP algorithm
(1)參數設置。給定BP 神經網絡的輸入層、隱含層、輸出層節點個數,學習率、迭代次數,連接權值和閾值的取值范圍,遺傳算法和粒子群算法的相關參數,如變異概率、交叉概率、慣性因子、約束因子、加速度因子,以及迭代次數、期望的適應度值等。
(2)參數初始化。在優化之前,需要將待優化的神經網絡的參數編碼為粒子群的個體信息,這里主要用算法優化權值和閾值,若輸入層、隱含層、輸出層節點個數分別為n,q,m,則待優化參數個數為D,其中D可以表示為:

因此可以將所有參數表示為D維向量,作為粒子群個體的編碼信息;其次,根據權值和閾值的取值范圍隨機初始化粒子的位置和速度編碼,并設置粒子群的個數D。
(3)BP 網絡構建。通過輸入、輸出數據的維度確定隱含層節點的個數以及網絡的傳遞函數。
(4)計算粒子的適應度值。通過BP網絡的前向訓練,計算出實際值與期望值之間的均方誤差,并將均方誤差設置為粒子的適應度值。
(5)尋找最優種群。將適應度值從小到大排列,并將其平分為種群P1 和種群P2,留下優質的P1,舍棄劣質的P2。
(6)在留優種群P1 中尋找個體最優(Pbest)和群體最優(Gbest)。
(7)更新粒子的速度和位置。
(8)交叉。對種群P1 進行交叉操作,以此為子代繼承父代的優良品質提供可能。交叉操作采用實數交叉方法,對粒子的位置和速度按照交叉概率Pc進行兩兩配對。
(9)變異。對種群進行變異操作,以此擴大搜索空間,使粒子能夠跳出先前搜索到的最優位置,為保持種群的多樣性和找到全局最優值提供了可能。
(10)經過以上的交叉、變異操作,可以得到新的種群,此時將新種群作為優化的權值和閾值,代入網絡中進行訓練,計算出進化種群的適應度值,并將此種群和父代P1組成新的種群P2。
(11)對新種群P2 根據適應度值再次進行留優處理,挑選優質的一半作為種群P3。
(12)個體最優更新和群體最優更新。
(13)判斷是否達到設定的最大迭代次數。如果滿足條件,則優化停止,轉入步驟(14),如果不滿足條件,則轉入步驟(7)。
(14)將滿足條件的最終優質粒子作為優化之后的權值和閾值。
(15)訓練BP 網絡并用于預測。經過以上的優化,將最優的權值和閾值代入網絡中進行訓練,由此得到最終優化之后的輸出結果。
至此,優化過程結束。
在進行仿真之前,設置合理的參數是至關重要的,這將直接影響到網絡的預測性能。為了比較改進算法與其他算法的性能,參數設置應該保持一致。需要設置的參數主要包括BP 神經網絡的結構和相關參數,遺傳算法、粒子群算法和PSO-GA 算法的參數。
通過對某大型煉油廠2017—2019 年真實測量數據的處理,從中挑選出1107 組數據,取其中的1000 組用于網絡的訓練,余下的107 組用于網絡的測試。神經網絡的輸入層神經元個數為10,取決于辛烷值的影響因子:10%蒸發溫度、50%蒸發溫度、90%蒸發溫度、終餾點、蒸氣壓、硫含量、苯含量、芳烴含量、烯烴含量、密度等。通過經驗公式2n+1 和多次的測試,選定隱藏層數為21,因此將網絡的最終拓撲結構設為10-21-1。其他參數設置如下:隱含層的傳遞函數為tansig,輸出層傳遞函數為purelin,神經網絡的學習率為0.01,訓練目標最小收斂誤差為0.001,最大訓練次數1000次。
對于遺傳算法參數的選擇沒有定性規定,通常設置種群規模大小為20~200,交叉概率為0.1~1.0,變異概率為0~0.05;對于種群進化次數的確定,通常需綜合考慮背景問題的復雜程度以及實際數據的多次預仿真結果,因此,這里最終選擇種群最大迭代次數為50,交叉概率為0.8,變異概率為0.05。
粒子群算法中,慣性權重(w)的選取是影響算法性能的關鍵因素,不同慣性權重的選擇可能會導致算法的收斂速度不同甚至不收斂,很多研究者都對慣性權重進行過研究[34-35],這里采用文獻[36]所提出的慣性權重隨著迭代次數線性遞減的模型,通過調整權重來實現搜索能力的提升,較大的w的值可以跳出局部極小值,利于全局搜索,較小的w的值有利于算法收斂,可加強局部搜索能力,如下

式中,w為慣性權重,k為當前迭代次數,kmax為迭代總數,wmax、wmin分別表示最大、最小慣性權重,通常取wmax=0.9,wmin=0.4。種群規模設為50,根據式(1)和網絡的拓撲結構,計算出D=253,因此將粒子維度設為253;同時,考慮后續SHPSO-GA 算法運行中,能有效實現每一代PSO 和GA 的交替優化,并結合預仿真驗證結果,最終將進化次數設為50,慣性因子為0.7,加速度因子均為1.4[36],將粒子的最大速度、最小速度,以及最大位置、最小位置均限制在[-1,1]內。
對于SHPSO-GA-BP 與PSO-GA-BP 算法,為了更為公平地比較各方法的優劣,保持參數一致尤為重要,因此,仿真中涉及到的相關參數均與PSO 與GA一致,迭代次數也設定為50。
本文所用算法均通過MATLAB2019a 實現。所使用的計算機配置為AMD A8-7100 Radeon R5,8 Compute Cores 4C+4G 1.80 GHz。
為了對加氫汽油組分辛烷值預測模型的性能進行評價,采用常用的性能評價指標均方誤差(mean-square error,MSE)和絕對誤差和(sum of absolute differences,SAD),并定義預測誤差分布(prediction error distribution,PED)評價指標。
(1)常用性能指標

(2)預測誤差分布 由于本文屬于回歸問題,模型的預測值很難完全等于實際值。為了從預測值個體誤差的角度出發,更為詳細地比較各種方法的性能,本文特定義PED 指標,對驗證數據集的誤差做出頻數分布直方圖,并考慮工程中允許的誤差,當誤差聚集在誤差范圍之內的數越多,即預測值與真實值接近的數據也就越多,則說明預測效果越好。將分布在誤差帶內的預測數據個數與預測數據總個數的百分比作為評價標準PED,也即準確率。
定義:設δ為給定誤差范圍,Δ表示小于等于δ的預測誤差,則分布在誤差范圍δ內的預測數據個數占預測數據總個數的百分比,即為預測準確性PED,可表示為:

其中,num(Δ≤δ)表示分布在誤差在δ范圍之內的預測數據個數,num(N)表示預測數據的總個數。顯然,預測數據位于誤差范圍之內的比重越大,說明預測準確率越高。
3.3.1 適應度分析 為顯現文中方法的優越性,本文 分 別 對GA-BP、PSO-BP、PSO-GA-BP 以 及SHPSO-GA-BP 幾種方法進行對比研究,采用均方誤差作為適應度值,其適應度值隨進化次數的變化曲線如圖2所示。

圖2 四種網絡適應度曲線(終止代數=50)Fig.2 Four network fitness curves
從圖2 可以看出,經過50 次的種群進化,采用GA、PSO 以及PSO-GA 優化BP 權值和閾值之后,其適應度值均不同程度地減小,GA-BP在28代附近達到穩定值0.026,PSO-BP 在7 代附近達到穩定值0.0275,PSO-GA-BP 在31 代 附 近 達 到 穩 定 值0.0261,SHPSO-GA-BP 在11 代 附 近 達 到 穩 定 值0.0256。對比可知GA-BP 預測模型適應度值較小,但收斂速度慢,PSO-BP 算法收斂速度最快,但精度不足。文中對PSO 與GA 算法的深度融合,使得混合算法SHPSO-GA-BP 既有快速收斂性又有較小的均方誤差,很好地繼承了兩者的優點。但在傳統PSO-GA-BP 模型中,PSO、GA 兩種算法各占迭代次數的一半,在25 代之前PSO 起作用,可以看出其收斂速度很快,在第7代已經收斂,但卻陷入了局部極小值,25 代之后GA 起作用,跳出了局部極小值,也得到最小均方誤差。
對比SHPSO-GA-BP 和PSO-GA-BP,出現上述現象的原因主要在于兩種算法融合方式的不同,前者通過算法之間的交替作用來實現二者之間更優的深度融合,優選粒子的同時進行遺傳算法的交叉變異操作,從而使得最優個體還有進一步提升的可能,更容易找到全局最優和加快收斂速度;而后者PSO 和GA 之間只是簡單結合,本質上還是獨立作用,迭代前期PSO 起作用,快速但容易陷入局部極小值,迭代后期GA 起作用,這種結合勢必會犧牲快速性來提高精度。
綜上可知,文中提出的SHPSO-GA-BP 預測方法具有更快的收斂速度和更小的適應度值。
3.3.2 預測準確性分析 圖3給出幾種方法對辛烷值的預測結果。
為了更直觀地呈現所提出方法的優越性,圖4給出預測誤差分布圖和密度圖,表1 給出幾種方法的性能比較。

表1 幾種方法性能比較Table 1 Performance comparison of several methods
從圖4 可以看出,BP 網絡的誤差在0.08 之前分布較為均勻,0.1 左右頻數較大,說明網絡的訓練結果與實際值存在一定偏差;GA-BP 網絡的誤差大部分控制在0.08 之內,其后誤差分布平緩,說明訓練結果的大部分值能很好地接近實際值,但也存在部分異常值;PSO-BP 網絡的誤差部分聚集在0.04 之內,其余大部分分布在0.04~0.16,0.2 之后也有部分分布,說明訓練結果除了部分能很好地接近實際值之外,大部分存在一定偏差;PSO-GA-BP 網絡的誤差一大部分聚集在0.08 之內,其余的大部分聚集在0.2 之前,其后有少量分布,說明網絡的訓練結果能很好地接近實際值,網絡偏差較??;SHPSO-GA-BP網絡的誤差有接近40個聚集在0.04之內,其余的大部分也能聚集在0.2 之前,說明其誤差更小。因此,從最小預測誤差來看,SHPSO-GA-BP 預測性能最好,PSO-GA-BP次之。

圖3 幾種方法預測結果Fig.3 Prediction results of several methods
從表1可以看出,采用本文PSO 與GA 交替融合的算法優化BP 網絡之后,其預測值的均方誤差、絕對誤差和以及相應誤差內的準確率等性能,較其他方法均有很大提升;在網絡的訓練時間上,與其他三種混合優化算法相比,其值也有顯著下降。通過比較誤差在0.05、0.15范圍之內的準確率,還可以看出文中提出的方法均具有最好的準確率。綜上結果表明文中的SHPSO-GA-BP 模型用于預測辛烷值具有更優的性能。
受成品汽油調和配方建模中質量指標辛烷值的預測需求驅動,本文提出了一種將GA 的全局搜索能力與PSO 的記憶性、快速性有機融合,用于優化BP 網絡參數的SHPSO-GA-BP 預測建模方法,并將其應用于加氫汽油組分辛烷值的預測中,其結果表明:


圖4 幾種方法預測誤差分布圖和密度圖Fig.4 Error distribution and density map of several methods of prediction
(1)文中提出的SHPSO-GA-BP 方法,通過引入PSO對種群進行棄劣留優處理、引入GA對優選粒子進行交叉變異操作,以算法的交替作用方式實現了二者之間更優的深度融合,相比PSO-GA-BP 方法分別采用PSO 和GA 獨立作用于迭代前期和后期,SHPSO-GA-BP 能更容易且更迅速地找到全局最優。
(2)基于本文提出的SHPSO-GA-BP 方法,對于加氫汽油組分辛烷值的預測建模,無論是模型的訓練速度還是預測精度,相較其他GA-BP、PSO-BP、PSO-GA-BP 等改進方法,均顯現出更優的性能,因而更適于加氫汽油的辛烷值預測建模,這也為后續成品汽油調和配方需求的完備數據生成提供了可能。