夏祥禮 陳國彬 劉 超
1(重慶工商大學融智學院 重慶 401320)2(貴州航天電器股份有限公司 貴州 貴陽 550009)
近年來,越來越多的研究人員開始關(guān)注數(shù)據(jù)驅(qū)動方法。許多過程數(shù)據(jù)可以通過使用測量技術(shù)來收集、存儲和分析。數(shù)據(jù)驅(qū)動的軟傳感器模型有望解決現(xiàn)場實際問題中難以采用機理建模的通用技術(shù)[1,2]。建立準確的數(shù)學模型是軟測量技術(shù)研究的主要內(nèi)容之一,常見的非線性預測模型包括人工神經(jīng)網(wǎng)絡、支持向量機[3-5]等。
最小二乘支持向量機LSSVM是支持向量機的一種變體,良好的非線性處理能力使得LSSVM得到廣泛應用。然而,LSSVM正則化參數(shù)和核參數(shù)嚴重影響模型的預測精度和泛化能力,其模型參數(shù)的選擇問題也是LSSVM模型重要研究內(nèi)容之一。文獻[6]采用差分進化算法優(yōu)化最小二乘支持向量機模型,將其用于開關(guān)磁阻電機模型建立,仿真實驗驗證了DE-LSSVM模型的有效性。為改善LSSVM模型對非高斯脈動風速預測性能,李春祥等[7]采用蟻群算法和遺傳算法分別與粒子群算法相融合的混合算法優(yōu)化模型參數(shù),結(jié)果驗證了優(yōu)化后的模型精度更高。文獻[8]采用三維果蠅優(yōu)化算法選擇LSSVM模型參數(shù)并建立庫存調(diào)節(jié)誤差預測模型,仿真結(jié)果驗證了優(yōu)化算法對模型泛化能力提升的有效性。
飛蛾火焰優(yōu)化算法MFO是Mirjalili等模仿飛蛾捕焰機制提出的群智能優(yōu)化技術(shù)[9-10]。為增強MFO算法的性能,提出一種反學習MFO算法OMFO。進一步,采用OMFO算法優(yōu)化選擇LSSVM模型參數(shù),并構(gòu)建OMFO-LSSVM軟測量模型,仿真實驗驗證了OMFO-LSSVM模型的實用性。
基于結(jié)構(gòu)風險最小化準則的LSSVM因具有良好的非線性回歸特性,常用作軟測量建模的主要工具之一。LSSVM的目標函數(shù)定義如下:
(1)
Subject toyi=<ω,xi>+b+eii=1,2,…,n
(2)
式中:(xi,yi),i=1,2…,l,xi∈Rn,yi∈R,為訓練樣本集;φ(·)為非線性映射;γ為正則化參數(shù);ei為第i個樣本的擬合誤差。利用拉格朗日法構(gòu)造目標函數(shù):
(3)
式中:αi是拉格朗日乘子。
根據(jù)式(3),通過L對ω、b、ei和αi的偏導數(shù)等于零對式(3)進行優(yōu)化,可得到LSSVM的數(shù)學模型:
(4)
待求參數(shù)α=[a1,a2,…,ai,…,an],b可由下式求得:
(5)
式中:e=[1 1 … 1]T;y=[y1y2…yn]T;支持向量值α和偏執(zhí)量b是LSSVR的模型參數(shù);Ω是一個n×n的對稱矩陣。
Ωij=φ(xi)Tφ(xj)=K(xi,xj)i,j=1,2,…,n
(6)
式中:K(xi,xj)為核函數(shù)。常用核函數(shù)多項式核函數(shù)、Sigmoid核函數(shù)、徑向基等核(RBF)函數(shù)。RBF函數(shù)比其余兩種核函數(shù)待優(yōu)化參數(shù)少、且性能優(yōu)良,因此選擇RBF函數(shù)為LSSVM模型的核函數(shù):
(7)
Mirjalili等在2015年提出飛蛾火焰優(yōu)化算法MFO,旨在通過模仿飛蛾夜間使用的導航方法來解決優(yōu)化問題。在MFO算法中,飛蛾個體為優(yōu)化問題的候選解。n個飛蛾在d維空間中構(gòu)成的種群由矩陣M描述:
(8)
飛蛾個體適應度值存儲在OM矩陣中:
(9)
火焰為當前迭代所獲得的最佳位置,種群F和適應度矩陣OF描述如下:
(10)
(11)
MFO算法包括捕焰行為和棄焰操作。飛蛾以對數(shù)螺旋運動軌跡移動到火焰位置,并實現(xiàn)全局最優(yōu),其捕焰行為描述如下:
S(Mi,Fj)=Di·ebt·cos(2πt)+Fj
(12)
式中:Mi,Fj分別為第i個飛蛾和第j個火焰;S(Mi,Fj)為飛蛾更新位置;b為螺旋常量;t為[-1,1]之間的隨機數(shù);Di=Fj-Mi。
在MFO算法中,定義最大迭代次數(shù)和當前迭代次數(shù)分別為T和t。MFO算法通過式(13)棄焰操作將火焰數(shù)量由N逐漸減少,并最終將保持一個最優(yōu)火焰:
(13)
MFO算法是一種自然啟發(fā)的搜索算法,在解決各種優(yōu)化問題時具有良好的性能和效率。橫向定向過程中的“火焰”變量是MFO用來更新種群新位置的一個重要參數(shù)。然而,火焰的減少會導致收斂速度變慢,從而影響最終解決方案的質(zhì)量。為了克服這個缺點,提出新的反學習OBL(opposition-based learning)飛蛾火焰算法;此外,針對越界飛蛾,采用一種鏡像越界策略保證飛蛾均在維度范圍內(nèi),改善種群多樣性。
2.2.1反學習算法

(14)
在MFO基礎上增加基于反學習策略的補充函數(shù)H以加快MFO收斂速度,并獲得了高精度的解。H函數(shù)描述如下:
H=(A+B)-C×rand()
(15)
Mi=H
(16)

(17)

(18)
式中:s=當前迭代次數(shù)/最大迭代次數(shù);Γ和Θ分別為飛蛾的最大和最小位置;U和L為搜索空間的上、下限;C為任意迭代過程中最佳火焰位置;rand()為(0,1)之間的隨機數(shù)。式(15)是反學習的一種新形式,H函數(shù)根據(jù)飛蛾的反向位置生成新的反向解。
2.2.2飛蛾越界鏡像策略
MFO優(yōu)化過程中,飛蛾按式(12)更新位置,其位置坐標會發(fā)生越界情況而不斷被置于邊界上,不僅降低飛蛾種群的多樣性,還容易使算法陷入局部最優(yōu),進而影響算法的優(yōu)化性能。針對這種情況,利用下式更新越界飛蛾:
(19)
式中:mi,j為第i個飛蛾中第j維越界位置;Lj、Uj為第j維的取值范圍。多次重復操作式(19)可以將mi,j映射到維度的范圍之內(nèi),保證了種群多樣性,有效提升MFO算法優(yōu)化性能。
OMFO算法步驟描述如下:

參數(shù)初始化:種群規(guī)模(sizepop)、維數(shù)(d)、最大迭代次數(shù)(Max_iterrations)、當前迭代次數(shù)(Iteration)等 初始化飛蛾和火焰While(Iteration<=Max_iterrations)OM=FitnessFunction(M);按式(13)更新MFOs算法火焰數(shù)量;if Iteration==1 F=sort(M); OF=sort(OM);else F=sort(Mt-1, Mt);//t是當前迭代次數(shù) OF=sort(OMt-1, OMt);endfor i=1: sizepop for j=1:d 計算Di=Fj-Mi; 按式(12)更新M(i, j); endend按式(17)-式(18)計算A、B;按式(15)計算H函數(shù);更新Mi=H;按式(19)處理越界飛蛾;End終止并輸出全局最優(yōu)解飛蛾。
LSSVM軟測量模型關(guān)心系統(tǒng)的輸入與輸出而不必掌握對象的具體內(nèi)部物理結(jié)構(gòu)。LSSVM模型參數(shù)包括正則化參數(shù)γ和核寬度δ,通過優(yōu)化技術(shù)解決模型參數(shù)確定的問題能夠有效提升模型預測精度和泛化能力。MFO算法全局優(yōu)化性能優(yōu)異,基于反學習與飛蛾越界鏡像策略改進的OMFO算法在高維、多模函數(shù)優(yōu)化中性能更優(yōu),因此采用OMFO解決LSSVM模型的數(shù)對(γ,δ2)的優(yōu)化選擇問題。以每個飛蛾對應的模型參數(shù)在訓練集上產(chǎn)生的均方誤差(MSE)作為算法調(diào)整LSSVM模型的適應度函數(shù),定義如下:
(20)

基于OMFO-LSSVM軟測量模型流程主要包括數(shù)據(jù)準備、模型建立與模型驗證三個過程。首先對控制系統(tǒng)進行分析,確定與被測變量相關(guān)的易測變量;然后采集模型所需實驗數(shù)據(jù)、并對數(shù)據(jù)進行清洗、選擇等預處理,按一定比例隨機確定訓練集和測試集;在上述步驟完成后,將采用OMFO算法訓練LSSVM模型。將每個飛蛾的位置映射到LSSVM模型,輸入樣本訓練模型,按式(20)計算群眾中飛蛾的適應度值,一旦搜索完成,適應度值最大對應的飛蛾位置就是最優(yōu)模型參數(shù)值,以求得的最優(yōu)參數(shù)對構(gòu)建最優(yōu)OMFO-LSSVM軟測量器;最后,將采用測試集進行模型驗證,將測試樣本輸入最優(yōu)OMFO-LSSVM軟測量器并獲得預測結(jié)果,根據(jù)結(jié)果對模型泛化能力進行分析、評估。
汽輪機是火電機組中重要設備之一,包括高、低壓缸系統(tǒng)、再熱系統(tǒng)、除氧器、凝結(jié)水、負荷自動控制等系統(tǒng),其結(jié)構(gòu)復雜、熱工過程常常難以采用機理模型進行準確描述。熱耗率是指每產(chǎn)生1 kWh的電能所消耗的熱量。作為機組最重要指標之一,熱耗率指標常用來衡量電廠熱經(jīng)濟性。本文采用OMFO-LSSVM軟測量模型對熱耗率值進行仿真預測實驗。
以某600 MW汽機為研究對象,確定機組負荷、主蒸汽壓力與溫度、過熱蒸汽壓力等12個易測參數(shù)作為軟測量模型輸入,熱耗率作為模型預測值[12]。從該機組的集散控制系統(tǒng)中采集正常運行的598組數(shù)據(jù),并離線分析出熱耗率值。為研究模型的預測性能,假設離線分析的熱耗率是準確的。隨機選擇550組數(shù)據(jù)作為訓練樣本,余下的48組數(shù)據(jù)作為測試樣本。采用550組數(shù)據(jù)訓練模型,得到最優(yōu)OMFO-LSSVM模型,并利用48組測試樣本進行模型預測,預測結(jié)果如圖1所示。此外,為了驗證該模型性能,將其結(jié)果與MFO-LSSVM和LSSVM進行對比。圖2為MFO-LSSVM預測結(jié)果。圖3為3個模型的預測誤差曲線。

圖1 OMFO-LSSVM預測曲線

圖2 MFO-LSSVM預測曲線

圖3 預測誤差對比曲線
從圖1可以看出,OMFO-LSSVM熱耗率預測曲線與真值曲線幾乎完全重合,預測誤差較小,反映出OMFO-LSSVM模型泛化性能優(yōu)良。從圖2可以發(fā)現(xiàn),MFO-LSSVM預測趨勢與真值曲線一致,對于樣本6、8、23、42、43、44,MFO-LSSVM預測誤差較大。從圖3可以看出,LSSVM模型預測誤差曲線波動范圍最大,其預測結(jié)果最差;經(jīng)過MFO算法優(yōu)化的LSSVM模型誤差明顯變小,驗證了模型參數(shù)是模型泛化能力的關(guān)鍵影響因素;OMFO-LSSVM模型預測曲線波動范圍最小,表明OMFO搜索優(yōu)化的模型參數(shù)最理想,也進一步驗證了OMFO算法改進策略的有效性。
表1給出了3種模型的預測誤差指標。可以看出,LSSVM模型預測精度最差,其最大絕對誤差MAE達到149.85 kJ/(kWh),平均絕對百分誤差MAPE達到4.52%;均方根誤差RMSE為56.72 kJ/(kWh);而OMFO-LSSVM模型3個指標分別為33.21、0.11、11.49,均是最小的,表明模型精度最高。綜上所述,OMFO-LSSVM模型在熱耗率預測中取得了最佳效果,驗證了OMFO-LSSVM模型的優(yōu)越性。

表1 模型預測性能比較
針對工業(yè)過程變量無法或難以直接測量的問題,本文提出一種新的LSSVM軟測量模型。所提出的模型與反學習OMFO算法相結(jié)合,采用OMFO算法優(yōu)化選擇模型參數(shù),并構(gòu)建OMFO-LSSVM軟測量模型。以某600 MW汽輪機熱耗率預測為案例進行研究,OMFO-LSSVM模型預測MAPE指標達到0.11%,與MFO-LSSVM、LSSVM模型相比,OMFO-LSSVM模型具有更高的精度。