陳圖南,馬鳳翔,袁小芳,邱宗甲,李 康,韓 冬,張國(guó)強(qiáng)
(1. 中國(guó)科學(xué)院電工研究所,北京100190; 2. 中國(guó)科學(xué)院大學(xué),北京 100049;3. 國(guó)家電網(wǎng)安徽省電力有限公司電力科學(xué)研究院,安徽 合肥 230601)
六氟化硫(SF6)具有良好的絕緣和滅弧性能,因此被廣泛地應(yīng)用于氣體絕緣電氣設(shè)備中。但是在電氣設(shè)備的運(yùn)行過(guò)程中,不可避免地會(huì)產(chǎn)生局部放電等故障[1]。在放電或過(guò)熱條件下,SF6會(huì)分解產(chǎn)生一系列低氟硫化物[2],進(jìn)一步的,在微水和微氧條件下,還會(huì)產(chǎn)生SO2、SOF2、SO2F2等硫氧化物[3-5]。SF6的分解產(chǎn)物會(huì)對(duì)電力設(shè)備的安全運(yùn)行及運(yùn)檢人員的人身健康造成危害,因此有必要對(duì)設(shè)備中的氣體成分及含量進(jìn)行測(cè)量,用以監(jiān)控設(shè)備內(nèi)部絕緣狀態(tài)[6,7]。
在目前常見(jiàn)的氣體檢測(cè)方法中,光學(xué)檢測(cè)法由于其所具有的測(cè)量范圍大、可檢測(cè)氣體的種類多、檢測(cè)速度快、檢測(cè)靈敏度高等優(yōu)點(diǎn),成為了氣體檢測(cè)的理想工具[8]。典型的光學(xué)檢測(cè)法包括差分吸收光譜法[9-11]、可調(diào)諧二極管激光器吸收光譜法[12,13]、光聲光譜法[14-16]等。這類檢測(cè)法均基于氣體分子對(duì)特定波長(zhǎng)光的選擇性吸收現(xiàn)象。但是,由于氣體分子所含的不同躍遷能級(jí),其光譜通常呈現(xiàn)出連續(xù)帶狀。此外,由于分子本身的性質(zhì),氣體分子在吸收光子后在特定波段上表現(xiàn)出來(lái)的譜線并非理想線段,而是具有一定帶寬。因此,當(dāng)吸收峰較為相近的分子處于同一波段的光源照射下時(shí),多種氣體分子均會(huì)對(duì)該光束產(chǎn)生吸收,產(chǎn)生譜線的重疊,這種現(xiàn)象就稱為氣體分子的交叉干擾。
當(dāng)氣體分子產(chǎn)生交叉干擾時(shí),在進(jìn)行光電轉(zhuǎn)換后,檢測(cè)得到的電信號(hào)的值會(huì)由多種氣體分子共同決定,從而使得檢測(cè)信號(hào)不僅攜帶待測(cè)氣體的信息,同時(shí)也包含其他氣體的信息,導(dǎo)致在使用檢測(cè)信號(hào)進(jìn)行反演時(shí),得到的待測(cè)氣體的體積分?jǐn)?shù)不準(zhǔn)確,從而難以正確判斷氣體絕緣設(shè)備內(nèi)部的絕緣狀況。因此,有必要對(duì)交叉干擾的產(chǎn)生機(jī)理及校正方法進(jìn)行深入研究,降低交叉干擾對(duì)待測(cè)氣體定量檢測(cè)的影響。
本文針對(duì)使用光學(xué)檢測(cè)法檢測(cè)微量氣體時(shí)產(chǎn)生的交叉干擾現(xiàn)象,從產(chǎn)生機(jī)理、常用的校正方法、校正后的評(píng)估三個(gè)方面出發(fā)進(jìn)行綜述,并對(duì)交叉干擾校正方法的改進(jìn)策略進(jìn)行了展望,旨在為使用光學(xué)檢測(cè)法對(duì)氣體絕緣設(shè)備進(jìn)行絕緣狀態(tài)監(jiān)測(cè)的相關(guān)人員提供參考,從而提升氣體絕緣設(shè)備狀態(tài)監(jiān)測(cè)系統(tǒng)的可靠性。
光具有波粒二象性,光子是電磁輻射的媒介,只能傳遞量子化能量。理論上,當(dāng)光通過(guò)某一氣體時(shí),氣體只吸收能量剛好等于它某兩個(gè)能級(jí)之差的光子而發(fā)生能級(jí)躍遷。在宏觀上,表現(xiàn)為特定波長(zhǎng)的光因氣體的吸收而光強(qiáng)減弱,這就是氣體對(duì)光的選擇性吸收,如圖1所示[17]。

圖1 氣體分子躍遷示意圖Fig.1 Diagram of gas molecular transition
當(dāng)氣體分子在不同能級(jí)之間發(fā)生躍遷時(shí),對(duì)外表現(xiàn)為吸收光子或發(fā)射光子,形成譜線,吸收或發(fā)射光子的頻率滿足玻爾理論,即:
ΔE=E2-E1=hγ
(1)
式中,ΔE為分子吸收的能量;E1、E2分別表示分子能級(jí)躍遷前后的能量;h為普朗克常數(shù);γ為光子頻率。
在氣體分子中,不僅有電子的運(yùn)動(dòng),同樣還有組成氣體分子的各原子之間的振動(dòng)和分子整體的轉(zhuǎn)動(dòng)。氣體分子中這三種不同的運(yùn)動(dòng)狀態(tài)都對(duì)應(yīng)有一定的能級(jí),且這三種不同的能級(jí)都是量子化的。當(dāng)氣體分子受到光的照射,并吸收一定能量的電磁輻射后,分子會(huì)由較低的能級(jí)躍遷到較高的能級(jí)。考慮到電子能級(jí)、振動(dòng)能級(jí)、轉(zhuǎn)動(dòng)能級(jí)的能量差之間的數(shù)量級(jí)差異,在同一電子能級(jí)之間往往存在有許多振動(dòng)能級(jí)和更多的轉(zhuǎn)動(dòng)能級(jí)。因此,宏觀上來(lái)看,當(dāng)發(fā)生電子能級(jí)的躍遷時(shí),同時(shí)會(huì)產(chǎn)生許多不同振動(dòng)能級(jí)和轉(zhuǎn)動(dòng)能級(jí)的躍遷,從而得到一光譜帶系,這些光譜帶均對(duì)應(yīng)同一個(gè)電子能級(jí)的值[18]。
此外,氣體分子的譜線并非理想的幾何線,而是具有一定的展寬。這是由于粒子從高能級(jí)向低能級(jí)躍遷時(shí),粒子會(huì)在高能級(jí)上存在一定的時(shí)間,即具有一定的壽命Δt。由海森堡不確定關(guān)系可得[19]:
(2)
式中,Δt為粒子的壽命。
式(2)表明這個(gè)能級(jí)的能量存在相應(yīng)的寬度,即分子輻射的總功率分布在中心頻率ΔE/h附近一個(gè)很小的頻率范圍內(nèi)。由原子物理學(xué)的知識(shí)可知,氣體分子吸收或發(fā)射的線狀光譜是一個(gè)中心頻率為ν0=ΔE/h的分布[20],即呈現(xiàn)出一個(gè)峰狀。
考慮到分子的光譜特性是由分子結(jié)構(gòu)決定的,當(dāng)不同種氣體分子具有相似的結(jié)構(gòu)(如包含相同的官能團(tuán))時(shí),其光譜特性較為相似。因此,對(duì)于同一束入射光而言,結(jié)構(gòu)相似的氣體分子的帶狀吸收光譜可能會(huì)因?yàn)榫嚯x較近而產(chǎn)生重疊。在進(jìn)行光電轉(zhuǎn)換得到檢測(cè)信號(hào)后,檢測(cè)信號(hào)的值會(huì)由多種氣體對(duì)光的吸收共同決定,從而難以從中分離出待測(cè)氣體的信息。這種會(huì)對(duì)待測(cè)氣體的檢測(cè)產(chǎn)生干擾的現(xiàn)象即為交叉干擾。
對(duì)多組分氣體檢測(cè)的交叉干擾進(jìn)行校正,降低交叉干擾對(duì)檢測(cè)的影響,通常可以從兩個(gè)方面入手。
一方面是基于設(shè)備進(jìn)行校正。這類方法的基本思想是減小入射光的波長(zhǎng)范圍,從而盡量使得在入射光的波段內(nèi)僅有待測(cè)氣體會(huì)產(chǎn)生吸收,降低其他氣體對(duì)檢測(cè)信號(hào)的影響,這種方法可以從根源上降低交叉干擾產(chǎn)生的可能性。這類方法的代表有可調(diào)諧激光器[21-23]、單色儀[24-27]、濾光片[28]等,但是除了濾光片外,其他設(shè)備成本較高、移植性較差,在實(shí)驗(yàn)室中不易進(jìn)行更換。因此需要脫離設(shè)備條件限制的校正方法,從而有效擴(kuò)大校正方法的適用范圍,使其適用于多種檢測(cè)儀器、多種待測(cè)氣體的交叉干擾分析。
另一個(gè)方面是基于算法進(jìn)行校正。基于算法的交叉干擾校正方法是基于已有的實(shí)驗(yàn)檢測(cè)數(shù)據(jù),通過(guò)特定的算法對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行分析,建立檢測(cè)信號(hào)與混合氣體中各組分氣體的體積分?jǐn)?shù)之間的關(guān)系,然后計(jì)算得各組分氣體的體積分?jǐn)?shù)。本質(zhì)上來(lái)說(shuō),該方法并沒(méi)有消除交叉干擾,而是通過(guò)解算算法得到了待測(cè)氣體的相關(guān)信息。
本文以更為常用的基于算法的校正方法為重點(diǎn),分別對(duì)幾種典型的交叉干擾校正算法進(jìn)行介紹。
當(dāng)體系的響應(yīng)與輸入呈線性關(guān)系,并且輸入之間無(wú)共線性,干擾較低時(shí),多元線性回歸(Multiple Linear Regression,MLR)是一種能夠良好處理多輸入響應(yīng)的方法[29]。
當(dāng)光源的波段內(nèi)存在多種氣體的吸收峰時(shí),根據(jù)朗伯-比爾定律,可以得到如下關(guān)系[30,31]:
(3)
式中,A(λ)為混合氣體在波長(zhǎng)λ處的吸光度;I0(λ)為光通過(guò)混合氣體的背景氣體時(shí)檢測(cè)得到的原始光強(qiáng);I(λ)為光通過(guò)混合氣體時(shí)檢測(cè)得到的吸收光強(qiáng);σi(λ)為組分氣體i在波長(zhǎng)λ處的吸收截面;ci為組分氣體i的體積分?jǐn)?shù);L為有效光程長(zhǎng)。
記:
Y=[A(λ1),A(λ2),…,A(λm)]T
(4)
(5)
C=[c1,c2,…,cn]T
(6)
E=[e1,e2,…,em]T
(7)
式中,m為測(cè)量次數(shù),即在測(cè)量過(guò)程中所取的不同波長(zhǎng)的數(shù)量;n為混合氣體中組分氣體的數(shù)量;Y為檢測(cè)信號(hào)矩陣;X為系數(shù)矩陣;C為體積分?jǐn)?shù)矩陣;E為殘差矩陣。
即可得到如下矩陣形式的線性模型:
Y=XC+E
(8)
對(duì)于該模型,有如下三種情況:
(1)n>m,此時(shí)矩陣C有無(wú)窮多解,說(shuō)明MLR不能適用于此種情況。
(2)n=m,此時(shí)矩陣X滿秩,矩陣C有唯一非全零解,且有E=0。應(yīng)用克萊姆法則即可求解各組分氣體的體積分?jǐn)?shù)。
(3)n C=(X′X)-1X′Y (9) 由此可得,將MLR應(yīng)用于交叉干擾校正的步驟如下: ① 分別制定多組已知各組分氣體體積分?jǐn)?shù)的樣氣。 ② 選定不同波長(zhǎng),得到在各波長(zhǎng)處各組分氣體的吸收截面數(shù)據(jù)。 ③ 在不同波長(zhǎng)處,分別測(cè)量各樣氣的檢測(cè)信號(hào)值。 ④ 采用MLR計(jì)算各組分氣體的體積分?jǐn)?shù)。 由上,可以得到使用MLR進(jìn)行交叉干擾校正的流程圖如圖2所示。 圖2 MLR流程示意圖Fig.2 Process diagram of MLR MLR的應(yīng)用過(guò)程較為簡(jiǎn)單,可以適用于多種情況。但同時(shí),MLR也有其固有的不足,當(dāng)干擾較強(qiáng)時(shí),或自變量之間的共線性較為顯著時(shí),線性模型均可能失真。 主成分回歸(Principle Component Regression,PCR)是基于主成分分析的回歸方法[32,33]。主成分分析的核心思想是將數(shù)據(jù)降維,以排除多組分氣體共存時(shí)存在的相互重疊的信息。主成分回歸可分為兩步進(jìn)行:測(cè)定主成分,將原矩陣降維;對(duì)降維的原矩陣進(jìn)行線性回歸分析。其基本原理介紹如下。 主成分是原變量的線性組合,用它來(lái)表征原變量時(shí)所產(chǎn)生的平方誤差最小。應(yīng)用主成分分析,原變量矩陣可以表達(dá)為得分矩陣,而得分矩陣由原矩陣在本征矢量上投影所得。主成分回歸的基本原理可以闡述如下。 設(shè)原矩陣為Xm×n,對(duì)原矩陣進(jìn)行標(biāo)準(zhǔn)化,然后計(jì)算矩陣X的相關(guān)系數(shù)矩陣R,其元素的計(jì)算式如下: (10) 式中,i,j=1,2,…,n;m為測(cè)量次數(shù);n為混合氣體中組分氣體的數(shù)量。由雅克比迭代法可得到相關(guān)系數(shù)矩陣R的特征值和特征向量,由特征向量組成的矩陣即為載荷矩陣P,并滿足: T=XP (11) 式中,T為得分矩陣。 選擇k(k X=TP+E (12) 然后將得分矩陣與因變量矩陣Y進(jìn)行MLR,即: Y=TB+F (13) 式中,B為回歸系數(shù)矩陣;F為殘差矩陣。 可得回歸系數(shù)矩陣B的最小二乘解為: B=(T′T)-1T′Y (14) 通過(guò)求解回歸系數(shù)矩陣,即可得到未知混合氣體各組分的體積分?jǐn)?shù)。具體步驟如下: (1)分別制定多組已知各組分氣體體積分?jǐn)?shù)的樣氣,并取各組分氣體的體積分?jǐn)?shù)構(gòu)成矩陣Y。 (2)分別測(cè)量不同樣氣的檢測(cè)信號(hào)值,并構(gòu)成矩陣X。 (3)由主成分回歸,得到回歸系數(shù)矩陣B。 由上,可以得到使用PCR進(jìn)行交叉干擾校正的流程圖如圖3所示。 圖3 PCR流程示意圖Fig.3 Process diagram of PCR 主成分回歸具有如下優(yōu)點(diǎn):由于各個(gè)主成分之間不存在線性相關(guān)關(guān)系,因此主成分回歸可以解決共線性問(wèn)題;在去除相對(duì)次要的成分后,主成分回歸具有較好的抗干擾能力;適用于復(fù)雜體系的測(cè)量,不需要辨別干擾組分。同樣,由于主成分回歸本身的原理,可能存在錯(cuò)誤去除有用主成分的情況,造成計(jì)算結(jié)果信息缺失、模型產(chǎn)生偏差。 在實(shí)際測(cè)量中,當(dāng)測(cè)量次數(shù)少于待測(cè)氣體的數(shù)量時(shí),難以應(yīng)用MLR等方法。此時(shí)可以通過(guò)偏最小二乘(Partial Least Square,PLS)進(jìn)行交叉干擾的校正[34-36]。PLS的特點(diǎn)在于對(duì)自變量矩陣X和因變量矩陣Y同時(shí)進(jìn)行分解,使用于描述矩陣Y因子的同時(shí)也用于描述矩陣X。從數(shù)學(xué)上來(lái)看,是以矩陣Y的列參與矩陣X的因子的計(jì)算。由此可以得到PLS的數(shù)學(xué)模型: X=TP+E (15) Y=UQ+F (16) 式中,T、P、E分別為X的得分矩陣、載荷矩陣和殘差矩陣;U、Q、F分別為Y的得分矩陣、載荷矩陣和殘差矩陣。 考慮T和U之間的線性關(guān)系,有: U=TB+E (17) 此時(shí),系數(shù)矩陣B的最小二乘解為: B=(T′T)-1T′U (18) 由此,可以得到使用PLS測(cè)量未知混合氣體各組分的體積分?jǐn)?shù)步驟,具體如下: (1)分別制定多組已知各組分氣體體積分?jǐn)?shù)的樣氣,并取各組分氣體的體積分?jǐn)?shù)構(gòu)成矩陣Y。 (2)分別測(cè)量不同樣氣的檢測(cè)信號(hào)值,并構(gòu)成矩陣X。 (3)由PLS,得到回歸系數(shù)矩陣B。 由上,可以得到使用PLS進(jìn)行交叉干擾校正的流程圖如圖4所示。 圖4 PLS流程示意圖Fig.4 Process diagram of PLS PLS的優(yōu)點(diǎn)主要在于:可以在樣本點(diǎn)數(shù)量較少、待測(cè)量較多的情況下進(jìn)行分析;PLS將數(shù)據(jù)矩陣的分解和回歸合并,在定量分析中所得到的特征向量直接與待測(cè)組分相關(guān)聯(lián),更符合實(shí)際情況。PLS同樣具有其局限性,例如,當(dāng)被測(cè)組分體積分?jǐn)?shù)范圍較大時(shí),非線性因素過(guò)強(qiáng)時(shí),會(huì)導(dǎo)致PLS模型內(nèi)的線性關(guān)系不準(zhǔn)確,使得模型失真等等。 在上述交叉干擾校正算法中,均是以朗伯-比爾定律為基礎(chǔ)進(jìn)行校正。但是朗伯-比爾定律的應(yīng)用具有前提條件,當(dāng)超出一定濃度范圍時(shí),該定律不成立。人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)具有很強(qiáng)的非線性映射能力,能夠很好地表征這種非線性系統(tǒng)[37]。在目前的研究中,使用較多的是徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(Radial Basis Function,RBF)[38,39]。RBF神經(jīng)網(wǎng)絡(luò)是具有單隱含層的三層前向網(wǎng)絡(luò),第一層為輸入層,輸入層僅起到傳輸信號(hào)的作用,其基本結(jié)構(gòu)如圖5所示。 圖5 RBF神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)Fig.5 Basic structure of RBF neural network 當(dāng)多種氣體產(chǎn)生交叉干擾時(shí),混合氣體的體積分?jǐn)?shù)和檢測(cè)信號(hào)的關(guān)系可抽象為: A=fn(c1,c2,…,cn) (19) 式中,A為檢測(cè)信號(hào)值;ci(i=1,2,…,n)為混合氣體中第i個(gè)組分的體積分?jǐn)?shù);fn為表征ci與A之間映射關(guān)系的隱函數(shù)。 當(dāng)組分氣體之間產(chǎn)生交叉干擾時(shí),需要計(jì)算各組分氣體準(zhǔn)確的體積分?jǐn)?shù)時(shí),可以用式(20)計(jì)算: ci=fn-1(A1,A2,…,An) (20) 式中,Ai為第i次測(cè)量時(shí)得到的檢測(cè)信號(hào)值;fn-1為函數(shù)fn的反函數(shù)。 實(shí)驗(yàn)測(cè)得的數(shù)據(jù)往往只能表示氣體體積分?jǐn)?shù)與檢測(cè)信號(hào)的映射,而難以對(duì)隱函數(shù)fn進(jìn)行準(zhǔn)確的求解。采用RBF神經(jīng)網(wǎng)絡(luò)可以對(duì)大量離散數(shù)據(jù)進(jìn)行擬合,從而逼近隱函數(shù)fn,達(dá)到求解反函數(shù)fn-1的目的。由此可知,將RBF神經(jīng)網(wǎng)絡(luò)應(yīng)用于交叉干擾校正的步驟如下: (1)分別制定多組已知各組分氣體體積分?jǐn)?shù)的樣氣,并取各組分氣體的體積分?jǐn)?shù)構(gòu)成矩陣Y。 (2)分別測(cè)量不同樣氣的檢測(cè)信號(hào)值,并構(gòu)成矩陣X。 (3)將測(cè)量得到的數(shù)據(jù)分為訓(xùn)練組和測(cè)試組兩組。 (4)用訓(xùn)練組的數(shù)據(jù)作為RBF神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本,對(duì)RBF神經(jīng)網(wǎng)絡(luò)的參數(shù)進(jìn)行訓(xùn)練。 (5)設(shè)定誤差閾值,并將測(cè)試組的數(shù)據(jù)放入訓(xùn)練后的RBF神經(jīng)網(wǎng)絡(luò)中進(jìn)行誤差測(cè)試。 (6)如果誤差測(cè)試得到的誤差小于設(shè)定的閾值,則訓(xùn)練完成;如果誤差大于設(shè)定的閾值,則增加RBF神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)量,直至誤差小于設(shè)定閾值。 由上,可以得到采用RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行交叉干擾校正的流程圖如圖6所示。 圖6 RBF流程示意圖Fig.6 Process diagram of RBF 在使用ANN時(shí),需注意兩個(gè)問(wèn)題是過(guò)擬合和過(guò)訓(xùn)練。在試樣數(shù)量和輸入節(jié)點(diǎn)確定后,若隱含層節(jié)點(diǎn)過(guò)多,會(huì)發(fā)生過(guò)擬合問(wèn)題,導(dǎo)致模型結(jié)構(gòu)不穩(wěn)定;過(guò)訓(xùn)練則是在訓(xùn)練集的均方根誤差降低的同時(shí),測(cè)試集的均方根誤差上升,同樣會(huì)導(dǎo)致模型結(jié)構(gòu)不穩(wěn)定。 雖然基于算法的校正方法能夠適用于大部分實(shí)驗(yàn)室實(shí)際測(cè)量情況,但是也存在其固有的不足:首先,一般來(lái)說(shuō)大部分算法需要大量的實(shí)驗(yàn)數(shù)據(jù)支持,特別是需要對(duì)不同配比的多組分氣體樣氣進(jìn)行多次測(cè)定;其次,算法中的參數(shù)也需要根據(jù)實(shí)際算例進(jìn)行調(diào)整;再者,從本質(zhì)上來(lái)說(shuō),基于算法的方法未能從根源上消除交叉干擾,因此可能存在未知的氣體對(duì)計(jì)算結(jié)果產(chǎn)生干擾。 為了更好地對(duì)各種校正方法進(jìn)行說(shuō)明,本文對(duì)基于算法的校正方法進(jìn)行了分析與討論,以期對(duì)實(shí)驗(yàn)或工程中選擇合適的校正算法提供參考。 由多元線性回歸方法的原理可知,將多元線性回歸應(yīng)用于交叉干擾分析的數(shù)學(xué)模型是解由實(shí)驗(yàn)數(shù)據(jù)構(gòu)成的非齊次線性方程組[40]。因此,多元線性回歸方法具有原理簡(jiǎn)單、易于實(shí)現(xiàn)等優(yōu)點(diǎn)。但同時(shí),由于多元線性回歸的求解部分使用了線性方程組,與其他方法相比,多元線性回歸方法需要檢測(cè)樣本數(shù)量不少于待測(cè)氣體數(shù)量[41]。此外,當(dāng)檢測(cè)對(duì)象受到外界干擾時(shí),線性方程組可能難以正確描述光聲信號(hào)與氣體體積分?jǐn)?shù)之間的關(guān)系。因此,多元線性回歸方法容易受到外界干擾,且對(duì)非線性關(guān)系難以適用[42]。 主成分回歸會(huì)根據(jù)相關(guān)性對(duì)影響輸出的成分進(jìn)行排序,從而將實(shí)驗(yàn)得到的數(shù)據(jù)矩陣進(jìn)行降維,然后再進(jìn)行線性回歸。從原理上來(lái)看,主成分回歸能夠去除較為次要的成分,從而不需要辨別干擾成分。這使得主成分回歸方法與其他方法相比具有較好的抗干擾能力[43]。但是,考慮到實(shí)際對(duì)變壓器油中溶解氣體進(jìn)行檢測(cè)時(shí),待檢測(cè)的主要成分往往都是已知的。因此,使用主成分回歸反而可能會(huì)導(dǎo)致信息缺失、忽略部分因素對(duì)結(jié)果的影響,致使計(jì)算結(jié)果不夠準(zhǔn)確[44]。 偏最小二乘方法集中了主成分回歸及多元回歸分析的優(yōu)點(diǎn),模型較為簡(jiǎn)潔,且對(duì)數(shù)據(jù)量的要求并不高[45]。與多元線性回歸、主成分回歸相比,偏最小二乘求得的殘差平方和往往更小,因此該模型具有更高的準(zhǔn)確性[46]。但與多元線性回歸和主成分回歸類似地,當(dāng)檢測(cè)對(duì)象受到外界較大干擾時(shí),偏最小二乘方法內(nèi)部的線性模型可能失真,使得計(jì)算結(jié)果出現(xiàn)偏差。 與前述方法相比,神經(jīng)網(wǎng)絡(luò)的優(yōu)勢(shì)在于可以很好地描述非線性系統(tǒng)。由神經(jīng)網(wǎng)絡(luò)的特點(diǎn)可知,根據(jù)不同的應(yīng)用場(chǎng)景,需要適當(dāng)對(duì)神經(jīng)網(wǎng)絡(luò)采用的建模函數(shù)進(jìn)行調(diào)整。因此,當(dāng)測(cè)量場(chǎng)景變化時(shí),需要對(duì)神經(jīng)網(wǎng)絡(luò)的函數(shù)進(jìn)行調(diào)整,以確保其收斂性。同時(shí),也需要對(duì)神經(jīng)網(wǎng)絡(luò)中的神經(jīng)元數(shù)量進(jìn)行調(diào)整,避免過(guò)訓(xùn)練、過(guò)擬合等問(wèn)題[47]。所以,相較于其他算法而言,神經(jīng)網(wǎng)絡(luò)算法的移植性較差,且對(duì)數(shù)據(jù)量要求較大[48]。由此,基于神經(jīng)網(wǎng)絡(luò)的校正方法更適用于在實(shí)驗(yàn)室中使用,或是針對(duì)某一特定場(chǎng)景進(jìn)行高精度檢測(cè)。 結(jié)合上述內(nèi)容,可將各種算法的特點(diǎn)總結(jié)如表1所示。 表1 基于算法的交叉干擾校正方法特點(diǎn)Tab.1 Features of crossover interference modification based on algorithm 鑒于各校正方法所具有的特點(diǎn),為了進(jìn)一步提高交叉干擾校正算法的準(zhǔn)確度與可靠性,有學(xué)者在典型算法的基礎(chǔ)上加以延伸,提出了眾多改進(jìn)的衍生方法。例如,基于最小二乘的基本原理,提出了最小二乘支持向量機(jī)回歸(LS-SVR)方法用于復(fù)雜成分微量元素的檢測(cè)[49,50];在文獻(xiàn)[51]中,作者在PLS中加入非線性函數(shù)替代線性函數(shù),用以增加回歸的泛化性。 此外,也有學(xué)者將多種方法進(jìn)行結(jié)合,從而得到組合方法來(lái)提高校正精度。例如,在文獻(xiàn)[52]中,作者采用MLR和PLS聯(lián)用的方法對(duì)質(zhì)譜數(shù)據(jù)進(jìn)行分析;在文獻(xiàn)[53]中,作者將主成分分析與RBF神經(jīng)網(wǎng)絡(luò)相結(jié)合,以解決輸入自相關(guān)嚴(yán)重時(shí),RBF神經(jīng)網(wǎng)絡(luò)精度下降問(wèn)題;在文獻(xiàn)[54]中,作者將PLS與BP神經(jīng)網(wǎng)絡(luò)相結(jié)合,改善了PLS的非線性適應(yīng)能力。 在采用交叉干擾校正方法得到校正模型后,需要建立評(píng)價(jià)體系對(duì)交叉干擾的校正結(jié)果進(jìn)行評(píng)估。通常采用的方法是交叉驗(yàn)證,結(jié)合評(píng)價(jià)指標(biāo),用以檢測(cè)校正模型的精確程度與可靠程度[55,56]。 (1) 殘差平方和 對(duì)于校正模型而言,較為通用的評(píng)價(jià)方法是計(jì)算其校正值與實(shí)際值的差距,即殘差,從而評(píng)判校正模型的準(zhǔn)確度。殘差是最基本的評(píng)價(jià)校正模型好壞的標(biāo)準(zhǔn),進(jìn)一步地,為了對(duì)校正后的數(shù)據(jù)進(jìn)行整體評(píng)價(jià),可以引入殘差平方和(Residual Sum of Squares,RSS),其計(jì)算式如下: (21) 殘差平方和是較為基本的評(píng)價(jià)校正算法結(jié)果的評(píng)價(jià)指標(biāo)。通過(guò)累加每一個(gè)校正點(diǎn)與實(shí)際值的差值,可以得到校正模型結(jié)果與實(shí)際值相比整體的偏離情況。殘差平方和是實(shí)驗(yàn)及工程中最為常用的評(píng)價(jià)指標(biāo)之一。 (2) 相關(guān)系數(shù) 相關(guān)系數(shù)反映了校正值與實(shí)際值變化趨勢(shì)的關(guān)系。相關(guān)系數(shù)的計(jì)算式如下: (22) 除了校正算法得到的殘差外,通常還需要對(duì)校正后得到的數(shù)值變化趨勢(shì)進(jìn)行評(píng)價(jià),從而判定校正算法中模型的穩(wěn)定性。在此,相關(guān)系數(shù)是較為常用的評(píng)價(jià)指標(biāo)。相關(guān)系數(shù)越接近1說(shuō)明校正值集合的變化趨勢(shì)越接近實(shí)際值集合,同時(shí)也說(shuō)明校正值中沒(méi)有單個(gè)偏差較大的點(diǎn)。 (3) 擬合優(yōu)度 擬合優(yōu)度R2的計(jì)算公式如下: (23) 式中,ymean表示實(shí)際目標(biāo)值的均值。 擬合優(yōu)度表征了線性模型對(duì)實(shí)際數(shù)據(jù)的擬合程度,擬合優(yōu)度越接近1,說(shuō)明校正算法中的線性模型能夠接近越多的實(shí)際數(shù)據(jù)。該指標(biāo)可用于評(píng)價(jià)包含線性模型的校正算法,但是不適用于非線性模型的校正算法。 (4) 建模集均方誤差 建模集均方誤差(Root Mean Square Error of Calibration,RMSEC)的計(jì)算式如下: (24) 建模集均方誤差表示模型中計(jì)算得到的點(diǎn)與實(shí)際值的均方誤差。該值越小,說(shuō)明所建的模型與建模集的實(shí)際情況越相近,從而能夠表明所建模型的合理性。 (5) 驗(yàn)證集均方誤差 驗(yàn)證集均方誤差(Root Mean Square Error of Validation,RMSEV)的計(jì)算式如下: (25) 建模集均方誤差和驗(yàn)證集均方誤差可以用于評(píng)價(jià)模型的穩(wěn)定性。驗(yàn)證集均方誤差用于表示模型預(yù)測(cè)未知數(shù)據(jù)驗(yàn)證集中的目標(biāo)值與實(shí)際值的差距,由于驗(yàn)證集的數(shù)據(jù)并未參與建模,該指標(biāo)可以有效反映所用的算法建立的模型應(yīng)用于實(shí)際檢測(cè)時(shí)的表現(xiàn)[57]。 由上述分析可知,當(dāng)實(shí)際對(duì)檢測(cè)數(shù)據(jù)進(jìn)行分析時(shí),通常情況下會(huì)首先關(guān)注殘差平方和,以此來(lái)初步推斷校正算法的表現(xiàn)。當(dāng)殘差平方和能夠滿足測(cè)量精度要求時(shí),可以對(duì)相關(guān)系數(shù)、擬合優(yōu)度進(jìn)行計(jì)算,用以進(jìn)一步確定校正算法的精度及模型的準(zhǔn)確性。此外,建立合適的校正算法后,還可以采用建模集均方誤差、驗(yàn)證集均方誤差作為評(píng)價(jià)指標(biāo),進(jìn)一步從理論的角度分析校正算法中模型的穩(wěn)定性,用以幫助進(jìn)行算法的優(yōu)化。 隨著高電壓與絕緣技術(shù)的發(fā)展,以SF6或環(huán)保氣體為絕緣介質(zhì)的氣體絕緣電氣設(shè)備大規(guī)模投運(yùn),該類設(shè)備內(nèi)部絕緣狀況的檢測(cè)已成為相關(guān)領(lǐng)域的研究焦點(diǎn)。其中,對(duì)SF6及其分解氣體進(jìn)行定量檢測(cè)來(lái)判斷氣體絕緣電氣設(shè)備絕緣狀態(tài)并分析故障類型和程度是近年來(lái)的研究熱點(diǎn)。因此,多組分氣體檢測(cè)的相關(guān)問(wèn)題具有重要的理論意義和實(shí)用價(jià)值。本文對(duì)氣體絕緣電氣設(shè)備中多組分氣體檢測(cè)的交叉干擾問(wèn)題及其校正方法進(jìn)行了綜述,對(duì)交叉干擾的產(chǎn)生機(jī)理、校正方法的研究現(xiàn)狀進(jìn)行了總結(jié)。在目前的研究中,在交叉干擾的產(chǎn)生機(jī)理、校正方法、評(píng)估指標(biāo)等方面均有眾多成果: (1) 交叉干擾的本質(zhì)是氣體分子的吸收峰重疊。由于氣體分子的譜線展寬特性,對(duì)同一束入射光而言,可能有多種吸收峰相近的氣體分子均會(huì)產(chǎn)生吸收。從結(jié)果上而言,這會(huì)使得測(cè)得的電壓信號(hào)攜帶了待測(cè)氣體以外的信息,從而不能準(zhǔn)確表征待測(cè)氣體的體積分?jǐn)?shù)。在使用分解氣體法等分析方法對(duì)氣體絕緣設(shè)備內(nèi)部狀況進(jìn)行評(píng)估時(shí),交叉干擾會(huì)致使測(cè)量結(jié)果不能真實(shí)反映待測(cè)氣體的體積分?jǐn)?shù),從而無(wú)法反映氣體絕緣設(shè)備內(nèi)部的實(shí)際狀況,阻礙相關(guān)人員對(duì)氣體絕緣設(shè)備的檢修和維護(hù)。 (2) 從交叉干擾的原理出發(fā),目前對(duì)交叉干擾的校正方法可以分為兩類:設(shè)備校正法和算法校正法。設(shè)備校正法是從交叉干擾的產(chǎn)生機(jī)理上進(jìn)行校正,基本思想是收窄入射光的波段,使得在一個(gè)較窄的波段內(nèi)僅有待測(cè)氣體會(huì)對(duì)入射光進(jìn)行吸收,從根源上消除交叉干擾的影響,這類方法的代表有可調(diào)諧激光器、單色儀等;但是囿于現(xiàn)有的技術(shù)水平、成本等因素,基于設(shè)備的校正方法受限于特定的實(shí)驗(yàn)條件,普適性較差,因此仍需要建立移植性較好、適用范圍較大的算法校正方法,即基于現(xiàn)有的檢測(cè)系統(tǒng)采集到的數(shù)據(jù),通過(guò)算法對(duì)數(shù)據(jù)進(jìn)行處理,分離出所需要的待測(cè)氣體的信息,進(jìn)而對(duì)待測(cè)氣體的體積分?jǐn)?shù)進(jìn)行反演。 (3) 交叉干擾校正后,需要對(duì)校正方法進(jìn)行評(píng)估,用以評(píng)價(jià)交叉干擾方法的可靠性。通常對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行交叉驗(yàn)證,通過(guò)建立交叉干擾校正方法的評(píng)價(jià)指標(biāo),對(duì)校正方法的質(zhì)量進(jìn)行評(píng)價(jià)。 盡管目前對(duì)于處理交叉干擾已有眾多解決方法,但是仍然存在很多值得深入探究的問(wèn)題: (1) 從原理上看,解決交叉干擾最好的方法是采用窄帶寬光源,從而使得僅有待測(cè)氣體在光源波段內(nèi)有吸收,排除其他氣體的干擾。但是這類光源一般可調(diào)諧范圍較小,且往往是一個(gè)光源只能對(duì)應(yīng)于一種氣體的吸收譜線,這導(dǎo)致使用此類光源研制多組分氣體檢測(cè)儀器的成本較高。 (2) 對(duì)于基于算法的交叉干擾校正方法,應(yīng)用的前提是大量的實(shí)驗(yàn)數(shù)據(jù)支持,所以通常只能夠用于離線分析,而較難應(yīng)用于在線檢測(cè)。同時(shí),考慮到實(shí)驗(yàn)條件的不同,在實(shí)驗(yàn)室中標(biāo)定、計(jì)算得到的參數(shù),可能不完全適用實(shí)際工程場(chǎng)景,這會(huì)導(dǎo)致算法的移植性降低,需要對(duì)算法進(jìn)行進(jìn)一步的優(yōu)化和校正。 結(jié)合上述問(wèn)題,可以對(duì)光學(xué)檢測(cè)方法中出現(xiàn)的交叉干擾的校正算法進(jìn)行如下展望: (1) 由目前的研究可知,交叉干擾的校正算法通常難以兼?zhèn)淞己玫囊浦残耘c較高的準(zhǔn)確性。移植性良好的算法通常模型較為簡(jiǎn)單,且包含一定的簡(jiǎn)化,當(dāng)實(shí)際情況較為復(fù)雜時(shí)難以準(zhǔn)確表示。另一方面,能夠準(zhǔn)確描述實(shí)際情況的模型,通常需要大量的調(diào)試以確定參數(shù),這使得對(duì)應(yīng)的算法移植性略顯不足,模型泛化能力較差。因此,有必要研究新的算法,并使其移植性與準(zhǔn)確性均達(dá)到較高水平。 (2) 通過(guò)校正算法的聯(lián)合使用,可以有效結(jié)合多種算法的優(yōu)點(diǎn),從而增強(qiáng)基于算法的校正方法的泛化能力,以滿足多組分氣體在線檢測(cè)的需求。因此,組合算法亦是基于算法的交叉干擾校正方法的主要發(fā)展方向。
3.2 主成分回歸

3.3 偏最小二乘

3.4 神經(jīng)網(wǎng)絡(luò)


3.5 小結(jié)

4 交叉干擾校正方法的評(píng)價(jià)指標(biāo)



5 結(jié)論