劉洋君,王菊香,邢志娜
(海軍航空大學(xué), 山東 煙臺(tái) 264001)
初餾點(diǎn)是表征燃料餾分組成的重要指標(biāo),用于衡量噴氣燃料的蒸發(fā)特性,在生產(chǎn)和使用中都必須進(jìn)行檢驗(yàn),以確保發(fā)動(dòng)機(jī)工作正常。
近紅外光譜技術(shù)(NIRS)在燃料快速分析中已得到廣泛應(yīng)用,但光譜中存在對(duì)分析和建模沒有貢獻(xiàn)的無關(guān)變量以及影響模型建立、導(dǎo)致模型質(zhì)量下降的干擾信息,因此有必要在校正模型建立過程中篩選波長(zhǎng)以提高校正模型的穩(wěn)健性和預(yù)測(cè)能力[1-2]。
由于物質(zhì)濃度及性質(zhì)與光譜變量之間存在非線性因素,以及光譜測(cè)量過程中儀器的噪聲、工作狀態(tài)變化及環(huán)境影響,使線性校正方法難以得到理想的校正模型。盡管PLS方法可以在一定程度上校正非線性模型,但當(dāng)非線性較為顯著時(shí),便較難得到理想的校正模型[5]。而BP神經(jīng)網(wǎng)絡(luò)可以實(shí)現(xiàn)輸入與輸出之間的任意非線性映射,具有較強(qiáng)的非線性映射逼近和預(yù)測(cè)能力。
本文通過iPLS法對(duì)建模區(qū)間進(jìn)行優(yōu)選,采用BP-ANN建立噴氣燃料初餾點(diǎn)的近紅外定量分析模型,并與PLS所建立的定量分析模型預(yù)測(cè)效果進(jìn)行了比對(duì)。
共采集了各部隊(duì)化驗(yàn)室的35個(gè)噴氣燃料樣本,依據(jù)GB/T 6536—2010測(cè)定初餾點(diǎn),如表1所示。

表1 樣本初餾點(diǎn)值 ℃
樣本在25±0.5 ℃條件下采集光譜。樣本光譜的波長(zhǎng)范圍為1 100~2 500 nm,使用5 mm光程的石英比色皿測(cè)量吸光度。每個(gè)樣本的光譜需采集3次,要求重復(fù)性小于5×10-4,并取平均光譜作為原始光譜。Kennard/Stone(K/S)算法可選出代表性強(qiáng)、分布均勻的樣品,是一種應(yīng)用較為廣泛的樣本選取方法[3]。本文采用K/S算法從35個(gè)樣本中選取30個(gè)樣品作為校正集樣本,5個(gè)作為驗(yàn)證集樣本。
Savitzky-Golay(S-G)卷積平滑法可以有效地消除光譜中的噪聲[4]。為消除光譜的基線平移和背景干擾,采用S-G一階卷積導(dǎo)數(shù)處理平滑后的光譜。窗口寬度是兩種預(yù)處理方法的重要參數(shù),若窗口寬度太小,S-G卷積平滑法的去噪效果不佳,S-G一階卷積導(dǎo)數(shù)則會(huì)引入噪聲,降低信噪比;若窗口寬度過大,兩種預(yù)處理方法均會(huì)在平滑噪聲的同時(shí)丟失有用信息,造成光譜信號(hào)的失真。
S-G卷積平滑法和S-G一階卷積導(dǎo)數(shù)法對(duì)光譜預(yù)處理的過程和原理較為相似,因此本文兩種預(yù)處理方法取相同的窗口寬度。為選擇合適的窗口寬度,考察兩種方法在5~19點(diǎn)范圍內(nèi)對(duì)建模效果的影響,如圖1所示。通過比較可知,當(dāng)窗口寬度為15點(diǎn)時(shí),模型的預(yù)測(cè)性能最好。預(yù)處理前后的光譜見圖2。
噴氣燃料近紅外光譜與初餾點(diǎn)相關(guān)系數(shù)如圖3所示,圖中所反映的波長(zhǎng)與初餾點(diǎn)的相關(guān)性較弱,手動(dòng)選取建模波長(zhǎng)較為困難,不易達(dá)到理想的效果。

圖2 預(yù)處理前和預(yù)處理后的光譜曲線
iPLS法是一種波長(zhǎng)區(qū)間選擇方法,其原理是將全譜區(qū)以固定寬度等分成若干等寬子區(qū)間,在每個(gè)子區(qū)間上分別進(jìn)行PLS回歸,建立局部模型,選擇交互驗(yàn)證標(biāo)準(zhǔn)差最小局部模型對(duì)應(yīng)的的子區(qū)間作為優(yōu)選區(qū)間[5,6],能夠簡(jiǎn)化模型、減少建模波長(zhǎng)變量,具有簡(jiǎn)便快捷、計(jì)算量小等優(yōu)點(diǎn)。應(yīng)用iPLS方法優(yōu)選建模區(qū)間流程如圖4所示。子區(qū)間寬度調(diào)整為30~70,比較不同區(qū)間寬度下iPLS法對(duì)建模效果的影響,結(jié)果如圖5。通過比較,當(dāng)子區(qū)間寬度為55時(shí),對(duì)應(yīng)的最佳子區(qū)間所建立的模型預(yù)測(cè)效果最好,在該寬度的子區(qū)間下,選擇1 650~1 705 nm光譜區(qū)間作為優(yōu)選的建模區(qū)間。

圖3 波長(zhǎng)-初餾點(diǎn)相關(guān)系數(shù)曲線

圖4 iPLS區(qū)間優(yōu)選方法流程框圖

圖5 不同寬度下iPLS優(yōu)選區(qū)間建模效果曲線
為研究區(qū)間組合對(duì)模型質(zhì)量的影響,將iPLS法計(jì)算得到的交互驗(yàn)證標(biāo)準(zhǔn)差最小的5個(gè)區(qū)間1 650~1 705 nm、1 320~1 375 nm、1 210~1 265 nm、2 475~2 500 nm、1 705~1 760 nm組合,比較組合區(qū)間建立校正模型的預(yù)測(cè)能力。不同個(gè)數(shù)的最佳區(qū)間組合見表2。通過比較,以1 650~1 705 nm作為建模區(qū)間所建立的校正模型預(yù)測(cè)能力最佳,因此,應(yīng)以該區(qū)間作為最終的優(yōu)選建模區(qū)間。

表2 不同區(qū)間組合對(duì)模型預(yù)測(cè)能力的影響
如圖6所示,BP神經(jīng)網(wǎng)絡(luò)由輸入層、隱藏層和輸出層組成。光譜數(shù)據(jù)由輸入層輸入向量x后,施以權(quán)重傳輸至隱藏層,隱藏層經(jīng)過權(quán)值、閾值和激勵(lì)函數(shù)運(yùn)算后傳輸?shù)捷敵鰧樱奢敵鰧咏o出預(yù)測(cè)值y,若預(yù)測(cè)值與實(shí)測(cè)值之間的誤差較大,則從輸出層開始反向傳播該誤差,進(jìn)行權(quán)值、閾值的調(diào)整,直至誤差減小到給定的范圍[7]。若輸入向量維數(shù)過高,輸入層神經(jīng)元過多,會(huì)導(dǎo)致網(wǎng)絡(luò)訓(xùn)練時(shí)間太長(zhǎng),造成運(yùn)算無法收斂。本文將iPLS法優(yōu)選的波長(zhǎng)區(qū)間作為神經(jīng)網(wǎng)絡(luò)的輸入,輸入向量維數(shù)從1 400減少到55,能夠提高神經(jīng)網(wǎng)絡(luò)的訓(xùn)練速度,降低校正模型復(fù)雜度。

圖6 BP-神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖
構(gòu)建隱藏層數(shù)為3,目標(biāo)均方差為10-6,學(xué)習(xí)率為0.001,輸入層和隱含層的傳遞函數(shù)均采用tansig函數(shù),輸出層的傳遞函數(shù)采用purelin函數(shù)的BP-ANN,以iPLS法優(yōu)選的校正集光譜建模區(qū)間作為神經(jīng)網(wǎng)絡(luò)的輸入,建立初餾點(diǎn)校正模型,對(duì)驗(yàn)證集樣本的初餾點(diǎn)進(jìn)行預(yù)測(cè),結(jié)果見表3。通過配對(duì)t檢驗(yàn),得t值為0.32,低于顯著性水平α=0.05,自由度為5時(shí)的臨界值2.571,表明模型預(yù)測(cè)的準(zhǔn)確度較高。

表3 驗(yàn)證集樣本初餾點(diǎn)預(yù)測(cè)值 ℃
分析表4和圖7所示不同建模方法建立的初餾點(diǎn)校正模型預(yù)測(cè)準(zhǔn)確度數(shù)據(jù),可知:采用全譜區(qū)建立的PLS校正模型預(yù)測(cè)效果不及iPLS優(yōu)選區(qū)間后所建立的PLS校正模型;在優(yōu)選區(qū)間相同情況下BP-ANN校正模型優(yōu)于PLS校正模型。
文獻(xiàn)[8]在700~1 100 nm的短波近紅外光譜區(qū)間內(nèi),建立的初餾點(diǎn)校正模型的預(yù)測(cè)相關(guān)系數(shù)r為0.886 1,驗(yàn)證標(biāo)準(zhǔn)差為2.69 ℃。綜合比較,iPLS結(jié)合BP-ANN方法在長(zhǎng)波近紅外光譜區(qū)間內(nèi)能夠建立預(yù)測(cè)能力較強(qiáng)的初餾點(diǎn)近紅外校正模型。

表4 不同方法所建模型評(píng)價(jià)參數(shù)值

圖7 樣本初餾點(diǎn)預(yù)測(cè)值與真實(shí)值關(guān)系圖
針對(duì)噴氣燃料初餾點(diǎn)近紅外光譜校正模型的建立,研究了不同建模區(qū)間和不同建模算法的建模效果。通過對(duì)不同區(qū)間PLS校正模型以及同一優(yōu)選區(qū)間下不同建模算法進(jìn)行比較,證明iPLS和BP-ANN均可在一定程度上提高模型的預(yù)測(cè)準(zhǔn)確度。iPLS區(qū)間優(yōu)選結(jié)合BP-ANN建模能夠有效解決全譜區(qū)內(nèi)干擾信息對(duì)校正模型的影響,有利于建立準(zhǔn)確度更高的近紅外光譜定量分析模型。