曾慶松,王菊香,邢志娜,魏騰飛,孫 宇
(1.海軍航空大學, 山東 煙臺 264001; 2.中國人民解放軍92212部隊, 山東 青島 266100)
近紅外光譜技術因其特有的無損、高效的特點得到廣的關注與研究,在眾多領域已經投入使用并取得良好的效益,特別是在物質分析與檢測方面。在噴氣燃料的檢測方面[1~4],袁洪福,李華等實現了冰點、烯烴和總硫含量的測量,并獲得了精度較高的預測模型。但是,近紅外光譜技術受外部測量條件影響較大,其中溫度的影響最為顯著,這為實現在線檢測及非實驗室條件測量帶來很大的困難。Liu等[5]通過實驗評估得出溫度變化給測量帶來的誤差占總誤差的50%以上。
消除溫度影響的方法主要有兩類:一類是建立溫度濾波矩陣,將非基準溫度下的光譜修正至基準溫度,然后進行預測,主要包括:外部參數正交化(external parameter orthogonalization,EPO)[ 6-8 ]、動態正交投影(dynamic orthogonal projection, DOP)[9]和分段直接標準化(piecewise direct standardization,PDS)[10]等。另一類是建立對溫度不敏感的預測模型,主要方法有選擇溫度不敏感波長進行建模和采用所有溫度的光譜數據進行全局溫度建模[11]。
其中,EPO方法在修正溫度影響方面有其特有的優勢:不僅對溫度干擾有著很好的抑制作用,而且建模的難度遠遠低于傳統的多變量建模方法。EPO方法不用收集大量的數據,僅需采集少量具有代表性的樣本在不同溫度下的光譜數據即可獲得溫度濾波矩陣,從而對光譜進行濾波,這一特點使溫度修正的工作量大大減小。本文以噴氣燃料的密度為例,重點研究EPO方法能否消除溫度對噴氣燃料光譜的影響,并考察劃分溫度子區間對濾波效果的影響,將其結合PLS進行建模并與全局溫度建模方法和直接建模方法進行對比。
實驗共采集了35個噴氣燃料樣本,根據GB/T 1884—2000《原油和液體石油產品密度實驗室測定法(密度計法)》測定樣本的密度。經測量得到35個樣本的密度如表1所示。
光譜采集系統波長檢測范圍為1 100~2 500 nm,波長的分辨率為1 nm;采用光程為5 mm的石英比色皿測量樣本吸光度,對每個樣本掃描3次,積分時間為30 ms,保證每次掃描波長的重復性不超過,最終取平均光譜作為樣本原始光譜。
采用恒溫箱對樣本進行保溫和加熱至設定溫度,分辨率為0.1 ℃。溫度區間為15~45 ℃,間隔5 ℃,在各個溫度依次操作得到35個樣本在7個溫度(15 ℃、20 ℃、25 ℃、30 ℃、35 ℃、40 ℃、45 ℃)下的光譜數據,并以25 ℃下的光譜作為基準光譜。實驗所選的溫度范圍基本覆蓋噴氣燃料存儲環境可能出現的溫度,因此對這些溫度下的光譜進行溫度修正具有普適意義。
外部參數正交化是以主成分分析(principal component analysis,PCA)為基礎的溫度修正方法,一般適用于外部參數無法實時測量的情況[12]。通過EPO方法可以將吸光度光譜分解為干擾信號和有用信號[13],本文中有用信號為基準溫度下的樣本吸光度,干擾信號為因溫度變化而引起的光譜變化,因此光譜的分解表達式為:
X=XP+XQ+R
(1)
式(1)中:P為有用子空間的投影矩陣;Q為干擾(溫度)子空間的投影矩陣;R為濾波冗余部分,一般視為隨機噪聲,可忽略不計。
(2)
M中每一行表示在相同溫度下所有樣本的光譜在同一波長點的平均值。
溫度差分矩陣D計算公式為:
D=MT-MTr
(3)
然后求取差分矩陣的協方差矩陣,再對其進行主成分分析,即
[U,S,VT]=svd(DTD)
(4)
以奇異值矩陣S對角線上的奇異值為依據,選擇前n個奇異值所對應右奇異值矩陣V的特征向量構成新矩陣Vs,參數n的選擇與n個主成分的累計貢獻率有關,一般要求達到90%以上。
接著計算干擾子空間的投影算子矩陣Q,
(5)
然后可得到溫度濾波矩陣P,
P=I-Q
(6)
(7)
2.3.1樣本集劃分
使用EPO方法消除溫度對光譜的影響僅需采用部分典型樣本用于建立溫度濾波矩陣。典型樣本從校正集中產生,采用SPXY(sample set partitioning based on joint x-y distance)方法對25 ℃的光譜進行劃分,校正集和驗證集的比例為8∶2。SPXY[14-15]不僅計算樣本光譜X之間的距離,同時也考慮Y之間的距離,因此可以最大程度保證對多維向量空間的有效覆蓋,提高樣本集的代表性與差異性,其計算公式為:
(8)
(9)
由SPXY方法劃分得到的校正集和驗證集如表2所示。

表2 SPXY樣本集劃分結果
2.3.2全溫度區間和劃分溫度子區間典型樣本選擇
研究在不同溫度區間選取典型樣本和典型樣本數量對溫度濾波效果的影響,本文設計了2種方案:① 在全溫度區間選擇不同數量的典型樣本建立濾波矩陣;② 首先確定典型樣本數量,然后劃分3個溫度子區間分別建立各子區間的濾波矩陣。
全溫度段的濾波矩陣獲取:以密度為依據設計了3種不同的樣本選取方法,并編號為A、B和C,具體如表3所示。方法A所選樣本密度為中間值;方法B選取的3個樣本的密度分別為最小、最大及中間值;方法C為按樣本的密度分布均勻選取12個樣本。將采用A方法所選樣本建立溫度濾波矩陣記為EPO-A,其余以此類推。

表3 全溫度區間濾波矩陣建立選取的典型樣本
各子區間濾波矩陣的建立:劃分3個溫度子區間:15~25 ℃、25~35 ℃、35~45 ℃,同樣以25 ℃為基準溫度,分別計算各區間的濾波矩陣,用于對各區間內的光譜進行溫度濾波。對比A、B、C方法的實驗結果可知B方法樣本數量較少,效果較優,故以B方法為例進行說明,具體如表4所示。記用B1溫度區間典型樣本建立濾波矩陣的EPO方法為EPO-B1,其余類似。

表4 溫度子區間濾波矩陣建立選取的典型樣本
建立PLS全局溫度預測模型需要校正集在所有溫度下的光譜數據,數據量較大。而全溫度段的PLS-EPO建模方法與PLS基準溫度法相類似,首先用預先獲得的溫度濾波矩陣對所有溫度下的光譜進行溫度修正;然后用修正后的校正集光譜(25 ℃)進行建模,用所建模型對所有溫度驗證集進行預測。幾種建模方法的校正集和驗證集具體如表5所示。
對于劃分溫度子區間的PLS-EPO建模方法以EPO-B方法為例進行說明:首先采用預先獲取的3個濾波矩陣將各自溫度區間的所有光譜修正至基準溫度;然后用各溫度區間修正后的校正集光譜(25℃)分別建模,建立的3個模型可對各自區間驗證集進行預測,樣本具體編號如表6所示。記第一個溫度區間建模方法為PLS-EPO-B1,其余依次類推。
在本實驗中以預測標準偏差(SEP)和決定系數(R2)為指標來評價模型的預測效果。

表5 不同預測模型的建模樣本

表6 溫度子區間預測模型的建模樣本
采用表3中A,B,C 3種典型樣本選取方法,由式(2)~式(7)計算得到3個溫度濾波矩陣,然后對所有溫度下的光譜進行溫度修正。以校正集中的16號樣本為例進行展示,計算其在各溫度下溫度修正前后與25 ℃光譜的差異系數,結果如表7所示。

表7 EPO方法溫度修正前后光譜差異系數
由表7可知EPO方法的溫度濾波效果較好,濾波后光譜的差異系數下降了一個數量級,EPO-B和C的光譜校正率達到90%以上,特別是EPO-B以較少的典型樣本獲得較優的濾波效果。
繪制16號樣本經EPO-B處理前后的光譜圖,如圖1所示。
如圖1所示,圖1(a)為原始光譜,圖1(b)為溫度修正后光譜,圖1(c)、圖1(d)分別為溫度修正前后的差分曲線。對比圖1(a)和圖1(b)可明顯觀察到溫度對光譜的影響較大,而經過EPO-B方法修正后不同溫度下的光譜重復性顯著提升。觀察圖1(c)和圖1(d)可知經過EPO-B修正后光譜間的差分效果明顯增強,光譜在不同溫度下的差異大大減小,由此可見,EPO-B對光譜的修正效果較好。其余2種方法效果與EPO-B相類似,此處不再展示。
按表4中的方案分別計算得到3個溫度區間的濾波矩陣,再對各自區間的光譜進行溫度修正。同樣以16號樣本為例,求得各區間濾波前后的光譜差異系數,如表8所示。

表8 EPO-B方法溫度修正前后光譜差異系數
劃分區間后最低校正率達到91.31%,與表7相比,校正率得到進一步提升,說明劃分溫度子區間建立多個濾波矩陣進行溫度修正比全溫度區間共用一個濾波矩陣的效果更好,矩陣的濾波性能得到一定程度的提升。
以EPO-B2為例,繪制16號樣本處理前后的光譜,如圖2所示。由圖1和圖2中的(b)可以看出經EPO-B2濾波后的3條光譜幾乎一樣,有更好的重復性;對比圖(d)說明EPO-B2濾波后的光譜差分要優于EPO-B。由此可見,縮小溫度區間可進一步提升EPO方法的溫度濾波效果。

圖1 16號樣本在不同溫度下經EPO-B處理前后的光譜

圖2 16號樣本30 ℃及35 ℃經EPO-B2處理前后的光譜Fig.2 Spectra of sample No.16 at 30 ℃ and 35 ℃ comparison before and after EPO-B2 treatment
采取表5中的建模方案建立噴氣燃料密度預測模型,然后對驗證集進行預測,以預測標準偏差(SEP)和決定系數(R2)為評價指標,結果如表9所示。

表9 不同建模方法預測結果
由表9可見,PLS-EPO方法和PLS全局溫度所建模型均取得了較好的預測效果,R2均在0.91以 上,模型預測性能與PLS基準溫度模型較為接近。尤其是PLS-EPO-B方法以數量較少的典型樣本獲取濾波矩陣,對光譜進行溫度修正并建模,其效果與采用大量數據進行建模的全局溫度模型預測效果相當。另外,采用更多典型樣本的數量可在一定程度上提升模型的預測效果。
同樣,按表6中的方案建立各個溫度子區間的預測模型,并對各自的驗證集進行預測,結果如表10所示。由表可知,在各個溫度子區間建立的模型預測能力進一步提升,預測效果與基準溫度模型非常接近。

表10 EPO-B區間模型預測結果
結合表9與表10,對所有模型進行綜合比較,如表11所示。

表11 不同模型預測結果
可見,PLS-EPO-B方法所建模型與PLS全局溫度模型預測性能無明顯差距,但建模樣本數少,建立的PLS模型主成分數也較少。劃分溫度子區間后,采用PLS-EPO-B(123)方法建立的模型預測效果再次提升,在各個溫度區間均取得很好的預測效果,SEP和R2與基準溫度所建模型差距很小,說明EPO方法選擇合適的典型樣本,在一定的溫度范圍內幾乎可以消除溫度對光譜的影響,溫度修正效果與區間大小成反比趨勢。
1) 采用EPO方法可以很好的消除溫度變化對光譜的影響,光譜在不同溫度下的差異得到有效抑制,對濾波后的光譜數據進行PLS建模可以得到高預測精度的模型。
2) 選取少量、合適的典型樣本即可以獲得濾波效果好的矩陣。
3) 縮小溫度區間可進一步提升EPO方法的溫度濾波效果,建立性能更優精度要求較高的預測模型,需要建立更多的模型。
4) EPO方法獲取濾波矩陣與預測模型的建立是相互獨立進行的,在很大程度上簡化了建模的復雜性。
5) 全局溫度建模法也可以獲得性能較好的預測模型,但其建模需要所有溫度的光譜數據,所建模型的復雜度也高于PLS-EPO方法。
6) EPO方法在消除溫度對噴氣燃料光譜的影響方面有較好的效果,可為實現在線分析和非實驗室環境檢測提供理論支持,并為消除其他外部干擾提供借鑒。