摘 要 分段直接校正(PDS)算法是目前最常用的近紅外光譜模型傳遞方法,但它在對整個譜區進行校正時,始終依賴大小不變的傳遞窗口。為了提高傳遞效果,本研究在PDS基礎上提出了一種新的算法——小波多尺度分段直接校正法(WMPDS),用于混胺的近紅外光譜模型傳遞,并詳細討論了模型的傳遞參數和傳遞結果。本算法首先對混胺的近紅外光譜進行小波分解,然后用PDS算法對每一層小波系數進行傳遞,PDS窗口隨小波系數頻率的提高進行動態調整,最后進行小波重構。本算法能有效消除不同儀器之間的大部分差異,大幅度地改善分析精度,與傳統的PDS相比,傳遞效果明顯提高。
關鍵詞 近紅外光譜; 模型傳遞; 小波多尺度分段直接校正
2010-05-21收稿;2010-12-11接受
本文系國防預研基金項目(No.9140A19050106JB1409)資助
* E-mail:juxiangw@163.com
1 引 言
模型傳遞也稱儀器標準化,是指經過數學處理后,使一臺儀器上的模型能夠用于另一臺儀器,從而減少重新建模所帶來的巨大工作量,實現樣品和數據資源的共享[1]。目前,模型傳遞大多使用的是有標模型傳遞算法,主要有S/B算法[2]、Shenk′s算法[3]、普魯克算法[4]、直接校正(DS)算法[5]、分段直接校正(PDS)算法[6,7]和目標因子法[8]等,其中應用最為普遍和最為成功的方法是PDS算法。近年來,小波分析作為一種新的時頻分析方法,廣泛應用于多個領域。小波變換(WT)結合PDS用于模型傳遞的算法已有報道,田高友等[9]用小波變換對原始光譜進行壓縮,然后對壓縮后的光譜進行傳遞;譚超等[10]在PDS傳遞時,用小波對原始光譜進行分解,光譜去噪后對剩余小波系數進行逐個傳遞,最后進行重構與預測。他們強調的是小波在預處理中的壓縮和去噪能力,小波主要起預處理的作用。本研究充分利用小波變換多分辨率分析的特點,建立了一種新的模型傳遞算法: 將WT和PDS充分融合,利用小波在空間域具有的表征信號局部特性的能力,將儀器間差異分解到各層小波系數中,調整各層的PDS窗口寬度實現最佳傳遞效果。
2 原理與算法
小波分析是由法國工程師J. Morlet在1974年提出的[11],它克服了短時傅里葉變換單分辨率上的缺陷,具有多分辨率分析的特點。PDS算法是一種多元全譜區模型傳遞算法,它的基本假設是實際光譜數據的變化只局限于一個小的區域,選擇合適的窗口能對各個波長點的光譜進行校正。
小波多尺度分段直接校正法的基本思想:對于已知樣品,在不同近紅外光譜儀測得的近紅外光譜存在較大差異。由于產生差異原因的多樣性,這些差異強度及體現在譜區的范圍有很大不同,有的尖銳,有的平緩,有些是局部性,有些是全譜區。由于小波變換的多分辨率分析的特點,因此可以利用小波變換將這些不同類型的差異分解到各層的小波系數中。在低頻部分,小波系數比較相似,差異一般局限在一小塊譜區內,可選擇較小的PDS窗口寬度進行校正;在高頻部分,小波系數差異較大,差異體現在較寬的譜區內,需選擇較大的PDS窗口寬度進行校正。WMPDS算法就是根據需要,選擇不同的小波函數和分解層數,將儀器間差異分解到各層小波系數中,然后動態調整PDS窗口寬度在各層小波系數進行校正。
小波多尺度分段直接校正法的具體步驟:(1)在校正集中選擇有代表性的樣品作為轉換集樣品,在光譜檢測和建模的主儀器獲得其光譜AM,在其它光譜儀(從儀器)上獲得其光譜AS; (2)選定母小波和小波分解的層數n,則光譜信號x可分解為
x≈v0+w0+w1+……+wn(1)
根據(1)式,可以對AM和AS進行分解:
AM≈AM,v0+AM,w0+AM,w1+……+AM,wn(2)
AS≈AS,v0+AS,w0+AS,w1+……+AS,wn(3)
(3)用PDS算法計算AM,v0和AM,v0(v0項對應的矩陣)間的轉換矩陣,PDS算法的窗口寬度選為f0。wi對應的矩陣也用PDS算法計算轉換矩陣,窗口寬度由公式fi=2if0計算得到; (4)在從儀器上測定預測集的近紅外光譜,按步驟(2)選擇的參數進行分解,用步驟(3)中的轉換矩陣對各層小波系數進行校正,然后對校正后的小波系數進行重構。
3 實驗部分
3.1 樣品性質的測定及光譜的采集
混胺是一種液體燃料,由三乙胺和二甲苯胺各約50%組成,易揮發、易吸濕,在貯存過程中各成分會發生變化。本研究從各化驗室采集不同存貯周期的混胺樣品68份,用0.5 mol/L HCl和0.5 mol/L NaOH標準溶液,采用返滴定電位分析測定二甲苯胺含量。
分別用兩臺TH2000型近紅外光譜儀(分別記作TH2000a和TH2000b,北京英賢公司)測定采集到的混胺樣品的光譜。近紅外光譜配備2048 象元線形陣列CCD 檢測器,分辨率優于1.5 nm,光譜采集范圍700~1100 nm,數據間隔0.2 nm。測量時將混胺樣品倒入5 cm玻璃樣品池,穩定8 min,以空氣為參比進行光譜掃描,掃描10次取平均值。
第6期王菊香等: 小波多尺度分段直接校正法用于近紅外光譜模型傳遞的研究
3.2 評價參數
采用校正標準偏差(SEC)、預測標準偏差(SEP)和決定系數(R2)評價PLS模型的質量,當SEC和SEP較小且比較接近時,PLS模型精度較高,穩健性較好。采用光譜平均差異(ARMS)評價傳遞性能[9]。ARMS能反映不同儀器間的光譜差異,ARMS越大,儀器差異越明顯。
4 結果與討論
4.1 主儀器上PLS模型的建立
將68個混胺樣品,按二甲苯胺的含量進行排序,然后每間隔4個選1個作為預測集樣品,選出14個作為預測集,剩下54個作為校正集,兩臺儀器的校正集和驗證集的樣品相應一致。在兩臺儀器上分別建立PLS模型,對預測集的組分含量進行預測。建模過程中采用“留一”交叉驗證法確定最佳主成分數,模型參數和預測結果如表1所示。由表1可知,兩臺儀器對混胺的各組分預測的R2都大于0.98,SEC和SEP比較小且比較接近,說明兩臺儀器的性能能達到分析要求。本實驗選擇TH2000b作為主儀器,TH2000a作為光譜模型傳遞從儀器。 4.2 轉換集樣品的選擇
在有標樣的模型傳遞中,需要選擇轉換集樣品,根據所選樣品計算轉換矩陣。轉換集樣品數對模型傳遞效果有影響。轉換集中樣品數太少,轉換矩陣包含的轉換信息不充分;標樣數太多,使實際應用變得復雜。本研究采用K/S算法,從主儀器的校正集中選取標準樣品。通過ARMS對標樣數作圖確定合適的標樣數。
圖1為從儀器的光譜傳遞后的ARMS隨標樣數的變化趨勢圖。隨著標樣數的增多,ARMS逐漸下降;當標樣數增至5時,ARMS變化幅度趨于平穩。因此,標樣數選取5。
圖1 預測集的ARMS隨轉換集樣品數的變化
Fig.1 Changs of average of root mean square(ARMS) with standard sample numbers
4.3 模型傳遞參數的選擇
采用“db4”作為母小波對混胺的近紅外光譜進行小波分解,選擇WMPDS算法的傳遞參數。對于WMPDS算法,參數的選擇主要有小波的分解層數w 和PDS窗口寬度f(即WMPDS算法步驟(3)中的f0)。在PDS算法進行傳遞時,如果f過小,選定的光譜數據會遺漏儀器間的差異,傳遞性能較差;如果f過大,選定的光譜數據將含有與儀器無關的信息,不僅計算量大,而且存在“過校正”現象,傳遞性能變差。小波分解的層數與分析的精度要求及光譜的信噪比有關。本研究考察小波分解層數的變化范圍為1~6,PDS窗口寬度的范圍為3~17,間隔為2點。用WMPDS算法校正預測集在從儀器上測定的光譜,ARMS隨兩者的變化如表2所示。當固定w時,ARMS隨f增加而減小,在某個寬度達到最小。然后, ARMS隨f增加而增大;當固定f時,ARMS隨w的變化也是先減小后增大,存在極小值。WMPDS的最佳參數為w=4,f=13。
4.4 模型傳遞結果分析 圖2 WMPDS傳遞前后的近紅外光譜圖
Fig. 2 NIR spectra of mixed amine before and after calibration transfer by WMPDS
圖2為混胺樣品在主儀器和從儀器上測定的光譜及用WMPDS算法校正后的光譜,其中WMPDS的參數為w=4,f=13。觀察在主、從儀器上測量得到的樣品的光譜圖,可以看出兩臺儀器測量的光譜之間的差異是非常明顯的;經過WMPDS校正后,光譜差異不明顯。
為了進一步說明WMPDS的傳遞效果,分別用主儀器模型對預測集在從儀器上測得的光譜和經過WMPDS算法校正過后的光譜進行預測,預測結果如表3所示。經WMPDS校正后,水分含量的SEP由0.110降到0.044,R2由0.365提高到0.894;三乙胺含量的SEP由0.881降到0.368,R2由0.605提高到0.933;二甲苯胺含量的SEP由0.769降到0.425,R2由0.799提高到0.938。結果表明: WMPDS能明顯改善模型的分析精度。圖3為經WMPDS傳遞前后三乙胺含量預測值與標準方法測定值的相關圖。經WMPDS校正后,對預測集的預測效果明顯提高。
Fig.3 Correlation of triethylamine between test and NIR predicted before and after calibration transfer by WMPDS
4.5 與PDS傳遞結果的比較
PDS算法的校正步驟:采用K/S算法在校正集中選擇轉換樣品集,通過PDS算法計算轉換矩陣,然后在對預測集的光譜進行校正,轉換集大小和PDS寬度通過ARMS最小的原則選出。在PDS校正的過程中,選擇的轉換集大小為5,窗口寬度為13,與WMPDS的最優參數w=4,f=13比較可知,WMPDS的傳遞過程相對于PDS并未簡化。分別用PDS算法和WMPDS算法對預測集在從儀器測得的光譜進行模型轉移,然后在主儀器的模型上對混胺的各組分進行預測,預測結果如表4所示。
由表4可知,無論是對水分含量,還是對三乙胺含量或二甲苯胺含量的預測,WMPDS的傳遞精度均好于PDS。說明在WMPDS算法中,通過小波變換把不同差異(可以理解為頻率)分解,用動態的窗口寬度進行轉移后,傳遞結果優于固定窗口寬度PDS算法。
綜上可知:(1)WMPDS算法用于混胺的近紅外光譜模型傳遞,能有效扣除不同近紅外光譜儀之間的差異,提高模型分析精度,實現不同儀器間模型的共享。(2)與傳統的PDS算法相比,WMPDS的傳遞過程未得到優化,但傳遞精度顯著提高。
References
1 ZHANG Xue-Bo, FENG Yan-Chuan, HU Chang-Qin(張學博,馮艷春,胡昌勤). Chin. J. Plarm. Anal.(藥物分析雜志), 2009, 29(8): 1390~1399
2 CHU Xiao-Li, YUAN Hong-Fu, LU Wan-Zhen(褚小立,袁洪福,陸婉珍). Spectroscopy and Spectral Analysis(光譜學與光譜分析), 2001, 21(6): 881~885
3 LU Wan-Zhen(陸婉珍). Medern Analysis Technique of NIR(現代近紅外光譜分析技術). Beijing(北京): Sinica Petro Chemistry Press(中國石化出版社), 2007: 89
4 CHU Xiao-Li, YUAN Hong-Fu, LU Wan-Zhen(褚小立,袁洪福,陸婉珍). Chinese J. Anal. Chem.(分析化學), 2002, 30(1): 114~119
5 LI Qing-Bo, ZHANG Guang-Jun, XU Ke-Xin, WANG Yan(李慶波,張廣軍,徐可欣,汪 彥). Spectroscopy and Spectral Analysis(光譜學與光譜分析), 2007, (5): 873~876
6 Griffiths M L, Svozil D, Worsfold P, Evans E H. Journal of Analytical Atomic Spectrometry, 2006, 21(10): 1045~1052
7 Tortajada-Genaro L A, Campins-Falco P. Talanta, 2007, 72(3): 1004~1012
8 WANG Yan-Bin, YUAN Hong-Fu, LU Wan-Zhen(王艷斌,袁洪福,陸婉珍). Spectroscopy and Spectral Analysis(光譜學與光譜分析), 2005, 25(3): 398~401
9 TIAN Gao-You, CHU Xiao-Li, YUAN Hong-Fu, LU Wan-Zhen(田高友,褚小立,袁洪福,陸婉珍). Chinese J. Anal. Chem.(分析化學), 2006, 34(7): 927~932
10 TAN Chao, QIN Xin, WU Tong(譚 超,覃 鑫,吳 同). Computers and Applied Chemistry(計算機與應用化學), 2009, 26(5): 645~648
11 ZHANG Rui-Feng(張瑞豐). Wavelet Analysis and Project Application with Matlab(Matlab小波分析與工程應用). Beijing(北京): National Defense Industry Press(國防工業出版社), 2008: 5~10
Application of Wavelet Multi-Scale Piecewise Direct Standardization on
Near Infrared Analysis Calibration
WANG Ju-Xiang1, LI Hua2, XING Zhi-Na1, GUO Heng-Guang1
1(Department of Airborne Vehicle Engineering, Naval Aeronautical and Astronautical, Yantai 264001)
2(The 91388th Unit PLA, Zhanjiang 524000)
Abstract Piecewise direct standardization (PDS) is the most popular method on near infrared analysis calibration transfer. One of the disadvantages of PDS is that the window widths are the same in the whole near infrared (NIR) spectral wavelengths as the window width is too large in some spectra region and too small in the others. A new calibration transfer method based on PDS was proposed to improve the calibrated results, the new method is wavelet multi-scale piecewise direct standardization (WMPDS). It was used for calibration transfer in NIR analysis of mixed amine. Wavelet transfer (WT) was conducted to discompose NIR data and then PDS was applied to correct the wavelet coefficients. The window widths of PDS were changed as the wavelet coefficients changed and the reconstruction of the coefficient was next to the correction of PDS. WMPDS can well correct the differences between instruments and improve analytical accuracy greatly. The performance of WMPDS is better than that of PDS in NIR calibration transfer.
Keywords Near infrared; Calibration transfer; Wavelet multi-scale piecewise direct standardization
(Received 21 May 2010; accepted 11 December 2010)