歐陽愛國,唐天義,王海陽,劉燕德
(華東交通大學 光機電技術及應用研究所,江西 南昌 330013)
近紅外光譜法檢測乙醇柴油主要性能指標
歐陽愛國*,唐天義,王海陽,劉燕德
(華東交通大學 光機電技術及應用研究所,江西 南昌 330013)
乙醇柴油是柴油替代品的一種,它的使用越來越廣泛,乙醇柴油品質由許多指標決定,采用傳統方法檢測這些指標不僅價格昂貴而且耗時長。近紅外光譜技術是一種廉價、快速實時在線檢測乙醇柴油品質的有效方法。本文采用近紅外光譜技術結合最小二乘支持向量機檢測了乙醇柴油的密度、粘度和乙醇含量,比較了線性和非線性校正技術(主成分回歸、偏最小二乘回歸和最小二乘支持向量機)對乙醇柴油品質的分析效果,同時也比較了不同預處理方法對預測模型能力的影響。實驗結果表明,最小二乘支持向量機優于主成分回歸和偏最小二乘回歸模型,其對乙醇柴油密度、粘度、乙醇含量建模效果最優,相關系數分別是0.995 8、0.995 7和0.995 3;預測均方根誤差分別為0.000 68、0.011 3和0.571 4。
近紅外光譜;乙醇柴油;密度;粘度;乙醇含量
過去十幾年中,汽車行業的快速發展,促使石油燃料消耗逐年增加,同時也帶來了一系列如經濟、社會、環境等問題。我國是石油進口大國,為了降低對石油進口的依賴程度和空氣污染程度,乙醇柴油等一系列石油替代品被研制出來。乙醇柴油的物理性質和柴油相近,在一定濃度內不需要改變發動機的參數就可以直接使用,乙醇柴油代替柴油使用減少了溫室氣體、顆粒物和硫化物的排放,并作為一種商業品在世界各地推廣使用。乙醇生產原料來自不同地方,生產工藝也有所差別,因此,最終乙醇柴油產品可能會有不同的屬性,所以乙醇柴油的質量控制非常重要。目前我國還沒有一種操作簡單、成本低、實時在線檢測方法去評價這些石油替代品的品質。
光譜數據(一般由近紅外光譜、質譜、核磁共振技術獲得)與先進的統計方法相結合,促進光譜分析在分析檢測方面的應用。其中,近紅外相對其他分析技術的優勢在于非破壞性、少量的樣品制備、實時響應[1]在很多領域都得到了應用[2-5]。近紅外光譜范圍包括780~2 500 nm(12 820~4 000 cm-1)區域內的電磁輻射吸收。目前,我國已有部分關于近紅外與拉曼技術對甲/乙醇汽油中甲/乙醇含量檢測[6-9]。
本文,應用近紅外光譜技術比較了線性(PCR、PLS)和非線性(LSSVM)校正技術對乙醇柴油主要性能指標預測。該模型檢測乙醇柴油的三個重要性能指標分別為:密度(20 ℃)、粘度(20 ℃)、乙醇含量。我們還討論了不同預處理方法(平滑,多元散射校正-平滑、標準正則變量變換-平滑、一階微分-平滑、二階微分-平滑等)對模型預測能力的影響,并將最小二乘支持向量機用于乙醇柴油主要性能指標的光譜檢測。
2.1 樣品制備
96個不同濃度的乙醇柴油均在實驗室配制,所用0#柴油購于南昌某加油站,乙醇由天津市大茂化學試劑廠生產,分析純度≥99.7%,正丁醇來自西隴化工有限公司,分析純度≥99.5%,電子天平和50 mL容量瓶購置于江西贛儀科技有限公司。配制乙醇柴油時,室溫控制在20 ℃左右,柴油、乙醇、正丁醇以43∶5∶2比例加入50 mL容量瓶內。實驗用50 mL容量瓶用純水清洗后烘干,記錄電子天平測量空容量瓶質量,先通過移液槍將乙醇和正丁醇按5∶2比例加入50 mL容量瓶中并充分振蕩,形成變性乙醇,完成后加入柴油并滴定至50 mL,振蕩均勻,直至得到淡黃色透明液體,測量此時的重量,貼上帶有濃度的標簽靜置一段時間。同樣的方法配制余下濃度的乙醇柴油,32種乙醇柴油濃度如表1所示。

表1 32種濃度乙醇柴油
2.2 乙醇柴油密度、粘度、乙醇含量測量
乙醇柴油的密度通過傳統的方法測量,由配制前、后50 mL容量瓶的質量差和50 mL體積計算得出;乙醇柴油的粘度由上海精天儀器有限公司生產的NDJ-5S旋轉粘度計測得,其原理是當轉子在乙醇柴油中旋轉時,由于乙醇柴油的粘滯性,轉子就受到一個與粘度成正比的扭力,通過扭矩傳感器測量這個扭力的大小,就可得到乙醇柴油的粘度。測量前先校準,以空氣為參比,按下測量鍵,數字顯示為零后按復位鍵。將乙醇柴油倒入直徑不小于70 mm的燒杯中,準確地控制被測液體的溫度。查閱乙醇及柴油的粘度選擇相應規格的轉子旋入連接螺桿。裝卸轉子時,避免碰壞轉子。旋轉升降旋鈕,使儀器緩慢地下降,轉子逐漸浸入乙醇柴油中,直至轉子液面標志和液面相平為止,再次調整好儀器水平試樣在測試溫度下充分恒溫(20 ℃左右),以保持示值穩定準確。當按下測量鍵后等待,當聽到六聲滴滴聲后儀器屏幕顯示的數值作為樣本的粘度,重復測量五次取平均值,每種濃度的乙醇柴油都依據上述方法測量其密度和粘度。
2.3 乙醇柴油近紅外光譜表征
乙醇柴油的近紅外光譜由布魯克公司生產的Tensor37型傅里葉變換紅外光譜儀采集獲得,采集前光譜儀先開機預熱20 min左右,實驗的環境溫度調到25 ℃左右,濕度調到50%以下。先用膠頭滴管吸取乙醇柴油慢慢滴入石英比色皿(光程5 mm)中,避免產生氣泡,再將比色皿放入載物臺上,關閉儀器的外蓋。實驗時,軟件中光譜采集范圍直接設為系統默認的12 500~4 000 cm-1,掃描次數為32次,分辨率為8 cm-1。每過45 min左右以空的比色皿采集背景通道光譜,為避免乙醇和柴油混合不勻或采集位置不同導致采集光譜的差異性,通過抬升載物臺的高度使入射光通過比色皿上、中、下3個不同位置進行光譜采集,計算平均光譜作為樣品的最終光譜。所有程序均在MATLABR2014a(The Math Work,Inc,USA)中運行。
2.4 乙醇柴油近紅外光譜
乙醇柴油的近紅外光譜圖如圖1所示,從圖中可以看出在1 400~1 650 nm和2 000~2 150 nm兩個光譜區域內,光譜譜帶的吸光度與乙醇柴油濃度有關系。吸收特征鋒大約在1 580 nm和2 100 nm處,這是由于乙醇分子中O—H伸縮振動的一級倍頻在1 587 nm處,其組合頻吸收譜帶在2 173 nm附近,在1 667~2 000 nm范圍內光譜數據與乙醇含量的線性相關性較差,這是由于柴油中烴類物質的化學鍵吸收峰重疊所致。

圖1 乙醇柴油近紅外光譜 Fig.1 Near infrared spectra of ethanol diesel
2.5 光譜預處理
預處理均在Unscrambler(verion.10.1;CAMO AS,Trondheim,Norway)化學計量學分析軟件中進行,簡單地說,在校正模型建立之前,常使用預處理技術對原始光譜進行處理。本文用到的預處理方法有以下5種:(1)SG:Savitzky-Golay;(2)MSC-SG:Mean Scattering correction followed by Savitzky-Golay;(3)SNV-SG:Standard Normal Variate scaling plus Savitzky-Golay;(4)SGD1-SG: First-order Savitzky-Golay Derivative followed by Savitzky-Golay;(5)SGD2-SG: Second-order Savitzky-Golay Derivative followed by Savitzky-Golay。
2.6 數據分析
乙醇柴油原始光譜進行數字化后,每條光譜為1×2203的向量,向量的長度是由光譜儀分辨率決定。所有程序均在MATLABR2014a(The MathWork,Inc,USA)中運行。本文比較了幾種不同的多元回歸方法,從中找到最適合檢測乙醇柴油指標的模型。由于校正模型好壞依賴其參數的選擇,本文所使用模型的參數有:主成分回歸(PCR):主成分(PC=1~20);偏最小二乘回歸(PLS):主因子數;最小二乘支持向量機(LSSVM):選擇不同的核函數其參數也會有變化,視具體情況而定。
3.1 線性校正模型:PCR和PLS
討論了兩種有效的多元線性方法對乙醇柴油物理參數進行預測:PCR和PLS。相對于MLR來說,PCR是一種更先進的光譜數據分析方法。在該方法中,通過減少變量的數目(從幾百到幾十)和去除噪聲,以達到更好的預測精度。表2總結了應用PCR處理乙醇柴油的近紅外光譜數據的結果。在MSC-SG預處理下,PCR對乙醇柴油密度、粘度、乙醇含量的建模效果最好,而相對于粘度、乙醇含量這兩個指標,PCR對密度的建模效果最好,此時,模型的主成分數PC為16,相關系數R2為0.909 4,預測均方根誤差RMSEP為0.001 7。

表2 PCR方法對乙醇柴油密度、粘度、乙醇含量的性能預測
PLS是一種與PCR歸相近的統計方法[10],主要區別是,輸入值x和輸出數據y被投影到新的空間。在分析乙醇柴油時,x和y分別是乙醇柴油的近紅外光譜和物理參數(包括密度、粘度和乙醇含量)。PLS操作簡單和較低的計算要求,它被廣泛用在非常不同的數據集的分析,是一種最受歡迎的用于建立校正模型化學計量學算法。此外,PLS可以被視為一種標準的近紅外光譜數據處理方法,是一種線性的數據分析方法。表3總結了應用PLS的到乙醇柴油的近紅外光譜數據的結果。PLS預測乙醇柴油密度、粘度、乙醇含量在SG預處理下建模效果最好。相比PCR的結果,PLS結果有明顯提高,幅度提高最大的是乙醇含量的預測,其R2提高了7.7%,RMSEP下降了54.5%。PLS是一種檢測乙醇柴油性能的線性模型的選擇方法,較少的輸入值數量使得PLS模型比PCR更穩定,可以通過SG預處理技術結合PLS校正模型獲得最佳的預測性能。

表3 PLS方法對乙醇柴油密度、粘度、乙醇含量的性能預測
3.2 非線性校正模型:最小二乘支持向量機
支持向量機是機器學習領域的一種監督學習技術,適用于分類和回歸分析[11-18]。支持向量機的主要缺點之一是必須解決大規模二次規劃問題。最小二乘支持向量對傳統的SVM做了修改,克服了這個缺點,將二次規劃問題轉化為成線性問題,以減少優化過程的復雜性。表4總結了將 LSSVM應用到乙醇柴油近紅外光譜數據的結果。乙醇柴油的密度在SGD1-SG預處理下建立的LSSVM效果最好,此時,gamma=131 969、sig2=2 047,R2為0.995 8,RMSEP為0.000 68。粘度和乙醇含量分別在SNV-SG、SG預處理下建立的LSSVM模型效果最好,而乙醇柴油的密度和粘度結果較為接近,主要是因為密度與粘度之間有一定的聯系,乙醇和柴油的比例影響乙醇柴油密度和粘度。

表4 LSSVM對乙醇柴油密度、粘度、乙醇含量的性能預測

圖2 乙醇柴油密度、粘度和乙醇含量在PCR,PLS,LSSVM建模下的RMSEP Fig.2 RMSEP of ethanol diesel oil density, viscosity and ethanol content under PCR, PLS and LSSVM modeling RMSEP
圖2是乙醇柴油密度、粘度和乙醇含量在PCR,PLS和LSSVM建模下的RMSEP變化,LSSVM在檢測乙醇柴油密度、粘度和乙醇含量得到的RMSEP是3種模型中最小的,分別是0.000 68、0.011 3和0.571 4,且檢測乙醇含量的RMSEP下降最明顯,降幅達到54.5%。PCR,PLS和LSSVM建模效果順序為:PCR 圖3 最小二乘支持向量機最佳模型預測結果 Fig.3 Predicted results of optimized LSSVM model 本文建立了基于近紅外光譜數據的乙醇柴油性能預測模型。最小二乘支持向量機優于PCR和PLS,其對乙醇柴油密度、粘度、乙醇含量建模最好,相關系數分別是0.995 8、0.995 7和0.995 3;RMSEP分別為0.000 68、0.011 3和0.571 4。本文配制的乙醇柴油濃度涵蓋了目前市面上銷售的乙醇柴油,能夠滿足乙醇柴油幾個主要指標的檢測,近紅外光譜檢測乙醇柴油所得到的結果可以拓展到其他燃料如生物柴油性能快速、準確的分析。 [1] BAPTISTA P,FELIZARDO P,MENEZES J C,etal.. Multivariate near infrared spectroscopy models for predicting the methyl esters content in biodiesel[J].Anal.Chim.Acta,2008,607(2):153-159. [2] 張明祥,閔順耕,李寧,等.乙醇混合燃料近紅外定量分析[J].分析測試學報,2003,6:15-18. ZHANG M X,MIN S G,LI N,etal.. Ethanol blends near-infrared quantitative analysis[J].InstrumentalAnalysis,2003,6:15-18.(in Chinese) [3] 蔡劍華,王先春,胡惟文.基于形態小波的煙草尼古丁含量近紅外光譜檢測[J].農業工程學報,2012(15):281-286. CAI J H,W X CH,HU W W. Near Infrared Spectroscopy based on morphological wavelet nicotine content of tobacco[J].J.AgriculturalEngineering,2012 (15):281-286.(in Chinese) [4] 孫通,應義斌,劉魁武,等.梨可溶性固形物含量的在線近紅外光譜檢測[J].光譜學與光譜分析,2008(11):2536-2539. SUN T,YING Y B,LIU K W,etal.. Pear-line Near Infrared Spectroscopy of soluble solids[J].SpectroscopyandSpectralAnalysis,2008 (11):2536-2539.(in Chinese) [5] 孫旭東,郝勇,高榮杰,等.臍橙糖度近紅外光譜在線檢測數學模型優化研究[J].光譜學與光譜分析,2011,31(5):1230-1235. SUN X D,HAO Y,GAO R J. Orange sugar content line Near Infrared spectroscopy detection mathematical model optimization[J].SpectroscopyandSpectralAnalysis,2011,31(5):1230-1235.(in Chinese) [6] 史永剛,粟斌,李華峰,等.拉曼光譜及其在石油產品分析中的應用[J].現代儀器,2010,16(9106):9-13. SHI Y G,SU B,LI H F,etal.. Merlin Raman spectroscopy and its application in petroleum product analysis[J].ModernInstruments,2010,16(9106):9-13.(in Chinese) [7] 李津蓉,俞柯.一種基于拉曼光譜技術的甲醇汽油定量分析方法[J].科技創新與應用,2016(15305):59. LI J R,YU K. Methanol gasoline quantitative analysis method based on Raman spectroscopy[J].ScienceandTechnologyInnovationandApplication,2016(15305):59.(in Chinese) [8] 歐陽愛國,劉軍.基于近紅外與拉曼光譜的甲醇汽油定量分析[J].西南師范大學學報(自然科學版),2012,37(18609):98-101. OUYANG A G,LIU J. Methanol-based gasoline Quantitative Near Infrared and Raman Spectra of[J].SouthwestChinaNormalUniversity(Natural Science),2012,37(18609):98-101.(in Chinese) [9] 淡圖南,戴連奎.近紅外光譜的甲醇汽油定量分析[J].計算機與應用化學,2011,3:329-332. DAN T N,DAI L K. Quantitative methanol gasoline near infrared spectroscopy[J].ComputerandAppliedChemistry,2011,3:329-332.(in Chinese) [10] 姚捷,戴連奎,林藝玲.基于拉曼特征峰的甲醇汽油甲醇含量測定[J].光散射學報,2013,1:59-65. YAO J,DAI L K,LIN Y L. Determination of methanol content of methanol-based gasoline Raman characteristic peak[J].J.ofLightScattering,2013,1:59-65.(in Chinese) [11] BALABIN R M,SAFIEVA R Z,LOMAKINA E I.ChemometrIntellLab,2007:88:183. [12] 劉燕德,周延睿,潘圓媛.基于最小二乘支持向量機的辣椒可溶性固形物和維生素C含量近紅外光譜檢測[J].光學 精密工程,2014(2):281-288. LIU Y D,ZHOU Y R,PAN Y Y. Based on least squares support chili soluble solids and vitamin C content of vector machine near infrared spectroscopy[J].Opt.PrecisionEng.,2014(2):281-288.(in Chinese) [13] 劉燕德,周延睿.基于GA-LSSVM的蘋果糖度近紅外光譜檢測[J].西北農林科技大學學報(自然科學版),2013,7:229-234. LIU Y D,ZHOU Y R. Near infrared spectroscopy based GA-LSSVM apple brix[J].J.NorthwestSci-TechUniversityofAgricultureandForestry(Natural Science Edition),2013,7:229-234.(in Chinese) [14] 彭秀輝,黃常毅,劉飛,等.LSSVM模型下的近紅外光譜聯合區間波長篩選方法[J].光譜學與光譜分析,2014,3:668-672. PENG X H,HUANG C Y,LIU F,etal.. Near infrared spectroscopy synergy interval wavelength selection method using the LSSVM model[J].SpectroscopyandSpectralAnalysis,2014,3:668-672.(in Chinese) [15] 伍鐵斌,朱紅求,孫備,等.PLS-LSSVM模型在鋅凈化中的應用[J].計算機工程,2012,10:212-214. WU T B,ZHU H Q,SUN B,etal.. Application of PLS-LSSVM model in zinc purification[J].ComputerEngineering,2012,10:212-214.(in Chinese) [16] 劉燕德,鄧清.基于高光譜成像技術的臍橙葉片的葉綠素含量及其分布測量[J].發光學報,2015,8:957-961. LIU Y D,DENG Q. Measurement of chlorophyll distribution in navel orange leaves based on hyper-spectral imaging technique[J].J.Luminescence,2015,8: 957-961.(in Chinese) [17] 鮑一丹,陳納,何勇,等.近紅外高光譜成像技術快速鑒別國產咖啡豆品種[J].光學 精密工程,2015,2:349-355. BAO Y D,CHEN N,HE Y,etal.. Near infrared hyper-spectral imaging technology for rapid identification of domestic coffee bean varieties[J].Opt.PrecisionEng.,2015,2:349-355.(in Chinese) [18] 郭文川,董金磊.高光譜成像結合人工神經網絡無損檢測桃的硬度[J].光學 精密工程,2015,6:1530-1537. GUO W CH,DONG J L. High spectral imaging combined with artificial neural network for nondestructive detection of peach hardness[J].Opt.PrecisionEng.,2015,6:1530-1537.(in Chinese) [19] YANG H,GRIFFITHS P R,TATE J D. Comparison of partial least squares regression and multi-layer neural networks for quantification of nonlinear systems and application to gas phase Fourier transform infrared spectra[J].AnalChimActa,2003,489:125-136. Detection of key performance indicators of ethanol diesel by the infrared spectroscopy method OUYANG Ai-guo*, TANG Tian-yi, WANG Hai-yang, LIU Yan-de (InstituteofOptics-Mechanics-ElectronicsTechnologyandApplication(OMETA),EastChinaJiaotongUniversity,Nanchang330013,China) Ethanol diesel is one of the alternatives for the diesel, which is used more and more widely. Many indicators reflect the quality of diesel ethanol fuel. It is not only expensive but also time consuming to detect these indicators with traditional method. Near infrared spectroscopy method is an inexpensive, fast and real time online test for the quality of ethanol diesel oil. In this paper, the density, viscosity and the quality of the ethanol content of diesel are detected, and the analysis effect on the quality of ethanol diesel are compared by linear and non-linear calibration technology, including principal component regression, partial least squares regression and least squares support vector machines(LSSVM), and the effects of different pretreatment methods on the prediction model capabilities are also compared. Experimental results show that LSSVM is better than the principal component regression and partial least squares regression model, with the optimal modeling effect on the density of ethanol-diesel, viscosity, alcohol content. The correlation coefficients are 0.995 8, 0.995 7 and 0.995 3, and the root mean square error of prediction are 0.000 68, 0.011 3 and 0.571 4, respectively. NIRS;ethanol diesel;density;viscosity;ethanol content 2017-01-25; 2017-03-22 南方山地果園智能化管理技術與裝備協同創新中心資助項目(No.贛教高字[2014]60號) Supported by Foundation Project of Intelligent Management Technology and Equipment Collaborative Innovation Center of the Southern Mountain Orchard(No.Gan Jiao high [2014]60) 2095-1531(2017)03-0363-07 O657.33; TE626.9 A 10.3788/CO.20171003.0363 歐陽愛國(1968—),男,江西常德人,學士,教授,主要從事車輛性能檢測方面的研究。E-mail:ouyangaiguo1968711@163.com *Correspondingauthor,E-mail:ouyangaiguo1968711@163.com
4 結 論
