999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于便攜式拉曼光譜的汽油快速識別模型

2021-11-18 06:31:40丁怡曼薛曉康董學勝舒耀皋
石油煉制與化工 2021年11期
關鍵詞:分類模型

丁怡曼,薛曉康,范 賓,董學勝,舒耀皋,蔣 鑫

(上海化工研究院有限公司 上海化學品公共安全工程技術中心,上海 200062)

汽油是目前最常用的發動機燃料,與人們的日常生活密切相關[1]。而某些商家為了賺取更多利潤,出現以低牌號汽油冒充高牌號汽油的不良行為,因而會傷害發動機,損害消費者的利益。因此,對市售汽油牌號及實際辛烷值進行檢測十分必要。

標準汽油牌號的識別方法包括測定汽油的研究法辛烷值(RON)或馬達法辛烷值(MON)[2],該方法準確度高,測試結果可靠,但需配備專用的汽油辛烷值試驗機及標準燃料,費時且昂貴[3-4]。因此,科技人員在不斷尋求能快速、準確識別汽油牌號和辛烷值的方法。張其可等[5]提出了基于近紅外光譜的汽油牌號識別算法,具有較好的分類效果;姜黎等[6]基于近紅外光譜波段選擇,并結合主成分分析-馬氏距離法(PCA-MD)對90號、93號、97號等不同牌號的汽油進行了分類。

研究發現,采用拉曼光譜能在短時間內獲得汽油分子內部豐富的骨架振動信息[7];且對于不同牌號的汽油,拉曼光譜呈現出明顯的區分性;同時,相比于近紅外光譜儀,拉曼光譜儀的成本較低。因此,拉曼光譜法開始被用于汽油牌號的識別,如Li Sheng等[8]采用拉曼光譜儀,并結合局部加權-偏最小二乘支持向量機(LSSVM)成功對90號、93號和97號汽油進行了分類。

在已有研究的基礎上,本研究采用小型便攜式拉曼光譜儀,并結合主成分分析和最小二乘化學計量算法,建立汽油牌號模型和汽油RON預測模型,旨在提供一種汽油牌號和實際辛烷值的快速現場識別方法,以協助對汽油質量的現場檢測工作。

1 實 驗

1.1 樣品和儀器

試驗收集了113個成品汽油樣品,由江蘇省產品質量監督檢驗研究院、杭州市質量技術監督檢測院提供,其中92號汽油樣品67個,95號汽油樣品46個,每個樣品都有對應的RON數據。

拉曼光譜儀為美國必達泰克公司生產的BWS415-785S型i-Raman便攜式拉曼光譜儀,主要由激發波長為785 nm的激光器、收集拉曼信號的光纖探頭以及光譜儀組成,并配有拉曼光譜采集軟件BWSpec,光譜測量范圍為175~3 150 cm-1。

1.2 光譜采集

首先將拉曼光譜儀的光纖探頭插入至樣品池,然后將裝有一定量汽油樣品的比色皿放入樣品池中,開啟光纖探頭的光源開關,打開BWSpec分析軟件,將積分時間設置為4 000 ms,時間乘數設置為1,平均采集次數設置為3。調整激光強度為0,進行暗電流掃描,以消除背景干擾,并調整激光強度為90%。對113個汽油樣品逐個進行光譜掃描,采集其拉曼光譜。

1.3 化學計量學算法

建模用算法的編寫和操作均在MATLAB2016a軟件上進行,程序在Window10系統環境下運行。

1.3.1 主成分分析法(PCA)主成分分析是將原變量進行變換,在只損失極少量信息的前提下,將多個指標轉化為少數幾個綜合指標(主成分),以降低數據維度[9]。其基本思路是將樣品的光譜矩陣X進行主成分分解,然后以主成分來解釋原始變量,依據的是方差最大原則。本試驗采用奇異值分解法對光譜矩陣X進行主成分分解,基本過程如式(1)和式(2)所示

X=U·S·Vt

(1)

T=U·S

(2)

式中:U為列正交矩陣,蘊含了樣品的類別信息;Vt為行正交矩陣(t代表矩陣的轉置運算);S為奇異值矩陣,反映每個主成分的特征值;T為矩陣X的得分矩陣,代表新變量,通過選擇T的數量,可以實現對原始光譜數據的信息壓縮,便于提取樣品的類別信息。

1.3.2 偏最小二乘法判別分析法(PLS-DA)PLS-DA是基于偏最小二乘回歸法(PLS)進行樣本的分類識別[10],是一種有監督的模式識別方法[11],可用于汽油牌號的分類識別。具體思路為:以所有汽油樣品的光譜數據組成自變量矩陣X,矩陣的行對應每個樣品,列對應特征變量(即拉曼譜峰強度),見式(3);以樣品類別信息構成因變量矩陣Y,其中行對應每個樣品,列對應樣品的牌號;Y是一個以0和1為元素的矩陣,若樣本屬于同一類,則該樣本在Y中對應列的元素為1,見式(4)。然后,將X、Y的每一列分別進行PLS回歸分析建模,并計算得到各樣品對應的回歸預測值yp。PLS-DA模型的識別規則為:若樣品對應列的預測值yp>0.5,則可判定該汽油樣品屬于同類,否則不屬于同類。

(3)

(4)

1.3.3 偏最小二乘法(PLS)偏最小二乘法也是通過原始變量的線性組合,產生新變量(PLS因子),然后將PLS因子進行多元線性回歸。與主成分分析不同的是,偏最小二乘法在計算主成分時,除考慮計算的主成分方差最大外,還要求主成分與因變量矩陣Y相關程度最大[12]。PLS算法的基本過程如下:

①按照式(5)和式(6)對X、Y矩陣進行分解。

X=TP+E

(5)

Y=MQ+F

(6)

式中:M為矩陣Y的得分矩陣;P和Q分別為矩陣X和Y的主成分矩陣;E和F分別為PLS算法對矩陣X、Y引入的誤差。

②將T、M進行線性回歸,按照式(7)和式(8)計算系數矩陣B,即:

由M=TB

(7)

可得B=TtM(TtT)-1

(8)

③根據①中所得的主成分矩陣P和未知樣品的光譜矩陣X,求出未知樣品的得分矩陣T,然后,根據式(7)可求出因變量Y對應的得分矩陣M,最后,由式(9)可得到未知樣品的預測值yp。

yp=TBQ

(9)

2 結果與討論

2.1 光譜預處理

拉曼光譜儀在采集光譜信號的過程中可能存在激光強度不穩定和噪聲干擾,造成熒光信號較強而樣品光譜信號較弱的問題,使拉曼譜峰產生熒光干擾、噪聲干擾和基線漂移、光譜重疊等現象,從而對光譜特征的提取產生不利的影響[13-14]。

因此,需要用BWSpec分析軟件校正基線,具體過程為:首先,根據原始光譜自動擬合對應的背景曲線;然后,調節lambda因子,使自動擬合的背景區域最大化的位于基線漂移的區域;最后,對原始光譜進行背景扣除,使漂移的基線回正。汽油樣品基線校正后的拉曼光譜如圖1所示。

圖1 汽油樣品基線校正后的拉曼光譜

2.2 汽油牌號模型建模分析

2.2.1 主成分分析法將汽油樣品基線校正后的光譜數據進行主成分分析,得到蘊含汽油牌號類別的得分矩陣T,選取T的前3個主成分PC1,PC2,PC3,得到汽油樣品的PCA分類散點圖,分別計算每個汽油樣品到其他樣品的歐氏距離,以每個樣品距離最近的樣品種類的作為汽油牌號分類的判據,計算所有樣品分類正確率。結果表明:在113個樣品中,此模型計算分類正確的樣品數目為84個,分類正確率為74.34%。

為提高汽油牌號識別模型的分類正確率,對基線校正后的光譜數據分別進行一階求導或二階求導處理,并設置不同求導點數p,計算汽油樣品牌號的分類正確率,結果如表1所示。從表1可以看到,經求導處理后,樣品牌號的分類正確率明顯提高,其中經二階求導(p=11)處理后,分類正確率可達92.92%。此時,汽油樣品的PCA分布散點如圖2所示。由圖2可以看到,92號、95號汽油可基本實現區分。

表1 不同求導點數p下的汽油牌號PCA分類正確率

圖2 求導處理后汽油樣品的PCA分類分布

2.2.2 偏最小二乘判別分析法采用基線校正后的光譜數據進行偏最小二乘判別分析,建模前首先將113個92號汽油和95號汽油樣本集隨機劃分為校正集(86個樣本)和預測集(27個樣本)。

(1)潛變量數的選擇

試驗通過五折交互檢驗法來確定潛變量的數目[15],即將校正集隨機分為5組,其中一組用于模型預測,也稱交互檢驗集,其他組用于模型建立,計算不同潛變量下交互檢驗集的平均正判率,結果如圖3所示。由圖3可知,當潛變量數為7時,平均正判率達到最大值。圖4為交互檢驗過程中校正集均方根誤差和交互檢驗集均方根誤差的變化情況。從圖4可以看到,隨著潛變量數的增加,校正集的均方根誤差始終小于交互檢驗集,符合數據建模規律。因此選取建模的最佳潛變量數為7。

圖3 交互檢驗集正判率變化

圖4 校正集和交互檢驗集的均方根誤差隨潛變量數的變化

(2)PLS-DA模型判別結果

選定最佳潛變量數后,以校正集汽油樣品建立汽油牌號PLS-DA模型,然后再以此模型分別對校正集、預測集的汽油牌號進行預測,結果如表2所示。從表2可以看到,所建的汽油牌號PLS-DA模型對校正集和預測集汽油牌號的正判率分別為97.67%和96.30%,分類錯誤個數分別為2和1。

表2 PLS-DA模型判別結果

為了更加直觀地反映汽油牌號PLS-DA模型的預測效果,分別對校正集、預測集的汽油牌號分類結果作圖,結果如圖5所示。由圖5(a)可知,校正集中除編號為64、81的兩個95號汽油樣品識別錯誤外,其他牌號汽油樣品均正確識別;由圖5(b)可知,預測集中僅編號為6的92號汽油樣品識別錯誤,因而具有較好的預測效果。總體來看,相比于主成分分析建模92.92%的正確率,采用PLS-DA建立的汽油牌號模型對于92號、95號汽油的分類識別具有更好的效果,其正判率均在95%以上。

圖5 校正集和預測集的PLS-DA分類

2.3 汽油RON建模分析

在基線校正后的汽油樣品光譜數據矩陣X、樣品RON數據矩陣Y的基礎上,采用偏最小二乘法(PLS)建立汽油RON定量預測模型。建模前,將113個汽油樣品隨機劃分為校正集(70個樣本)、交互檢驗集(23個樣本)、預測集(20個樣本)。

2.3.1 PLS因子數的確定PLS因子數以交互檢驗集的預測殘差平方和(PRESS)來確定,如圖6所示。由圖6可知:當PLS因子數小于8時,隨著PLS因子數增加,交互檢驗集的PRESS快速減小;當PLS因子數為8時,交互檢驗集的PRESS最小;當PLS因子數超過8后,PRESS逐漸增加,出現過擬合的現象。因此,選取最佳PLS因子數為8,建立汽油RON預測模型。

圖6 不同PLS因子數對應的交互檢驗集PRESS

2.3.2 模型預測以建立的PLS汽油辛烷值模型對校正集、預測集進行預測,并分別計算其相關系數及均方根誤差,結果如表3所示。由表3可知:校正集實際辛烷值與預測辛烷值的相關系數為0.944 8,均方根誤差為0.512 6;預測集實際辛烷值與預測辛烷值的相關系數為0.892 7,均方根誤差為0.609 6,它們的相關系數均接近于1,說明模型預測辛烷值與實際辛烷值相比偏差較小。

表3 PLS辛烷值模型預測結果

圖7為校正集和預測集汽油樣品RON實際值與預測值的相關圖。由圖7可以看到,汽油樣品靠近于對角線兩側,說明汽油樣品RON實際值與模型預測值具有很好的相關性。這表明,建立的PLS汽油辛烷值預測模型能夠對汽油樣品的RON進行精確預測。

圖7 校正集和預測集汽油樣品RON實際值與預測值的相關性

3 結 論

基于汽油樣品的拉曼光譜數據,結合相應的化學計量學算法,建立了汽油牌號識別模型及汽油RON預測模型。對基線校正后的光譜數據進行主成分分析建模后,汽油牌號的分類正確率僅為74.34%;對其進行求導處理后,樣品分類的正確率明顯提升,最高可達92.92%。

采用PLS-DA有監督的模式識別方法建立的汽油牌號模型,樣品分類的正判率均在95%以上,對于區分92號、95號汽油的分類效果好。

采用偏最小二乘法建立汽油RON預測模型,其預測集相關系數為0.892 7,均方根誤差為0.609 6,說明此模型預測值與汽油RON實際值具有較好的相關性,且偏差較小,此模型對汽油的RON具有較好的預測效果。

猜你喜歡
分類模型
一半模型
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: a在线亚洲男人的天堂试看| 亚洲精选无码久久久| 久久美女精品| 国产精品久久国产精麻豆99网站| 欧美国产日产一区二区| 白浆免费视频国产精品视频| 岛国精品一区免费视频在线观看| 日韩av高清无码一区二区三区| 免费全部高H视频无码无遮掩| 亚洲国产日韩一区| 亚洲AV色香蕉一区二区| 欧美日在线观看| 99久久精品免费看国产电影| 中文字幕在线永久在线视频2020| 久久久久国产精品免费免费不卡| 国产综合精品日本亚洲777| 理论片一区| 欧美高清国产| 国产一区二区三区在线观看免费| 波多野结衣视频一区二区| 免费国产高清精品一区在线| 亚洲水蜜桃久久综合网站| aa级毛片毛片免费观看久| 在线欧美一区| 日本手机在线视频| 麻豆精品在线播放| 欧美人与动牲交a欧美精品| 色噜噜综合网| 天堂在线www网亚洲| 亚洲最猛黑人xxxx黑人猛交| 欧美区一区| 欧美激情一区二区三区成人| 国产sm重味一区二区三区| 丁香婷婷激情综合激情| 亚洲欧美日韩色图| 国产福利2021最新在线观看| 日韩成人午夜| 国产一级做美女做受视频| 在线a视频免费观看| 永久免费精品视频| 久久无码高潮喷水| av午夜福利一片免费看| 黄色网站在线观看无码| 国产视频入口| 日韩欧美一区在线观看| 99成人在线观看| a天堂视频在线| 日本高清在线看免费观看| 日韩精品专区免费无码aⅴ| 亚洲αv毛片| 亚洲区视频在线观看| 亚洲欧美成人综合| 欧美激情视频二区三区| 91青青在线视频| 国产视频 第一页| 中文字幕资源站| 午夜毛片免费看| 国产99视频在线| 亚洲视频无码| 久草视频福利在线观看| 国产精品久久久久久久久久98| 国产精品自在拍首页视频8| 欧美、日韩、国产综合一区| 国产资源站| 人人爱天天做夜夜爽| 亚洲成年人片| 国产高清在线观看91精品| 亚洲综合色婷婷中文字幕| 狂欢视频在线观看不卡| 欧美翘臀一区二区三区| 波多野结衣在线se| 一级全免费视频播放| 色综合网址| 亚洲欧美综合另类图片小说区| 香蕉久久国产超碰青草| 国产麻豆福利av在线播放| 免费一级大毛片a一观看不卡| 中文字幕在线免费看| 热re99久久精品国99热| 国产第四页| 国产本道久久一区二区三区| 丝袜久久剧情精品国产|