999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于便攜式拉曼光譜的汽油快速識別模型

2021-11-18 06:31:40丁怡曼薛曉康董學勝舒耀皋
石油煉制與化工 2021年11期
關鍵詞:分類模型

丁怡曼,薛曉康,范 賓,董學勝,舒耀皋,蔣 鑫

(上海化工研究院有限公司 上海化學品公共安全工程技術中心,上海 200062)

汽油是目前最常用的發動機燃料,與人們的日常生活密切相關[1]。而某些商家為了賺取更多利潤,出現以低牌號汽油冒充高牌號汽油的不良行為,因而會傷害發動機,損害消費者的利益。因此,對市售汽油牌號及實際辛烷值進行檢測十分必要。

標準汽油牌號的識別方法包括測定汽油的研究法辛烷值(RON)或馬達法辛烷值(MON)[2],該方法準確度高,測試結果可靠,但需配備專用的汽油辛烷值試驗機及標準燃料,費時且昂貴[3-4]。因此,科技人員在不斷尋求能快速、準確識別汽油牌號和辛烷值的方法。張其可等[5]提出了基于近紅外光譜的汽油牌號識別算法,具有較好的分類效果;姜黎等[6]基于近紅外光譜波段選擇,并結合主成分分析-馬氏距離法(PCA-MD)對90號、93號、97號等不同牌號的汽油進行了分類。

研究發現,采用拉曼光譜能在短時間內獲得汽油分子內部豐富的骨架振動信息[7];且對于不同牌號的汽油,拉曼光譜呈現出明顯的區分性;同時,相比于近紅外光譜儀,拉曼光譜儀的成本較低。因此,拉曼光譜法開始被用于汽油牌號的識別,如Li Sheng等[8]采用拉曼光譜儀,并結合局部加權-偏最小二乘支持向量機(LSSVM)成功對90號、93號和97號汽油進行了分類。

在已有研究的基礎上,本研究采用小型便攜式拉曼光譜儀,并結合主成分分析和最小二乘化學計量算法,建立汽油牌號模型和汽油RON預測模型,旨在提供一種汽油牌號和實際辛烷值的快速現場識別方法,以協助對汽油質量的現場檢測工作。

1 實 驗

1.1 樣品和儀器

試驗收集了113個成品汽油樣品,由江蘇省產品質量監督檢驗研究院、杭州市質量技術監督檢測院提供,其中92號汽油樣品67個,95號汽油樣品46個,每個樣品都有對應的RON數據。

拉曼光譜儀為美國必達泰克公司生產的BWS415-785S型i-Raman便攜式拉曼光譜儀,主要由激發波長為785 nm的激光器、收集拉曼信號的光纖探頭以及光譜儀組成,并配有拉曼光譜采集軟件BWSpec,光譜測量范圍為175~3 150 cm-1。

1.2 光譜采集

首先將拉曼光譜儀的光纖探頭插入至樣品池,然后將裝有一定量汽油樣品的比色皿放入樣品池中,開啟光纖探頭的光源開關,打開BWSpec分析軟件,將積分時間設置為4 000 ms,時間乘數設置為1,平均采集次數設置為3。調整激光強度為0,進行暗電流掃描,以消除背景干擾,并調整激光強度為90%。對113個汽油樣品逐個進行光譜掃描,采集其拉曼光譜。

1.3 化學計量學算法

建模用算法的編寫和操作均在MATLAB2016a軟件上進行,程序在Window10系統環境下運行。

1.3.1 主成分分析法(PCA)主成分分析是將原變量進行變換,在只損失極少量信息的前提下,將多個指標轉化為少數幾個綜合指標(主成分),以降低數據維度[9]。其基本思路是將樣品的光譜矩陣X進行主成分分解,然后以主成分來解釋原始變量,依據的是方差最大原則。本試驗采用奇異值分解法對光譜矩陣X進行主成分分解,基本過程如式(1)和式(2)所示

X=U·S·Vt

(1)

T=U·S

(2)

式中:U為列正交矩陣,蘊含了樣品的類別信息;Vt為行正交矩陣(t代表矩陣的轉置運算);S為奇異值矩陣,反映每個主成分的特征值;T為矩陣X的得分矩陣,代表新變量,通過選擇T的數量,可以實現對原始光譜數據的信息壓縮,便于提取樣品的類別信息。

1.3.2 偏最小二乘法判別分析法(PLS-DA)PLS-DA是基于偏最小二乘回歸法(PLS)進行樣本的分類識別[10],是一種有監督的模式識別方法[11],可用于汽油牌號的分類識別。具體思路為:以所有汽油樣品的光譜數據組成自變量矩陣X,矩陣的行對應每個樣品,列對應特征變量(即拉曼譜峰強度),見式(3);以樣品類別信息構成因變量矩陣Y,其中行對應每個樣品,列對應樣品的牌號;Y是一個以0和1為元素的矩陣,若樣本屬于同一類,則該樣本在Y中對應列的元素為1,見式(4)。然后,將X、Y的每一列分別進行PLS回歸分析建模,并計算得到各樣品對應的回歸預測值yp。PLS-DA模型的識別規則為:若樣品對應列的預測值yp>0.5,則可判定該汽油樣品屬于同類,否則不屬于同類。

(3)

(4)

1.3.3 偏最小二乘法(PLS)偏最小二乘法也是通過原始變量的線性組合,產生新變量(PLS因子),然后將PLS因子進行多元線性回歸。與主成分分析不同的是,偏最小二乘法在計算主成分時,除考慮計算的主成分方差最大外,還要求主成分與因變量矩陣Y相關程度最大[12]。PLS算法的基本過程如下:

①按照式(5)和式(6)對X、Y矩陣進行分解。

X=TP+E

(5)

Y=MQ+F

(6)

式中:M為矩陣Y的得分矩陣;P和Q分別為矩陣X和Y的主成分矩陣;E和F分別為PLS算法對矩陣X、Y引入的誤差。

②將T、M進行線性回歸,按照式(7)和式(8)計算系數矩陣B,即:

由M=TB

(7)

可得B=TtM(TtT)-1

(8)

③根據①中所得的主成分矩陣P和未知樣品的光譜矩陣X,求出未知樣品的得分矩陣T,然后,根據式(7)可求出因變量Y對應的得分矩陣M,最后,由式(9)可得到未知樣品的預測值yp。

yp=TBQ

(9)

2 結果與討論

2.1 光譜預處理

拉曼光譜儀在采集光譜信號的過程中可能存在激光強度不穩定和噪聲干擾,造成熒光信號較強而樣品光譜信號較弱的問題,使拉曼譜峰產生熒光干擾、噪聲干擾和基線漂移、光譜重疊等現象,從而對光譜特征的提取產生不利的影響[13-14]。

因此,需要用BWSpec分析軟件校正基線,具體過程為:首先,根據原始光譜自動擬合對應的背景曲線;然后,調節lambda因子,使自動擬合的背景區域最大化的位于基線漂移的區域;最后,對原始光譜進行背景扣除,使漂移的基線回正。汽油樣品基線校正后的拉曼光譜如圖1所示。

圖1 汽油樣品基線校正后的拉曼光譜

2.2 汽油牌號模型建模分析

2.2.1 主成分分析法將汽油樣品基線校正后的光譜數據進行主成分分析,得到蘊含汽油牌號類別的得分矩陣T,選取T的前3個主成分PC1,PC2,PC3,得到汽油樣品的PCA分類散點圖,分別計算每個汽油樣品到其他樣品的歐氏距離,以每個樣品距離最近的樣品種類的作為汽油牌號分類的判據,計算所有樣品分類正確率。結果表明:在113個樣品中,此模型計算分類正確的樣品數目為84個,分類正確率為74.34%。

為提高汽油牌號識別模型的分類正確率,對基線校正后的光譜數據分別進行一階求導或二階求導處理,并設置不同求導點數p,計算汽油樣品牌號的分類正確率,結果如表1所示。從表1可以看到,經求導處理后,樣品牌號的分類正確率明顯提高,其中經二階求導(p=11)處理后,分類正確率可達92.92%。此時,汽油樣品的PCA分布散點如圖2所示。由圖2可以看到,92號、95號汽油可基本實現區分。

表1 不同求導點數p下的汽油牌號PCA分類正確率

圖2 求導處理后汽油樣品的PCA分類分布

2.2.2 偏最小二乘判別分析法采用基線校正后的光譜數據進行偏最小二乘判別分析,建模前首先將113個92號汽油和95號汽油樣本集隨機劃分為校正集(86個樣本)和預測集(27個樣本)。

(1)潛變量數的選擇

試驗通過五折交互檢驗法來確定潛變量的數目[15],即將校正集隨機分為5組,其中一組用于模型預測,也稱交互檢驗集,其他組用于模型建立,計算不同潛變量下交互檢驗集的平均正判率,結果如圖3所示。由圖3可知,當潛變量數為7時,平均正判率達到最大值。圖4為交互檢驗過程中校正集均方根誤差和交互檢驗集均方根誤差的變化情況。從圖4可以看到,隨著潛變量數的增加,校正集的均方根誤差始終小于交互檢驗集,符合數據建模規律。因此選取建模的最佳潛變量數為7。

圖3 交互檢驗集正判率變化

圖4 校正集和交互檢驗集的均方根誤差隨潛變量數的變化

(2)PLS-DA模型判別結果

選定最佳潛變量數后,以校正集汽油樣品建立汽油牌號PLS-DA模型,然后再以此模型分別對校正集、預測集的汽油牌號進行預測,結果如表2所示。從表2可以看到,所建的汽油牌號PLS-DA模型對校正集和預測集汽油牌號的正判率分別為97.67%和96.30%,分類錯誤個數分別為2和1。

表2 PLS-DA模型判別結果

為了更加直觀地反映汽油牌號PLS-DA模型的預測效果,分別對校正集、預測集的汽油牌號分類結果作圖,結果如圖5所示。由圖5(a)可知,校正集中除編號為64、81的兩個95號汽油樣品識別錯誤外,其他牌號汽油樣品均正確識別;由圖5(b)可知,預測集中僅編號為6的92號汽油樣品識別錯誤,因而具有較好的預測效果。總體來看,相比于主成分分析建模92.92%的正確率,采用PLS-DA建立的汽油牌號模型對于92號、95號汽油的分類識別具有更好的效果,其正判率均在95%以上。

圖5 校正集和預測集的PLS-DA分類

2.3 汽油RON建模分析

在基線校正后的汽油樣品光譜數據矩陣X、樣品RON數據矩陣Y的基礎上,采用偏最小二乘法(PLS)建立汽油RON定量預測模型。建模前,將113個汽油樣品隨機劃分為校正集(70個樣本)、交互檢驗集(23個樣本)、預測集(20個樣本)。

2.3.1 PLS因子數的確定PLS因子數以交互檢驗集的預測殘差平方和(PRESS)來確定,如圖6所示。由圖6可知:當PLS因子數小于8時,隨著PLS因子數增加,交互檢驗集的PRESS快速減小;當PLS因子數為8時,交互檢驗集的PRESS最小;當PLS因子數超過8后,PRESS逐漸增加,出現過擬合的現象。因此,選取最佳PLS因子數為8,建立汽油RON預測模型。

圖6 不同PLS因子數對應的交互檢驗集PRESS

2.3.2 模型預測以建立的PLS汽油辛烷值模型對校正集、預測集進行預測,并分別計算其相關系數及均方根誤差,結果如表3所示。由表3可知:校正集實際辛烷值與預測辛烷值的相關系數為0.944 8,均方根誤差為0.512 6;預測集實際辛烷值與預測辛烷值的相關系數為0.892 7,均方根誤差為0.609 6,它們的相關系數均接近于1,說明模型預測辛烷值與實際辛烷值相比偏差較小。

表3 PLS辛烷值模型預測結果

圖7為校正集和預測集汽油樣品RON實際值與預測值的相關圖。由圖7可以看到,汽油樣品靠近于對角線兩側,說明汽油樣品RON實際值與模型預測值具有很好的相關性。這表明,建立的PLS汽油辛烷值預測模型能夠對汽油樣品的RON進行精確預測。

圖7 校正集和預測集汽油樣品RON實際值與預測值的相關性

3 結 論

基于汽油樣品的拉曼光譜數據,結合相應的化學計量學算法,建立了汽油牌號識別模型及汽油RON預測模型。對基線校正后的光譜數據進行主成分分析建模后,汽油牌號的分類正確率僅為74.34%;對其進行求導處理后,樣品分類的正確率明顯提升,最高可達92.92%。

采用PLS-DA有監督的模式識別方法建立的汽油牌號模型,樣品分類的正判率均在95%以上,對于區分92號、95號汽油的分類效果好。

采用偏最小二乘法建立汽油RON預測模型,其預測集相關系數為0.892 7,均方根誤差為0.609 6,說明此模型預測值與汽油RON實際值具有較好的相關性,且偏差較小,此模型對汽油的RON具有較好的預測效果。

猜你喜歡
分類模型
一半模型
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 2021精品国产自在现线看| 国产精品.com| a免费毛片在线播放| 国产在线观看第二页| 国产精品大尺度尺度视频| 免费av一区二区三区在线| 国产xx在线观看| 亚洲第一视频网站| 国产三级视频网站| 在线欧美日韩| 亚洲,国产,日韩,综合一区 | 无码高潮喷水在线观看| 国产乱子伦精品视频| 色一情一乱一伦一区二区三区小说| 中国成人在线视频| 都市激情亚洲综合久久| 天堂成人av| 亚洲欧美日本国产专区一区| 国产精品微拍| 精品国产成人高清在线| 国产精品成人不卡在线观看| 露脸国产精品自产在线播| 成人福利在线免费观看| 国产三区二区| 欧美日韩成人在线观看| 久爱午夜精品免费视频| a级毛片免费在线观看| 欲色天天综合网| 欧美亚洲一区二区三区在线| 99热在线只有精品| 污视频日本| 久久夜色精品| 五月婷婷激情四射| 久久久精品无码一二三区| 国产乱人视频免费观看| 国产精品毛片一区| 亚洲国产亚洲综合在线尤物| 国产美女精品一区二区| 制服丝袜无码每日更新| 欧美成人手机在线视频| 91久久国产成人免费观看| 国产在线精品美女观看| 国产福利影院在线观看| 在线永久免费观看的毛片| 亚洲Av综合日韩精品久久久| 一区二区三区高清视频国产女人| 激情综合网激情综合| 亚洲第一成年免费网站| 国产精品亚欧美一区二区| 欧美高清视频一区二区三区| 午夜爽爽视频| 国产精品久久自在自线观看| 沈阳少妇高潮在线| 国产日本一区二区三区| 91啦中文字幕| 国模沟沟一区二区三区| 成年女人a毛片免费视频| 国产精品第5页| 全色黄大色大片免费久久老太| 手机在线看片不卡中文字幕| 精品一区二区三区四区五区| 成人在线视频一区| www精品久久| 国产精品美女自慰喷水| 日本不卡在线播放| 欧美自拍另类欧美综合图区| 免费日韩在线视频| 国产高清在线丝袜精品一区| 免费观看国产小粉嫩喷水| 欧美激情福利| 欧美天天干| 色婷婷亚洲综合五月| 激情综合图区| 中文字幕永久视频| 99人妻碰碰碰久久久久禁片| 四虎永久在线精品国产免费| 久久亚洲综合伊人| 啊嗯不日本网站| 亚洲最大福利网站| 中文国产成人久久精品小说| 一本一道波多野结衣av黑人在线| 午夜精品久久久久久久2023|