999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于最小角回歸結(jié)合一元線性直接校正法的近紅外光譜模型傳遞方法

2019-01-22 11:15:16路皓翔吳鵬飛楊輝華劉振丙
分析測試學(xué)報(bào) 2019年1期
關(guān)鍵詞:模型

路皓翔,吳鵬飛,楊輝華,3*,劉振丙

(1.桂林電子科技大學(xué) 電子工程與自動化學(xué)院,廣西 桂林 541004;2.桂林電子科技大學(xué) 計(jì)算機(jī)與信息安全學(xué)院,廣西 桂林 541004;3.北京郵電大學(xué) 自動化學(xué)院,北京 100876)

自20世紀(jì)90年代起,近紅外光譜分析技術(shù)在石油化工、食品藥品監(jiān)督以及農(nóng)業(yè)等領(lǐng)域有了廣泛應(yīng)用[1-4]。然而在實(shí)際應(yīng)用中,由于儀器老化、基線漂移和吸光度波動等原因,會造成以一臺儀器測得的樣品光譜數(shù)據(jù)建立的定量分析模型不能直接應(yīng)用于其他光譜儀上測得的樣品光譜數(shù)據(jù)的分析。為了提高定量分析模型的通用性,近紅外光譜的模型傳遞技術(shù)應(yīng)運(yùn)而生。

近紅外光譜的模型傳遞又稱近紅外光譜儀器的標(biāo)準(zhǔn)化[5],主要是用數(shù)學(xué)運(yùn)算的相關(guān)知識求解出兩臺或兩臺以上的光譜儀測得的光譜數(shù)據(jù)之間的轉(zhuǎn)換矩陣,進(jìn)而實(shí)現(xiàn)不同儀器上測得的光譜數(shù)據(jù)的標(biāo)準(zhǔn)化,提高近紅外光譜定量分析模型在不同儀器上的通用性。當(dāng)前模型傳遞中轉(zhuǎn)換矩陣的求解主要有標(biāo)樣法和無標(biāo)樣法兩種[6-7]。其中,標(biāo)樣法需要在主、從儀器之間測得的光譜矩陣上選擇一定數(shù)量的標(biāo)樣集,并通過標(biāo)樣集建立主、從儀器之間模型傳遞的數(shù)學(xué)模型,主要包括直接校正算法[8]、分段直接校正算法[9]、Shenk's[10]及一元線性回歸直接校正法[11]等。無標(biāo)樣法則不需要標(biāo)樣集,主要包括有限脈沖響應(yīng)算法[12]等。最小角回歸(Least angle regression,LAR)算法是由Efron等[13]于2004年提出的一種既可以用于特征變量篩選又可以用于線性回歸的機(jī)器學(xué)習(xí)算法,然而在近紅外光譜分析領(lǐng)域該方法應(yīng)用相對較少[14]。

針對近紅外光譜分析技術(shù)中的模型傳遞問題,本文提出了一種最小角回歸結(jié)合一元線性回歸直接校正(Least angle regression combined simple linear regression direct standardization,LAR-SLRDS)的模型傳遞方法。為了驗(yàn)證LAR-SLRDS算法的性能,采用LAR實(shí)現(xiàn)藥品樣品和汽油樣品近紅外光譜數(shù)據(jù)全譜區(qū)特征波長的篩選,然后結(jié)合SLRDS實(shí)現(xiàn)從儀器測得光譜數(shù)據(jù)的校正,并與未經(jīng)過篩選的一元線性回歸直接校正法(Simple linear regression direct standardization,SLRDS)、直接校正法(Direct standardization,DS)、分段直接校正法(Piecewise direct standardization,PDS)進(jìn)行對比。實(shí)驗(yàn)結(jié)果表明,LAR-SLRDS可以很好地解決不同光譜儀器之間的差異,提高PLS定量分析模型的通用性和準(zhǔn)確性。

1 原理與方法

1.1 LAR算法

LAR算法通過引入一階懲罰函數(shù)將無效變量的系數(shù)置為0,從而實(shí)現(xiàn)變量的篩選。其線性回歸模型如下:

(1)

在式(1)中,(xi1,xi2,…,xip)代表第i個(gè)樣本的自變量,yi代表第i個(gè)樣本的響應(yīng)變量,βj表示第j個(gè)自變量系數(shù),t代表約束值,通常設(shè)置t≥0。

1.2 SLRDS算法

一元線性回歸的表達(dá)式是y=a0+ax,式中x和y分別代表自變量和因變量,a0和a為回歸系數(shù)。假設(shè)近紅外光譜樣本中不同波長的吸光度不相關(guān),采用SLRDS對從儀器上測得的近紅外光譜分析校正[13]。設(shè)主、從儀器上測得的第i個(gè)樣品在第j個(gè)波長點(diǎn)上的吸光度Xm(i,j)和Xs(i,j)滿足如下一元線性回歸方程:

Xm(i,j)=a0(j)+a(j)Xs(i,j) (i∈1…n,j∈1…p)

(2)

式(2)中,第j(j∈1…p)個(gè)波長點(diǎn)對應(yīng)的回歸系數(shù)分別為a0(j)和a(j)。把式(2)寫成矩陣形式如下:

(3)

其中,1n×1表示n×1的列向量且元素全為1。由式(3)可得:

(4)

(5)

第j(j∈1…p)個(gè)波長點(diǎn)對應(yīng)的回歸系數(shù)a0(j)和a(j)可以通過公式(4)求出。從儀器上測得的未知樣品光譜Xunknown(n′×p)通過公式(5)轉(zhuǎn)換為與主儀器上測得的光譜一致的光譜Xstd,其中n′為未知樣品數(shù)。最后由主儀器建立的校正模型計(jì)算結(jié)果。

從內(nèi)部網(wǎng)絡(luò)中的打印機(jī)和多功能一體機(jī)上收集工作日志,然后生成對管理員和管理層有用的報(bào)告。能保存所有用戶的打印、復(fù)印、掃描、傳真記錄,并可以隨時(shí)搜索,可以追蹤及監(jiān)視用戶用量,可以生成各種報(bào)表(列表,圖形)制作及分析。包括以下:服務(wù)類型、色彩模式、紙張尺寸、單/雙面選擇、什么時(shí)間、輸出設(shè)備型號等信息。

1.3 LAR-SLRDS算法

由于樣品的光譜特征波長數(shù)量較多,而這些波長中部分與預(yù)測結(jié)果的相關(guān)性較低,反而會影響預(yù)測結(jié)果和模型傳遞的準(zhǔn)確性和可靠性[15-16]。本文采用LAR以最小化池化信息準(zhǔn)則(Akaike information criterion,AIC)作為回歸系數(shù),將相關(guān)性較低的系數(shù)置為0,相關(guān)性較高的系數(shù)置為非0,從而實(shí)現(xiàn)樣品近紅外光譜特征波長的篩選。然后利用SLRDS對篩選出的波長進(jìn)行校正,從而提高模型的通用性。LAR-SLRDS算法的具體步驟如下:

(1)預(yù)處理:利用墨西哥帽小波變換對主、從儀器上測得的樣品近紅外光譜數(shù)據(jù)進(jìn)行預(yù)處理;

(2)波長篩選:將小波變換預(yù)處理后的光譜數(shù)據(jù)作為LAR算法的輸入,根據(jù)AIC最小的原則實(shí)現(xiàn)全譜區(qū)波長點(diǎn)的篩選,并利用篩選出來的特征波長點(diǎn)建立對應(yīng)的偏最小二乘回歸(Partial least squares regression,PLS)分析模型;

(3)轉(zhuǎn)換矩陣計(jì)算:利用K-S算法從主、從儀器測得的樣品光譜數(shù)據(jù)中篩選出最具代表性的光譜數(shù)據(jù)樣本,結(jié)合步驟(2)中篩選出的波長點(diǎn),利用SLRDS算法實(shí)現(xiàn)轉(zhuǎn)換矩陣的求解;

(4)驗(yàn)證:在從儀器上測得驗(yàn)證集樣品的光譜數(shù)據(jù),并結(jié)合步驟(2)中篩選出的波長點(diǎn)信息,利用求解出的轉(zhuǎn)換矩陣對驗(yàn)證集的光譜數(shù)據(jù)進(jìn)行校正,將校正后的樣品光譜數(shù)據(jù)送入到主儀器上建立的PLS回歸分析模型,利用預(yù)測標(biāo)準(zhǔn)偏差(Standard error of prediction,SEP)對模型的性能進(jìn)行評估。

2 實(shí)驗(yàn)部分

2.1 實(shí)驗(yàn)樣品

為了驗(yàn)證LAR-SLRDS算法的有效性,在汽油和藥品兩個(gè)近紅外光譜數(shù)據(jù)集上進(jìn)行相關(guān)實(shí)驗(yàn)并與DS、PDS和SLRDS進(jìn)行對比。數(shù)據(jù)集1采用石油化工科學(xué)研究院提供的汽油樣品的近紅外光譜數(shù)據(jù)集,該數(shù)據(jù)集包含兩臺NIR-3000型近紅外光譜儀(分別記作m1和s1)上測得的88個(gè)汽油樣本的近紅外光譜,其波長范圍為700~1 100 nm,波長間隔為0.2 nm,每個(gè)樣本共有2 002個(gè)特征波長點(diǎn),此外還測定了C7、C8、C9和C10 4種成分的含量值。數(shù)據(jù)集2采用國際漫反射會議提供的藥品樣品的近紅外光譜數(shù)據(jù)集(http://www.eigenvector.com/data/tablets/index.html),該數(shù)據(jù)集包含兩臺Foss NIR-Systems近紅外光譜儀(分別記為m2和s2)上測得的655粒藥片樣本的近紅外光譜,其采樣的波長為600~1 898 nm,采樣的間隔為2 nm,每個(gè)樣本共650個(gè)特征波長點(diǎn),并分別測定了藥片樣本活性、重量和硬度3種成分的參考值。

2.2 數(shù)據(jù)預(yù)處理

由于實(shí)驗(yàn)用到的藥品樣本和汽油樣本的近紅外光譜數(shù)據(jù)存在基線漂移、漫反射和隨機(jī)噪聲等,首先采用標(biāo)準(zhǔn)正態(tài)變量變化消除樣本漫反射以及光程變換造成的樣本近紅外光譜數(shù)據(jù)之間的差異,然后采用數(shù)據(jù)平滑化消除樣本近紅外光譜數(shù)據(jù)存在的隨機(jī)噪聲,最后采用墨西哥帽小波變換(尺度值scale設(shè)為3,母小波波長設(shè)為32*scale)消除樣本近紅外光譜數(shù)據(jù)存在的基線漂移。預(yù)處理后藥品樣本和汽油樣本主、從儀器的光譜圖如圖1所示。

2.3 標(biāo)樣集的選取

由于LAR-SLRDS算法本質(zhì)上是有標(biāo)樣法,因此在實(shí)現(xiàn)模型傳遞的過程中需要選擇合適數(shù)量的標(biāo)樣集,本文采用K-S算法實(shí)現(xiàn)藥品樣本和汽油樣本兩個(gè)近紅外光譜數(shù)據(jù)集標(biāo)樣集的選取,其中設(shè)置標(biāo)樣集的上限為25,下限為3。

2.4 PLS模型及評價(jià)標(biāo)準(zhǔn)

本次實(shí)驗(yàn)采用偏最小二乘法(PLS)建立定量回歸分析模型,其主成分?jǐn)?shù)由交互驗(yàn)證法確定。采用光譜平均差異(ARMS)、光譜校正率(Prcorrected)及預(yù)測均方根誤差(RMSEP)作為LAR-SLRDS算法的評價(jià)指標(biāo)。其中,ARMS的值越大,表明不同儀器間測得的光譜數(shù)據(jù)差異越大;Prcorrected可顯示不同儀器間光譜差異的扣除率,其值越大表明算法的模型傳遞效果越好。RMSEP作為PLS回歸模型的評價(jià)準(zhǔn)則,其值越小說明算法的傳遞性能越好。其中,ARMS和Prcorrected計(jì)算公式如下:

(6)

(7)

3 結(jié)果與分析

3.1 模型建立及波長數(shù)對模型的影響

首先將藥品樣本和汽油樣本的成分含量參考值按照升序排列;然后采用隔三選一的方式在汽油樣本數(shù)據(jù)集中挑選預(yù)測集60個(gè),校正集28個(gè);在藥品樣本數(shù)據(jù)集中挑選預(yù)測集460個(gè),校正集155個(gè);最后利用PLS分別在兩臺主儀器上建立定量模型。

圖2 汽油C7成分RMSECV隨變量數(shù)變換情況Fig.2 RMSECV of gasoline C7 component with variable number conversion

由于樣品近紅外光譜數(shù)據(jù)維度較高,特征波長數(shù)量較多,而這些變量中存在很多與PLS回歸模型預(yù)測結(jié)果相關(guān)性較低甚至無關(guān)的變量,如果過多引入這些變量,會降低模型傳遞的效果和PLS模型預(yù)測結(jié)果的準(zhǔn)確性,因此需要對樣品光譜數(shù)據(jù)中的有效變量進(jìn)行篩選,對無關(guān)變量進(jìn)行剔除。以汽油樣本C7成分含量為例,采用LAR算法對其變量進(jìn)行篩選,然后利用PLS建立回歸分析模型。本次實(shí)驗(yàn)采用交叉驗(yàn)證均方根誤差(Root mean square error of cross validation,RMSECV)作為PLS回歸模型的評價(jià)指標(biāo),通常RMSECV值越小,PLS回歸模型的效果越好。汽油C7成分的RMSECV隨變量數(shù)變換的情況如圖2所示,從圖中可以看出特征波長數(shù)的選取對PLS模型的預(yù)測會產(chǎn)生影響。隨著樣品波長數(shù)目的增加,汽油樣品C7成分的RMSECV值逐漸變小,當(dāng)樣品波長數(shù)為45時(shí),C7成分的RMSECV取得最小值,表明PLS模型的預(yù)測效果最好。當(dāng)樣品波長數(shù)大于45時(shí),隨著樣本波長數(shù)的增加,C7成分的RMSECV值逐漸處于擺動狀態(tài),但均高于樣品波長數(shù)為45時(shí)的RMSECV值,表明當(dāng)波長數(shù)超過一定數(shù)量時(shí)反而會降低PLS模型的預(yù)測效果。

3.2 模型傳遞前后的光譜差異分析

為了驗(yàn)證模型傳遞的效果,利用LAR-SLRDS算法對汽油和藥品的近紅外光譜數(shù)據(jù)集進(jìn)行模型傳遞實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如圖3所示,其中圖3A(左)給出了汽油樣本C7成分選擇標(biāo)樣集時(shí),測試集在主、從儀器上的平均光譜,圖3B(左)給出了藥品樣本重量成分選擇標(biāo)樣集時(shí),測試集在主、從儀器上的平均光譜。從圖中可以看出汽油、藥品兩個(gè)數(shù)據(jù)集在主、從儀器上測得光譜數(shù)據(jù)的平均光譜均存在明顯的差異。圖3(右)給出了LAR-SLRDS算法校正后汽油樣本和藥品樣本測試集在主、從儀器上的平均光譜。從圖中可以看出經(jīng)LAR-SLRDS算法校正后,兩個(gè)數(shù)據(jù)集在主、從儀器上的平均光譜之間幾乎不存在差異。

LAR-SLRDS算法校正前后兩個(gè)數(shù)據(jù)集的光譜平均差異(ARMS)和光譜校正率(Pr)的計(jì)算值如表1所示。以藥品中重量性質(zhì)為例進(jìn)行相關(guān)說明,從表1中可以看出,從儀器的標(biāo)樣集大小設(shè)為4,光譜傳遞前主、從儀器上測得的近紅外光譜的光譜差異為0.109 1,經(jīng)LAR-SLRDS算法傳遞后主、從儀器上測得的近紅外光譜的差異僅為0.031 8,校正率達(dá)到91.59%。與圖3B的結(jié)果一致。由此可以得出,LAR-SLRDS算法能夠消除主、從儀器上光譜之間的差異性,很好地實(shí)現(xiàn)模型傳遞。

表1 LAR-SLRDS算法傳遞前后儀器間的光譜差異(ARMS)Table 1 ARMS before and after calibration transfer by LAR-SLRDS

3.3 與DS、PDS及SLRDS模型傳遞光譜差異的比較

本文將DS、PDS和SLRDS與LAR-SLRDS算法模型傳遞進(jìn)行對比。前3種算法校正過程中標(biāo)樣集大小的選取以及PDS算法窗口的選擇與LAR-SLRDS算法相同,均遵從SEP最小原則,僅缺少波長篩選環(huán)節(jié)。表2給出了DS、PDS、SLRDS和LAR-SLRDS傳遞后測試集主、從儀器上光譜差異的計(jì)算值。從表2中可以看出,與DS、PDS、SLRDS傳遞后的光譜差異相比,汽油和藥品兩個(gè)數(shù)據(jù)集經(jīng)LAR-SLRDS算法傳遞后主、從儀器上的光譜差異均明顯降低。以藥品數(shù)據(jù)集的重量性質(zhì)為例說明,經(jīng)DS、PDS和SLRDS算法傳遞后,主、從儀器上的光譜差異分別降為0.074 7、0.039 5和0.049 5,然而經(jīng)LAR-SLRDS算法傳遞后,主、從儀器上的光譜差異降為0.031 8,證明LAR-SLRDS模型傳遞的效果最好。

表2 經(jīng)DS、PDS、SLRDS和LAR-SLRDS傳遞后主、從儀器間的光譜差異(ARMS)Table 2 ARMS between master and slave devices after calibration transfer by DS,PDS,SLRDS and LAR-SLRDS

3.4 與DS、PDS及SLRDS預(yù)測結(jié)果的比較

表3給出了DS、PDS、SLRDS和LAR-SLRDS算法模型傳遞以后從儀器測試集預(yù)測標(biāo)準(zhǔn)差(SEP)的變化情況。以汽油數(shù)據(jù)集中C7成分含量為例進(jìn)行相關(guān)分析,從表3中可以看出,未經(jīng)過校正的從儀器上C7成分的SEP為2.783 2,經(jīng)過DS、PDS、SLRDS和LAR-SLRDS算法模型傳遞后,其預(yù)測標(biāo)準(zhǔn)偏差均明顯降低,其中本文提出的LAR-SLRDS算法的模型傳遞效果最好,從儀器上測得的汽油樣本光譜數(shù)據(jù)經(jīng)LAR-SLRDS算法模型傳遞并進(jìn)行PLS回歸后,預(yù)測標(biāo)準(zhǔn)差僅為0.410 6。

表3 DS、PDS、SLRDS和LAR-SLRDS傳遞前后的預(yù)測標(biāo)準(zhǔn)差(SEP)Table 3 SEP before and after calibration transfer by DS,PDS,SLRDS and LAR-SLRDS

4 結(jié) 論

近年來,近紅外光譜技術(shù)研究融入人們生活的方方面面,然而模型傳遞問題尚未得到很好地解決。本文提出了一種新的模型傳遞方法——最小角回歸結(jié)合一元線性回歸直接校正法(LAR-SLRDS),利用LAR算法進(jìn)行樣品光譜信息中有效特征波長點(diǎn)的篩選,同時(shí)剔除無關(guān)或非線性變量,使得樣品的光譜矩陣維度降低,結(jié)合SLRDS算法所求參數(shù)少、傳遞效果好等優(yōu)勢,提高了近紅外光譜定量分析模型在不同儀器之間的通用性。最后,采用汽油和藥品樣本兩個(gè)光譜數(shù)據(jù)集評估LAR-SLRDS算法的性能,并與DS、PDS和SLRDS算法的模型傳遞效果進(jìn)行對比。實(shí)驗(yàn)結(jié)果表明,LAR-SLRDS算法可以消除儀器間的光譜差異,實(shí)現(xiàn)模型傳遞,提高定量分析模型的準(zhǔn)確性以及穩(wěn)定性,較DS、PDS和SLRDS算法具有所求參數(shù)少、模型傳遞效果好等優(yōu)點(diǎn),能夠?qū)崿F(xiàn)藥品和汽油樣本的近紅外光譜模型傳遞。

猜你喜歡
模型
一半模型
一種去中心化的域名服務(wù)本地化模型
適用于BDS-3 PPP的隨機(jī)模型
提煉模型 突破難點(diǎn)
函數(shù)模型及應(yīng)用
p150Glued在帕金森病模型中的表達(dá)及分布
函數(shù)模型及應(yīng)用
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 亚洲成人在线免费| 国产69精品久久久久孕妇大杂乱| 国产精品lululu在线观看| 青青青国产在线播放| 国产第一页第二页| 亚洲欧美日韩久久精品| AV无码国产在线看岛国岛| 国产成人精品一区二区不卡| 亚洲福利片无码最新在线播放| 夜色爽爽影院18禁妓女影院| 激情爆乳一区二区| 国产超碰在线观看| 亚洲日韩精品无码专区97| 亚洲精品无码AV电影在线播放| 国产伦片中文免费观看| 亚洲精品中文字幕无乱码| 亚洲a免费| 国产人成午夜免费看| 国产免费黄| 无码免费的亚洲视频| 国产亚洲欧美在线专区| 国产在线八区| 91毛片网| 久久久91人妻无码精品蜜桃HD| 欧美亚洲一区二区三区导航| 国产特级毛片aaaaaaa高清| 久久www视频| 国内精自视频品线一二区| 亚洲欧美日韩另类在线一| 久久人搡人人玩人妻精品一| 国产精品福利尤物youwu| 乱人伦视频中文字幕在线| 日本道中文字幕久久一区| 嫩草影院在线观看精品视频| 亚洲一道AV无码午夜福利| 中日韩一区二区三区中文免费视频| 制服丝袜 91视频| 日韩国产高清无码| 亚洲区第一页| 国产成本人片免费a∨短片| 国产精品深爱在线| 极品私人尤物在线精品首页 | 久久成人免费| 欧美性色综合网| 69综合网| 秋霞一区二区三区| 亚洲第一精品福利| 精品国产香蕉在线播出| 91啦中文字幕| 久久特级毛片| 亚洲欧美日韩色图| 极品av一区二区| 永久免费精品视频| 久久国产精品娇妻素人| 亚洲精品在线91| 国产成人精品在线| 亚洲va欧美ⅴa国产va影院| 亚洲天堂精品在线| 在线观看无码av五月花| Jizz国产色系免费| 欧美三级不卡在线观看视频| 精品无码国产自产野外拍在线| 欧洲日本亚洲中文字幕| 欧美日韩中文国产va另类| 欧美性久久久久| 国产欧美精品一区aⅴ影院| 99热这里只有精品免费| 日韩a在线观看免费观看| 国产91精品久久| 欧美国产日韩在线播放| 亚洲成人一区二区| 亚洲三级成人| 9啪在线视频| 一本大道香蕉中文日本不卡高清二区 | 欧美在线三级| 欧美一区二区三区国产精品| 欧美精品啪啪| 免费国产小视频在线观看| 国产精品漂亮美女在线观看| 亚洲va欧美va国产综合下载| 亚洲国产成人精品无码区性色| 91在线国内在线播放老师|