摘 要:介紹了光譜儀多元校正模型傳遞的原理和一些常用算法,并詳細(xì)給出了重要算法演化過程;并對相關(guān)算法進行評述;最后對可研究方向進行了展望。
關(guān)鍵詞:光譜儀;模型傳遞;算法
中圖分類號:TS251.51 文獻(xiàn)標(biāo)識碼:A 文章編號:1674-7712 (2014) 24-0000-02
在多元校正方法實際應(yīng)用中,經(jīng)常遇到這樣的情況,在某一儀器(稱源機,Master)上建立的一個多元校正模型,而該模型在另一臺與源機相同型號的儀器(稱目標(biāo)機,Slaves)上無法使用,或者結(jié)果產(chǎn)生較大的偏差。解決這類問題過程稱之為模型傳遞(Model Transfer),也稱儀器的標(biāo)準(zhǔn)化(Standardization of Spectrometric Instruments)。
模型傳遞的概念有廣義和狹義之分,狹義的模型傳遞特指使用數(shù)學(xué)方法對光譜變異進行修正,使之能適用于原模型。廣義的模型傳遞則泛指利用數(shù)學(xué)方法使特定條件下建立的模型能夠應(yīng)用于新的樣品狀態(tài)、環(huán)境條件或儀器狀態(tài)等,即包括了狹義的模型傳遞和模型維護二部分。
即廣義模型傳遞包括模型傳遞和模型矯正,本文主要介紹狹義概念的模型傳遞算法。
狹義模型轉(zhuǎn)移方法可分為需要借助于標(biāo)準(zhǔn)化樣品的標(biāo)準(zhǔn)化算法(standardization methods)和不需要借助于標(biāo)準(zhǔn)化樣品的非標(biāo)準(zhǔn)化算法。常用的非標(biāo)準(zhǔn)化方法系指各種光譜預(yù)處理方法(包括基線校正、一階或二階導(dǎo)數(shù)、平滑、標(biāo)準(zhǔn)正態(tài)變量變換等)。但當(dāng)標(biāo)準(zhǔn)化方法難以應(yīng)用時,如兩臺儀器相隔很遠(yuǎn),或者樣品的化學(xué)性質(zhì)不穩(wěn)定等,不能在不同的儀器上測定標(biāo)準(zhǔn)化樣品時,必須使用非標(biāo)準(zhǔn)化方法解決部分模型傳遞問題。本文按方法特點將狹義模型傳遞問題分為兩類主流算法。第一類算法是基于光譜圖矯正的方法,即通過建立主從機產(chǎn)生光譜圖的函數(shù)關(guān)系,將從機所測數(shù)據(jù)經(jīng)過函數(shù)變換后,再使用主機所建立的校正模型進行預(yù)測。常見算法包括神經(jīng)網(wǎng)絡(luò)[1]、DS、PDS、PA算法以及改進算法[2-5]。第二類算法是提高校正模型自身的穩(wěn)健性,其主要思想是扣除非化學(xué)物質(zhì)信號與因變量之間的關(guān)系,從而提高校正模型的穩(wěn)健性(信號預(yù)處理方法和回歸方法)[3]。常見算法包括變量篩選、微分、小波變換、多元散射校正(MSC)、標(biāo)準(zhǔn)正交變量變換(SNV)、傅里葉變換(FT)、正交信號校正(OSC)等。
目前,大多數(shù)研究成果屬于第一類算法,而應(yīng)用最為普遍和最為成功的方法是基于分段直接標(biāo)準(zhǔn)化(PDS)方法的優(yōu)化方法。因此本文按算法大致演變的順序,在每一類算法中摘選代表性的算法進行闡述。
一、基于光譜圖矯正核心算法
(一)DS算法
DS模型傳遞方法的基本思想為:通過數(shù)學(xué)方法建立主儀器和從儀器所測光譜信號之間的函數(shù)關(guān)系,由確定的函數(shù)關(guān)系變換從儀器所測光譜信號,盡可能從儀器上測定的譜圖,與主儀器測定的同一樣品的譜圖相同,從而實現(xiàn)模型傳遞。
尋求兩臺儀器間的變換關(guān)系的目的就是希望將從儀器上測得一個樣品的光譜X′,通過一定的數(shù)學(xué)模型,同相應(yīng)的主儀器上的光譜聯(lián)系起來,得到轉(zhuǎn)換光譜X,
X=g(X′) (1)
進行完轉(zhuǎn)換后,原始的校準(zhǔn)模型就可以用來間接預(yù)測新儀器上測得的光譜,
Y=f(g(X′)) (2)
除了對于不同儀器之間的測量光譜進行轉(zhuǎn)換以外,這種轉(zhuǎn)換思想對于同一儀器的長時間漂移,或者由于部件的更換,測量環(huán)境的改變等引入的光譜差異糾正也是適用的。
該算法是有標(biāo)樣方法。這類算法必須選擇一定數(shù)量的樣品組成標(biāo)樣集,并在源機和目標(biāo)機上分別測得其信號,從而找出該函數(shù)關(guān)系。SD算法假設(shè)不同儀器之間光譜的變異關(guān)系是線性的;在計算轉(zhuǎn)換矩陣F時,通常標(biāo)準(zhǔn)化樣品的數(shù)量遠(yuǎn)少于波長點的數(shù)量,因此可能會出現(xiàn)過擬和現(xiàn)象;SD算法在計算轉(zhuǎn)換矩陣F時假設(shè)不同儀器之間光譜的任何變化都是由于儀器差異引起的,因此除了儀器的差異外,樣品的變化也會被校正到模型中去,即F中還校正了大量的樣品化學(xué)變化信息。
(二)PDS算法
DS的改進算法,是一種多元全光譜標(biāo)準(zhǔn)化方法。該算法考慮到:對于一個實際的光譜數(shù)據(jù),波長點的漂移通常只局限于一個小的區(qū)域,因此,主儀器上的每個波長點只需要與從儀器上相應(yīng)的波長點附近的譜段關(guān)聯(lián),而并非需要與全譜區(qū)的所有光譜點關(guān)聯(lián)。具體步驟是:將一臺儀器上i波長附近的i-k到i+j波長段(窗口)對應(yīng)的吸光度與另一臺儀器上i波長對應(yīng)的吸光度關(guān)聯(lián)起來,將窗口沿波長移動從而得到整個光譜的傳遞系數(shù)。關(guān)聯(lián)的數(shù)學(xué)方法可以是主成分回歸或偏最小二乘法。
由于PDS是在譜圖局部的一定范圍內(nèi)進行關(guān)聯(lián)的,所以它能較好地校正儀器間波長的差別,所需的傳遞樣品數(shù)也較少;由于PDS在許多領(lǐng)域中的成功應(yīng)用,它也常常作為新方法的對比方法。DS是在整個光譜區(qū)域進行這種轉(zhuǎn)換,而PDS則選擇某個頻率附近的一個大小固定的窗口內(nèi)進行轉(zhuǎn)換。只要能選擇出反映儀器間差異的樣品,DS和PDS就能得到好的結(jié)果。需要指出的是,這類方法對標(biāo)樣的選擇比較敏感。DS和PDS必須有同一樣品在不同儀器上的測量信號。
二、基于噪聲扣除算法
(一)正交信號處理[3]
儀器的測量信號X由樣品本征信號X1和儀器響應(yīng)信號Ri兩部分組成,也就是對于原機A和目標(biāo)機B分別得到
XA=X1,A+RiA, XB=X1,B+RiB
OSC的基本思想是以矩陣X對矩陣Y的信息正交為判斷標(biāo)準(zhǔn),對矩陣X中的變量進行過濾,以除去X中與Y無關(guān)的部分。由于它是針對與Y無關(guān)的信息,也就可以消除儀器間的差異。OSC是以PLS為基礎(chǔ)建立起來的,為使PLS的第一主成分t對Y正交,(1)建立等式:Torth=t-Y(YTY)-1YTt;(2)求出權(quán)重矢量:torth=Xworth(3)載荷矢量為:Porth=XTtorth/(tTorth*torth);(4)把第一主成分中與 不相關(guān)的信息去除,得到殘差:E=X-torthPTorth。
在第二主成分計算時,E代替X進行計算,反復(fù)進行,直至所需的OSC因子被移除。對目標(biāo)機取得的譜圖XB,test,可輸入建立好的OSC模型,由X*B,test=XB,testw(PTw)-1PT,得到OSC變換后的X*B,test。文獻(xiàn)[4]對建立的正交和預(yù)測模型,通過OSC處理后對數(shù)據(jù)實現(xiàn)了預(yù)測,預(yù)測精度有了明顯改善。
OSC既不需要限定標(biāo)樣的來源,也不需要取得同一樣品在兩臺儀器上的測量信號。以矩陣X中和Y正交的信息作為去除的對象,OSC的這種思想對于噪聲的去除、模型的穩(wěn)健性發(fā)展具有借鑒意義。相對于DS和PDS,雖然三者傳遞效果相當(dāng),但是OSC不需要同一樣品在兩臺儀器上的測量信號,對標(biāo)樣的來源也沒有限制。同時,可以用較少的支集進行轉(zhuǎn)換,具有穩(wěn)健性。這對于模型傳遞的廣泛應(yīng)用,尤其是對一些特殊的測量樣品的模型傳遞,具有很現(xiàn)實的意義。
(二)WT-PDS算法
小波變換用于近紅外預(yù)處理,提取有用信息,消除背景干擾,可以提高近紅外的分析精度和模型穩(wěn)健性,用于數(shù)據(jù)壓縮可以減少數(shù)據(jù)庫存儲空間,提高建模速度[5]。
王菊香[6]提出小波多尺度分段直接校正法(WMPDS),先對混胺的近紅外光譜進行小波分解,然后用PDS算法對每一層小波系數(shù)進行傳遞,PDS窗口隨小波系數(shù)頻率的提高進行動態(tài)調(diào)整,最后進行小波重構(gòu)。能有效消除不同儀器之間的大部分差異,大幅度地改善分析精度,與傳統(tǒng)的PDS相比,傳遞效果明顯提高。小波系數(shù)用于模型傳遞,具有傳遞速度快,穩(wěn)健性強,所需標(biāo)樣少等特點。小波變換可以與神經(jīng)網(wǎng)絡(luò)、遺傳算法等結(jié)合,在近紅外分析領(lǐng)域呈現(xiàn)出良好的發(fā)展前景。
三、結(jié)束語
本文介紹了狹義模型傳遞算法的演變過程以及重要算法流程。其中,以光譜修正算法和信號處理算法為主,主要的思想是希望通過更換統(tǒng)計算法和信號處理算法來改進的變換模型具有更優(yōu)的性能。這些算法的有局限性是任何一種模型傳遞方法都不可能完全適用于所有情況[7]。因此,如果研究學(xué)者們能將模型傳遞領(lǐng)域研究的重心更多地放在廣義模型傳遞上(從加強校正模型相對于儀器的適應(yīng)性可移植性、模型的健壯性)出發(fā)來構(gòu)建有效多元校正模型,并有所突破。這個技術(shù)將會很快在模型傳遞的工程應(yīng)用領(lǐng)域中得到廣泛應(yīng)用。
參考文獻(xiàn):
[1]熊宇虹,溫志渝.基于支持向量機的模型傳遞方法研究[J].光譜學(xué)與光譜分析,2007(27):147-150.
[2]李華,王菊香.改進的K_S算法對近紅外光譜模型傳遞影響的研究[J].光譜學(xué)與光譜分析,2011(31):362-365.
[3]張琳,張黎明.正交信號校正用于傅里葉變換紅外光譜的模型傳遞[J].分析化學(xué)(FENXI HUAXUE)研究報告,2005(33):1709-1712.
[4]張琳,張黎明.模型傳遞用于解析遙感傅里葉變換紅外譜圖[J].光譜學(xué)與光譜分析,2006(26):1614-1617.
[5]田高友,袁洪福.小波變換在近紅外光譜分析中的應(yīng)用進展[J].光譜學(xué)與光譜分析,2003(23):1111-1114.
[6]王菊香,李華.小波多尺度分段直接校正法用于近紅外光譜模型傳遞的研究[J].分析化學(xué)(FENXI HUAXUE)研究報告,2011(39):846-850.
[7]褚小立,袁洪福.光譜多元校正中的模型傳遞[J].光譜學(xué)與光譜分析,2001(21):881-885.
[作者簡介]梅青平(1982.03-),男,重慶沙坪壩人,講師,工學(xué)碩士,主要從事計算智能算法應(yīng)用教學(xué)及研究。
[基金項目]重慶城市管理職業(yè)學(xué)院科研項目(項目編號:2014kykt019)。