王玉喜,賈振紅*,楊 杰,Nikola K Kasabov
1. 新疆大學(xué)信息科學(xué)與工程學(xué)院, 新疆 烏魯木齊 830046 2. 上海交通大學(xué)圖像處理與模式識(shí)別研究所,上海 200240 3. Knowledge Engineering and Discovery Research Institute, Auckland University of Technology, Auckland 1020, New Zealand
近幾年來(lái),近紅外光譜(NIR)分析在石化、制藥、環(huán)境、臨床、農(nóng)業(yè)、食品和生物醫(yī)學(xué)等領(lǐng)域得到了廣泛的應(yīng)用; 有時(shí),不同樣品的光譜包含的信息非常相近,變量提取困難。 靈敏、快速和準(zhǔn)確的提取相關(guān)變量來(lái)預(yù)測(cè)樣品的化學(xué)成分是化學(xué)計(jì)量學(xué)的重要內(nèi)容。 一般來(lái)說(shuō),近紅外光譜技術(shù)與多變量技術(shù)結(jié)合用于對(duì)相關(guān)物質(zhì)的定性或定量分析。 在光譜化學(xué)計(jì)量學(xué)中通常遇到的是具有大量波長(zhǎng)變量和相對(duì)較少樣本的光譜數(shù)據(jù)情況,在這種情況下建模具有過(guò)度擬合的高風(fēng)險(xiǎn),并導(dǎo)致多變量校準(zhǔn)模型不良或低效的預(yù)測(cè)結(jié)果。 多變量分析中的變量選擇是一個(gè)非常重要的步驟,因?yàn)橄裏o(wú)關(guān)或無(wú)信息變量和降低數(shù)據(jù)維度不僅可以簡(jiǎn)化校準(zhǔn)建模,并在準(zhǔn)確性和魯棒性方面也能改進(jìn)預(yù)測(cè)結(jié)果。
鑒于變量選擇帶來(lái)的益處,基于不同策略的變量選擇方法已被大量提出。 這不僅包括傳統(tǒng)經(jīng)典的方法,如前向選擇和后向消除[1]; 懲罰性方法,如最小絕對(duì)收縮和選擇算子(LASSO)[2],彈性網(wǎng)和最小角度回歸(LARS)[3-4]; 智能學(xué)習(xí)算法,如遺傳算法(GA)[5],蟻群優(yōu)化(ACO)[6]和粒子群優(yōu)化(PSO)[7]。 還有一些基于不同的變量排列標(biāo)準(zhǔn)的方法,如回歸系數(shù)[8],投影中的變量重要性(VIP)和選擇性比率(SR)[9],蒙特卡羅無(wú)信息消除(MC-UVE)[10]和子窗口置換分析(SPA)[11]。 隨著模型群體分析(MPA)思想的發(fā)展,在此基礎(chǔ)上提……