郭志明等
1引言
近紅外光譜區(qū)是指波長在780~2526 nm范圍內(nèi)的電磁波,是分子振動光譜倍頻和合頻吸收譜,具有豐富的結(jié)構(gòu)和組成信息,可用于碳?xì)溆袡C(jī)物質(zhì)的組成與性質(zhì)的測量。與傳統(tǒng)分析技術(shù)相比,近紅外光譜具有無損檢測、分析效率高、成本低、重現(xiàn)性好、樣品測量一般不需預(yù)處理、適合于現(xiàn)場檢測和在線分析等優(yōu)勢。隨著近紅外光譜分析技術(shù)、化學(xué)計量學(xué)和近紅外光譜儀器的快速發(fā)展,近紅外光譜分析技術(shù)已在許多領(lǐng)域得到廣泛應(yīng)用。借助先進(jìn)的近紅外光譜儀,研究者可快速獲取大量光譜數(shù)據(jù)。但物質(zhì)在該譜區(qū)的倍頻和合頻吸收信號弱,譜帶重疊,解析復(fù)雜;且由于儀器所采集的數(shù)據(jù)除樣品的自身信息外,還包含了其它無關(guān)信息和噪音,如電噪音、樣品背景等,這些信息在預(yù)處理中很難全部消除;其次有些光譜區(qū)域樣品的信息很弱,與樣品的組成或性質(zhì)間相關(guān)程度不高;另外,同一樣本的光譜數(shù)據(jù)內(nèi)部存在共線性關(guān)系,易產(chǎn)生數(shù)據(jù)冗余[1,2]。如果將這些數(shù)據(jù)都參與建模,不但計算量大、模型復(fù)雜,而且精度也受到影響。因此,光譜特征變量優(yōu)選方法成為提高建模質(zhì)量的關(guān)鍵環(huán)節(jié)。
目前,近紅外光譜的特征變量選擇方面的大量研究主要集中在特征波段的選擇、特征波長的優(yōu)選及波段和波長選擇相結(jié)合的篩選方法。在特征波段的選擇上主要有區(qū)間偏最小二乘法(iPLS)[3,4]、移動窗偏最小二乘法(MWPLS)、向前區(qū)間偏最小二乘法(FiPLS)、向后區(qū)間偏最小二乘法(BiPLS)和聯(lián)合區(qū)間偏最小二乘法(SiPLS)[5,6]等;在特征波長的選擇上主要有遺傳算法(GA)、無信息變量消除(UVE)、連續(xù)投影算法(SPA)[7]、模擬退火算法(SAA)[8]和粒子群優(yōu)化算法(PSO)等[4,9]。近紅外光譜校正模型建立方法以偏最小二乘法(PLS)最為經(jīng)典,且PLS應(yīng)用廣泛,一般認(rèn)為其具有較強(qiáng)的抗干擾能力,對非海量數(shù)據(jù)建模穩(wěn)定性較好。蟻群優(yōu)化算法(Ant colony optimization, ACO)由Dorigo等于20世紀(jì)90年代初提出, 是人工智能或群體智能的新發(fā)展,具有分布計算、信息正反饋和啟發(fā)式搜索的特征,已較好的解決旅行商、通訊、網(wǎng)絡(luò)路由和定量構(gòu)效關(guān)系等組合優(yōu)化問題[10~12]。目前已有學(xué)者采用ACO算法進(jìn)行光譜變量的選擇[13~15],但信息素初始權(quán)值的分配有待進(jìn)一步的研究。蟻群優(yōu)化算法結(jié)合偏最小二乘法(ACOPLS)用于近紅外光譜的特征波長選擇,可實現(xiàn)光譜變量的全局搜索,建立精度高穩(wěn)定性強(qiáng)的多元校正模型。
蘋果可溶性固形物含量的近紅外光譜檢測研究多選取同一產(chǎn)地同批次或多個批次的蘋果樣本[16~18]。同一品種不同產(chǎn)區(qū),因土壤、海拔、光照、水量、晝夜溫差等氣候差異, 蘋果的外觀特征和風(fēng)味不同。另外,可溶性固形物主要是可溶性糖類,包括單糖、雙糖,多糖等,難以直接確定其對應(yīng)的特征波長,故需采用優(yōu)化組合算法尋找光譜中最相關(guān)的信息。鑒于此,本研究利用蟻群算法啟發(fā)式全局搜索的特點(diǎn),結(jié)合蒙特卡羅輪盤賭隨機(jī)選擇機(jī)制,選擇蘋果可溶性固形物含量的近紅外光譜特征波長,然后用偏最小二乘法建立不同產(chǎn)地蘋果可溶性固形物含量混合分析模型,以提高近紅外光譜預(yù)測模型的穩(wěn)健性和適用性。
2實驗部分
2.1實驗材料
選用的富士蘋果為我國蘋果主產(chǎn)區(qū)山東、陜西和特產(chǎn)區(qū)新疆,選擇無缺陷、損傷或污染物的蘋果共207個,隨機(jī)挑選138個(40個陜西、48個山東、50個新疆)作為校正集,其余的69個(20個陜西、24個山東、25個新疆)作為預(yù)測集,將它們分別編號后置于4 ℃冰柜中貯藏。實驗前,將蘋果從冰柜取出置于實驗室中12 h,以使蘋果樣本整體溫度與環(huán)境溫度一致,試驗過程保持實驗室溫濕度基本不變。
2.2光譜采集與標(biāo)準(zhǔn)值測定
2.3.3目標(biāo)函數(shù)選取在優(yōu)化過程中,目標(biāo)函數(shù)表明了個體生存能力和群體的優(yōu)化程度。建立一個好的目標(biāo)函數(shù),可加快收斂速度,提高計算精度。近紅外光譜多元校正模型建立過程中,常采用交互驗證法來評價模型的預(yù)測能力,即采用預(yù)測殘差平方和、交互驗證均方根誤差、預(yù)測均方根誤差和待測組分預(yù)測值與實測值間的相關(guān)系數(shù)等作為目標(biāo)函數(shù)。本研究以均方根誤差RMSE為評價指標(biāo),公式(4)中yi為樣本SSC的實測值,t為預(yù)測值。均方根誤差的值越小,對應(yīng)校正模型的預(yù)測能力越好;并設(shè)置顯著性因子Q,Q為常數(shù),用于調(diào)整目標(biāo)函數(shù)的收斂效度。
2.3.4算法流程蟻群優(yōu)化算法是一種迭代算法。首先初始化信息素向量等相關(guān)參數(shù),設(shè)置最大變量數(shù)、最大迭代次數(shù)、最大循環(huán)次數(shù)、螞蟻群體大小,其中初始信息素向量值均置為1,即每個變量具有相同的被選擇概率;其次,啟動所有螞蟻,采用蒙特卡洛輪盤轉(zhuǎn)法隨機(jī)從變量集中選擇一個變量,直到變量數(shù)達(dá)到最大變量數(shù),階段性完成變量選擇后建立偏最小二乘模型,輸出均方根誤差;再次,未達(dá)到最大迭代次數(shù)時,更新信息素向量,繼續(xù)進(jìn)行變量選擇并建立偏最小二乘模型;最后,比較各次循環(huán)次數(shù)獲得的偏最小二乘模型結(jié)果,輸出最優(yōu)解。
4結(jié)論
利用蟻群優(yōu)化算法選擇蘋果可溶性固形物含量的近紅外光譜特征波長,建立穩(wěn)健精細(xì)的偏最小二乘分析模型。與全光譜偏最小二乘模型和遺傳偏最小二乘模型相比,蟻群優(yōu)化算法選擇的波長數(shù)最少,且模型預(yù)測能力最強(qiáng),其校正集相關(guān)系數(shù)Rc和均方根誤差RMSEC分別為0.9830和0.4615,預(yù)測集相關(guān)系數(shù)Rp和預(yù)測均方根誤差RMSEP分別為0.9708和0.5144。研究選用3個富士蘋果主產(chǎn)地的樣本,建立不同產(chǎn)地蘋果可溶性固形物含量混合分析模型,最優(yōu)模型具有較高的預(yù)測精度,應(yīng)用近紅外光譜可以建立多產(chǎn)地蘋果品質(zhì)混合分析模型,具有較好的穩(wěn)健性和適用性。研究結(jié)果表明,自適應(yīng)蟻群優(yōu)化算法可以有效選擇近紅外光譜特征波長,簡化模型,提高計算效率,增強(qiáng)模型的穩(wěn)健性。
References
1YANG HaoMin, LU QiPeng, HUANG FuRong. J. Infrared Millim. Waves, 2011, 30(6): 522-525
2JIN Ye, YANG Kai, WU YongJiang, LIU XueSong, CHEN Yong. Chinese J. Anal. Chem., 2012, 40(6): 925-931
3ZHANG DeQuan, CHEN XiaoNa, SUN SuQin, LI ChunHong, ZHANG BaiLin, LI Yong, LI ShuRong, LI QingPeng, ZHOU HongJie. Spectroscopy and Spectral Analysis, 2008, 28(11): 2550-2553
4WANG JiaHua, LI PengFei, CAO NanNing, HAN DongHai. J. Infrared Millim. Waves, 2009, 28(5): 386-391
5Zou X, Zhao J,Malcolm J W, Mel H, Mao H. Anal. Chim. Acta, 2010, 667(1): 14-32
6CHEN YongMing, LIN Ping, He Yong. Spectroscopy and Spectral Analysis, 2009, 29(3): 671-674
7CHEN Bin, MENG XiangLong, WANG Hao. Journal of Instrumental Analysis, 2007, 26(1): 66-69
8PAN Tao, WU ZhenTao, CHEN HuaZhou. Chinese J. Anal. Chem., 2012, 40(6): 920-924
9Sorol N, Arancibia E, Bortolato S A, Olivieri A. Chemometr. Intell. Lab., 2010, 102(2): 100-109
10Dorigo M, Maniezzo V, Colorni A. IEEE Trans. Syst. Man Cybern. B, 1996, 6: 29-41
11Bonabeau E, Dorigo M, Theraulaz G. Nature, 2000, 406: 39-42
12Shen Q, Jiang J H, Tao J C,Shen G, Yu R. J. Chem. Inf. Model., 2005, 45: 1024-1029
13WANG YuTian, LI YanChun. Chinese Journal of Sensors and Actuators, 2006, 19(2): 508-510
14GUO Liang, JI HaiYan. Spectrosc. Spect. Anal., 2007, 127(19): 1703-1705
15Franco A, Olivieri A C. Anal. Chim. Acta, 2011, 699(1): 18-25
16Ventura M, Jager A, Putter H, Roelofs F. Postharvest Biol. Tec., 1998, 14(1): 21-27
17Peng Y K, Lu R F. J. Food Eng., 2007, 82(2): 142-152
18Nicolai B M, Beullens K, Bobelyn E, Peirs A, Saeys W, Theron K, Lammertyn J. Postharvest Biol. Tec., 2007, 46(2): 99-118
2JIN Ye, YANG Kai, WU YongJiang, LIU XueSong, CHEN Yong. Chinese J. Anal. Chem., 2012, 40(6): 925-931
3ZHANG DeQuan, CHEN XiaoNa, SUN SuQin, LI ChunHong, ZHANG BaiLin, LI Yong, LI ShuRong, LI QingPeng, ZHOU HongJie. Spectroscopy and Spectral Analysis, 2008, 28(11): 2550-2553
4WANG JiaHua, LI PengFei, CAO NanNing, HAN DongHai. J. Infrared Millim. Waves, 2009, 28(5): 386-391
5Zou X, Zhao J,Malcolm J W, Mel H, Mao H. Anal. Chim. Acta, 2010, 667(1): 14-32
6CHEN YongMing, LIN Ping, He Yong. Spectroscopy and Spectral Analysis, 2009, 29(3): 671-674
7CHEN Bin, MENG XiangLong, WANG Hao. Journal of Instrumental Analysis, 2007, 26(1): 66-69
8PAN Tao, WU ZhenTao, CHEN HuaZhou. Chinese J. Anal. Chem., 2012, 40(6): 920-924
9Sorol N, Arancibia E, Bortolato S A, Olivieri A. Chemometr. Intell. Lab., 2010, 102(2): 100-109
10Dorigo M, Maniezzo V, Colorni A. IEEE Trans. Syst. Man Cybern. B, 1996, 6: 29-41
11Bonabeau E, Dorigo M, Theraulaz G. Nature, 2000, 406: 39-42
12Shen Q, Jiang J H, Tao J C,Shen G, Yu R. J. Chem. Inf. Model., 2005, 45: 1024-1029
13WANG YuTian, LI YanChun. Chinese Journal of Sensors and Actuators, 2006, 19(2): 508-510
14GUO Liang, JI HaiYan. Spectrosc. Spect. Anal., 2007, 127(19): 1703-1705
15Franco A, Olivieri A C. Anal. Chim. Acta, 2011, 699(1): 18-25
16Ventura M, Jager A, Putter H, Roelofs F. Postharvest Biol. Tec., 1998, 14(1): 21-27
17Peng Y K, Lu R F. J. Food Eng., 2007, 82(2): 142-152
18Nicolai B M, Beullens K, Bobelyn E, Peirs A, Saeys W, Theron K, Lammertyn J. Postharvest Biol. Tec., 2007, 46(2): 99-118
2JIN Ye, YANG Kai, WU YongJiang, LIU XueSong, CHEN Yong. Chinese J. Anal. Chem., 2012, 40(6): 925-931
3ZHANG DeQuan, CHEN XiaoNa, SUN SuQin, LI ChunHong, ZHANG BaiLin, LI Yong, LI ShuRong, LI QingPeng, ZHOU HongJie. Spectroscopy and Spectral Analysis, 2008, 28(11): 2550-2553
4WANG JiaHua, LI PengFei, CAO NanNing, HAN DongHai. J. Infrared Millim. Waves, 2009, 28(5): 386-391
5Zou X, Zhao J,Malcolm J W, Mel H, Mao H. Anal. Chim. Acta, 2010, 667(1): 14-32
6CHEN YongMing, LIN Ping, He Yong. Spectroscopy and Spectral Analysis, 2009, 29(3): 671-674
7CHEN Bin, MENG XiangLong, WANG Hao. Journal of Instrumental Analysis, 2007, 26(1): 66-69
8PAN Tao, WU ZhenTao, CHEN HuaZhou. Chinese J. Anal. Chem., 2012, 40(6): 920-924
9Sorol N, Arancibia E, Bortolato S A, Olivieri A. Chemometr. Intell. Lab., 2010, 102(2): 100-109
10Dorigo M, Maniezzo V, Colorni A. IEEE Trans. Syst. Man Cybern. B, 1996, 6: 29-41
11Bonabeau E, Dorigo M, Theraulaz G. Nature, 2000, 406: 39-42
12Shen Q, Jiang J H, Tao J C,Shen G, Yu R. J. Chem. Inf. Model., 2005, 45: 1024-1029
13WANG YuTian, LI YanChun. Chinese Journal of Sensors and Actuators, 2006, 19(2): 508-510
14GUO Liang, JI HaiYan. Spectrosc. Spect. Anal., 2007, 127(19): 1703-1705
15Franco A, Olivieri A C. Anal. Chim. Acta, 2011, 699(1): 18-25
16Ventura M, Jager A, Putter H, Roelofs F. Postharvest Biol. Tec., 1998, 14(1): 21-27
17Peng Y K, Lu R F. J. Food Eng., 2007, 82(2): 142-152
18Nicolai B M, Beullens K, Bobelyn E, Peirs A, Saeys W, Theron K, Lammertyn J. Postharvest Biol. Tec., 2007, 46(2): 99-118