999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

改進團隊進步算法的近紅外光譜波長篩選

2021-10-17 01:33:40高美鳳陶煥明
光譜學與光譜分析 2021年10期
關鍵詞:價值

高美鳳, 陶煥明

江南大學輕工過程先進控制教育部重點實驗室, 物聯(lián)網(wǎng)工程學院, 江蘇 無錫 214122

引 言

近紅外光譜分析技術憑借其快速、 無損以及低成本的特點, 已經廣泛運用在食品分析、 生物醫(yī)學、 農業(yè)等領域。 但由于近紅外光譜不同的波長點對被測物質不同化學基團的吸收強度不同, 被測物質濃度并不與光譜全譜波長信息相關, 往往采集到的全光譜數(shù)據(jù)存在大量的冗余信息以及噪聲信息, 與之直接相關的有效信息僅僅存在于全譜信息中的一部分。 如何快速有效地提取出有用光譜信息是近紅外光譜技術研究的重點之一。

目前, 國內外研究學者提出大量基于不同原理策略的波長篩選方法, 主要有: 以全譜PLS模型的某些參數(shù)作為變量選擇的依據(jù), 如無信息變量消除法(UVE)對回歸系數(shù)設定閾值限制來選擇有效變量[1]; 以光譜區(qū)間為篩選對象的方法, 如區(qū)間偏最小二乘(iPLS)[2]、 移動窗口偏最小二乘(MWPLS)[3]、 向前和向后間隔偏最小二乘(FB-iPLS)[4]、 區(qū)間隨機蛙跳(iRF)[5]等; 以連續(xù)投影策略進行變量排序篩選出最優(yōu)變量子集, 如連續(xù)投影算法(SPA)[6]; 以模型集群分析策略的方法, 如變量空間迭代收縮(VISSA)[7]、 變量組合集群分析(VCPA)[8]; 以智能算法為核心進行波長組合優(yōu)化, 如遺傳算法(genetic algorithm, GA)[9-11]、 免疫遺傳算法(IGA)[12]、 粒子群算法(PSO)[13]、 蟻群算法(ACO)[14]、 二進制蜻蜓算法(BDA)[15]等。 團隊進步算法(team progress algorithm, TPA)[16-17]是一種典型的智能組合優(yōu)化算法, 它是通過樹立榜樣引導團隊進步的方向, 利用合理的分工合作提高工作效率。

近紅外光譜波長變量多, 需要在多達幾百甚至上千的波長點中, 選擇最有效的波長點, 使得所建模型的預測精度最高, 因此將波長篩選問題轉化為波長點之間的組合優(yōu)化問題, 通過智能組合優(yōu)化算法尋找光譜中的最佳波長。 在團隊進步算法的基礎上, 提出一種應用于近紅外光譜波長篩選的智能組合優(yōu)化算法: 改進團隊進步算法(improved team progress algorithm, iTPA)。 首先將波長變量均分為若干波段, 對波段按照與其相應的理化值進行PLS建模, 將得到的評價值函數(shù)按大小降序排列, 波段分組中增設一個垃圾回收組。 按評價值從高到低依次分為精英組、 普通組和垃圾回收組, 建立精英組和垃圾回收組兩個學習樣板, 結合學習和探索的過程, 通過不斷的迭代更新, 選取評價值最高的波段作為篩選波段。 該算法在計算迭代過程中, 每個波段的波長點在不斷進行更新, 各小組在搜索過程中出現(xiàn)明顯的分工, 使算法具備良好的全局搜索能力。

1 算法原理及實現(xiàn)

1.1 TPA算法實現(xiàn)原理

1.1.1 數(shù)學模型

TPA是一種雙群體搜索算法[16], 模仿團隊兩個小組(精英組和普通組)的學習和探索過程, 并設計合理的成員更新規(guī)則, 逐步提升其評價值以達到全局最優(yōu)。 實驗表明, 該算法能夠在較少的計算量前提之下快速尋找全局最優(yōu)。

算法模型多變量無約束最大化問題可表示為

(1)

式(1)中, 向量x代表一個成員, 即為包含多個波長的波段;xi表示該成員的第i個能力因素, 即該波段中的第i個波長點;ai和bi分別表示xi的上下邊界值; 而函數(shù)f(x)代表該成員x的評價值。 通過更新成員以逐步提升或降低評價值來尋求最優(yōu)成員。

1.1.2 分組規(guī)則

將整條光譜波段均分為P個波段同時確定其評價值, 評價值為該波段與測得的含量理化值進行PLS建模得到的校正集均方差(RMSEC)和相關系數(shù)(r)為變量的函數(shù)值, 本工作設定的評價值為

(2)

每一個波段就相當于向量x。 將P個波段按評價值從大到小排列分成N+M個波段(N和M均為整數(shù)),N個評價值較高的波段組成精英組{xe1,xe2, …,xen},M個評價值較低的波段組成普通組{xp1,xp2, …,xpm}。 通過團隊進步過程更新組內成員。

1.1.3 行為定義

需要產生一條新生波段xr, 新生波段可從任意一組產生, 其波長點從當前組隨機波段同一波長點中繼承。 若新生波段出身自精英組, 且該新生波段的第i個波長點如果是在精英組第n個波段中產生, 那么該波長點需繼承精英組第n個波段中第i個波長點; 若新生波段出身自普通組, 且該新生波段的第i個波長點如果是在普通組第m個波段中產生, 那么該波長點需繼承普通組第m個波段中第i個波長點。 繼承下來的新生波段通過設定概率選擇一次學習或者探索行為以更新自身的波長點, 才能成為候選波段xc。

新生成員xr如果選擇進行學習行為, 則需要向參照目標方向調節(jié)。 參照方向產生于精英組和普通組, 分別稱為精英組樣板ee和普通組樣板ep, 且樣板值取所在組波段波長的平均值。 若新生波段產生于普通組, 則其需向精英組樣板調節(jié); 若新生波段產生于精英組, 則向普通組樣板的反方向調節(jié), 如式(3)所示。

(3)

式(3)中,γ為區(qū)間[0, 1]內隨機數(shù)。 若xc某個波長點范圍越界, 則改用其邊界值。

新生成員如果進行探索行為, 則其各波長點xri(i=1, 2, …,n)將做隨機改變。 并且探索強度逐步減小。 兩組新生波段xr經過探索行為生成xc的表達式如式(4)和式(5)所示。

xc=[xc1,xc2, …,xcn]T

(4)

(5)

式(5)中,γi是區(qū)間(0, 1)的隨機數(shù),mi為0和1二值隨機整數(shù)。 收縮系數(shù)te, p為

(6)

式(6)中,K為算法最大迭代次數(shù),k表示當前累計的迭代次數(shù)。 收縮指數(shù)αe, p表示當新生波段繼承自精英組時選取αe, 當新生波段繼承自普通組時選取αp。

1.1.4 更新規(guī)則

若候選波段xc的評價值高于精英組末位xewst的評價值, 則xc進入精英組, 同時精英組再次進行評價值排序, 精英組末位xewst不進入普通組直接淘汰。 這是因為TPA設置了學習行為, 加強了算法的定向搜索和局部搜索能力, 遭到淘汰的精英組末位xewst如果進入普通組的話容易導致算法陷入局部最優(yōu)。 若候選波段xc的評價值劣于xewst但優(yōu)于普通組末位xpwst, 還需檢查xc是否由探索行為得到, 若是, 則xc進入普通組, 淘汰xpwst。 若不是, 直接丟棄xc。 這是因為學習行為產生高評價值候選波段的可能性比較大, 且趨同性強, 容易導致普通組波段同化, 降低全局尋優(yōu)能力。

1.2 改進TPA算法

在TPA算法中, 繼承于精英組的新生波段xr在選擇學習行為時, 需要向普通組樣板ep的反方向調節(jié)。 但在迭代過程中, 精英組和普通組的成員在不斷進行更新優(yōu)化, 從而在迭代后期, 普通組的樣板值ep也隨著精英組樣板值增大, 在選擇學習行為時, 并不能為繼承于精英組的新生波段xr提供一個良好的調節(jié)方向, 容易陷入局部最優(yōu)。 因此對TPA算法進行如下改進:

1.2.1 改進分組規(guī)則

在對P個成員進行分組時, 由原來的N+M模式改為N+M+L模式, 評價值依次降序排列。N為評價值高的波段組成的精英組{xe1,xe2, …,xen},M為評價值適中的波段組成的普通組{xp1,xp2, …,xpm}, 新增添的L組為評價值最低的波段組成的垃圾回收組{xg1,xg2, …,xgl}。 再通過團隊進步過程更新成員。

1.2.2 學習行為重定義

新增添的L組不參與繼承、 學習以及探索行為。 新生波段進行學習行為時, 仍需要向參照目標方向調節(jié), 參照方向更改為分別產生于精英組和垃圾回收組, 稱為精英組樣板ee和垃圾回收組樣板eg, 樣板值依舊取所在組波段波長的平均值。 即若新生波段產生于普通組, 則其需向精英組樣板調節(jié); 若新生波段產生于精英組, 就向垃圾回收組樣板的反方向調節(jié), 如式(7)所示。

(7)

式(7)中,γ為區(qū)間[0, 1]內隨機數(shù)。 若xc某個波長點范圍越界, 則改用其邊界值。

1.2.3 更新規(guī)則的修改

在進行波段更新的時候需要將低評價值的波段回收進L組, 使L組的波段評價值極低。 新的波段更新規(guī)則在精英組和普通組不做修改, 當候選波段xc的評價值低于垃圾回收組首位(垃圾回收組中評價值最高)xgbst的評價值, 則xc進入垃圾回收組, 同時垃圾回收組中的xgbst波段遭到淘汰, 促使垃圾回收組評價值一直保持低的狀態(tài), 為繼承于精英組的新生波段進行學習行為時提供一個正確的更新方向, 有效地避免算法陷入局部最優(yōu)。

1.3 iTPA算法實現(xiàn)步驟

Step1: 初始化基本參數(shù)。 包含總波段成員個數(shù), 精英組、 普通組以及垃圾回收組的波段個數(shù), 新生波段選擇學習或探索行為的概率, 精英組和普通組的收縮系數(shù), 迭代次數(shù)。

Step2: 分組。 將各波段按照與其相應的理化值PLS建模得到的評價值函數(shù)大小降序排列, 評價值函數(shù)如式(2)所示, 依次放入精英組、 普通組和垃圾回收組, 使得精英組中評價值最高, 普通組次之, 垃圾回收組最低。

Step3: 產生新生波段。 新生波段隨機選擇從精英組或普通組中產生, 其波長點從當前組隨機波段同一波長點中繼承。

Step4: 新生波段選擇學習或探索行為生成候選波段。 生成一個隨機數(shù), 若隨機數(shù)滿足選擇學習行為的概率, 則需進行學習行為。 在進行學習行為之前, 需判斷該新生波段是從精英組還是普通組產生, 以便選擇不同的學習行為, 如式(7)所示。 若隨機數(shù)滿足選擇探索行為的概率, 則需進行探索行為。 在進行探索之前, 仍需判斷該新生波段是從精英組還是普通組產生, 從而為探索行為選擇不同的收縮系數(shù), 如式(5)和式(6)所示。 若行為過程中某個波長點范圍越界, 則改用其邊界值。

Step5: 波段更新。 候選波段的評價值需要跟三個小組中的波段評價值進行對比更新。 更新規(guī)則參閱本文1.1.4和1.2.3。

Step6: 循環(huán)Step3—Step5進行迭代更新。 迭代結束, 選出精英組中評價值最高的波段為最終篩選波段。

2 實驗部分

2.1 數(shù)據(jù)準備

2.1.1 數(shù)據(jù)來源

為考察新提出的變量篩選算法對建模預測的效果, 將其應用在一組標準玉米近紅外光譜數(shù)據(jù)集。 該光譜數(shù)據(jù)集引用自eigenvector網(wǎng)站上開源的玉米樣本光譜數(shù)據(jù)集, 網(wǎng)址https://eigenvector.com/resources/data-sets/。 該數(shù)據(jù)集為80個玉米樣品用mp5spec儀器掃描得到的光譜數(shù)據(jù), 并用化學方法測定了其淀粉和蛋白質含量。 以間隔為2 nm在波長范圍為1 100~2 498 nm上收集(700個波長點)。

2.1.2 剔除異常數(shù)據(jù)及樣本劃分

考慮到儀器測量光譜數(shù)據(jù)時因誤差而得到異常光譜, 會影響模型性能, 故先用馬氏距離剔除光譜中異常數(shù)據(jù)。 圖1為各個數(shù)據(jù)樣本點到數(shù)據(jù)中心點的馬氏距離分布圖。 馬氏距離最遠的兩個樣本(75和77號樣本)作為異常點剔除, 圖2為剔除異常樣本之后的原始光譜圖。

圖1 樣本馬氏距離分布圖

圖2 剔除異常樣本的光譜圖

采用Kennard-Stone(KS)方法[18]將剩余的78個樣本點分成校正集和預測集。 劃分結果為校正集樣本50個, 預測集樣本為28個。 校正集和預測集淀粉和蛋白質含量值統(tǒng)計如表1。 由表1可知, 校正集樣本與預測集樣本的平均值和標準差相差不大, 通過KS方法劃分數(shù)據(jù)集保證了校正集樣本均勻分布。

表1 校正集和預測集中淀粉和蛋白質含量值g/100 g統(tǒng)計

2.2 方法

實驗使用的是一臺戴爾計算機, 處理器是Intel(R) Core i5-9400, CPU主頻為2.90 GHz, 操作系統(tǒng)為Windows10,所有計算均在MATLAB 2016a中進行。 為了驗證iTPA算法的有效性和優(yōu)越性, 分別用全譜波長、 GA、 TPA以及主成分分析(principal component analysis, PCA)算法對玉米的淀粉和蛋白質含量的建模效果進行了對比。 進行GA算法時, 由于原始光譜波長點數(shù)眾多, 如對波長點進行優(yōu)選組合, 運算效率將會非常低, 因此將原光譜均分若干個子區(qū)間, 用GA算法進化迭代獲取最大適應度值所對應的優(yōu)選子區(qū)間組合。 根據(jù)基因選出的波段建立PLS模型, 計算出模型的相關系數(shù)(r)和校正集預測均方根誤差(RMSEC), 適應度函數(shù)F跟iTPA算法評價值函數(shù)f(x)保持一致為

(8)

將原光譜在1 100~2 498 nm范圍之間共700個波長點數(shù)劃分35個等距區(qū)間, 即遺傳編碼長度為35, 每一個基因包含20個波長點數(shù)。 設定群體個數(shù)為50個, 交叉概率為0.85, 變異概率為0.1, 最大迭代數(shù)為200代。 在種群進化過程中尋找最大迭代次數(shù)內進化過程中最優(yōu)適應度個體。

同樣的, 采用TPA算法時將原光譜等分35個波段區(qū)間, 每個波段內含20個波長點數(shù), 即每個成員對應20個能力因素。 按照算法經驗, 精英組由15個波段組成, 普通組由20個波段組成, 該分組模式算法性能最優(yōu)。 設定選擇學習概率為0.35, 循環(huán)嘗試不同的收縮指數(shù), 當精英組收縮指數(shù)為20時, 算法預測效果最優(yōu), 普通組收縮指數(shù)設定為精英組的0.5倍。 迭代次數(shù)為1 000。 迭代完畢之后, 取精英組評價值最高的成員為優(yōu)選成員, 優(yōu)選成員中包含的能力因素就是所要篩選的波長點。 如出現(xiàn)重復波長點則去除即可。 因此, 采用TPA算法篩選出來的波長點數(shù)最多不超過20個。

對于iTPA算法, 同樣分為35個成員, 按照算法經驗, 其中精英組10個成員, 普通組10個成員, 垃圾回收組15個成員, 該分組模式算法效果最優(yōu), 其余設定條件與原TPA算法保持一致。 由于GA算法、 TPA算法、 iTPA算法都具有的隨機性, 因此將以上三種算法分別運行50次求平均。

3 結果與討論

3.1 算法性能分析

改進算法iTPA優(yōu)化了TPA算法的更新方向, 促使算法很大程度上避免陷入局部最優(yōu)。 圖3為用TPA和iTPA篩選之后的變量分別與淀粉和蛋白質含量測試50次進行建模分析的預測均方根誤差值。

由圖3可知, iTPA算法由于避免了陷入局部最優(yōu), 使得整體預測效果得到了明顯的提升。 表2和表3分別為各算法測試淀粉含量和蛋白質含量的各項性能數(shù)據(jù)。

圖3 TPA和iTPA算法運行50次(a)淀粉預測RMSEP值和(b)蛋白質預測RMSEP值

表2 不同變量篩選方法對玉米淀粉含量的預測結果

從表2可得, 在玉米淀粉含量的預測上, iTPA相比于全譜PLS(F-PLS), 變量個數(shù)從700個減少到均值為17.55個(50次運算求平均), 模型的校正均方根誤差RMSEC從0.335 7降到0.260 9左右, 校正集預測精度提升22.3%。 模型的預測均方根誤差RMSEP從0.391 4下降到0.334 4左右, 預測集預測精度提升14.6%。 相比原TPA算法有了提升, TPA算法的RMSEP為0.345 3。 GA算法總體預測效果是最佳, 但其篩選出來的平均波長點數(shù)高達350個和算法運算時間21.98 s, 遠遠大于iTPA算法的17.55個和0.676 s。 通過對原光譜進行PCA降維, 篩選出20個波長點(貢獻率已達0.999 98), 以此與篩選出近乎相同波長數(shù)的iTPA算法作比較。 經PCA算法篩選波長之后得到的RMSEP為0.792 7, 預測效果遠不如iTPA算法。 因此, iTPA算法應用在淀粉含量光譜數(shù)據(jù)集中能在保持預測能力的前提下大幅度削減波長點數(shù), 有效地減小建模的計算量, 同時算法速度更快。

表3 不同變量篩選方法對玉米蛋白質含量的預測結果

從表3可得, 對于玉米蛋白質的預測, iTPA算法預測均方根誤差RMSEP為0.117 7, 預測相關系數(shù)Rp為0.970 4, 校正均方根誤差RMSEC為0.101 9, 校正相關系數(shù)Rc為0.975 9, 預測效果比全譜PLS和原TPA算法都有提升, 全譜PLS的RMSEP為0.178 9, TPA算法的RMSEP為0.119 3。 GA算法總體預測效果最佳, 但其篩選出來的平均波長點數(shù)高達346個, 以及算法運算時間22.12 s, 遠遠大于iTPA的19.60個和0.666 s。 通過對原光譜進行PCA降維, 篩選出20個波長點(貢獻率已達0.999 997)。 經PCA算法篩選波長之后得到的RMSEP為0.236 2, 預測效果遠不及iTPA算法。 因此, iTPA算法應用在蛋白質含量光譜數(shù)據(jù)集中, 同樣能在保持預測能力的前提下大幅度削減波長點數(shù), 有效地減小建模的計算量, 同時算法速度更快。

3.2 化學特性分析

圖4表示iTPA算法分別在玉米淀粉和蛋白質數(shù)據(jù)集上運行50次后變量被選取的頻率。

由圖4(a)可知, 淀粉近紅外光譜被iTPA算法篩選后的信息變量區(qū)域主要分布在1 540~1 546, 1 576~1 588, 1 724~1 730和1 766~1 772 nm等區(qū)域, 而這些區(qū)域與淀粉中O—H的伸縮振動一級倍頻以及C—H的伸縮振動一級倍頻的頻率一致, 這與本次研究中淀粉的化學性質相一致。

圖4 iTPA算法運行50次后(a)淀粉光譜變量被選取的頻率和(b)蛋白質光譜變量被選取的頻率

因此iTPA算法能夠有效地消除光譜信息中的一些干擾波長點, 達到篩選出有效波長點目的。

4 結 論

提出了一種近紅外光譜波長變量選擇算法, 即改進的團隊進步算法(iTPA), 對玉米淀粉和蛋白質的近紅外譜波長進行選擇, 建立了更加穩(wěn)健的PLS模型, 模型的預測均方根誤差RMSEP分別為0.334 4和0.117 7, 獲得了滿意的預測精度。 結果表明: iTPA與其他波長選擇算法相比性能均有一定優(yōu)化, 特別是篩選出的有效波長數(shù)目最少, 達到20個以下, 從而降低了模型的復雜度; 快速的尋優(yōu)能力也有利于近紅外光譜檢測在工業(yè)現(xiàn)場的實時應用。

猜你喜歡
價值
踐行初心使命的價值取向
當代陜西(2019年18期)2019-10-17 01:48:58
價值3.6億元的隱私
華人時刊(2019年23期)2019-05-21 03:31:36
一分鐘能創(chuàng)造多少價值?
一粒米的價值
人與自然的和諧之美——《七月》價值新解讀
唐山文學(2016年2期)2017-01-15 14:03:53
“給”的價值
俆衛(wèi):用夢創(chuàng)造價值
科學中國人(2015年4期)2015-02-28 09:12:39
價值
小說月刊(2014年8期)2014-04-19 02:39:17
從平凡中體現(xiàn)價值
聲屏世界(2014年1期)2014-02-28 15:17:32
“活著就要體現(xiàn)自身價值”
中國火炬(2012年3期)2012-07-25 10:34:02
主站蜘蛛池模板: 国产91熟女高潮一区二区| 久久伊人色| 日韩在线永久免费播放| 久久久久无码国产精品不卡| 亚洲天堂高清| 亚洲天堂日韩在线| 在线观看无码a∨| 最新无码专区超级碰碰碰| 精品91视频| 国产成人综合久久精品下载| 国产精品永久在线| 精品人妻无码中字系列| 亚洲无码精彩视频在线观看| 性视频一区| 欧美在线视频a| 欧美日本不卡| 亚洲大尺码专区影院| 久久99国产视频| 国产高清精品在线91| 日韩精品无码一级毛片免费| 四虎免费视频网站| 亚洲美女一区| 国产门事件在线| 亚洲三级a| 三上悠亚一区二区| 精品国产成人国产在线| 中文字幕2区| 久久99久久无码毛片一区二区| 欧美日韩动态图| 在线国产综合一区二区三区| 日韩最新中文字幕| 亚洲娇小与黑人巨大交| 99青青青精品视频在线| 免费一级无码在线网站| 97se综合| 天堂亚洲网| 色丁丁毛片在线观看| 91亚洲精品第一| 亚洲av色吊丝无码| 亚洲精品国产自在现线最新| 欧美午夜性视频| 亚洲香蕉伊综合在人在线| 国产区福利小视频在线观看尤物| 国产精品亚洲片在线va| 久久婷婷色综合老司机| 亚洲欧美综合精品久久成人网| 亚洲区第一页| 欧美激情福利| 波多野结衣视频一区二区| 一级黄色片网| 日韩在线1| 国产微拍精品| 亚洲区第一页| 成人免费一区二区三区| 久久一级电影| 欧美日韩在线成人| 在线播放精品一区二区啪视频| 日韩美一区二区| a免费毛片在线播放| 国产精品短篇二区| 亚洲第一视频区| 9cao视频精品| 欧洲精品视频在线观看| 人人91人人澡人人妻人人爽| 国产香蕉国产精品偷在线观看| 国产午夜人做人免费视频中文| 日韩色图区| 欧美亚洲激情| 亚洲日本在线免费观看| 国产精品亚洲综合久久小说| 中文字幕啪啪| 欧美三级日韩三级| 在线看免费无码av天堂的| 国产v精品成人免费视频71pao | 全午夜免费一级毛片| 免费无码又爽又刺激高| 国产小视频免费观看| 国产成人精品午夜视频'| 国产一区成人| 日韩欧美国产另类| 亚洲免费三区| 久久久久九九精品影院|