廉小親,劉 鈺,陳彥銘,黃 靜,龔永罡,霍亮生
1.北京工商大學人工智能學院,北京 100048 2.北京工商大學中國輕工業工業互聯網與大數據重點實驗室,北京 100048
電感耦合等離子體原子發射光譜儀法(inductively coupled plasma atomic emission spectrometer,ICP-AES),一定濃度的元素試樣溶液經過ICP-AES儀霧化、在炬管中進入等離子態,試樣中的組分被原子化、電離、激發,以光的形式發射出能量,通過測定試樣溶液光譜圖的特征與光強值進而對元素進行定性和定量分析,該測量方法具有靈敏度高、檢出限低及多元素可同時測定的優點,因此被廣泛應用于稀土分析、合金冶煉、石油化工等領域。然而ICP光源激發能高,所以在元素測定過程中,會產生大量發射譜線,幾乎每種元素分析線都會受到不同程度的光譜干擾。
光譜干擾分為背景干擾和譜線重疊干擾。背景干擾是指均勻分布的帶狀光譜疊加在被測元素分析線上造成的干擾,這是ICP光譜儀的固有問題;譜線重疊干擾是指其他元素的譜線重疊在被測元素分析線上產生的干擾[1],被測元素分析線與干擾線疊加后的合成曲線作為混合光譜分析線,導致被測元素分析結果不精確,因此研究光譜干擾校正方法就尤為重要。
近年來,數學和統計學方法常用于ICP-AES信號處理,為ICP-AES光譜干擾校正提供了新的途徑,李劃新等[2]提出用自適應平方根卡爾曼濾波法校正ICP-AES光譜干擾,需要在合適的參數條件下測定加入回收率及相對標準偏差,此方法對參數設定要求較高;沈蘭蓀等[3]提出以目標元素譜圖作為目標數據輸入,選擇元素理論譜線經儀器函數映射得到的元素物理譜線作為參考輸入,通過自適應濾波器輸出元素譜線的最佳估計,其操作較為復雜。本文基于自適應粒子群優化(adaptive particle swarm optimization,APSO)算法在多峰函數優化、全局尋優方面具有的良好優勢,以及基于多峰譜線分離的理論扣除譜線重疊干擾的方法,利用多個Voigt線型函數疊加構造多峰譜線模型,提出將APSO算法作為校正算法的設計思路,通過APSO算法尋求重疊干擾線函數和被測元素分析線函數相關參數的最優解,實現ICP-AES的多峰譜線分離。
激發態原子或離子由于不均勻展寬所致形成服從Gaussian函數分布的發射譜線,均勻展寬的發射譜線具有Lorentzian函數分布特征。在ICP-AES工作條件下,激發態原子或離子的譜線是在均勻和不均勻展寬效應綜合作用下形成的混合型譜線,ICP-AES發射光譜譜線為Lorentzian函數與Gaussian函數卷積得到的Voigt線型函數[4],如式(1)所示。
(1)
為了簡便計算,原子發射光譜譜線可以用Voigt線型近似函數來描述,如式(2)所示。
(2)
式(2)中,I0為譜峰高度,λ0為特征譜線中心位置,ΔλV為譜線半峰寬,η為Lorentz-Gauss比例系數,0≤η≤1,I0,λ0,ΔλV和η為Voigt線型近似函數的待確定參數。
ICP-AES實驗曲線通常是由M條Voigt線型曲線與一個背景值疊加而成,構成的多峰譜線疊加模型如式(3)所示。
(3)


(4)

本文考慮到APSO算法可以有效解決函數尋優問題、具有較快的收斂速度的特點,能夠通過粒子的個體經驗以及種群內的信息共享實現問題求解的智能化,擬利用APSO算法實現ICP-AES多峰譜線的分離。
粒子群優化算法(particle swarm optimization,PSO)的根本思想來源于對鳥群捕食行為的研究,模擬鳥群覓食的過程把每個粒子的運動過程比作小鳥,為了尋找未知位置的食物即適應度值搜尋目前離食物最近的鳥的周圍區域,并根據自己的飛行經驗找到最近的路線,即算法中尋找最優解的過程[6]。粒子群算法以適應度函數值作為判別標準,每個粒子都有自己的位置和速度屬性,代表適應度函數的一種可能解,在每次迭代中更新粒子個體最優解Pbest和全局最優解Gbest,每一次迭代粒子在D維空間下搜索移動,追蹤當前最優粒子得到這兩個適應度值,根據式(5)和式(6)來更新粒子的速度和位置。
(5)
(6)


為了解決PSO算法易陷入局部最優問題,本文提出帶壓縮因子的自適應慣性權重和線性學習因子的APSO算法。該算法中自適應慣性權重變化可以根據早熟收斂情況和粒子個體適應度值動態調整權重值,學習因子線性變化能夠有效解決粒子群算法在后期多樣性減少陷入局部最優的問題,引入的壓縮因子能夠均衡APSO算法局部搜索能力和全局搜索能力,保持算法在整個迭代過程中全局收斂性和收斂速度的動態平衡[8]。
標準PSO算法中慣性權重ω決定了粒子上一次迭代速度與當前次迭代速度的關聯程度。結合前期算法收斂情況,為了提高PSO算法搜索效果的精準性,在標準PSO算法的基礎上將慣性權重ω改進為自適應權重變化,慣性權重ω根據粒子適應度值進行動態調整,如式(7)所示[9]。
(7)
式(7)中,f為當前粒子的適應度值,favg和fmin分別為當前所有粒子的平均適應度值和最小適應度值。若當前粒子的適應度值優于所有粒子的平均適應度值,說明該粒子當前位置接近全局最優解,慣性權重ω應選擇較小值,以達到保護該粒子的目的,若當前粒子的適應度值差于平均適應度值,則表明該粒子需要向接近全局最優的搜索區域靠攏,慣性權重ω應選擇較大值[10]。

(8)
(9)
式中,T為當前迭代次數,Tmax為算法最大迭代次數。自我學習因子c1先大后小動態變化,社會學習因子c2則先小后大動態調整[11],則算法在前期階段搜索時,移動粒子變化更多依據自身經驗,在后期階段搜索時,粒子位置變化則需要根據整個種群的社會經驗,追蹤全局最優粒子位置,維持收斂速度與搜索效果的穩定性[12]。
在算法計算過程中,若種群內的粒子多樣性減少,且種群粒子遠離全局最優位置時,需要增強種群全局搜索能力探索粒子的全局最優位置,當種群內粒子多樣性不斷增加時,需要增強種群局部開發能力,使種群內的粒子向全局最優位置靠近[13],為了維護算法全局探索能力與局部開發能力的平衡,在標準PSO算法速度更新公式的基礎上乘以收縮因子,加快收斂速度,保證算法的收斂性,此時速度更新根據式(10)調整。
(10)
式(10)中,χ為收縮因子,用式(11)表示。
(11)
式(11)中,φ通常取4.1,能夠適當保持種群粒子的多樣性。
本文采取慣性權重和學習因子動態變化,同時引入壓縮因子的改進粒子群優化算法,該算法可以有效保證前期迭代盡可能全局探索最優解和后期迭代局部收斂于全局最優解,具有更優的性能。

APSO算法設置粒子個數為50個,最大迭代次數Tmax=1 500,慣性權重最大值ωmax=0.6,慣性權重最小值ωmin=0.4,收縮因子參數φ=4.1,由于需要尋找9個參數變量的最優解,因此種群維數D=9,粒子速度和位置矢量初始化根據目標數據點(λk,Ik)分布范圍隨機賦值。粒子的位置矢量即所求特征參數向量,特征參數向量包含五類參數,分別是譜峰高度I0、特征譜線中心位置λ0、譜線半峰寬ΔλV、Lorentz-Gauss比例系數η以及背景值BK,每類參數的取值范圍如表1所示。速度矢量初始化范圍為位置最大矢量的±15%。

表1 粒子位置矢量初始化參數范圍表Table 1 Particle position vector initialization parameter range table
由于在粒子群尋優算法程序中粒子的速度和位置初始化具有隨機性,所以測試數據每次通過改進粒子群算法搜索得到的最優適應度值以及特征參數向量值會有小范圍變化,為了保證算法結果的準確性與穩定性,在程序中設定算法重復處理同組目標數據20次,最終20組數據結果中選取五組較小的全局最小值及相應的粒子最優解向量作為算法結果,并將五組粒子最優解向量包含的每個對應的參數變量取五組平均,得到的一組平均結果作為該組目標數據下多峰譜線疊加模型擬合曲線的特征參數向量。APSO算法程序設計流程圖如圖1所示。

圖1 APSO算法程序設計流程圖Fig.1 APSO algorithm program design flow chart
(12)
(1)算法測試數據
本文選取兩類數據作為目標數據進行算法性能測試,分別是模擬數據以及實測數據。第一類模擬數據是由兩個Voigt線型近似函數構成的三種不同重疊程度的疊加合成曲線上的坐標點作為三組模擬目標數據,x軸坐標表征為目標數據點的所在位置點,y軸坐標值表征為所在位置點的函數值,Voigt線型函數模擬數據1的目標數據曲線兩峰幾乎不重疊,相互干擾很小;Voigt線型函數模擬數據2的目標數據曲線兩峰部分重疊,峰形發生變化,但兩峰中心位置清晰;Voigt線型函數模擬數據3的目標數據曲線兩峰嚴重混疊難以分辨,兩峰變形同時峰中心位置移位,峰值大小也受到嚴重影響。
第二類實測數據是通過ICP-AES系統檢測含有Pr元素溶液的譜線,選擇Pr的特征波長為390.844 nm;檢測汞燈譜線,選擇Hg的特征波長為313.183 nm,ICP-AES檢測器返回的以上述兩條譜線所在位置點與光強AD采樣值的光譜數據點作為兩組實測目標數據,目標數據點的波長λk用對應波長所在位置點pos表示,所在位置點檢測到的光強AD采樣值即為該目標數據點的Ik。實測數據與模擬數據均選擇了50個能夠包含曲線全部特征參數信息的點作為目標數據,通過APSO算法搜索最優適應度值,求解構成擬合曲線的兩組Voigt線型近似函數待定參數和背景值。
(2)算法測試結果
兩類目標數據經過APSO算法計算得到的平均粒子最優解以及平均相對誤差結果如表2所示,在相同坐標下五組目標數據點(λk,Ik)曲線與最優粒子位置解作為多峰譜線疊加模型相關參數的擬合曲線圖如圖2—圖6所示。圖2—圖4中模擬數據的目標數據曲線以及擬合數據曲線以所在位置點x為橫坐標,目標數據和擬合曲線在所在位置點處的函數值y為縱坐標;圖5和圖6中實測數據的目標數據曲線以及擬合數據曲線以所在位置點的波長λ為橫坐標,目標數據曲線以光強AD采樣值為縱坐標,擬合曲線以在λ下的pos求解函數值為縱坐標。

表2 五組目標數據APSO算法平均結果Table 2 The average results of five sets of target data APSO algorithm

圖2 Voigt線型函數模擬數據1曲線與擬合曲線Fig.2 Simulated data1 of Voigt linear function and fitting curve

圖3 Voigt線型函數模擬數據2曲線與擬合曲線Fig.3 Simulated data2 of Voigt linear function and fitting curve

圖4 Voigt線型函數模擬數據3曲線與擬合曲線Fig.4 Simulated data 3 of Voigt linear function and fitting curve

圖5 390.844 nm Pr元素實測數據與擬合曲線Fig.5 390.844 nm Pr element measured data and fitting curve

圖6 313.183 nm Hg元素實測數據與擬合曲線Fig.6 313.183 nm Hg element measured data and fitting curve
經過五組測試數據結果表明,通過APSO算法得到的Voigt線型近似函數相關參數能夠較準確地擬合出目標曲線,相對誤差較低,同組目標數據下選擇最小的最優適應度值相應的特征參數向量作為Voigt線型近似函數的相關參數擬合出的曲線精準度越高,相對誤差越小。可見,本文提出的APSO算法具有較強的泛化能力,收斂速度快,逼近能力強。
針對ICP-AES光譜重疊干擾問題,以多峰譜線分離的數學原理作為理論依據,提出用Voigt線型近似函數和背景值構成的多峰譜線疊加模型擬合目標曲線,以二者之間的均方根誤差構造APSO算法適應度函數,設計APSO算法得到全局最優粒子解作為分離曲線的特征參數向量。通過對實測目標數據和模擬目標數據的APSO算法處理,結果表明該算法具有較好的泛化能力,算法結果精確度較高,能夠成功實現元素光譜重疊譜線分離,可以有效應用于ICP-AES在元素定性、定量方面的分析研究。但對于目標數據由兩條譜線中心位置較近、譜線半峰寬較小的Voigt線型近似函數合成譜線的情況,需要進行多次算法處理才能取得較為精準的特征參數向量結果,算法有待完善。