鄭培超,尹義同,王金梅,周椿棪,張 莉,曾金銳,呂 強
重慶郵電大學光電工程學院,光電信息感測與傳輸技術重慶重點實驗室,重慶 400065
在工業鍋爐中隨著水蒸氣蒸發,大量的鈣鎂離子留在爐水中,如果不加處理,在水冷管中會形成水垢,造成爆管停爐[1]。 為了保障設備的安全運行,消除安全隱患,工業上通過維持水中一定含量的磷酸根離子來去除鍋爐中的鈣、 鎂水垢。 磷酸根離子濃度過低,無法防止和去除水垢; 而磷酸根濃度過高,會影響pH值,對鍋爐造成腐蝕[2-3]。 因此鍋爐水中磷酸根含量的快速、 實時檢測對設備的安全運行和工業的安全生產活動具有重要意義[4]。
傳統的磷酸根離子檢測技術主要有比色法、 分光光度法、 色譜法、 電位法等[5]。 其中比色法通過比較待測溶液和標準溶液的顏色來確定磷酸根離子的含量,我國工業鍋爐水質檢測目前采用這種方法,其受人為主觀因素影響較大[6]; 分光光度法需要添加藥品并將樣品消解為正磷酸鹽,前期處理步驟較繁瑣且耗時較長[7]; 離子色譜法利用離子交換柱分離陰、 陽離子,但色譜柱造價昂貴并且操作復雜[8]; 電位法通過電極間的電位差來計算磷酸根離子濃度,雖然避免了人為主觀因素,但易受到溫度、 電勢的影響[9]。
隨著光電檢測技術的發展,檢測技術普遍提高。 紫外-可見吸收光譜法(UV-VIS)是通過測定物質的吸收光譜并建立和濃度關系的數學模型,對物質濃度定量的一種分析方法。 Chen[10]基于紫外-可見吸收光譜測定混合溶液中硝酸鹽、 化學需氧量和濁度的濃度,相關系數均大于0.9,預測值的均方根誤差在0.696~2.337之間。 Yu[11]等基于神經網絡模型來預測農藥的濃度,預測值和真實值的誤差在1%以內。 Marie-No?lle Pons[12]等采集摩澤爾河流域的900份水樣,建立了硝酸鹽濃度和紫外吸收光譜的線性關系,決定系數R2為0.75。
目前使用吸收光譜測量水中磷酸根的研究較少。 本工作采集了磷酸根溶液的紫外吸收光譜,使用Savitzky-Golay(S-G)濾波對光譜進行預處理,使用SPA-ELM混合算法建立吸收光譜和濃度的預測模型,以實現磷酸根的快速、 實時測量。
實驗裝置如圖1所示,吸收支架兩側嵌有光纖準直鏡,氘鹵燈光源(聞奕光電,DH-mini緊湊型)發出的紫外-可見光通過光纖連接到光纖準直鏡,準直后的光線平行通過樣品池后又經光纖準直鏡匯聚,光譜儀(復享光學,PG2000pro)采集到的光譜數據通過計算機軟件保存并處理。

圖1 實驗平臺Fig.1 The experimental platform
我國《工業鍋爐水質GB/T 1576—2018》中規定了進入熱水鍋爐前的水質參數要求,其中磷酸根的濃度要求在5~50 mg·L-1范圍內。 樣品使用十二水磷酸三鈉(分析純,川東化工)藥品配置。 準確稱量0.4 g十二水磷酸三鈉溶于100 mL去離子水中,配置成1 000 mg·L-1的磷酸根標準溶液,隨后逐級稀釋成不同濃度的磷酸根標準溶液,濃度范圍為5~100 mg·L-1。 使用搭建的實驗裝置,設置光譜儀參數積分時間、 平均次數、 平滑度分別為45 ms、 11次和3。 共采集了37份不同濃度的待測樣品的吸收光譜,如圖2所示。

圖2 磷酸根溶液紫外吸收光譜圖Fig.2 UV absorption spectra of phosphate ions solution
從圖2可以看出,磷酸根溶液的吸收光譜信號主要集中在180~220 nm范圍內,磷酸根濃度為5 mg·L-1時,吸收峰在190 nm,吸光度為0.07 a.u.。 隨著濃度升高,吸收強度逐漸增加,并且吸收峰發生紅移,濃度為100 mg·L-1時,吸收峰在195 nm,吸光度為1.0 a.u.。 這是因為隨著濃度升高,微觀上吸光物質粒子間的距離減小、 相互作用力增強,導致摩爾吸收系數改變。
使用SPXY算法將獲得的紫外-可見吸收光譜數據按照7∶3的比例隨機劃分成訓練集和測試集,分別對訓練集和測試集的數據進行S-G濾波、 SPA特征選擇,使用ELM建立訓練集吸收光譜和濃度關系的模型,然后將測試集光譜數據輸入模型,輸出測試集的磷酸根離子預測濃度。 最后,計算出決定系數R2和均方根誤差RMSE來評價模型。
1.3.1 S-G濾波
S-G平滑濾波可以在濾除高頻噪聲的同時提高光譜的平滑性,可以有效提高光譜的信噪比[13]。 基本原理如圖3所示,將m個波長點視為一個窗口,數據記為集合{Xm-2,Xm-1,Xm,Xm+1,Xm+2},利用n階多項式擬合后的值來取代Xm,然后窗口依次移動一個框長度的距離,直到把所有數據點遍歷完。

圖3 S-G濾波原理示意圖Fig.3 Schematic diagram of S-G filtering principle
使用3階多項式、 框長度為5的濾波窗口對數據預處理,濾波后的吸收光譜如圖4。

圖4 S-G濾波后紫外吸收光譜圖Fig.4 UV absorption spectra after S-G filtering
1.3.2 特征波長選擇
在S-G濾波后,為了篩選出磷酸根吸收光譜的特征波長,使用連續投影算法(successive projections algorithm,SPA)選擇與磷酸根濃度強相關的波長[14-15]。 SPA的具體步驟如下:
(1) 輸入磷酸根的吸收光譜數據,并設定挑選的特征波長個數為N。
(2) 記迭代次數為n,任選吸收光譜數據的第j列作為初始波段賦值給xj,記為xk(n),去除初始波段后剩下的波段集合記為S。
(3) 計算初始化波段和未選擇波段的投影映射記為pxj,p為投影算子。
(4) 選擇最大投影向量的光譜波長
k(n)=arg(max(‖pxj‖),j∈S)
(1)
(5) 將最大投影值作為下次迭代的初始值
xj=pxj
(2)
令n=n+1,若n (6) 確定選擇波段序列。 當n=N時,選擇出與磷酸根濃度強相關的波長集合為: {k(n),n=0,…,N-1} (3) 所選擇的特征波長個數與位置如圖5所示。 當特征向量個數為5時,SPA內置回歸模型的RMSE最小,為1.707 8 mg·L-1。 所選波長分別為183.27、 192.86、 202.91、 215.35和219.65 nm。 1.3.3 建立回歸模型 篩選出特征波長后,使用極限學習機(extreme learning machine,ELM)建立光譜數據與物質濃度的模型。 ELM由輸入層,隱含層,輸出層三層組成,隱含層僅有一個,權值和偏置隨機給定,具有較強的非線性建模能力[16]。 具體訓練過程如下: (1) 設置隱含層隱藏節點數L,隨機產生權重矩陣w和偏移矩陣b。 (2) 輸入數據集{xi,ti|xi∈Rn,ti∈Rm,i=1,2,…,N},則單隱層神經網絡可以表示為 (4) (3) 為使預測精度最高,即存在βi、wi和bi使得 (5) 矩陣表示為Hβ=T。 (4) 求最優解β*。 β*=H+T (6) 與需要多次迭代的傳統學習算法相比,ELM的反向傳播參數調節過程無需耗時,故其具有建模過程簡單、 建模速度快等特點,適用于快速學習應用場景,與我們實時、 快速檢測的需求相適應[17-18]。 1.3.4 模型評價指標 模型的性能采用決定系數R2和均方根誤差RMSE評價。R2∈[0,1],用來判斷回歸方程的擬合程度,擬合情況越好越接近1。 RMSE用來反映測量精度,越接近0代表預測值越接近真實值[19-20]。 R2和RMSE的計算方法如式(7) (7) (8) 光譜數據訓練集和測試集的擬合曲線如圖6所示。 所建立的定量分析模型訓練集R2為0.997 2,測試集R2為0.999 5。 圖6 SPA-ELM模型回歸結果(a): 訓練集; (b): 測試集Fig.6 SPA-ELM prediction model regression(a): Training set; (b): Test set 說明建模方法正確,所建立的模型具有較好的穩健性以及適應能力,能夠完成水體中磷酸根離子的檢測。 為了驗證預測模型的效果,分別建立LASSO-ELM、 PCA-ELM、 SPA-PLS以及SPA-SVR四種模型,與本文提出的SPA-ELM模型進行對比。 從圖7可以看出SPA-ELM模型的波動較小,其中編號為9、 真實值為15 mg·L-1的樣本相對誤差最大,僅有5.6%。 SPA-ELM模型明顯優于其他幾種模型。 圖7 不同分析模型中的相對誤差(測試集)Fig.7 Relative errors in different analytical models (Test set) 為了更直觀地體現模型的預測精度,表1列出了基于LASSO、 PCA和SPA算法進行特征選擇的測試集回歸結果。 由表1可以看出,對于10個測試集數據,分別采用LASSO、 PCA和SPA算法進行特征選擇,使用ELM進行回歸測試,其平均相對誤差分別為6.39%、 8.32%和1.90%,采用SPA算法作為特征選擇方法可以獲得更低的相對誤差。 表2列出了不同回歸方法的測試集回歸結果。 五種模型平均相對誤差分別為6.39%、 8.32%、 2.78%、 4.06%、 1.90%,證明了SPA-ELM模型的優越性。 表1 不同特征選擇方法的測試集回歸結果Table 1 Test set regression results of different feature selection methods 表2 不同回歸方法的測試集回歸結果Table 2 Test set regression results of different regression methods 表3比較了不同分析模型的決定系數和均方根誤差。 SPA-ELM模型測試集的決定系數R2為0.999 5,相比于其他4種模型分別提高了1.00%、 3.45%、 0.68%、 0.76%; RMSE為0.517 5,相比于其他4種模型分別降低了81%、 89%、 79%、 70%。 說明所提出的模型優于其他模型。 表3 不同分析模型的評價參數Table 3 Evaluation parameters of different analytical models 以磷酸根溶液作為研究對象,使用S-G濾波對數據預處理以提高光譜的信噪比,通過連續投影算法SPA對光譜進行降維,篩選出5個與磷酸根強相關的特征波長,最后使用極限學習機ELM將特征波長處的吸光度與樣本濃度進行擬合建立磷酸根離子的回歸模型,并與LASSO-ELM、 PCA-ELM、 SPA-PLS以及SPA-SVR模型進行對比。 數據表明,預測模型測試集的決定系數R2與RMSE分別為0.999 5和0.517 4 mg·L-1,說明本文中采用的建模方法能夠對磷酸根濃度范圍為5~100 mg·L-1的水體進行準確預測,為水體磷酸根離子的檢測提供了一種新的解決方法。
2 結果與討論





3 結 論