宋建軍, 趙 凌
(四川師范大學 數學與軟件科學學院,四川 成都 610068)
隨著我國工業的快速發展,水環境污染問題已經十分嚴峻,研究出一種用時較短的可在線水質檢測傳感器具有重要意義[1]。水質污染程度主要根據化學需氧量(chemical oxygen demand,COD)、五日生化需氧量、水體含磷量、水體含氮量等指標評價[2]。COD指水體中易被強氧化劑氧化的還原性污染物所消耗的氧化劑的量,結果折算成氧的量,主要反映了水中受還原性物質污染的程度,是水體受有機物污染的綜合性指標,也是水質檢測的重要參數[3]。檢測COD的化學方法有重鉻酸鉀法與高錳酸鹽指數法。用化學方法檢測COD精度雖然較高,但存在測定速度慢、耗時長、所用化學試劑會對環境造成二次污染、需要調配大量的人力和物力、操作過程復雜以及穩定性差等問題;基于物理光譜學測量物質含量的紫外吸收光譜法在水質檢測中的應用在近年來備受關注,紫外吸收光譜法通常結合多元線性回歸[4]、偏最小二乘回歸[5]或神經網絡等模型測定水樣中的COD值[6]。但上述方法主要存在以下問題:未能考慮濁度對模型的影響,由于生活污水含有懸浮微粒和膠體,其從屬性上分析不屬于COD的范疇,但會對經過水體中的光線產生散射和干擾吸收,對測量結果造成很大的影響[7~9]。
為了解決上述問題,本文提出了一種基于濁度補償和偏最小二乘回歸相結合的模型預測污水中COD值,屬于免化學試劑的物理檢測方法,具有快速準確、可在線監測、綠色無污染、泛化能力更強等優點。
當一束單色平行入射光通過均勻非散射的稀溶液時,溶液的吸光度A與溶液濃度c以及液層厚度b的乘積成正比,即
(1)
式中A為吸光度;I0為入射光強度;It為透射光強度;T為透光率;k為比例系數,其與入射光波長、溫度和吸光物質有關;c為溶液濃度;b為液層厚度。A具有可加性,即對于不發生化學反應的多組分體系,其在某一波長處的吸光度等于各組分在該波長處吸光度值Ai(i=1,2,…,n)之和,即
A=A1+A2+…+An
(2)
根據朗伯—比爾定律可知溶液的吸光度與其所含物質的濃度之間具有極強的相關性[10]。
設因變量為y,自變量記為x1,x2,…,xp,且共取得n個樣本,則自變量矩陣記為X=(xij)n×p。通常記 經過標準化處理后的變量為F0,記X經過標準化處理后的變量矩陣為E0=(E01,E02,…,E0p)n×p,則可從矩陣E0中提取第一個成分t1。提取的原則是成分t1能最大程度地代表E0,且t1和F0要具有很強的相關性,則
(3)
(4)
式中r(xi,y)為xi與y的相關系數。得到成分t1后可求E0的信息殘差矩陣E1,即求E0對t1的回歸方程及其所對應的回歸系數p1得

(5)

將E1作為新的E0并重復上述提取成分和求殘差矩陣的步驟,假設共提取了A個成分,則分別實施F0對t1,t2,…,tA的多元線性回歸可得
(6)
式中FA為殘差項,由于t1,t2,…,tA可以表示成E01,E02,…,E0P的線性組合,式(6)可化簡為
(7)
將標準化后的數據矩陣E0和F0還原可得y對x1,x2,…,xp的回歸方程
(8)
提取成分的終止條件為交叉有效性準則,在偏最小二乘回歸建模過程中并不需要將全部的成分t1,t2,…,tp提取。一個成分被提取的條件是:當提取了這個成分后能否對模型的預測功能有明顯的改進。對于因變量y,成分th的交叉有效性定義為
(9)
(10)

1)將鄰苯二甲酸氫鉀置于烘箱中在105 ℃條件下烘干2 h,干燥器中冷卻后稱取0.063 6 g,并倒入500 mL的燒杯中,緩慢加入350 mL蒸餾水并不停攪拌,待其完全溶解后滴加0.1 mL濃度為98 %的硫酸,用玻璃棒將溶液引流至500 mL的容量瓶中,并用蒸餾水定容,此時溶液的COD值為150 mg/L,稀釋得到濃度從1~150 mg/L共150組數據的COD標準溶液。2)稱取1 g硫酸肼溶于重蒸餾水中,定容至100 mL得到硫酸肼溶液;稱取10 g六次甲基四胺溶于重蒸餾水中,定容至100 mL得到六次甲基四胺溶液。分別吸取5 mL硫酸肼溶液和5 mL六次甲基四胺溶液于100 mL的容量瓶中,在25 ℃條件下反應24 h后定容至標線,配得濁度為400 NTU的濁度標準液,稀釋得到濃度從1~400NTU共400組數據的濁度標準溶液。
使用島津公司的UV—2450紫外可見分光光度計對配制的化學需氧量標準溶液和濁度標準溶液進行光譜掃描,可獲得溶液在200~725 nm處波長的吸光譜。在200~725 nm波段中,并不是所有波長的吸光度都與COD值有較強的相關性。為了提高模型的分析性能、降低計算量、簡化模型,有必要對全波段的吸光度數據進行特征提取,篩選出與COD有很強相關性的特征波長,以及具有代表性的特征波長,如光譜中最大吸收峰、波谷、肩峰、次峰所對應的波長[11]。通過觀察COD標準溶液的紫外吸收光譜發現,水樣的紫外吸收度在230,240,250,260,270 nm波長處有明顯的局部最大、最小值,如圖1所示。分別計算樣本的COD值與上述波長處吸光度的相關系數,可發現COD值與這5處波長的吸光度均有很強的相關性。

圖1 水樣的原始紫外光譜
與此同時,根據已有研究發現濁度與545 nm波長處的吸光度有較強的相關性[12]。因此,用濁度標準液收集到的光譜數據定量分析濁度與230,240,250,260,270,545 nm處波長吸光度的關系,發現這6處吸光度與濁度之間均有較強的相關性,而COD標準溶液在545 nm處波長的吸光度與COD值相關性較弱,如表1、表2所示。因此,可選擇230,240,250,260,270 nm處波長的吸光度建立偏最小二乘回歸模型來預測COD值;用545 nm處的吸光度建立一元線性回歸模型預測濁度的大小。

表1 COD與各特征波長的相關系數

表2 濁度與各特征波長的相關系數
將紫外光譜段中的230,240,250,260,270 nm處波長的吸光度作為自變量記為x1,x2,…,x5,將COD標準溶液的COD值作為因變量并記為y1,用配制的COD標準溶液吸光度數據建立COD值關于吸光度的偏最小二乘回歸模型為
y1=-0.737 9-3.210 3x1+2.320 9x2+19.735 6x3+
20.486 7x4+21.359 3x5
(11)
在建立偏最小二乘回歸模型的過程中,當提取第一個主成分時交叉有效性系數Q2=0.365 9>0.097 5,當提取第二個主成分時交叉有效性系數Q2=0.016 4<0.097 5,因此共提取2個成分。模型擬合結果如圖2所示,擬合優度R2高達0.987 6,說明建模效果很好。

圖2 模型的擬合效果
根據配制的濁度標準溶液的光譜數據,將545 nm波長處的吸光度記為x6,溶液的濁度值記為y2,并分別求濁度y2關于x1,x2,…,x6的一元線性回歸方程
(12)
對于COD值未知的污水,分別測得其在230,240,250,260,270,545 nm波長處的吸光度,并記其數值為a1,…,a6。并將a6代入y2=f(x6)=-6.394 3+345.514x6中求得溶液的濁度值y2,再將y2分別代入xi=f-1(y2)(i=1,2,…,5,xi=f-1(y2)為y2=f(xi)的反函數)可求得濁度在230,240,250,260,270 nm波長處所造成的吸光度x1,x2,…,x5。再對230,240,250,260,270 nm波長處的吸光度進行濁度補償,即分別計算ai-xi(i=1,2,…,5)的結果,同時將其結果分別記為A1,A2,…,A5。因此,A1,A2,…,A5即為230,240,250,260,270 nm波長處將濁度影響排除后的吸光度。最后將A1,A2,…,A5同時代入偏最小二乘回歸方程(11)中即可計算出待測溶液的COD值。
分別從四川省各江河取樣進行檢測,同時使用化學分析方法和所建模型對以上待測水樣的COD進行檢測,其結果如表3所示。模型預測值的平均誤差為0.252 7,平均誤差率為4.568 %,均在國家環境類測量儀器指定的誤差范圍之內。因此,所建模型具有良好的預測性能。

表3 模型預測效果
為了進一步分析基于濁度補償的偏最小二乘回歸預測水樣COD值的效果,用未經濁度補償的偏最小二乘回歸模型同時對水樣的COD值進行預測。對兩個模型的預測結果比較如圖3所示。

圖3 預測曲線
可以看出基于濁度補償的偏最小二乘回歸的預測效果始終優于未經濁度補償的偏最小二乘回歸模型,而且未經濁度補償的偏最小二乘回歸的預測值始終大于理論值。說明濁度的存在使得待測污水在230,240,250,260,270 nm處波長的吸光度比實際值偏高,從而使預測的COD值也偏高。
系統地介紹了紫外吸收法測量COD的原理和偏最小二乘回歸模型的方法,建立了COD預測模型,同時還將濁度對測量的影響考慮在內,并進行了補償處理。通過實驗表明:所建模型的平均誤差為0.252 7,平均誤差率為4.568 %。本文為適應性強、快捷準確、無二次污染、免化學試劑的COD在線檢測傳感器的研發提供了算法基礎。
參考文獻:
[1] 環境保護部科技標準司.水污染連續自動監測系統運行管理[M].北京:化學工業出版社,2008.
[2] 趙友全,李玉春,郭 翼,等.基于光譜分析的紫外水質檢測技術[J].光譜學與光譜分析,2012,32(5):1301-1304.
[3] 趙 輝,王 勤,戚海燕,等.基于光吸收原理的化學需氧量傳感器設計與應用[J].傳感器與微系統,2014,33(12):73-75.
[4] 周 娜,羅 彬,廖 激,等.紫外吸收光譜法直接測定化學需氧量的研究進展[J].四川環境,2006,25(1):84-87.
[5] 張穎萍,董前民,張章源,等.雙波長紫外光譜法檢測豬場污水實驗研究[J].中國農機化學報,2015(3):145-148.
[6] 吳國慶,畢衛紅,呂佳明,等.近紅外透射和紫外吸光度法檢測水質化學需氧量的研究[J].光譜學與光譜分析,2011,31(6):1486-1489.
[7] 張榮標,馮 俊,謝志超.基于廣義回歸神經網絡的COD在線檢測方法研究[J].儀器儀表學報,2008,29(11):2357-2361.
[8] 羅繼陽,魏 彪,湯 斌,等.水質COD檢測用光譜法的水體環境濁度解算方法[J].環境科學與技術,2015,38(12Q):246-250.
[9] 張國強,康戈文,黃建國,等.紫外分光光度法測定水質COD的技術研究[J].環境污染與防治,2007(4):1-6.
[10] 畢新勝,賈金亮,王玉剛,等.近紅外光譜技術在籽棉回潮率檢測系統的應用[J].自動化儀表,2015,36(9):73-76.
[11] 夏阿林,葉華俊,周新奇,等.基于粒子群算法的波長選擇方法用于蘋果酸度的近紅外光譜分析[J].分析實驗室,2010,29(9):12-15.
[12] 侯迪波,張 堅,陳 泠,等.基于紫外—可見光光譜的水質分析方法研究進展與應用[J].光譜學與光譜分析,2013,33(7):1839-1844.