付萍杰,楊可明
中國(guó)礦業(yè)大學(xué)(北京)/煤炭資源與安全開采國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100083
土壤污染問(wèn)題一直備受關(guān)注,被認(rèn)為是對(duì)人類健康構(gòu)成潛在風(fēng)險(xiǎn)的全球性問(wèn)題。重金屬以不同的形式和濃度聚集在土壤中,因此對(duì)土壤中重金屬元素進(jìn)行監(jiān)測(cè)是很有必要的。眾多學(xué)者采取野外采樣和室內(nèi)化學(xué)分析的方法研究土壤中重金屬的種類和含量以及它們之間的相互關(guān)系,得出的結(jié)果精度高、準(zhǔn)確性強(qiáng),但是,該方法費(fèi)時(shí)費(fèi)力費(fèi)錢,很難獲取大面積的污染監(jiān)測(cè)結(jié)果(李湘洲,2000;吳健生等,2011;肖捷穎等,2013)。
由于有機(jī)質(zhì)、粘土礦物、鐵氧化物等在光譜曲線中具有一定的吸收特征,并對(duì)重金屬具有一定的吸附作用,借助土壤中不同的重金屬含量之間及其與有機(jī)質(zhì)、粘土礦物、鐵氧化物等之間的關(guān)系(李巨寶等,2005;焦文濤等,2005;李娜等,2010;龔紹琦等,2010;南聰強(qiáng)等,2012),預(yù)測(cè)土壤重金屬已成為了常用手段,也取得了一定的實(shí)質(zhì)性成果,間接地預(yù)測(cè)了土壤重金屬含量,實(shí)現(xiàn)了無(wú)光譜特征的土壤重金屬含量的監(jiān)測(cè)。Stazi et al.(2014)研究發(fā)現(xiàn),土壤中 As的含量與土壤光譜曲線在580、660、715、780 nm波段處的吸收峰相關(guān)性較高,可以用來(lái)預(yù)測(cè)土壤中As的含量。Gholizadeh et al.(2015)利用光譜數(shù)據(jù)研究煤礦周圍的土壤重金屬污染,研究發(fā)現(xiàn),Pb含量與513 nm波段處的光譜反射率具有較高的相關(guān)性,Zn含量與769 nm波段處的光譜反射率具有較高的相關(guān)性,土壤光譜曲線在一階導(dǎo)數(shù)處理后,位于450~550 nm、1400 nm、1900~2000 nm、2200 nm波段處的光譜特征明顯。Stenberg et al.(2010)發(fā)現(xiàn)對(duì)土壤光譜數(shù)據(jù)進(jìn)行一階導(dǎo)數(shù)、二階導(dǎo)數(shù)處理有助于研究土壤特征。Xia et al.(2007)利用光譜曲線研究長(zhǎng)江流域土壤中 Cd污染情況,發(fā)現(xiàn)560~760 nm波段處土壤光譜反射率一階導(dǎo)數(shù)與土壤中Cd含量相關(guān)性較高,可以用來(lái)預(yù)測(cè)Cd的含量,粘土礦物在1400、1900、2200 nm波段處(吸收峰)光譜反射率一階導(dǎo)數(shù)值與Cd含量具有較高的相關(guān)性,可以用來(lái)預(yù)測(cè) Cd含量。總體而言,已有研究取得的成果大體分為以下三類:570~830 nm 光譜波段區(qū)間內(nèi)土壤有機(jī)質(zhì)含量與反射率之間有較強(qiáng)的相關(guān)性,有機(jī)質(zhì)含量越低,土壤反射率越高;鐵氧化物在400~1300 nm波段區(qū)間內(nèi)因具有吸收特征,可用于探測(cè)重金屬含量,鐵含量越高,土壤反射率越高,土壤中鐵的含量與重金屬含量具有一定的相關(guān)性;粘土礦物在2200 nm附近具有明顯的吸收特征,根據(jù)吸收峰深度可預(yù)測(cè)重金屬含量。
隨著土壤重金屬含量與光譜曲線之間關(guān)系研究的深入,眾多學(xué)者在土壤重金屬含量預(yù)測(cè)模型的建立中也取得了大量的成果,利用支持向量機(jī)(Stazi et al.,2014),多重線性回歸,人工神經(jīng)網(wǎng)絡(luò)法(Kemper et al.,2002),倒數(shù)對(duì)數(shù)、一階微分(王維等,2011),一階導(dǎo)數(shù)、包絡(luò)線去除(任紅艷等,2009)處理后的光譜曲線特征波段吸收峰深度與重金屬含量、有機(jī)質(zhì)含量、鐵含量之間的關(guān)系預(yù)測(cè)重金屬含量,預(yù)測(cè)模型精度較高,但均方根誤差也較大。同時(shí),多變量預(yù)測(cè)模型也取得了一定的成果,用偏最小二乘法(Kooistra et al.,2001;Yeniay et al.,2002;Maliki et al.,2014;Stazi et al.,2014;Rathod et al.,2015;Gholizadeh et al.,2015),最大、最小一階導(dǎo)數(shù)比值,多元線性回歸分析,多元自適性回歸樣條法(Kooistra et al.,2001;Wu et al.,2005a;Pandit et al.,2010),主成分分析法(Maliki et al.,2012)預(yù)測(cè)重金屬含量,預(yù)測(cè)模型精度較高,且均方根誤差較小,模型建立較成功。因此,土壤重金屬含量預(yù)測(cè)模型研究結(jié)果顯示,采用多變量預(yù)測(cè)重金屬含量模型精度明顯高于單變量預(yù)測(cè)模型精度。
本研究利用土壤銅(Cu)污染538~834 nm波段區(qū)間的光譜數(shù)據(jù)及一階導(dǎo)數(shù)距離檢測(cè)土壤Cu污染的界限濃度及光譜特征波段區(qū)間,并根據(jù)界限濃度、多重分形譜參量、一階導(dǎo)數(shù)距離參量、土壤含水率及有機(jī)質(zhì)含量等建立土壤Cu濃度的預(yù)測(cè)模型,為土壤重金屬污染的高光譜研究提供依據(jù),精確土壤重金屬污染光譜的研究范圍,為利用界限濃度建立土壤重金屬濃度預(yù)測(cè)模型提供新思路,促進(jìn)高光譜技術(shù)在土壤重金屬污染檢測(cè)中的應(yīng)用。
本研究設(shè)計(jì)的土壤 Cu污染試驗(yàn),采用CuSO4?5H2O 分析純制備重金屬污染土壤,添加量分別為 0、50、100、150、200、300、400、600、800、1000、1200 μg?g-1。每種污染梯度平行設(shè)置 3組處理,共33個(gè)土壤樣品,選用自然土進(jìn)行實(shí)驗(yàn)。自然土于2017年5月采自北京市海淀區(qū)一片廢棄的土地,自然土樣品Cu本底值為19.6 μg?g-1,其土壤含水率為 20.588%~35.484%,有機(jī)質(zhì)含量為10.40~21.80 g?kg-1。對(duì)土壤的處理分以下幾步,(1)土壤預(yù)處理,土壤先過(guò)5 mm篩,然后過(guò)2 mm篩,將過(guò)篩之后的土壤混合均勻。(2)稱取等量(5 kg)的土壤和不同添加量的CuSO4?5H2O混合,使用攪拌棒將混有CuSO4?5H2O的土壤攪拌均勻。(3)將土壤靜置1 d后,第二天上午10:00使用電子秤和直徑為10 cm的圓柱形模具稱取等量的不同Cu污染水平的土壤樣品,后于11:00—14:00使用光譜范圍為340~2500 nm的SVC HR-1024I高性能地物光譜儀采集土壤樣品光譜。(4)測(cè)定土壤含水率、土壤中有機(jī)質(zhì)和Cu含量,土壤含水率測(cè)量方法為取土烘干法(徐倩等,2017;顏小飛等,2017);土壤中有機(jī)質(zhì)與Cu含量的測(cè)量方法為電感耦合等離子體發(fā)射光譜法(曹洪斌等,2016;梁榕源,2018),測(cè)量?jī)x器為 ICP—OES電感耦合等離子發(fā)射光譜儀。
經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)的目的是通過(guò)對(duì)非線性、非平穩(wěn)信號(hào)的分解獲得一系列表征信號(hào)特征時(shí)間尺度的本征模函數(shù)IMF(Intrinsic Mode Function),使得如系列IMF1,IMF2,IMF3,……,IMFn等各個(gè)IMF是單分量的幅值或頻率調(diào)制信號(hào)。EMD基本思想是:將 1個(gè)頻率不規(guī)則的波(原形波,PW)轉(zhuǎn)化為多個(gè)單一頻率的波加上余波(res)的形式,即 PW=ΣIMFn+res。EMD降噪的主要思想是通過(guò)一定準(zhǔn)則找出模態(tài)函數(shù)中的“無(wú)用”成分,無(wú)用的IMF被認(rèn)定為噪聲,予以剔除(黃海等,2007;譚善文等,2004;胡勁松等,2007)。該去噪過(guò)程是自適應(yīng)的,能夠自主分解輸入的信號(hào),不需要先驗(yàn)知識(shí),故相對(duì)傅里葉變換和小波去噪而言具有明顯的優(yōu)勢(shì)(王維強(qiáng)等,2012)。
經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)對(duì)原始信號(hào) X(t)處理后可獲得多個(gè)本征模函數(shù)(IMF),EMD分解出來(lái)的各 IMF分量包含了 X(t)的不同時(shí)間尺度的局部特征。一個(gè) IMF分量需滿足兩個(gè)條件:(1)IMF分量中過(guò)零點(diǎn)和極值點(diǎn)的數(shù)目要相等或者最多相差1個(gè);(2)IMF分量上任意一點(diǎn)由局部極大、極小值點(diǎn)確定的包絡(luò)線的均值為零,即t關(guān)于t軸局部對(duì)稱。
假設(shè)X(t)為一條復(fù)雜的原始光譜曲線,則EMD的處理過(guò)程為:(1)找出X(t)所有的極大值點(diǎn)和極小值點(diǎn),并用三次樣條插值函數(shù)擬合形成原光譜曲線的上、下包絡(luò)線;然后計(jì)算該上、下包絡(luò)線的均值(記作曲線m);再根據(jù)h=X(t)-m得到1條新的曲線h。如果h不滿足IMF的兩個(gè)條件,則需重復(fù)上述步驟,直到分解出第一個(gè)分量 IMF1;(2)以X(t)減去IMF1得到第一階剩余光譜 r1,把r1作為新的原光譜曲線,重復(fù)步驟(1),得到IMF2與r2;以此類推,可得出IMF3與r3,……,IMFn與rn,當(dāng)rn變?yōu)橐粋€(gè)單調(diào)函數(shù)時(shí),篩選結(jié)束。
多重分形是描述在不規(guī)則的分形空間之上質(zhì)量分布的定量化工具,多重分形譜是描述多重分形的一套常用參量。就光譜信息而言,光譜信號(hào)在多重分形時(shí),不僅需要考慮把整個(gè)光譜區(qū)間分成不同的小區(qū)域(也即能覆蓋整個(gè)光譜的不同盒子,小區(qū)域個(gè)數(shù)就是盒子的數(shù)目),還要考慮每個(gè)盒子中信號(hào)的質(zhì)量(盒子內(nèi)所有光譜反射率之和)及到各個(gè)盒子之間光譜信號(hào)的差別。以α表示光譜信號(hào)中某個(gè)盒子的分維(也稱奇異指數(shù)或標(biāo)度指數(shù)),具有相同α的盒子構(gòu)成了一個(gè)分形子集,則一個(gè)多重分形就可以看成是具有不同α的分形子集的并集。把具有相同 α的盒子分布概率信息稱為多重分形譜f(α),α和f(α)能夠表述多重分形的局部特征,反映光譜信號(hào)的微小差異。Δα表示多重分形譜寬度,反映了整個(gè)分形結(jié)構(gòu)上光譜信號(hào)的概率測(cè)度 Pi(δ)的分布不均勻程度,Δf(α)表示最大、最小概率 Pi(δ)子集分形維數(shù)差。多重分形譜計(jì)算步驟如下:
(1)概率測(cè)度。若定義Si(δ)為當(dāng)盒子尺寸為δ時(shí)第i個(gè)小盒子的質(zhì)量,則第i個(gè)小盒子內(nèi)質(zhì)量的分布概率即為概率測(cè)度Pi(δ),可表示為:

式中,ΣSi(δ)是全部光譜反射率值之和。
(2)配分函數(shù)。對(duì)概率測(cè)度 Pi(δ)用 q次方(-∞<q<+∞,q為權(quán)重因子)進(jìn)行加權(quán)求和,即為配分函數(shù)Xq(δ)。對(duì)于多重分形分布概率測(cè)度,配分函數(shù)Xq(δ)和盒子尺寸 δ之間需滿足 Xq(δ)∝δτ(q),其中,τ(q)為質(zhì)量指數(shù),則配分函數(shù)Xq(δ)可表示為:

如果上式成立,即Xq(δ)和盒子尺寸δ存在冪函數(shù)關(guān)系,則 logXq(δ)~logδ的斜率即為質(zhì)量指數(shù) τ(q)。

(3)計(jì)算τ(q)與q的關(guān)系。對(duì)每個(gè)q值,利用
式(3)在雙對(duì)數(shù)坐標(biāo)系中采用最小二乘法擬合估算τ(q),得到τ(q)與q的關(guān)系。
(4)求多重分形譜。多重分形譜f(α)是指不同的奇異性標(biāo)度指數(shù)α的分形子集所確定的分形維數(shù)。在無(wú)標(biāo)度區(qū)間內(nèi),概率測(cè)度Pi(δ)與盒子尺寸δ的劃分需滿足下面的冪函數(shù)子集 Pi(δ)∝δα,α 由τ(q)曲線的Legendre變換來(lái)決定,即α=dτ(q)/dq,因此:

式中,N(δ)為具有奇異性標(biāo)度指數(shù)為α的子集的個(gè)數(shù);N(δ)與 δ之間具有冪函數(shù)關(guān)系 N(δ)=∝δ-f(α),f(α)為具有奇異性指數(shù)α的分形子集的分形維數(shù)。
當(dāng)光譜曲線滿足多重分形特征時(shí),Σδα·q-f(α)-τ(q)=1,當(dāng) δ→0 時(shí),得到多重分形譜,即 f(α)與α的關(guān)系曲線。

光譜曲線一階導(dǎo)數(shù)可以表示該曲線在某一點(diǎn)的斜率(變化率),其計(jì)算公式為:

式中,xi為光譜曲線第i個(gè)反射率對(duì)應(yīng)的波長(zhǎng);f′(xi)為xi波長(zhǎng)處光譜反射率一階導(dǎo)數(shù)
將光譜曲線一階導(dǎo)數(shù)距離定義為兩條波長(zhǎng)范圍相同、波長(zhǎng)間隔相同的光譜曲線一階導(dǎo)數(shù)差值的絕對(duì)值,其計(jì)算公式如下:

式中,f′(xi)為一條光譜曲線 xi波長(zhǎng)處光譜反射率一階導(dǎo)數(shù);g′(xi)為另一條光譜曲線xi波長(zhǎng)處光譜反射率一階導(dǎo)數(shù)。
選取一組極為相似的光譜曲線中的一條光譜曲線為基準(zhǔn)光譜曲線,可以得到該組中剩余的每條光譜曲線與基準(zhǔn)光譜曲線的一階導(dǎo)數(shù)距離,通過(guò)一階導(dǎo)數(shù)距離變換可以放大兩條相似光譜曲線之間的差異,更有利于鑒別兩條光譜曲線之間細(xì)微的差異。
SVC HR-1024I高性能地物光譜儀采集的土壤樣品光譜數(shù)據(jù)在不同的波段區(qū)間內(nèi)其分辨率是不同的,350~1000、1000~1850、1850~2500 nm 波段區(qū)間內(nèi)分辨率分別為 3.5、9.5、6.5 nm。使用sigProcessor將數(shù)據(jù)重采樣到1 nm精度,并導(dǎo)出為“. xlsx”格式。以不同Cu污染水平下538~834 nm波段區(qū)間內(nèi)土壤光譜為研究對(duì)象,利用 MATLAB對(duì)其進(jìn)行一階導(dǎo)數(shù)處理,并求其一階導(dǎo)數(shù)距離。利用MATLAB軟件,通過(guò)經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)去除不同 Cu污染水平下整個(gè)土壤光譜波段范圍內(nèi)(343.1~2052.1 nm)的噪聲,再分析其多重分形特征,得到多重分形譜參量。
3.1.1 土壤Cu污染光譜一階導(dǎo)數(shù)

圖1 不同Cu污染水平下538~834 nm土壤光譜反射率Fig. 1 Soil spectral reflectivity at 538~834 nm band interval under different Cu pollution level

圖2 不同Cu污染水平下538~834 nm土壤光譜反射率一階導(dǎo)數(shù)Fig. 2 First-order derivative at 538~834 nm band interval of the soil’s spectral reflectivity under different Cu pollution level
由圖1可知,0~1200 μg?g-1Cu污染下538~834 nm波段區(qū)間內(nèi)土壤光譜反射率與處理水平之間關(guān)系不明確(圖1)。分析其一階導(dǎo)數(shù)可得50~150 μg?g-1Cu污染下土壤光譜反射率一階導(dǎo)數(shù)的最大值大于 CK污染下土壤樣品光譜反射率一階導(dǎo)數(shù)最大值(圖 2),200~1200 μg?g-1Cu 污染下土壤光譜反射率一階導(dǎo)數(shù)的最大值基本上小于 CK污染下土壤樣品光譜反射率一階導(dǎo)數(shù)最大值,但是局部現(xiàn)象不明顯。
根據(jù)光譜曲線一階導(dǎo)數(shù)距離計(jì)算公式,以 CK污染下土壤樣品光譜曲線為基準(zhǔn)曲線,將50~1200 μg?g-1Cu污染下土壤光譜曲線一階導(dǎo)數(shù)距離定義為任一 Cu污染水平下土壤光譜曲線一階導(dǎo)數(shù)與 CK處理下土壤光譜曲線一階導(dǎo)數(shù)差值的絕對(duì)值。利用式(8)和式(9)可得以CK處理為基準(zhǔn)光譜曲線的不同Cu污染水平下土壤光譜曲線一階導(dǎo)數(shù)距離(圖3)。

圖3 不同Cu污染水平下538~834 nm土壤光譜反射率一階導(dǎo)數(shù)距離Fig. 3 First-order derivative distance at 538~834 nm band interval of the soil’s spectral reflectivity under different Cu pollution level
由圖 3 可知,50~1200 μg?g-1Cu 污染梯度下土壤光譜曲線特征區(qū)間可分為兩類:50~150 μg?g-1Cu(土壤樣品Cu質(zhì)量分?jǐn)?shù):60~120 μg?g-1)污染梯度下土壤光譜曲線一階導(dǎo)數(shù)距離最大值分布在730~760 nm 波段區(qū)間(見表 1),200~1200 μg?g-1Cu(土壤樣品 Cu 質(zhì)量分?jǐn)?shù):160~740 μg?g-1)污染梯度下土壤光譜曲線一階導(dǎo)數(shù)距離最大值分布在540~590 nm 波段區(qū)間內(nèi)(見表 1)。據(jù)此推斷,120~160 μg?g-1(150~200 μg?g-1Cu 添加量)為土壤Cu污染的界限濃度(見表1)。

表1 不同Cu污染水平下538~834 nm土壤光譜曲線特征Table 1 Characteristics of 538~834 nm soil spectral curve under different Cu pollution level
3.1.2 土壤Cu污染光譜多重分形特征
3.1.2.1 土壤Cu污染光譜經(jīng)驗(yàn)?zāi)B(tài)分解
為了避免整個(gè)波段區(qū)間上(波長(zhǎng)范圍 343.1~2052.1 nm)光譜噪聲的影響,對(duì)數(shù)據(jù)進(jìn)行去噪處理。依據(jù)本實(shí)驗(yàn)所采集到的不同處理水平Cu污染下土壤光譜數(shù)據(jù),分別對(duì)33組數(shù)據(jù):0 μg?g-1Cu-1、0 μg?g-1Cu-2、0 μg?g-1Cu-3、……、1200 μg?g-1Cu-1、1200 μg?g-1Cu-2、1200 μg?g-1Cu-3 污染梯度的土壤光譜進(jìn)行EMD處理。由于光譜噪聲成分主要集中在高頻段的IMF分量上(趙雯雯等,2008),可通過(guò)剔除IMF1分量達(dá)到光譜有效降噪。又因?yàn)樵夹盘?hào)中最有效的信息往往集中在幾個(gè) IMF分量中(郭興明等,2014),所以可利用剔除IMF1后的剩余IMF分量和余波進(jìn)行光譜重構(gòu)。基于上述光譜去噪和重構(gòu)方法,可得到不同處理水平Cu污染梯度下土壤的重構(gòu)光譜,如圖4所示。
3.1.2.2 土壤Cu污染光譜多重分形特征

圖5 50 μg?g-1 Cu污染下土壤重構(gòu)光譜logδ和logXq(δ)線性關(guān)系Fig. 5 Linear relationship of the soil’s reconstruction spectrum logδand logXq(δ) under 50 μg?g-1 Cu pollution gradient
對(duì)每3組平行的Cu污染下的重構(gòu)土壤光譜進(jìn)行取均值,可得不同處理水平Cu污染下重構(gòu)土壤光譜的平均光譜。采用多重分形理論的非線性信號(hào)處理和分析方法,可獲取0~1200 μg?g-1Cu污染梯度下土壤重構(gòu)光譜的多重分形特征。根據(jù)式(2)和式(3)可得,當(dāng)權(quán)重因子 q在-20~20之間取不同值時(shí),以50 μg?g-1Cu污染下土壤重構(gòu)光譜的logδ和logXq(δ)之間的關(guān)系為例(見圖5),圖中線均保持較好的線性且匯聚于一點(diǎn),因此土壤重構(gòu)光譜曲線表現(xiàn)出良好的標(biāo)度不變性;同時(shí),logδ和logXq(δ)之間擬合所得直線斜率均不同,表明了50 μg?g-1Cu污染下土壤重構(gòu)光譜具有多重分形特征(Mandelbrot,1982;周煒星等,2000)。由圖 6可知,質(zhì)量指數(shù)τ(q)與q之間的線性擬合并不是一條標(biāo)準(zhǔn)直線,而是大體呈直線分布,表明50 μg?g-1Cu污染下土壤重構(gòu)光譜中出現(xiàn)了不同的奇異性。對(duì)CK和 100~1200 μg?g-1Cu污染梯度下土壤重構(gòu)光譜進(jìn)行類似分析,所得結(jié)果相同,即土壤Cu污染重構(gòu)光譜具有多重分形特征。
采用多重分形理論的非線性信號(hào)處理和分析方法,可獲取0~1200 μg?g-1Cu污染梯度下土壤重構(gòu)光譜的多重分形特征。基于上述分析結(jié)合式(5)、

圖4 不同Cu污染水平下土壤EMD重構(gòu)光譜Fig. 4 EMD reconstruction of the soil spectrum under different Cu pollution level

表2 不同Cu污染水平梯度下土壤重構(gòu)光譜多重分形譜Δα計(jì)算值Table 2 Calculated value of the multi-fractal spectrum Δα of the soil’s reconstruction spectrum under the Cu pollution gradient with different concentrations

圖6 50 μg?g-1 Cu污染下土壤重構(gòu)光譜τ(q)與q關(guān)系Fig. 6 Relationship of the soil’s reconstruction spectrum τ(q) and q under 50 μg?g-1 Cu pollution gradient
式(6)和式(7),可得 50 μg?g-1Cu 污染下土壤重構(gòu)光譜多重分形譜參量Δα,同理可得,所對(duì)應(yīng)的不同Cu污染梯度下土壤重構(gòu)光譜多重分形譜寬度Δα的計(jì)算值,見表2。
由多重分形譜參量 Δα 可知,0~150 μg?g-1Cu(土壤樣品 Cu質(zhì)量分?jǐn)?shù):20~120 μg?g-1)污染下土壤光譜 Δα值隨污染水平升高而降低,200~1200 μg?g-1Cu(土壤樣品 Cu 質(zhì)量分?jǐn)?shù):160~740 μg?g-1)污染下土壤光譜Δα值具有隨污染水平升高而升高的趨勢(shì)。據(jù)此推斷,120~160 μg?g-1(150~200 μg?g-1Cu添加量)為土壤 Cu污染的界限濃度,與土壤Cu污染一階導(dǎo)數(shù)距離分析結(jié)果一致。
由以上分析可知,土壤Cu污染光譜一階導(dǎo)數(shù)距離和多重分形分析預(yù)測(cè)的土壤Cu污染的界限濃度為 120~160 μg?g-1。
根據(jù)不同處理水平Cu污染下土壤光譜一階導(dǎo)數(shù)距離最大值及多重分形譜參量Δα值劃分的土壤Cu 污染的界限濃度(120~160 μg?g-1),建立土壤Cu污染的濃度預(yù)測(cè)模型。模型參數(shù)選擇不同處理水平Cu污染下土壤光譜多重分形譜參量Δα、反射率一階導(dǎo)數(shù)最大值、反射率最大值、含水率、有機(jī)質(zhì)。0~150 μg?g-1Cu污染梯度下土壤Cu含量預(yù)測(cè)模型參數(shù)為反射率、有機(jī)質(zhì)及多重分形譜參量Δα值,預(yù)測(cè)模型選用多元線性回歸模型(Multiple Linear Regression Analysis,MLR),模型 R2為 0.998,RMSE為 0.25(表 3)。200~1200 μg?g-1Cu 污染梯度下土壤Cu含量預(yù)測(cè)模型參數(shù)為多重分形譜參量Δα值、反射率最大值、含水率、有機(jī)質(zhì)、一階導(dǎo)數(shù)最大值,預(yù)測(cè)模型選用 MLR,模型 R2為 0.992,RMSE為47.3(表 3)。

表3 多元線性回歸模型(MLR)預(yù)測(cè)土壤Cu含量Table 3 Prediction of the soil’s Cu content using a multiple linear regression (MLR) model
本實(shí)驗(yàn)采樣土壤來(lái)自于同一地區(qū),并進(jìn)行了粒徑篩選及均勻混合,雖然不同樣品的有機(jī)質(zhì)含量與含水率有所差異,但不同樣品Cu濃度的變異系數(shù)明顯高于有機(jī)質(zhì)含量與含水率的變異系數(shù)(表4)。因此,不同樣品的差異性重點(diǎn)體現(xiàn)在所使用的化學(xué)試劑 CuSO4?5H2O上,重金屬Cu是以離子態(tài)存在的,所測(cè)得的土壤Cu污染光譜的差異主要體現(xiàn)在Cu離子的含量上(Maliki et al.,2014;Paresh et al.,2016)。為確保所測(cè)數(shù)據(jù)能盡量反映土壤本身的光譜特征,減少太陽(yáng)光散射的影響,數(shù)據(jù)采集時(shí)間選擇11:00—14:00之間,在5月晴朗無(wú)云、風(fēng)力不超過(guò)5級(jí)的天氣進(jìn)行,SVC光譜儀鏡頭垂直于樣品中心(李婷等,2012;黃芝,2017),獲取的樣品光譜數(shù)據(jù)范圍為直徑為8 cm的圓。根據(jù)實(shí)驗(yàn)設(shè)計(jì)可知,每份樣品平行采集3次光譜,本研究所使用的數(shù)據(jù)為每份樣品3組數(shù)據(jù)的平均值,因此從樣品的選擇、數(shù)據(jù)采集到數(shù)據(jù)應(yīng)用3方面可知數(shù)據(jù)具有一定的可靠性和科學(xué)性。

表4 土壤Cu污染樣品中Cu濃度、有機(jī)質(zhì)含量及含水率統(tǒng)計(jì)分析Table 4 Analysis of Copper concentration, organic matter and water content in soil Copper contamination samples
前人對(duì)土壤重金屬污染光譜的研究基本是利用整體波段區(qū)間內(nèi)(Maliki et al.,2014;Paresh et al.,2016;Gholizadeh et al.,2015)或局部波段區(qū)間內(nèi)(Stazi et al.,2014;Chen et al.,2016)反射率的導(dǎo)數(shù)變換,且根據(jù)前人經(jīng)驗(yàn)可知,570~830 nm波段范圍內(nèi)土壤光譜反射率與土壤中有機(jī)質(zhì)含量具有較強(qiáng)的相關(guān)性,土壤有機(jī)質(zhì)含量與土壤重金屬濃度也具有較強(qiáng)的相關(guān)性(宋練等,2014;Paresh et al.,2016)。因此,本研究選用了538~834 nm波段區(qū)間(Liu et al.,2011;Lu et al.,2007)的不同處理水平土壤Cu污染的光譜數(shù)據(jù)進(jìn)行土壤Cu污染檢測(cè),一階導(dǎo)數(shù)雖然能夠放大光譜的細(xì)節(jié)差異(Wu et al.,2005;Fard et al.,2016),但是對(duì)于無(wú)光譜特征的土壤光譜數(shù)據(jù)的特征波段提取效果并不明顯,因此引入了一階導(dǎo)數(shù)距離。以未受污染的土壤光譜為基準(zhǔn)曲線,對(duì)不同處理水平土壤Cu污染光譜數(shù)據(jù)與未受污染的土壤光譜數(shù)據(jù)進(jìn)行運(yùn)算,然后對(duì)不同處理水平土壤Cu污染光譜的一階導(dǎo)數(shù)距離(差值)進(jìn)行對(duì)比分析,以增大土壤Cu污染光譜之間的差異(Rathod et al.,2015;Maliki et al.,2012),并結(jié)合一階導(dǎo)數(shù)距離最大值所在波段的不同,探索土壤Cu污染的界限濃度及光譜特征波段。對(duì)局部波段區(qū)間內(nèi)不同處理水平Cu污染土壤光譜進(jìn)行一階導(dǎo)數(shù)距離分析后,再對(duì)整體光譜進(jìn)行EMD去噪(賀利芳等,2017;王金貴等,2017;黃翔,2017)及多重分形微弱特征分析(姚精明等,2016;王曉喬等,2016;李楠等,2017),根據(jù)多重分形譜參量Δα隨重金屬濃度變化而變化的趨勢(shì),同樣得到土壤Cu污染的界限濃度。與前人研究不同的是,本研究從整體到局部對(duì)土壤Cu污染光譜的分析得到的界限濃度一致,結(jié)果的準(zhǔn)確性較高,實(shí)現(xiàn)了土壤Cu污染界限濃度的劃分。
基于土壤有機(jī)質(zhì)含量與土壤光譜和重金屬濃度之間的相關(guān)性,本研究所選用的土壤Cu濃度預(yù)測(cè)模型參數(shù)為集中在570~830 nm波段范圍內(nèi)的土壤光譜反射率,再結(jié)合整體光譜多重分形譜參數(shù)可以探索不同濃度Cu污染的光譜細(xì)節(jié)差異的能力,進(jìn)行了土壤Cu濃度的預(yù)測(cè),可以提高預(yù)測(cè)模型的精度。查閱相關(guān)文獻(xiàn)可知(Rathod et al.,2015;Xie et al.,2012;Wu et al.,2015;Maliki et al.,2014;Stazi et al.,2014),土壤Cu濃度最佳預(yù)測(cè)模型R2為 0.92,As、Pb、Ar濃度最佳預(yù)測(cè)模型的 R2為 0.96,但模型的 RMSE相對(duì)較大(表 5),因此,本研究預(yù)測(cè)模型的R2及RMSE均得到了較好的效果。
多重分形譜參量Δα值和一階導(dǎo)數(shù)距離最大值可作為土壤Cu污染界限濃度劃分和光譜特征波段提取的依據(jù),結(jié)合土壤Cu污染光譜反射率、土壤中有機(jī)質(zhì)含量及土壤含水率構(gòu)建的MLR模型可有效預(yù)測(cè)土壤Cu濃度,主要結(jié)論如下:

表5 土壤重金屬含量預(yù)測(cè)模型精度對(duì)比Table 5 Comparison of the precision of the model for predicting the heavy metal content in the soil
(1)土壤Cu 污染的界限濃度為 120~160 μg?g-1;土壤 Cu污染的特征波段區(qū)間為 730~760 nm 和540~590 nm。
(2)以 120~160 μg?g-1為界限濃度,當(dāng)土壤 Cu濃度在 20~120 μg?g-1和 160~740 μg?g-1時(shí),分別建立MLR模型預(yù)測(cè)土壤中Cu濃度,該模型精度較高(R2>0.99),RMSE 較小(RMSE<50)。