王海江 劉 凡 YUNGER John A 崔 靜 馬 玲
(1.石河子大學(xué)農(nóng)學(xué)院, 石河子 832003; 2.新疆生產(chǎn)建設(shè)兵團(tuán)綠洲生態(tài)農(nóng)業(yè)重點(diǎn)實(shí)驗(yàn)室, 石河子 832003;3.伊利諾伊州長(zhǎng)州立大學(xué)生物系, 芝加哥 IL 60466)
快速、有效地獲取土壤屬性信息,是現(xiàn)代農(nóng)業(yè)發(fā)展、自然資源合理利用以及土壤環(huán)境保護(hù)的重要保障。傳統(tǒng)的土壤屬性測(cè)試方法費(fèi)時(shí)、費(fèi)力,成本高且造成一定的環(huán)境污染。近些年,高光譜技術(shù)以其簡(jiǎn)便、非破壞性、信息量豐富的特點(diǎn)為土壤屬性快速、準(zhǔn)確獲取提供了可能[1-2]。土壤氮素水平不僅是衡量和表征土壤肥力特征的重要指標(biāo),也是決定植株氮素營(yíng)養(yǎng)水平的關(guān)鍵因素,實(shí)驗(yàn)室測(cè)定方法繁瑣且有限的樣本數(shù)量已經(jīng)無(wú)法滿足現(xiàn)代精準(zhǔn)農(nóng)業(yè)施肥技術(shù)的需求。
目前,普遍認(rèn)為采用適當(dāng)?shù)墓庾V預(yù)處理和模型構(gòu)建方法,能夠很好地簡(jiǎn)化土壤屬性的反演模型,并能提高預(yù)測(cè)精度[3],如對(duì)原始光譜反射率進(jìn)行一階導(dǎo)數(shù)、二階導(dǎo)數(shù)、對(duì)數(shù)、連續(xù)統(tǒng)去除等變換[4-7],采用多元線性逐步回歸、偏最小二乘法、人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等建模方法,均能夠有效提高土壤屬性的預(yù)測(cè)能力[8-13]。郭熙等[14]應(yīng)用高光譜技術(shù)分析了南方稻田土壤堿解氮的光譜特征,認(rèn)為波長(zhǎng)694、2 058、2 189 nm是構(gòu)建光譜反演模型的特征波段,對(duì)土壤堿解氮含量具有一定的預(yù)測(cè)能力,在對(duì)山東潮土[15]和三峽庫(kù)區(qū)的紫色土[16]氮素含量預(yù)測(cè)中也表現(xiàn)出較好的估測(cè)精度。劉秀英等[8]對(duì)陜西省吳起縣24個(gè)土壤剖面的黃綿土全氮含量進(jìn)行了光譜預(yù)測(cè),模型校正和驗(yàn)證的R2分別為0.929和0.935;劉雪梅等[17]對(duì)原始光譜平滑后采用蒙特卡羅無(wú)信息變量消除方法,預(yù)測(cè)堿解氮模型的相關(guān)系數(shù)和均方根誤差分別為0.84和17.1 mg/kg,文獻(xiàn)[18-20]利用近紅外光譜分析技術(shù),通過(guò)對(duì)土壤原始光譜反射率的平滑和變換處理,采用多元逐步回歸和偏最小二乘法構(gòu)建土壤氮素的估測(cè)模型也得到了較好的預(yù)測(cè)結(jié)果。
土壤的光譜特征是土壤理化特性的綜合反映,而土壤顆粒粒徑(比表面積)對(duì)土壤光譜反射率有著顯著的影響,以往的土壤氮素高光譜估測(cè)大都針對(duì)同一種土壤粒徑,不同的光譜變換和建模方法開(kāi)展研究,但是土壤光譜測(cè)定前的不同過(guò)篩處理會(huì)存在較大差異。基于此,本研究以新疆主要棉區(qū)土壤為研究對(duì)象,分析不同過(guò)篩粒徑的土壤光譜特征與全氮含量的相關(guān)關(guān)系,確定不同光譜變換數(shù)據(jù)建立的全氮含量估測(cè)模型精度,以期為土壤屬性信息的快速獲取提供技術(shù)支持。
新疆地域遼闊,自然條件復(fù)雜,深居歐亞大陸腹地,四周距海遙遠(yuǎn),北、西、南三面為高山所環(huán)抱,很難受到海洋氣流的影響,屬于典型的溫帶大陸性干旱氣候,其總的特點(diǎn)是干旱多風(fēng),致使在土壤形成過(guò)程中物理風(fēng)化占有突出地位,風(fēng)蝕、風(fēng)積相當(dāng)強(qiáng)烈,形成大面積的漠土、干旱土、鹽堿土、風(fēng)沙土等。棉花是新疆農(nóng)業(yè)種植的特色優(yōu)勢(shì)作物,雖光照充足,但受其溫度、土壤、灌水等因素的影響,棉花的種植主要分布在南疆、東疆和北疆的部分地區(qū),因土壤養(yǎng)分貧瘠,新疆棉田氮肥和磷肥單位面積施用量大,鉀肥單位面積施用量較低,區(qū)域差異明顯[21]。
新疆棉花氮肥單位面積施用量大,區(qū)域間土壤養(yǎng)分差異明顯,這為本研究獲取較為寬泛的土壤氮素含量樣本提供了基礎(chǔ)條件。因此,在前期調(diào)查和查閱大量資料的基礎(chǔ)上,重點(diǎn)選取近3年棉花產(chǎn)量差異大、區(qū)域間養(yǎng)分差異明顯的棉田樣地,其中博樂(lè)地區(qū)116個(gè)、昌吉地區(qū)123個(gè)、奎屯地區(qū)83個(gè)、石河子地區(qū)66個(gè),采樣點(diǎn)分布位置如圖1所示。土壤樣品采集地表0~20 cm土層,分別在每一個(gè)采樣點(diǎn)的周邊5 m范圍內(nèi)隨機(jī)再采集2個(gè)土樣,3個(gè)土樣混合后作為該采樣點(diǎn)待測(cè)樣品,質(zhì)量約1 kg。每一個(gè)采樣點(diǎn)詳細(xì)記錄經(jīng)緯度坐標(biāo),并對(duì)采樣點(diǎn)周邊環(huán)境進(jìn)行拍照記錄,采集后迅速封裝在自封袋中,帶回實(shí)驗(yàn)室后去除礫石及動(dòng)植物殘骸等雜質(zhì)。

圖1 樣區(qū)采樣點(diǎn)分布圖Fig.1 Sample plot distribution
土樣經(jīng)自然風(fēng)干、研磨和壓碎后,全氮含量采用全自動(dòng)凱氏定氮儀(FOSS-2300型,福斯公司,瑞典)測(cè)定。為了能夠獲得不同區(qū)域較寬泛的土壤全氮樣本,依據(jù)化學(xué)測(cè)定結(jié)果剔除同一區(qū)域全氮含量相近的樣本,最終篩選出博樂(lè)地區(qū)62個(gè)、昌吉地區(qū)76個(gè)、奎屯地區(qū)50個(gè)、石河子地區(qū)42個(gè)土壤樣品,對(duì)篩選出的230個(gè)土樣都分4份,分別過(guò)2、1、0.5、0.15 mm篩,得到同一個(gè)土樣的4種不同粒徑處理樣本,待測(cè)光譜反射率。為了能夠更好地構(gòu)建高光譜反演模型并對(duì)模型的精度和普適性驗(yàn)證,將博樂(lè)地區(qū)、昌吉地區(qū)和奎屯地區(qū)的188個(gè)樣品隨機(jī)分為141 個(gè)(75%)建模樣本和 47個(gè)(25%)檢驗(yàn)樣本,并經(jīng)Levene檢驗(yàn)與T檢驗(yàn)確保建模樣本集與檢驗(yàn)樣本集代表相同的總體樣本。石河子地區(qū)的42個(gè)樣本不參與模型構(gòu)建和外部檢驗(yàn),作為最優(yōu)模型的普適性驗(yàn)證,樣品描述性統(tǒng)計(jì)分析見(jiàn)表1。

表1 土壤全氮含量描述性統(tǒng)計(jì)分析Tab.1 Descriptive statistical analysis of soil total nitrogen content
采用美國(guó)ASD 公司 Field Spec Pro FR 型光譜儀進(jìn)行土壤樣品測(cè)試,其波長(zhǎng)為350~2 500 nm,其中350~1 000 nm、1 000~2 500 nm波段光譜分辨率分別為3、10 nm,采樣間隔分別為1.4、2 nm。取制備好的土壤樣品放置于半徑5 cm、深1.5 cm(認(rèn)為是光學(xué)上無(wú)限厚)的黑色盛樣皿內(nèi),土壤裝填容重約1.4 g/cm3。光譜測(cè)定在暗室中進(jìn)行,將200 W的鹵素?zé)糁糜谀繕?biāo)兩側(cè),光源入射角為25°,距離目標(biāo)30 cm,采用8°視場(chǎng)角的傳感器探頭置于離土壤樣本表面15 cm的垂直上方,探頭接收光譜的區(qū)域?yàn)橹睆?.1 cm的圓,小于盛樣皿的面積,探頭接收的均為土壤的反射光譜。測(cè)試之前先以白板進(jìn)行定標(biāo),每個(gè)土樣采集10條光譜曲線,算術(shù)平均后得到該土樣的實(shí)際反射光譜。

在對(duì)光譜數(shù)據(jù)變換和篩選的基礎(chǔ)上,選取與土壤全氮含量顯著相關(guān)波段多的變換形式,采用支持向量機(jī)(Support vector machine,SVM)、偏最小二乘回歸(Partial least squares regression,PLSR)和多元逐步線性回歸(Stepwise multiple linear regression,SMLR)方法構(gòu)建土壤全氮含量光譜反演模型。設(shè)定SVM類型為4(即v-SVR),核函數(shù)類型為 2(即 RBF),采用訓(xùn)練集交叉驗(yàn)證和網(wǎng)格搜索法(Grid search)進(jìn)行參數(shù)尋優(yōu),依據(jù)均方差最小原則確定懲罰參數(shù)C和RBF核參量g的值。采用Matlab R2012a和Sigmaplot軟件完成相關(guān)建模、制圖。
(1)
(2)
(3)
(4)
(5)
nc——校正樣本數(shù)

ypi——預(yù)測(cè)集中第i個(gè)樣本的實(shí)測(cè)值
np——預(yù)測(cè)集樣本數(shù)

SD——預(yù)測(cè)集樣本測(cè)量值的標(biāo)準(zhǔn)偏差
RMSECV——交互驗(yàn)證均方根誤差
圖2是不同粒徑土壤樣品光譜特征與全氮含量的相關(guān)性,土壤原始光譜反射率在各個(gè)波段與全氮含量的相關(guān)系數(shù)均不高[22],從其變化趨勢(shì)來(lái)看,不同粒徑處理土壤樣品與全氮的相關(guān)性變化相似,波長(zhǎng)在350~664 nm內(nèi)表現(xiàn)為負(fù)相關(guān),波長(zhǎng)在664~1 520 nm內(nèi)相關(guān)性為正值,而后至2 500 nm為負(fù)相關(guān)。不同粒徑土壤樣品在370 nm處與土壤全氮含量的相關(guān)性出現(xiàn)一峰值,相關(guān)系數(shù)為-0.31~-0.21,隨著波長(zhǎng)的增加,相關(guān)性降低,在497~520 nm內(nèi)有一谷值,相關(guān)系數(shù)約為-0.09,而后在564~584 nm形成小的峰值,相關(guān)系數(shù)在-0.10左右;隨著波長(zhǎng)的增加相關(guān)性變?yōu)檎担? 046 nm附近有一峰值,相關(guān)系數(shù)約為0.22,后在1 892、2 457 nm處形成峰值,相關(guān)系數(shù)分別在-0.32和-0.34附近。從相關(guān)性來(lái)看,不同粒徑組成的土壤原始光譜與全氮含量相關(guān)性均不高,其中2 mm粒徑處理相關(guān)性最低,0.5 mm處理最高,其次是0.15、1 mm,試驗(yàn)結(jié)果表明,土壤粒徑較小的處理在相關(guān)性上優(yōu)于粒徑較大的處理。

圖2 不同粒徑組成土壤光譜特征與全氮含量相關(guān)性Fig.2 Correlation of soil total nitrogen content and spectral characteristics in different soil particle sizes
土壤光譜特征是土壤理化特性的綜合反映,其原始光譜特征與全氮含量的相關(guān)性受土壤類型、質(zhì)地、有機(jī)質(zhì)、鹽分含量以及背景噪聲等多因素綜合作用[3],因此,不同研究中土壤光譜特征與全氮含量的相關(guān)系數(shù)及其變化趨勢(shì)差異較大[23-25]。


表2 不同光譜數(shù)據(jù)變換與土壤全氮含量的最優(yōu)相關(guān)關(guān)系Tab.2 Correlation between different spectrum transformations and soil total nitrogen content
表3是利用SVM、PLSR和SMLR 3種方法構(gòu)建的不同粒徑處理全氮含量的擬合模型,由表3可知,對(duì)土壤原始光譜進(jìn)行不同形式的變化均能夠不同程度地提高模型精度,土壤過(guò)篩粒徑越小模型的擬合精度越高,從建模精度對(duì)比,SVM方法優(yōu)于PLSR和SMLR。


通過(guò)分析不同粒徑土壤各變換形式構(gòu)建的模型表明(圖3),3種模型構(gòu)建方法均采用過(guò)篩0.15 mm的土壤樣品能夠明顯提高氮素含量的預(yù)測(cè)精度,SVM方法采用(lgR)′變換形式、PLSR和SMLR方法采用R′建立的全氮含量擬合模型精度最高,將未參與建模的石河子地區(qū)42個(gè)土壤樣本進(jìn)行模型適應(yīng)性驗(yàn)證,并計(jì)算出預(yù)測(cè)值與實(shí)測(cè)值的絕對(duì)百分比誤差(圖3)。SVM、PLSR和SMLR模型R2分別為0.822 9、0.771 5和0.705 4,其中SVM和PLSR的預(yù)測(cè)數(shù)值略高于實(shí)測(cè)值,SMLR模型的預(yù)測(cè)值略低于實(shí)測(cè)值,3種方法構(gòu)建的模型在不同區(qū)域間都能夠較好地估測(cè)土壤全氮含量,具有一定的區(qū)域穩(wěn)定性。從絕對(duì)誤差的變化來(lái)看,3種模型均表現(xiàn)出土壤全氮含量越小其誤差越大,隨著土壤氮素含量的增大,誤差迅速降低,如實(shí)測(cè)值氮素含量為0.06 g/kg時(shí),SVM、PLSR和SMLR模型的絕對(duì)誤差分別為562.83%、787.11%和547.24%,氮素含量為0.93 g/kg時(shí),絕對(duì)百分比誤差分別為2.46%、3.85%和7.85%,說(shuō)明采用3種估測(cè)方法都無(wú)法對(duì)土壤氮素含量低的樣品進(jìn)行準(zhǔn)確反演。

表3 不同粒徑土壤全氮含量的模型構(gòu)建與檢驗(yàn)Tab.3 Models of hyperspectral inverse for soil total nitrogen content in different soil particle sizes

圖3 全氮含量最優(yōu)模型的驗(yàn)證與誤差分析Fig.3 Model checking and error analysis of soil total nitrogen content
土壤的原始光譜特征是土壤屬性的綜合反映,張娟娟等[24]對(duì)我國(guó)中東部地區(qū)土壤樣品進(jìn)行風(fēng)干處理,分析發(fā)現(xiàn)土壤全氮含量與原始光譜反射率在350~560 nm和1 913~1 932 nm區(qū)域內(nèi)為正相關(guān),其余波段為負(fù)相關(guān),相關(guān)系數(shù)均低于0.4;張瑤等[11]對(duì)北京昌平褐色沙壤土原始光譜特征與全氮含量進(jìn)行相關(guān)分析,在波長(zhǎng)800~2 564 nm范圍內(nèi)均呈現(xiàn)負(fù)相關(guān);趙燕東等[22]對(duì)北京海淀區(qū)土壤樣品過(guò)篩處理,在控制土壤含水率為15%的條件下測(cè)定原始光譜與全氮含量相關(guān)性,波長(zhǎng)在2 203~2 219 nm區(qū)域?yàn)檎嚓P(guān),其他區(qū)域均為負(fù)相關(guān);李焱等[25]對(duì)新疆北部灰漠土過(guò)篩進(jìn)行光譜測(cè)定,表明土壤全氮與原始光譜反射率在350~540 nm區(qū)域?yàn)樨?fù)相關(guān),540~2 490 nm呈現(xiàn)正相關(guān)。本研究中土壤原始光譜特征與全氮含量的相關(guān)性在350~664 nm范圍內(nèi)表現(xiàn)為負(fù)相關(guān),664~1 520 nm相關(guān)性為正值,而后至2 500 nm為負(fù)相關(guān)。綜上所述,僅利用土壤原始光譜反射率對(duì)土壤全氮含量進(jìn)行估測(cè)時(shí)往往因成土母質(zhì)、粒徑、有機(jī)質(zhì)含量等因素而大相徑庭,在對(duì)土壤樣品風(fēng)干、過(guò)篩等預(yù)處理消除樣品不一致的影響后,利用原始光譜特征仍無(wú)法估測(cè)土壤氮素含量。大量的研究證明,通過(guò)對(duì)原始光譜數(shù)值進(jìn)行一階微分、二階微分、連續(xù)統(tǒng)去除等變換后,能夠顯著提高光譜特征與土壤特性參數(shù)的相關(guān)性[8,17,26],本研究中對(duì)原始光譜反射率進(jìn)行了12種不同形式的變換,其相關(guān)性較原始光譜均有所提高,一階微分變換后的擬合精度優(yōu)于其他變換,二階微分變換在增強(qiáng)特征波段信息的同時(shí)或許也增強(qiáng)了背景噪聲的信號(hào),使建模精度低于一階微分。不同變換形式最大相關(guān)系數(shù)對(duì)應(yīng)的波段位置沒(méi)有很好的規(guī)律性,但同一種變換形式在不同的粒徑處理上位置是相近的,依據(jù)估測(cè)模型的擬合精度,采用SVM方法對(duì)光譜進(jìn)行(lgR)′變換,PLSR和SMLR方法對(duì)光譜進(jìn)行R′變換能夠較為準(zhǔn)確地估算土壤全氮含量。
土壤光譜反射率受到質(zhì)地、理化性質(zhì)等因素的共同影響,其光譜測(cè)定通常是經(jīng)過(guò)去雜、過(guò)篩處理后進(jìn)行,不同粒徑的土粒由于比表面積的不同而會(huì)影響到反射率,粒徑小的土粒具有較大的比表面積而反射率也較高。國(guó)內(nèi)外土壤光譜的測(cè)定在過(guò)篩處理上差異較大,如預(yù)處理過(guò)20目篩(0.83 mm)[22,24]、16目篩(1 mm)[25,27-28]、100目篩(0.15 mm)[29]、8目篩(2.5 mm)[30]、2 mm粒級(jí)[10,31-34],研究者均認(rèn)為在利用光譜特征反演不同土壤參數(shù)前需要進(jìn)行過(guò)篩處理,通過(guò)過(guò)篩能夠使被測(cè)樣品粒徑較為一致,但在不同粒徑樣品的光譜擬合精度上研究略顯不足。本研究在對(duì)土壤樣品的原始光譜進(jìn)行12種不同形式數(shù)據(jù)轉(zhuǎn)換后,利用支持向量機(jī)、偏最小二乘回歸和多元逐步回歸3種方法分別構(gòu)建了土壤全氮含量的高光譜擬合模型,從不同粒徑的擬合精度來(lái)看,過(guò)篩最小粒徑的0.15 mm處理模型的擬合精度最高,其原因或許是土壤顆粒越小,彼此的結(jié)合越緊密,土壤表面也就越平滑,反射率就越大[35-36],另一方面較大的土壤顆粒間能夠容納更多的空氣和束縛水,其對(duì)光譜特征的表達(dá)會(huì)產(chǎn)生干擾和掩蓋。因此,本研究的結(jié)果可推斷對(duì)土壤待測(cè)樣品過(guò)篩越細(xì),土壤顆粒越小,利用土壤光譜特征對(duì)土壤全氮含量的估測(cè)能力越強(qiáng)。從模型的絕對(duì)誤差來(lái)看,土壤氮素含量越低,SVM、PLSR和SMLR模型的預(yù)測(cè)誤差均越大,與采用的建模方法并無(wú)關(guān)系,這在其他一些研究者得出的結(jié)論中并未表現(xiàn)的很明顯[22-24],或許是因?yàn)楸狙芯繀^(qū)采集的土壤樣品氮素含量偏低,在土壤氮素含量較低的情況下,利用光譜反射特征無(wú)法準(zhǔn)確估測(cè)。
(1)利用土壤的原始光譜特征無(wú)法準(zhǔn)確估測(cè)土壤全氮含量,對(duì)光譜反射率進(jìn)行相應(yīng)的數(shù)據(jù)轉(zhuǎn)換能夠顯著提高特征波長(zhǎng)與土壤全氮含量的相關(guān)性,但光譜特征波長(zhǎng)在各變換中差異不大,其中采用SVM方法通過(guò)(lgR)′變換在不同粒徑處理中都能夠較準(zhǔn)確地估測(cè)土壤全氮含量,RPD均大于1.5;PLSR和SMLR方法通過(guò)R′變換在過(guò)篩粒徑小于等于1 mm處理,能夠較為準(zhǔn)確地估測(cè)土壤全氮含量。
(2)從不同粒級(jí)模型的估測(cè)精度來(lái)看,過(guò)篩粒徑越細(xì),對(duì)土壤全氮含量的擬合精度越高,0.15 mm處理,SVM方法采用(lgR)′變換后構(gòu)建的模型RPD為2.704 9,PLSR和SMLR方法通過(guò)R′變換后RPD分別為2.554 9和2.437 4,3種方法均能夠很好地估測(cè)氮素含量,SVM方法擬合精度優(yōu)于PLSR和SMLR。從最優(yōu)模型的驗(yàn)證結(jié)果來(lái)看,SVM、PLSR和SMLR方法的模型檢驗(yàn)R2分別為0.822 9、0.771 5和0.705 4,土壤中氮素含量越低,預(yù)測(cè)誤差也越大。