冷信風(fēng),賴祖龍
(1.修水縣國土資源局,江西 修水332400;2.中國地質(zhì)大學(xué)信息工程學(xué)院,湖北 武漢430074)
喀斯特石漠化是在脆弱的生態(tài)地質(zhì)環(huán)境基礎(chǔ)上,由于人為因素的影響而導(dǎo)致的以土地生產(chǎn)力退化為本質(zhì)的現(xiàn)象,是土地荒漠化的主要類型之一,它對生態(tài)環(huán)境和人類生存發(fā)展造成了嚴(yán)重的危害[1—2]。石漠化風(fēng)險(xiǎn)評估是非常重要的自然災(zāi)害風(fēng)險(xiǎn)分析,但由于其具有明顯的多目標(biāo)性、且受多因子和各個(gè)層次因素相互作用的影響,因此對石漠化進(jìn)行風(fēng)險(xiǎn)評估是一項(xiàng)復(fù)雜的系統(tǒng)工程[3]。目前針對石漠化風(fēng)險(xiǎn)評估主要考慮以下三大類的評估指標(biāo):現(xiàn)狀指標(biāo)(基巖裸露率、植被覆蓋度、坡度、土壤裸露率、土壤類型)、演變速率指標(biāo)(石漠化年增長率、人均耕地面積)、脆弱性評價(jià)指標(biāo)(人口密度、人均 GDP、農(nóng)業(yè)利用價(jià)值)[4],這些指標(biāo)主要是通過遙感[5]和調(diào)查統(tǒng)計(jì)獲取,并運(yùn)用地理信息系統(tǒng)(Geographic Information System,GIS)對處理后的遙感影像進(jìn)行綜合分析。由于GIS具有數(shù)據(jù)組織和管理、空間分析、地理制圖和空間數(shù)據(jù)可視化等方面的優(yōu)勢,因此已成為進(jìn)行地理空間信息綜合分析的有效工具[6]。
在進(jìn)行石漠化風(fēng)險(xiǎn)評估時(shí),面對大規(guī)模的指標(biāo)體系,必須要揭示變量之間的關(guān)系并簡化數(shù)學(xué)建模的過程,使得評估模型變量的選取更加合理,風(fēng)險(xiǎn)評估結(jié)果精度更高,因此有必要先使用主成分分析(PCA)將原始指標(biāo)數(shù)據(jù)進(jìn)行壓縮以避免指標(biāo)間的多重共線性[7]。傳統(tǒng)評估模型大都存在權(quán)重系數(shù)難以確定、只考慮了各指標(biāo)間線性關(guān)系的缺點(diǎn),而支持向量機(jī)(Support Vector Machine,SVM)具有避免定權(quán)、充分考慮非線性關(guān)系和評估結(jié)果更加客觀可靠的優(yōu)點(diǎn),它是一種基于統(tǒng)計(jì)學(xué)理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理的模式識別方法[8],評估分類效果較基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原理的人工神經(jīng)網(wǎng)絡(luò)更優(yōu)。此外,考慮到SVM模型的評估性能很大程度上依賴于參數(shù)的選取,如文獻(xiàn)[9]中支持向量機(jī)參數(shù)選取均采用窮舉法等人工反復(fù)試驗(yàn)的方法,不僅效率低且得到的未必是全局最優(yōu)解,針對這一問題,采用全局搜索能力強(qiáng)且實(shí)現(xiàn)簡單的粒子群優(yōu)化(PSO)算法[10]來優(yōu)化選取SVM模型參數(shù)。
基于此,本文在利用GIS進(jìn)行空間數(shù)據(jù)管理和分析的基礎(chǔ)上,首先采用主成分分析進(jìn)行指標(biāo)篩選,再運(yùn)用PSO-SVM模型對云南省文山州喀斯特石漠化現(xiàn)象進(jìn)行風(fēng)險(xiǎn)評估,并將評估結(jié)果與單獨(dú)SVM模型和PSO-BP模型進(jìn)行對比分析,以期為石漠化風(fēng)險(xiǎn)評估提供一種新思路。
粒子群優(yōu)化(PSO)算法是由Eberhart和Kennedy等提出的基于群體智能的參數(shù)尋優(yōu)技術(shù),它通過群體中各個(gè)粒子間的競爭和合作形成的群體智能來優(yōu)化搜索。PSO算法數(shù)學(xué)描述為:初始化D維向量空間中的K個(gè)隨機(jī)粒子,其中第k個(gè)粒子的位置向量為xk=(xk1,xk2,…,xkD),速度向量為vk=(vk1,vk2,…,vkD),(k=1,2,…,K),將xk代入目標(biāo)函數(shù),計(jì)算出每個(gè)粒子的適應(yīng)度值,確定每個(gè)粒子的當(dāng)前個(gè)體最優(yōu)解pbest記為Pk=(pk1,pk2,…,pkD)和當(dāng)前群體最優(yōu)解gbest記為Pg=(pg1,pg2,…,pgD)。在每一次迭代中,找到這兩個(gè)最優(yōu)值后,粒子根據(jù)下面公式更新本身的速度向量和位置向量:式中:t=1,2,…,tmax代表迭代次數(shù);ω為慣性權(quán)重;r1和r2為區(qū)間[0,1]上的隨機(jī)生成數(shù);c1和c2為學(xué)習(xí)因子。

Vapnik等1995年提出基于統(tǒng)計(jì)學(xué)習(xí)理論的支持向量機(jī)模型(SVM模型),它是一種新型機(jī)器學(xué)習(xí)算法,其基本思想為:定義最優(yōu)線性超平面,并把尋找最優(yōu)線性超平面的算法歸結(jié)為求解一個(gè)凸規(guī)劃問題;進(jìn)而基于Mercer核展開定理,通過非線性映射把樣本空間映射到一個(gè)高維特征空間,使其在特征空間中可以應(yīng)用線性學(xué)習(xí)機(jī)的方法解決樣本空間中的高度非線性分類和回歸等問題。與傳統(tǒng)統(tǒng)計(jì)學(xué)相比,統(tǒng)計(jì)學(xué)理論專門研究有限樣本條件下的機(jī)器學(xué)習(xí)規(guī)律,而SVM模型既有嚴(yán)格的理論基礎(chǔ),又能較好地解決有限樣本、高維數(shù)、非線性和局部最值等問題。
本文的三大類評估指標(biāo)主要通過遙感影像解譯、地圖數(shù)字化和實(shí)地調(diào)查統(tǒng)計(jì)獲取,指標(biāo)數(shù)據(jù)量巨大,因此需要利用GIS軟件制作出反映各種信息的專題圖與專題數(shù)據(jù)庫,以便高效地管理風(fēng)險(xiǎn)評估的空間數(shù)據(jù)與屬性數(shù)據(jù)。由于GIS具有優(yōu)越的空間數(shù)據(jù)顯示功能[11],因此可采用顏色的深淺和填充紋理的差異來反映不同地區(qū)的石漠化風(fēng)險(xiǎn),從而形象、直觀地表達(dá)石漠化風(fēng)險(xiǎn)評估的結(jié)果。基于GIS的石漠化風(fēng)險(xiǎn)評估類似于一種柵格影像的疊加分析,如圖1所示。
依據(jù)基巖裸露率、植被覆蓋度等指標(biāo)數(shù)據(jù)進(jìn)行石漠化風(fēng)險(xiǎn)評估,其本質(zhì)是一個(gè)非線性映射的過程,而利用SVM模型解決這類復(fù)雜的非線性映射問題具有明顯的優(yōu)勢,因此本文使用SVM模型進(jìn)行石漠化風(fēng)險(xiǎn)評估。使用SVM模型進(jìn)行評估之前,需先運(yùn)用主成分分析對原始指標(biāo)數(shù)據(jù)進(jìn)行預(yù)處理,具體流程如下:
(1)將原始指標(biāo)數(shù)據(jù)進(jìn)行歸一化處理,主要是為了消除各指標(biāo)量綱不同和數(shù)量級差異過大對模型造成的影響。

圖1 各個(gè)指標(biāo)專題圖以柵格影像的方式進(jìn)行疊加分析Fig.1 All indexes thematic maps
(2)對歸一化后的指標(biāo)數(shù)據(jù)進(jìn)行主成分分析,獲得新的綜合指標(biāo),主要包括求取原始指標(biāo)數(shù)據(jù)相關(guān)系數(shù)矩陣的特征值、特征向量以及指標(biāo)主成分。
適合的溫度有利于釀酒酵母更好的生長代謝,研究了溫度對Y17aM3生長及生產(chǎn)RNA的影響,結(jié)果如圖 13。Y17aM3隨著培養(yǎng)溫度升高而生長減慢及RNA產(chǎn)量減少,因此低溫更有利于Y17aM3生長和積累RNA。最適溫度為26 ℃,此時(shí)Y17aM3生長OD600最高為14.5,RNA含量最高為115 mg-RNA/g-DCW,比在30 ℃條件下提高了3 mg-RNA/g-DCW。
(3)將新的綜合指標(biāo)作為SVM模型的訓(xùn)練和測試數(shù)據(jù),并運(yùn)用PSO算法對SVM模型進(jìn)行參數(shù)尋優(yōu),得到SVM模型的最佳參數(shù),以便確定最終用于石漠化風(fēng)險(xiǎn)評估的SVM模型。
(4)使用石漠化風(fēng)險(xiǎn)評估的分類精度作為模型訓(xùn)練和模型測試的效果檢驗(yàn),通過野外實(shí)地調(diào)查和專題圖采樣獲取樣本數(shù)據(jù),選取其中部分樣本數(shù)據(jù)用作模型訓(xùn)練,另外的樣本數(shù)據(jù)用作模型測試,并在試驗(yàn)分析的基礎(chǔ)上,對石漠化風(fēng)險(xiǎn)評估模型的性能進(jìn)行綜合評定。
本文以云南省文山州為研究區(qū)進(jìn)行石漠化風(fēng)險(xiǎn)評估。
文山州位于滇東南偏西,東經(jīng)103°43′~104°27′、北 緯 23°16′~23°44′之間,全州總面積2 972km2,總?cè)丝?19 018人。文山州地域?qū)俚釚|南巖溶山原區(qū),境內(nèi)山巒起伏,河谷溝壑縱橫,大部分地區(qū)屬西風(fēng)帶中亞熱帶季風(fēng)氣候,年均氣溫為12.8℃~18.1℃,降雨量較充沛,年均降雨量為992.7mm。圖2為文山州的州界輪廊圖。
本次喀斯特石漠化風(fēng)險(xiǎn)評估以柵格為計(jì)算單元,每個(gè)格網(wǎng)的大小為50m×50m,將研究區(qū)分割成372 311個(gè)格網(wǎng)。其中,基巖裸露率、植被覆蓋度、坡度和土壤裸露率的分布見圖3至圖6。

圖2 文山州的州界輪廓圖Fig.2 Boundary contour figure of Wenshan Prefecture

圖3 文山州基巖裸露率分布圖Fig.3 Bedrock exposed rate distribution of Wenshan Prefecture

圖4 文山州植被覆蓋度分布圖Fig.4 Vegetation coverage distribution of Wenshan Prefecture

圖5 文山州坡度分布圖Fig.5 Slope distribution of Wenshan Prefecture
本文選取200個(gè)樣本數(shù)據(jù),根據(jù)野外調(diào)查,將對應(yīng)的喀斯特石漠化風(fēng)險(xiǎn)程度分為4個(gè)等級,形成訓(xùn)練樣本和測試樣本數(shù)據(jù),見表1。

圖6 文山州土壤裸露率分布圖Fig.6 Bare soil rate distribution of Wenshan Prefecture
為了便于對SVM機(jī)模型的參數(shù)進(jìn)行訓(xùn)練,將SVM模型的訓(xùn)練結(jié)果和石漠化風(fēng)險(xiǎn)程度評估等級相對應(yīng),即沒有石漠化風(fēng)險(xiǎn)時(shí)對應(yīng)等級為1,輕度石漠化時(shí)對應(yīng)等級為2,中度石漠化時(shí)對應(yīng)等級為3,重度石漠化時(shí)對應(yīng)等級為4。

表1 歸一化處理后的樣本數(shù)據(jù)Table 1 Sample data after normalization
表1中10個(gè)風(fēng)險(xiǎn)評估指標(biāo)中,某些指標(biāo)間可能存在一定的相關(guān)性,如植被覆蓋度與土壤裸露率之間、石漠化年增長率與人均耕地面積之間均呈負(fù)相關(guān)性,而且過多的輸入變量容易造成數(shù)據(jù)冗余,增加評估模型的復(fù)雜度,因此有必要對200個(gè)樣本數(shù)據(jù)的10個(gè)變量指標(biāo)進(jìn)行主成分分析,剔除變量之間的相關(guān)性,提高模型風(fēng)險(xiǎn)評估的精度。本文使用SPSS軟件自動(dòng)計(jì)算主成分其具體計(jì)算過程如下:

表2 累計(jì)方差貢獻(xiàn)率Table 2 Cumulative variance contribution rate
(2)由前3個(gè)特征根求得相對應(yīng)的特征向量構(gòu)成正交矩陣,再用特征根平方根對角矩陣左乘正交矩陣,得到主成分載荷矩陣,見表3。

表3 主成分載荷矩陣Table 3 Principal component load matrix
(3)最后計(jì)算主成分與原始變量之間的關(guān)系,用轉(zhuǎn)置后的正交矩陣左乘原始數(shù)據(jù)矩陣,即可得到經(jīng)過主成分變換后的新指標(biāo),這3個(gè)新指標(biāo)反映了原始變量92.419%的信息。
從主成分分析后得到的新指標(biāo)樣本中,選取100個(gè)樣本作為訓(xùn)練樣本,另外100個(gè)樣本作為測試樣本,并采用PSO算法優(yōu)選SVM模型的參數(shù),具體過程如下(見圖7):
(1)用分類預(yù)測誤差作為適應(yīng)度值,初始化PSO-SVM模型,主要是針對SVM模型的兩個(gè)參數(shù)(核函數(shù)參數(shù)g和懲罰因子C)進(jìn)行優(yōu)化選取,PSO算法需要設(shè)置的參數(shù)主要包括粒子維數(shù)d、粒子位置和速度隨機(jī)初始化、種群規(guī)模N、最大迭代次數(shù)tmax等。
(2)分別由每個(gè)粒子建立相應(yīng)的SVM模型,再根據(jù)計(jì)算適應(yīng)度值的函數(shù)對各個(gè)粒子的初始適應(yīng)度值進(jìn)行對比分析。
(3)由迭代后的粒子獲取新的SVM模型參數(shù),并建立新的預(yù)測模型,再對比分析目標(biāo)函數(shù)預(yù)測值,重新對每個(gè)個(gè)體進(jìn)行迭代更新。
(4)對區(qū)域中的所有個(gè)體,將當(dāng)前位置計(jì)算出的目標(biāo)函數(shù)適應(yīng)度值同該個(gè)體歷史最優(yōu)位置和群體最優(yōu)位置的目標(biāo)函數(shù)適應(yīng)度值進(jìn)行對比分析,假若當(dāng)前位置效果更好,則將該位置替代掉歷史最優(yōu)位置。
(5)給粒子群設(shè)定終止條件,通常設(shè)定為迭代次數(shù)達(dá)到了極限迭代次數(shù),若滿足該終止條件,搜索停止,否則算法會(huì)返回到第(3)步,繼續(xù)迭代。
(6)將滿足條件的全局最優(yōu)粒子所對應(yīng)的核函數(shù)參數(shù)g和懲罰因子C,代入SVM模型中對其進(jìn)行分類評估。

圖7 PSO-SVM模型參數(shù)選取過程圖Fig.7 Process of parameter selection in PSO-SVM model
由圖7可知,粒子群優(yōu)化的SVM模型參數(shù)為核函數(shù)參數(shù)g=0.328 21,懲罰因子C=68.392 2。
對于PSO-BP模型,采用PSO算法優(yōu)化選取BP模型的參數(shù)值,BP網(wǎng)絡(luò)隱藏層神經(jīng)元個(gè)數(shù)為20,訓(xùn)練次數(shù)為500次。對于單獨(dú)SVM模型,采用交叉驗(yàn)證的方法來得到最優(yōu)參數(shù),并通過反復(fù)驗(yàn)證最終確定SVM模型的參數(shù)為:核函數(shù)參數(shù)g=0.15,懲罰因子C=50。
幾種模型對文山州石漠化風(fēng)險(xiǎn)最終評估精度見表4。由表4可見:PSO-SVM模型對文山州石漠化風(fēng)險(xiǎn)的評估精度為90%,高于單獨(dú)SVM模型的86%和PSO-BP模型的87%,表明本文所提出的評估模型精度更高。

表4 三種模型的評估精度(%)Table 4 Assessment accuracies of three models
本文采用PSO-SVM模型對文山州石漠化風(fēng)險(xiǎn)進(jìn)行綜合評估,經(jīng)PSO算法優(yōu)化的SVM模型參數(shù)為:核函數(shù)參數(shù)g=0.328 21,懲罰因子C=68.392 2。首先將GIS數(shù)據(jù)庫中的經(jīng)主成分分析后得到3個(gè)主分量指標(biāo)導(dǎo)入MATLAB軟件中,在MATLAB軟件中運(yùn)用PSO-SVM模型進(jìn)行研究區(qū)石漠化風(fēng)險(xiǎn)評估;再將評估結(jié)果返回GIS數(shù)據(jù)庫中,使用專題圖的形式展示石漠化風(fēng)險(xiǎn)程度分布狀況。文山州喀斯特石漠化風(fēng)險(xiǎn)程度綜合評估結(jié)果見圖8。

圖8 文山州喀斯特石漠化風(fēng)險(xiǎn)程度綜合評估圖Fig.8 Comprehensive assessment of risk for karst rocky desertification in Wenshan Prefecture
由圖8可以看出:從整體上看,文山州石漠化風(fēng)險(xiǎn)比較嚴(yán)重,需要加大綜合治理的力度,遏制石漠化現(xiàn)象進(jìn)一步向北部擴(kuò)展;文山州南部的石漠化風(fēng)險(xiǎn)明顯較北部嚴(yán)重,東西方向變化趨勢不明顯,其原因在于北部植被覆蓋度較高,土壤裸露率和基巖裸露率較低。可見,加強(qiáng)植樹造林、防止土壤流失對于遏制該地區(qū)石漠化擴(kuò)張具有重要的意義。
(1)石漠化風(fēng)險(xiǎn)評估的最大難點(diǎn)在于原始指標(biāo)數(shù)據(jù)的獲取,本文獲取的10個(gè)原始指標(biāo)數(shù)據(jù)主要來源于遙感影像和地形圖數(shù)字化,通過模型評估和野外實(shí)地調(diào)查,可以看出本文提出的評估模型可信度較高,評估結(jié)果從整體上反映了文山州喀斯特石漠化分布現(xiàn)狀,可為該地區(qū)石漠化治理提供依據(jù)。
(2)GIS在專題圖制作、空間分析和可視化方面運(yùn)用廣泛,而SVM在解決小樣本和非線性等模式識別問題中表現(xiàn)出特有優(yōu)勢。本文將GIS技術(shù)與PSO-SVM模型有機(jī)結(jié)合起來進(jìn)行喀斯特石漠化風(fēng)險(xiǎn)評估,表明該模型具有良好的模式識別和泛化能力,也表現(xiàn)出了優(yōu)越的評價(jià)性能和空間信息展示能力,適用于對石漠化風(fēng)險(xiǎn)進(jìn)行有效的評估。但同時(shí)也存在諸如SVM模型參數(shù)選取困難、計(jì)算量大、判別效率有待進(jìn)一步提高等問題。
[1]中國科學(xué)院地學(xué)部.關(guān)于推進(jìn)西南巖溶地區(qū)石漠化綜合治理的若干建議[J].中國科學(xué)院院刊,2003,18(4):165-169.
[2]王世杰.喀斯特石漠化概念演繹及其科學(xué)內(nèi)涵的探討[J].中國巖溶,2002,21(2):101-105.
[3]王世杰,李陽兵,李瑞玲.喀斯特石漠化的形成背景、演化與治理[J].第四紀(jì)研究,2003,2(6):657-666.
[4]蘇維詞.中國西南巖溶山區(qū)石漠化的現(xiàn)狀成因及治理的優(yōu)化模式[J].水土保持學(xué)報(bào),2002,16(2):29-32.
[5]周忠發(fā).貴州高原喀斯特石漠化遙感調(diào)查研究——以貴州省清鎮(zhèn)市為例[J].貴州地質(zhì),2001,18(12):93-98.
[6]閆滿存,王光謙,劉家宏.基于GIS的瀾滄江下游區(qū)滑坡災(zāi)害危險(xiǎn)性分析[J].地理科學(xué),2007,27(3):365-369.
[7]伊元榮,海米提·依米提,王濤,等.主成分分析法在城市河流水質(zhì)評價(jià)中的應(yīng)用[J].干旱區(qū)研究,2008,25(4):497-501.
[8]鄧乃揚(yáng),田英杰.數(shù)據(jù)挖掘中的新方法——支持向量機(jī)(第2版)[M].北京:科學(xué)出版社,2004:25-30.
[9]Shi,Y.,R.C.Eberhart.A modified particle Swarm optimizer[A].InProceedingsofIEEEInternationalConferenceonEvolutionaryComputation[C].Anchorage,Alaska,USA,1998:69-73.
[10]Wan,V.,W.M.Campbell.Support vector machines for speaker verification and identification[A].InNeuralNetworksforSignalProcessing-ProceedingsoftheIEEESignalProcessingSocietyWorkshop[C].Sydney,Australia,2000:775-784.
[11]唐川,朱大奎.基于GIS技術(shù)的泥石流風(fēng)險(xiǎn)評價(jià)研究[J].地理科學(xué),2002,22(3):300-304.