王萬賓,劉 芳,2,張星梓,劉岳雄,李 森
(1.云南省生態環境科學研究院環境規劃研究中心,云南 昆明 650034;2.云南師范大學旅游與地理科學學院,云南 昆明 650500)
2000年以來,云南省GDP進入高速發展時期,2000—2018年年均GDP增速為13.82%。與此同時,人口和經濟空間布局已發生重大變化[1-3],縣域年均GDP增速為6.61%~30.17%,年均人口增速分布在-0.7‰~4.9‰,經濟社會發展更聚集于滇中等片區。另外,云南省景觀格局已發生較大空間性變化[4],研究景觀格局變化與驅動因子之間的關系越發重要。廣義回歸神經網絡(GRNN)是基于徑向基函數網絡的一種改進,具有很強的非線性映射能力和學習速度,對處理不穩定數據具有較大優勢[5,6]。景觀格局指數與驅動因子之間的定量關系呈高復雜非線性。本研究構建云南省縣域主要景觀格局指數與其驅動因子之間的GRNN模型,以期為云南省景觀格局預測預警提供有效途徑。
云南省位于我國西南地區,地勢西北高、東南低,屬山地高原地形,平均坡度39.5°,坡度分布在0~79°。平均海拔3013.14 m,分布在 76 ~ 6151 m,縣域最大海拔差 4328.00 m,最小海拔差為654.00 m。云南氣候基本屬于亞熱帶高原季風型,立體氣候特點顯著,多年平均氣溫16.4℃,分布在5.8~23.85℃,月份上分布在9.300~21.62℃。多年平均降水量1148.39 mm,縣域上分布在563.9~2323.45 mm,月份上分布在14.07~223.94 mm。土地類型主要以耕地和林地為主,2018年分別約占流域總面積的19.52%和53.73%,但不同縣域差距較大,耕地占比分布在0.21%~41.64%,林地分布在22.13%~82.46%;建設用地分布在0.03%~32.05%,平均占比為2.30%。云南省多年平均河川水資源量2210億m3,人均占有水資源量4576.04 m3,總體水資源較為豐富,多年平均徑流深為545.88 mm,分布在107.20~2181.10 mm;2018年人口密度203.45人/km2,縣域在8.91~2806.67人/km2變化;經濟密度1154.52萬元/km2,縣域分布在31.93~27885.25萬元/km2。云南省區域發展非常不平衡,區位條件、資源稟賦、產業基礎差距較大,地形地勢、水資源及氣象氣候呈多復雜性及空間分異性。
云南省2000—2018年(2000年、2005年、2010年、2015年和2018年共5期)土地利用數據來源于中國科學院資源環境科學數據中心(http://www.resdc.cn),本研究采用二級分類系統數據,其中:一級類分為耕地、林地、草地、水域、建設用地和未利用土地6類,二級分類為水田、旱地、有林地、灌木林、疏林地、其他林地、高覆蓋度草地、中覆蓋度草地、低覆蓋度草地、河渠、湖泊、水庫坑塘、永久性冰川雪地、灘涂、灘地、城鎮用地、農村居民點、其他建設用地等。GDP、總人口數據、氣溫、降水量數據來源于云南省各年度的統計年鑒(http://stats.yn.gov.cn/tjsj/tjnj/)。數字高程模型(DEM)使用的是ASTER GDEM V2數據產品,空間分辨率30 m,數據來源于中國科學院計算機網絡信息中心地理空間數據云平臺。景觀格局通過景觀指數反映其結構組成和空間配置特征,其變化大體上可以從斑塊聚集度、破碎度、復雜度和多樣性四個大的方面來進行描述,本研究選取了密度及大小差異(PD),形狀指標(LSI CONTAGPAFRAC),多樣性指標(SHDISHEI),聚散性指標(SPLITAI)共8個指標表征云南省景觀格局狀態。選取影響景觀格局變化的主要自然社會驅動因子有人口密度、經濟密度、氣溫、降水量、平均海拔、海拔差、坡度等七個作為輸入因子。輸出因子為(PD),形狀指標(LSI CONTAGPAFRAC),多樣性指標(SHDISHEI),聚散性指標(SPLITAI)。利用Fragstats 4.2分別計算2000年、2005年、2010年、2015年和2018年云南省129個縣市區的8個景觀格局指數。所有數據均通過GIS空間計算分配至云南省129個縣(區、市)中,各指標計算公式[7]簡介見表1。

表1 景觀格局指數與驅動因子簡介
GRNN最早是由Specht提出的,是RBF神經網絡的一個分支,是一種基于非線性回歸理論的前饋式神經網絡模型[8]。
GRNN的結構如圖1所示,一般由輸入層、隱含層和輸出層組成。輸入層僅將樣本變量送入隱含層,并不參與真正的運算。隱含層的神經元個數等于訓練集樣本數,該層的權值函數為歐式距離函數(用||dist||表示),其作用為計算網絡輸入與第一層的權值IW1,1之間的距離,b1為隱含層的闕值。隱含層的傳遞函數為徑向基函數,通常采用高斯函數作為網絡的傳遞函數。網絡的第三層為線性輸出層,其權函數為規范化點積權函數(用nprod表示),計算網絡的向量為n2,它的每個元素就是向量a1和權值矩陣IW2,1每行元素的點積再除以向量a1的各元素之和得到的,并將結果n2提供給線性傳遞函數n2=purelin(n2),計算網絡輸出。

圖1 廣義回歸神經網絡的結構
基于2000—2018年共5a的云南省各縣區的景觀指標及其驅動因子數據,利用SPSS軟件中的偏相關分析,旨在找到影響云南省景觀指數變化的主要驅動因子。偏相關分析見表2。
從表2可知:影響PD的主要驅動因子排序為人口密度、經濟密度、海拔差、氣溫,自然因子和社會因子交錯影響斑塊密度變化,其中呈負相關的為經濟密度、海拔差、氣溫;影響LSI的主要驅動因子為人口密度、氣溫、平均海拔、海拔差、坡度,以自然因子影響為主;影響PAFRAC的主要驅動因子為氣溫、降水量、海拔差、坡度,以自然因子影響為主;影響CONTAG的主要驅動因子為人口密度、坡度,自然因子和社會因子交錯影響;影響SPLIT的主要驅動因子排序為人口密度、降水量、平均海拔、坡度,自然因子和社會因子交錯影響,其中呈負相關的為人口密度、坡度;影響SHDI的主要驅動因子為人口密度、氣溫、平均海拔、海拔差、坡度,自然因子和社會因子交錯影響;影響SHEI的主要驅動因子為人口密度、氣溫、平均海拔、坡度,自然因子和社會因子交錯影響,與SHDI指標類似;影響AI的主要驅動因子為經濟密度、氣溫、平均海拔、海拔差,自然因子和社會因子交錯影響。因子偏相關分析可知,由于各因子對景觀格局指數的影響存在較大不確定性和復雜性,一般線性回歸模型很難真正定量描述其之間的定量響應關系。

表2 景觀格局指數與驅動因子之間的偏相關分析
對于GRNN,學習樣本確定,則相應的網絡結構和各神經元之間的連接權值也隨著確定,與傳統的誤差反向傳統算法不同,GRNN的學習算法在訓練過程中不調整神經元之間的連接權值,而是改變平滑參數(SPREAD),從而調整模式層中各單元的傳遞函數,以獲得最佳的回灌估計結果[9]。SPREAD值越小,網絡對樣本的逼近性就越強; SPREAD 值越大,網絡對樣本數據的逼近過程就越平滑,但誤差也相應增大。在實際應用時,為了選取最佳的SPREAD值,一般采取循環訓練的方法,從而達到最好的預測效果。采取交叉驗證方法訓練GRNN神經網絡,利用循環4次方法找出最佳的SPREAD。本研究共有輸入輸出數據645個樣本,選取2000年、2005年、2010年、2015年作為網絡的訓練數據,2018年的數據作為網絡的檢驗數據。基于Matlab 2018a平臺,利用函數newgrnn()等函數進行編程進行升級網絡模擬。選用平均方差(MSE)、可決系數(R2)來計算和評估模型的誤差。當SPREAD值設置為0.1時,測試數據的預測較好。
2018年檢驗數據各景觀格局指數指標模擬值和計算值示意圖見圖1,模擬誤差R2和MSE見表3。從圖2可知:GRNN神經網絡模型能較好定量描述PD、LSI、CONTAG、SPLIT、SHDI、SHEI、AI與驅動因子之間的高度非線性關系,其平均R2分別為0.80、0.86、0.89、0.84、0.90、0.88、0.81,MSE分別為0.01、15.03、1.52、135.70、0.004、0.001、0.19, 而 PAFRAC 與驅動因子之間的關系模擬較差,其R2為0.28,MSE分別為0.003。從表3可知:模擬10次檢驗樣本的R2和MSE變化均較小,證明GRNN模型模擬云南省驅動因子與景觀格局指數之間的關系穩健性較好。

圖2 景觀格局指數模擬值與計算值對比示意圖

表3 景觀格局指數模擬R2與MSE
GRNN神經網絡模型能較好定量描述云南省縣域景觀格局指數PD、LSI、CONTAG、SPLIT、SHDI、SHEI、AI與驅動因子之間的高度非線性關系,其平均R2分別為0.80、0.86、0.89、0.84、0.90、0.88、0.81。本研究提出的基于廣義回歸神經網絡的景觀格局預測方法預測效果較好,應用于地區景觀生態安全格局預警具有廣泛前景。