涂云燕,彭道黎
基于神經網絡的森林蓄積量估測
涂云燕,彭道黎
(北京林業大學,北京 100083)
在前人研究中還沒有把基于BP與RBF神經網絡的森林蓄積量預測模型的應用效果進行評價。擬在實際應用中對兩種方法進行綜合分析與評價,找到一種預測精度更高、適用性更強的方法。采用相關分析法選定郁閉度、陰坡、陽坡、TM1、TM2、TM3、TM5、TM7、NDVI、TM(4-3)、TM4/3為輸入變量,以密云縣森林蓄積量為輸出變量,建立蓄積量估測的RBF與BP神經網絡模型。并從神經網絡的訓練步長、訓練時間、預測精度、模型適用性對二者進行了綜合分析,RBF神經網絡無論是在訓練步長、訓練時間、預測精度、模型適用性上都優于BP神經網絡模型。
BP神經網絡;RBF神經網絡;綜合分析與評價;北京密云縣;森林蓄積量預測
人工神經網絡是通過模仿動物神經網絡行為特征,進行分布式并行信息處理算法的數學模型。這種網絡依靠系統的復雜程度,通過調整內部大量節點之間相互連接的關系,從而達到處理信息的目的。通過預先提供一批相互對應的輸入、輸出數據,進行訓練,分析掌握兩者之間潛在的規律。最終根據這些規律,用新的數據數據來推算輸出結果,以此進行預測精度的分析[1]。人工神經網絡不斷應用于經濟領域預測、證券預測分析、氣象、農業等研究中,并都取得了一定的效果。由于人工神經網絡具有大規模并行處理、容錯性、自適應和聯想功能強等特點,作為非線性智能預測方法的人工神經網絡預測將成為森林蓄積量預測研究的一個熱點。
目前,在森林蓄積量估測中的神經網絡有BP與RBF[2]。但針對二者的應用效果比較還沒有研究。神經網絡模型的優良評價,與傳統回歸擬合評價不同(主要根據殘差,擬合優度等),不是體現在其對已有數據擬合能力上,而要從訓練步長、時間、效率,以及對后來的預測能力,即泛化能力。但不管哪種模型對適用性檢驗還是有必要。
密云縣 ( 116°39 ′33″ ~ 117°30 ′25″ , 40°13 ′ 7″~ 40°47 ′57″) 位于北京市東北部,屬燕山山地與華北平原交接地,是華北通往東北、內蒙古的重要門戶。東南至西北依次與本市的平谷、順義、懷柔三區接壤,北部和東部分別與河北省的灤平、承德、興隆三縣毗鄰。屬暖溫帶半濕潤半干旱大陸性季風氣候區,四季分明,年平均氣溫10 ℃,年平均降雨量約660 mm,降雨主要集中在6~9月。其植被屬于針闊混交林森林植被帶,現存植被主要為人工林以及一些次生植被類型。主要森林類型有:側柏林Platycladus orientalis、油松林Pinus tabulaeformis、 櫟 林Quercus spp.、 刺 槐Robinia pseudoacacia、楊樹 Populus spp.、樺木Betula spp.、核桃楸Juglans mandshurica、五角楓Acer mono等。
數據來自密云縣2006年一類調查樣地的101個測樹點。遙感影像來自2006年北京TM遙感圖像,該數據多光譜數據30 m。利用ERDAS對其進行線性變換、幾何校正,校正誤差在一個像元內。并利用密云縣行政區界進行不規則剪切得到密云縣2006年TM影像。并在GIS中提取各波段灰度值,結合一類調查資料及相關檔案材料,ARCGIS、ERDAS.IMAGE 8.6、SPSS等軟件,對數據進行處理。
此次的試驗中一類調查的101個樣地點,均勻分布。選取了61個樣地作為訓練數據,用剩下的40個樣地作為新數據進行預測,并將實測值與模型預測值進行模型適用性檢驗與精度分析。
通過影響森林蓄積量的因子進行相關性分析,與森林蓄積量蓄積量相關性較好的因子有:郁閉度、 陰 坡、 陽 坡、TM1、TM2、TM3、TM5、TM7、NDVI、TM(4-3)、TM4/3。
將這些因子作為蓄積量估測的自變量。
BP網絡是也是一種多層前向型神經網絡,具有三層或三層以上的神經網絡。包括輸入層、隱層和輸出層,可有一個或多個sigmoid隱層和線性輸出層,每層由多個神經元組成。當一組學習樣本提供給網絡后,神經元的激活函數從輸入層經各中間層向輸出層傳播,在輸出層的各神經元獲得網絡的輸入響應[3]。接下來,按照減少目標輸出與實際誤差的方向,從輸出層經過各中間層逐層修正各連接權值,最后回到輸入層,這種算法稱為“誤差反向傳播算法”。隨著這種誤差逆的傳播修正不斷進行,網絡對輸入模式相應的正確率也不斷上升,得到合適的網絡鏈接值后便可對新樣本進行非線性映像[4]。但BP神經網絡中學習速率的選擇是一項有挑戰性的工作,過高的學習速率會導致學習過程的不穩定,過低會導致訓練消耗過長的時間。一般選擇為0.01~0.1之間的值,再根據訓練過程中梯度變化和均方誤差變化值來確定[5]。同時BP神經網絡對于隱層中的神經元個數敏感。隱層中神經元數目太少,可能導致訓練不適性,步長很長也不能達到訓練精度要求,就算達到訓練精度要求,也不足以存儲訓練樣本蘊含的所有規律。而太多增加網絡訓練時間,會將樣本中非規律內容如干擾和噪聲存儲進去,反而降低泛化能力。
RBF神經網絡屬于多層前向型神經網絡。通常由輸入層、隱層、輸出層3個神經元層組成。隱含層節點中的作用函數(最常用的是高斯函數)對輸入信號在局部產生響應,即每一個RBF神經元層都會根據輸入向量與神經元權值向量的距離產生一個輸出[6]。相對于BP神經網絡往往需要更多的神經元,但它的訓練速度更快,在輸入向量樣本數目較多的情況下,RBF網絡的效果是很好的。
3.1.1 RBF神經網絡設計與訓練
本文的RBF與BP神經網絡模型的構建和訓練是通過MATLAB環境下開發的神經網絡工具箱實現的。
首先對數據進行歸一化
[pn,minp,maxp,tn,mint,maxt]=premnmx(p,t)。 (1)式(1)中:P為輸入自變量,t為蓄積量,pn、tn為歸一化數據。
利用MATLAB工具箱提供的newrb以迭代的方式生成一個散步常數為1,顯示頻率為1,誤差值為0.01,隱層最大神經元數為80的RBF神經網絡。
spread=1;
goal=0.01;
df=1;mn=80;
net=newrb(pn,tn,goal,spread,mn,df)
經過不斷學習和訓練,綜合考慮訓練時間、預測精度得到的圖1的訓練結果為最佳訓練結果。該圖中訓練步長在32時達到了訓練精度,可知該網絡學習速度快。

圖1 RBF網絡訓練均方差與訓練步數關系Fig.1 Relationship of training mean square error and training step length of RBF neural network
3.1.2 RBF模型精度與適應性檢驗
將剩下的40個樣地數據作為新數據,用該RBF神經網絡進行預測,并與實測數據進行比較,預測精度達到了89.71%。新數據預測程序如下:
pn =premnmx(p)
an1 =sim(net,pn);
an =postmnmx(an1,mint,maxt)
premnmx()是對數據進行歸一化,postmnmx()是對數據進行還原。
采用F檢驗對模型適用性進行分析。用實測值與預測值組成成對值,建立線性回歸方程y=a+bx,如果模型擬合的很好,常數項a和回歸系數b就分別趨近于0和1。利用樣地調查蓄積量實測值為自變量x,本研究建立的RBF模型所計算出來的林分蓄積量為因變量y,建立二者的線性回歸方程:y=0.517+0.732x相關系數R2為0.525。通過F檢驗,Sig=0.000小于0.01,結果表明:在α=0.01可靠性條件下,模型估測林分蓄積量理論值與外業調查實測值無顯著差異。
3.1.3 BP神經網絡設計與訓練
采用MATLAB自帶的newff()函數創建一個網絡拓撲結構為11:20:1的三層BP神經網絡,即輸入曾層神經元個數為11(自變量個數),隱層神經元個數為20,本次試驗時神經元個數通過不斷調整得到最佳個數為20。當神經元個數過小時,訓練步長到1000步以上,訓練精度也達不到要求。神經元個數太多時,訓練步長很短,擬合度也高,但用新數據對其進行預測時,導致過擬合現象,擬合精度很高,但樣本成對值不滿足F檢驗。輸出層一個神經節點。創建的BP神經網絡函數是newff(),網絡第1、第2層的神經元轉換函數為tansig(),第3層的轉換函數是purelin(),訓練函數用共軛梯度法trainscg(),網絡仿真函數sim()。其程序如下:
[pn,minp,maxp,tn,mint,maxt]=premnmx(p',t');
net=newff(minmax(pn),[20,1],{'tansig','purelin'},'trainscg');

圖2 BP網絡訓練均方差與訓練步數關系Fig.2 Relationship of training mean square error and training step length of BP neural network
net.trainParam.show=500;
net.trainParam.lr=0.01;
net.trainParam.epochs=500;
net.trainParam.goal=0.01;
net=init(net);
[net,tr]=train(net,pn,tn);
an=sim(net,pn);
a=postmnmx(an,mint,maxt)
圖2中訓練步長在58時達到了訓練精度,可知該網絡學習速度沒有RBF學習速度快。
3.1.4 BP神經網絡精度與適用性檢驗
用該BP神經網絡進行預測,并與實測數據進行比較,預測精度達到了88.0%。建立的線性回歸方程:y=0.621+0.749x相關系數R2為0.519。
3.1.5 RBF與BP 神經網絡綜合比較
在訓練精度一致的條件下,兩種模型的比較表1所示。

表1 RBF與BP 神經網絡綜合比較Table 1 Comprehensive comparison of RBF and BP neural network
從表1可知,在相同的訓練精度下,RBF的訓練時間與訓練步長都優于BP網絡,對相同的預測樣本RBF預測精度高于BP,但兩種模型的適用性沒什么差別。
BP神經網絡的學習速率、隱層神經元個數要根據實際情況確定,且訓練函數的選擇也受樣本數據的限制。若應用恰當,預測精度、模型適用性將比RBF高,但實際應用中很難找到三者的最佳結合。對隱層神經元個數確定[7,8],徐廬生、高大啟提出了根據輸入節點與輸出節點數目決定隱層神經元個數的初始值公式,根據初始值公式得到初始值后,利用逐步增長或逐步修剪法。即先從一個較簡單的網絡開始,若不符合要求則逐步增加隱層單元數到合適為止;或從一個較復雜的網絡開始逐步刪除隱層單元,直到符合要求。
針對密云縣具體情況,篩選與蓄積量存在較好相關性的因子作為神經網絡模型輸入變量,蓄積量為輸出變量。建立了密云縣森林蓄積量的RBF與BP神經網絡模型。并從神經網絡的訓練步長、訓練時間、預測精度、模型適用性對二者進行了綜合分析,RBF神經網絡無論是在訓練步長、訓練時間、預測精度、模型適用性上都優于BP神經網絡模型。所以本文選擇RBF神經網絡作為密云縣森林蓄積量估測模型,預測精度為89.71%,模型適用性較強,可用于密云縣森林蓄積量估測。
[1] 朱 凱,王正林.精通MATLAB神經網絡[M].北京:電子工業出版社, 2010.
[2] 程武學,楊存建,周介銘,等.森林蓄積量遙感定量估測研究綜述[J].安徽農業科學, 2009, 37(16):7746-7750.
[3] 胡淑萍,余新曉,王小平,等.人工神經網絡在流域植被類型優化中的應用[J].北京林業大學學報, 2008, 30(增刊2): 1-5.
[4] 高 丹,遲道才,王鐵良.基于MATLAB神經網絡的水稻需水量的預報模型[J].沈陽農業大學學報, 2005, 36(5): 599-602.
[5] 桂現才.BP神經網絡在MATLAB上的實現與應用[J].湛江師范學院學報, 2004, 6, 3(25):79-83.
[6] 高 寧,張建中.MATLAB在RBF神經網絡模型中的應用[J].農業網絡信息 , 2009(2):110-111,116.
[7] 徐廬生.微機神經網絡[M].北京:中國醫藥科技出版社,1995.
[8] 高大啟.有教師的線性基本函數前向三層神經網絡結構研究[J].計算機學報 ,1998, 21(1): 80-85.
Prediction of forest stock volume based on neural network model
TU Yun-yan, PENG Dao-li
(Beijing Forestry University,Beijing 100083,China)
BP and RBF neural network to predict forest stock volume of have been studied, but the study in evaluating the both networks’application effects didn’t conduct.In order to find a higher forecast precision,more strong applicative method, in the practical application,the comprehensive analysis and evaluation on the two methods were carried out.By the correlation analysis, and selecting crown density,shady-slope and sunny-slope.TM1 TM2, TM3, TM5, TM7, NDVI, TM, (4-3), TM4/3 as input variables, the volume of forest of Miyun county as output variables, RBF and BP neural network model for the volume of forest were established.And the neural network training step length, training time, prediction accuracy and the applicability model of the two methods were comprehensively analyzed.The results show that in the aspacts of the training step length, training time, prediction accuracy and the applicability, the model of RBF neural network model is superior to BP neural network model.
BP neural network; RBF neural network; Analysis and evaluation comprehensively; Beijing Miyun county; Volume of forest forecast
S757
A
1673-923X(2012)03-0049-04
2012-01-30
國家“十一五”科技支撐計劃課題(2006BAD23B05);國家級推廣項目(201145)
涂云燕(1986—),女,貴州仁懷人,碩士研究生,主要從事森林資源監測與評價的研究;電話:15201436678;E-mail:yunyantu@163.com
彭道黎,教授,博士生導師,主要從事森林環境監測與評價研究;E-mail:dlpeng@bjfu.edu.cn
[本文編校:歐陽欽]