謝非凡 張世濤 黃威
摘? 要: 通過C#編程語言與ArcEngine開發引擎編寫一種BP神經網絡的滑動窗口算法,實現活躍火頻次預測。對中南半島五國活躍火進行建模,預測2020年活躍火頻次并與實際對比。經過多次迭代實驗,結果表明,模型程序在誤差小于0.8或學習訓練次數大于8000作為單次結束條件時具有優良的預測效果。
關鍵詞: 神經網絡; 活躍火; 機器學習; 中南半島
中圖分類號:TP399.4? ? ? ? ? 文獻標識碼:A? ? ?文章編號:1006-8228(2023)09-124-05
Research and implementation of BP neural network sliding window algorithm
in active fire spatiotemporal prediction model
Xie Feifan, Zhang Shitao, Huang Wei
(Faculty of Land and Resources, Kunming University of Science and Technology, Kunming, Yunnan 650000, China)
Abstract: A sliding window algorithm for BP neural networks is developed using C# programming language and ArcEngine development engine to predict active fire frequency. Active fires in five countries on Indochina Peninsula are modeled to predict the frequency of active fires in 2020 and compare with the actual situation. The results of several iterations show that the model program has a good prediction effect when the error is less than 0.8 or the number of learning training is more than 8000 as a single end condition.
Key words: neural network; active fire; machine learning; Indochina Peninsula
0 引言
活躍火(Active fire)是全球生態系統碳循環的重要因素,亦是影響大氣污染、公共安全、生物多樣性等重要因素之一。活躍火在地球表面的大部分地區均產生重要的生態作用,是全球氣候變化與森林生態系統反饋的關鍵因子[1-2]。熱帶活躍火在全球的發生頻率日益加劇,已對全球陸生、水生和大氣系統造成重大影響[3]。 在微觀尺度上,活躍火通過植被燃燒、溫度升高改變土壤的理化性質,直接影響植被生長[4-5],從而改變植被和土壤的結構和組成[6]。全球每年由火災引起的碳排放量可達2~4Pa,是每年化石燃料的50%。因此,預估和預測活躍火,對大氣環境治理及檢測評估等具有重要的參考價值[7]。中南半島山區歷來有刀耕火種的農業耕作傳統,且山地移民的增加又進一步提高了刀耕火種的利用強度,從而加劇了植被焚燒與森林野火的發生概率[8-9]。美國火災信息資源管理系統(FIRMS)提供了近乎實時的活躍火位置矢量產品數據,已被各個領域研究者廣泛應用[10]。其數據質量得到了廣泛的認可,但在挖掘此矢量數據信息時,研究人員更多的是在統計分析層面來解析數據,缺乏更為深層次的數據挖掘方法與技術手段[11-15]。因此從時間和空間上建模進而預測是非常有意義和有必要的。
目前BP神經網絡已經在許多領域得到應用,理論上BP神經網絡可以逼近任何復雜的函數[16-17]。技術人員和研究人員設計的神經網絡算法模型對火災的預測需要大量的火災影響因子數據進行訓練學習[18-19],小區域研究范圍內的研究取得了不錯的預測效果,但針對大區域面積的研究時,獲取各種相關因素數據存在許多困難。因此本文提出一種次優的基于BP神經網絡的滑動窗口算法對東南亞活躍火頻次進行預測。本文相關研究成果可以對大尺度空間范圍活躍火進行預測評估,希望能為同行提供參考,為活躍火相關因子評估分析提供科學的啟發與思考。
1 源數據整理
從NASA FIRMS分別下載了中南半島五國(柬埔寨,老撾、緬甸、泰國、越南)2000年至2020年的MODIS與VIIRS活躍火矢量數據。MODIS的歷史數據更加充足,更加的有利于下文的神經網絡訓練學習建模,剔除MODIS數據缺失的時間段,最終選用MODIS產品2010年至2020年的數據作為我們的研究源數據,通過GIS軟件強大的空間數據統計分析能力做了初步的統計處理,統計表如表1所示。
據統計,2010年至2020年間柬埔寨活躍火頻次總數達3.80591×105次,老撾達4.42116×105次,緬甸達6.97154×105次,泰國達3.04636×105次,越南達2.09489×105次。緬甸活躍火每年頻次總數均大于其他四國,且走勢較為陡峭,在2010年達到峰值,其他四國數據波動較為平緩,越南每年活躍火頻次均低于其他四國。在2010至2011年中南半島各國活躍火頻次均在降低,在2018年至2019年均在上升,我們認為可能是某種大環境因素導致其同步變化(圖1)。11年間柬埔寨活躍火總頻次密度約為1.4074次/km2,老撾約為1.3527次/km2,緬甸約為0.8469次/km2,泰國約為0.4364次/km2,越南約為0.4198次/km2。在密度分布上柬埔寨、老撾、緬甸走勢較為陡峭,越南與泰國較為平緩,其數據的平滑性更有利于下文神經網絡在時間序列的函數擬合(圖2)。
通過整理發現柬埔寨活躍火頻次密集時間段在每年的1月、2月、3月、12月,老撾活躍火頻次密集時間段在3月和4月,緬甸集中在2月、3月、4月,泰國集中在1月、2月、3月、4月、12月較為平滑,泰國集中在2月、3月、4月。根據這一數據特征,可以將每個國家的數據按此特征分為兩組作為滑動窗口神經網絡算法的處理數據集,目的是為了訓練的數據集在數據上更加的平滑,為BP算法計算各參數值時減輕負擔。
2 數據構型
火災的發生有人為因素和自然因素,火災是一個復雜的物理過程,選用具有處理復雜非線性問題的BP神經網絡模型建立其預測模型是非常必要的。傳統的神經網絡學習需要大量數據進行訓練學習,在小尺度空間范圍時,據有關實驗表明,其在諸多領域具有良好的預測效果,但面對大尺度空間范圍時,往往會因為數據的收集困難導致實驗難以繼續,或因數據不足導致訓練效果較差,實驗誤差大。因此我們采用本文提出的次優的基于滑動窗口神經網絡算法,分別對中南半島的柬埔寨,老撾、緬甸、泰國、越南五個國家數據進行了總量的預測和分網格的預測,采用局部和整體混合驗證模型,以保其精確度。
2.1 BP神經網絡
神經網絡是對人腦神經工作過程進行抽取模擬出的,類似于大腦神經突觸聯接的結構進行信息處理的數學模型。BP神經網絡模型拓撲結構包括輸入層、輸出層和多個隱層,BP算法的學習過程,由信息的正向傳播和誤差的反向傳播兩個過程組成。理論上隱層只要足夠多就可以逼近任意復雜的非線性函數。三層神經網絡結構如圖3所示。
神經網絡中的訓練或者學習,旨在求解所要解決問題的網絡模型中的參數,這些參數包括神經元之間的連接權重(w1,w2..wxm)以及偏置等,偏置的存在可以更好的擬合數據。根據不同的實際問題,設計者所構造出來的網絡模型是不同的,為了求出這些參數,往往需要算法進行學習和訓練來迭代找出最優的參數,BP算法就是現在應用最為廣泛的和成功的算法之一[20]。
2.2 數據設計
本實驗首先對柬埔寨,老撾、緬甸、泰國五個國家活躍火數據按月進行統計標記,統計完成后按時間序列進行滑動窗口數據設計,以此形成一種次優的基于滑動窗口神經網絡結構進行訓練學習。訓練數據組織排列方式如下:
[x1x2x3x4x5x2x3x4x5x6……………xn-4xn-3xn-2xn-1xn] ⑴
X1至Xn為每個國家按月統計的活躍火頻次數據,按照以上數據排列方式進行訓練,值得注意的是此處的滑動窗口設計的數據列數可以根據實際需求調整,未來輸出的個數來決定。研究區按(10km×10km)劃分格網,每個格網里以月為單位統計活躍火頻次,以每個格網為單位進行訓練學習,預測出每個格網的結果,對每個國家的結果進行累加,與整體的預測結果進行對比驗證小于閾值時輸出結果。
3 模型
3.1 模型設計
本預測模型需要通過GIS軟件進行初步的數據統計與整理,篩選出時間與空間數據序列,其次將統計后的數據作為預測模型的輸入數據,預測模型核心利用.NET Framework框架通過c#(sharp)編程語言與ArcEngine開發引擎編寫而成,神經網絡搭配使用AForge.NET庫。AForge.NET主要用于計算機視覺、人工智能、機器學習、圖像處理、機器人等領域。一種次優的基于滑動窗口神經網絡算法對東南亞活躍火頻次進行預測,極大的降低了對多元數據的要求,擴大了其應用場景與廣度。通過以上數據的整理構建東南亞活躍火頻次預測模型,通過交叉驗證的方法對網絡訓練進行進一步的控制以提高預測精度。中南半島活躍火頻次預測模型包含對原始數據整體的時間序列整理,對劃分網格后的各網格內活躍火頻次按時間序列整理,對神經網絡模型的建立,對兩次預測模型的閾值設置與評判。BP神經網絡的建立包括對原始數據的歸一化處理、初始化權重、激活函數的選擇、網絡模型的構建、網絡訓練。中南半島活躍火頻次預測模型構架圖如圖4所示。
3.2 模型實驗與結果
本文通過中南半島活躍火頻次預測模型在時間上以時間序列月為單位組織數據結構,在空間上通過格網10km*10km進行劃分,在統計數據的基礎上應用模型對2020年實際數據與模型的輸出數據進行了實驗對比。數據每個格網的時間尺度序列數據為輸入,將結果和實際值及誤差數據通過GIS軟件可視化出圖。統計每個格網的實際值,根據2020年活躍火頻次數量填充格網顏色得到活躍火頻次圖(圖5),通過模型預測的頻次數量統計得2020年活躍火預測頻次圖、誤差圖(圖6、圖7),實驗表明該模型有較好的穩定性、準確性。可為大尺度的活躍火預測評估提供科學的數據支撐。
4 結束語
本文對中南半島五國2020年活躍火進行建模預測并與實際對比,單格網內誤差絕對最大為8。經過多次迭代實驗測試結果表明,單個格網模型程序在誤差小于0.8或者學習訓練次數大于8000作為單次結束條件具有優良的預測效果。值得注意的是,在做參數優化時誤差不能設定的太小,作者在參考其他學者的研究時發現,有學者將其設置為很小,這可能會導致程序假死陷入無線循環導致無法結束。一種次優的基于滑動窗口神經網絡算法設計目的是在沒有相關因子情況下,科學的對數據未來趨勢進行預測評估,是一種適用于空間大尺度區域的預測算法,是一種適應于實際生產需求的次優的算法。本文通過編程語言合理的設計模型并對中南半島2020年活躍火頻次進行了預測,實驗效果良好。此模型雖然減少了數據的輸入量,但是與多因子模型相比精度會低一些。
參考文獻(References):
[1] 李鵬,李文君,封志明,等.基于FIRMS MODIS與VIIRS的東南亞活躍火頻次時空動態分析[J].資源科學,2019,41(8):1526-1540.
[2] 劉穎,李鵬,肖池偉,等.中南半島旱季VIIRS活躍火的空間特征與國別差異[J].地理科學進展,2021,40(8):1406-1418.
[3] Leigh B. Lentile,Zachary A. Holden,Alistair M. S. Smith,el al.Remote sensing techniques to assess active fire characteristics and post-fire effects[J]. International Journal of Wildland Fire,2006,15(3).
[4] U. Choromanska,T.H. DeLuca. Microbial activity andnitrogen mineralization in forest mineral soils following heating: evaluation of post-fire effects[J]. Soil Biology and Biochemistry,2002,34(2).
[5] He Han,ChangYu,LiuZhihua,et al. Evaluations on theConsequences of Fire Suppression and the Ecological Effects of Fuel Treatment Scenarios in a Boreal Forest of the Great Xing'an Mountains, China[J]. Forests,2023,14(1).
[6] Charles W. McHugh,Thomas E. Kolb. Ponderosa pinemortality following fire in northern Arizona[J]. International Journal of Wildland Fire,2003,12(1).
[7] 劉怡媛,李鵬,肖池偉,等.老撾VIIRS活躍火的主要自然地理要素特征[J].地理研究,2020,39(3):749-760.
[8] 廖諶婳,封志明,李鵬,等.緬老泰交界地區刀耕火種農業的時空變化格局[J].地理研究,2014,33(8):1529-1541.
[9] 李文君,肖池偉,封志明,等.2015年厄爾尼諾年東南亞主要國家活躍火發生類型與影響分析[J].自然資源學報,2020,35(10):2539-2552.
[10] 薛乃婷,張震,杜志恒,等.北極地區活躍火的時空分布格局分析[J].極地研究,2020,32(4):555-564.
[11] 李軍,張志東,喬元健,等.基于自適應集成神經網絡的火災預測方法[J].消防科學與技術,2020,39(12):1727-1731.
[12] 薛乃婷,張震,杜志恒,等.北極地區活躍火的時空分布格局分析[J].極地研究,2020,32(4):555-564.
[13] 楊偉,姜曉麗.森林火災火燒跡地遙感信息提取及應用[J].林業科學,2018,54(5):135-142.
[14] 丁青,馮險峰.歐亞北方森林MODIS14數據的林火變化分析——以俄羅斯歐洲地區為例[J].地球信息科學學報,2013,15(3):476-482.
[15] 胡超.基于BP人工神經網絡的區域森林火災預測研究[D].浙江:浙江海洋學院,2015.
[16] 史一通.基于BP神經網絡的城市區域火災風險評估模型研究[D].四川:西南交通大學,2018.
[17] 汪文野,劉靜,賈南.基于神經網絡的森林火災預測分析[J].武警學院學報,2020,36(6):15-20.
[18] 李曉明,顧鈺培,張俊濤.一種滑動窗口的GPS軌跡點地圖匹配算法[J].西安工業大學學報,2017,37(6):459-462.
[19] 南虎,路璐,麻曉晶,等.基于卷積神經網絡的滑動窗口算法在高分辨電鏡圖像中的應用[J].電子顯微學報,2021,40(3):242-250.
[20] 王亞琴,王耀力,郭學斌,等.基于直連BP神經網絡模型的森林火險預測[J].森林防火,2018(2):41-45,54.