摘? 要:文章研究利用改進的機器學習理論與算法,建立針對森林火險因子大數據的深度約簡機制,旨在對現有森林火險預警模型中重要的火險因子進行過濾和修正,以更為充分地剔除規模較大的火險因子大數據中冗余的、無效的數據,并且利用改進的人工魚群算法對過濾約簡得到的關鍵火險因子進行補償修正。為基于大數據的、有效的森林火險預測預防方法及對策奠定重要基礎。
關鍵詞:森林火險因子;機器學習;大數據
中圖分類號:TP181? ? ? ?文獻標識碼:A 文章編號:2096-4706(2020)01-0086-02
Abstract:A deep reduction mechanism for forest fire risk factor big data is established to filter and correct the important fire risk factors in the existing forest fire risk warning model using the improved machine learning theory and algorithm in this paper,which is aimed at eliminating the redundant and invalid data with large scale in the fire risk factor big data more fully. Meanwhile,a modified artificial fish swarm algorithm is used to compensate and correct the key fire risk factors obtained by the filter reduction. It lays an important foundation for effective forest fire risk prediction prevention methods and countermeasures based on big data.
Keywords:forest fire risk factor;machine learning;big data
1? 研究背景
隨著大數據時代的來臨,森林火險預警系統需要分析的森林火險因子數據逐漸增多。如何聚類這些火險因子并分析其對于森林火險的影響程度,對森林火險的預測準確度以及火勢發展趨勢等都尤為關鍵。由于數據龐大、干擾數據眾多,在建立森林火災預警模型之前,對各類火險因子的數據分析與處理就顯得尤為關鍵。本文采用灰色關聯分析與模糊集理論,研究利用改進算法的神經網絡建立針對森林火險因子大數據的深度約簡機制,旨在從橫向和縱向對火險因子進行過濾和修正,利用多種機器學習算法建立深度約簡機制。人工神經網絡具有自組織、自學習和泛化能力,無需考慮數學模型的內部結構、不需假設前提條件和人為地確定因子權重就可對林火等非線性現象的任意非線性函數進行逼近和模擬。但是處理大數據時,神經網絡自身易陷于最小化和收斂速度慢的情境。因此,新時期應在前人研究的基礎上,結合當今的計算機科學技術和各種類型的大數據,為森林火險的預警建立動態改良的機制,提高森林火災預測的準確率,為開展生態安全防護工作提供更加豐富的對策支撐,使因森林火災造成的損失最小化。
在大數據時代,各行各業為了適應新的需要,都已經在建立專業的大數據的對策方面開展相關工作。林業相關部門也已經提出建立建成森林、濕地、荒漠等林業資源大數據采集、分析、預測和應用的一體化林業智慧決策機制。充分發揮大數據的作用,深化林業智慧決策機制的建立意義,實現森林、濕地、荒漠等林業資源大數據的預測和分析應用是未來的研究重點,也是森林防火研究的實際應用價值所在。
2? 研究現狀
森林火險預警是一個集不同影響因素于一體的復雜機制,森林火險因子大數據為其主要研究對象。目前對森林火險預警模型研究主要也集中在森林火險因子大數據分析技術的開發與研究上。我國在森林火險預警方面的研究起步較晚,但發展迅速。隨著科技的進步與發展,我國的森林火災預警的研究仍然在不斷開拓與完善。尤其在基于森林火險因子大數據分析的預警機制研究上已經取得了一定的成果。
國內對森林火險因子大數據技術的分析研究中,大部分學者都認為濕度、溫度和風速是影響林火發生的三個主要的火險氣象因子,并對相關的氣象因子在林火預測中的權重進行分析[1];還有一些學者以森林植被類型和林地面積資料等相關因子為基礎,進行各區域的森林火險劃分;還有運用衛星遙感獲取到的火點位置信息與氣象數據來推演火災的動態變化(蔓延方向、火燒面積及強度)的研究[2];此外,一些先進國家已經形成的成熟技術,比如加拿大森林火險氣候指數(Fire Weather Index,FWI),也被用來研究我國森林火災的等級劃分,已經得到了較好的研究成果[3]。除了這些可檢測到的森林綠度和氣象因子,還有因吸煙、祭祀等野外用火以及農耕、生產用火等人為影響的火險因子的相關研究也有報道[4]。事實上,我國對于森林火災預警模型的指標體系還沒有完全形成,本文也希望建立一種改進的神經網絡模型,并對各類火險因子進行聚類與篩選,以提高預警模型的預測精度。
在處理規模較大的數據時,粗糙集理論能夠識別和抽取出其中隱含的、潛在的、有意義、有價值的數據,去掉冗余的、無效的數據。基于此,許多學者利用粗糙集理論對預處理神經網絡的輸入數據進行簡化,以提高神經網絡算法的預測率。但是這些研究只考慮到了縱向維度的約簡,即各類指標對預測結果的影響,而忽略了橫向維度的數據。對輸入數據的約簡并不徹底,仍然會出現部分無關的、冗余的數據,這樣可能會造成人工神經網絡出現過度學習等情況,從而影響模型的預測精度。
由此可見,雖然許多專家與學者運用各種數據挖掘方法對森林火險因子大數據分析各個方面進行研究,但是對于各種類的火險因子的收集以及篩選的研究略顯不足。而且大多選用人工智能對森林火險進行預警的研究,都沒有進行模型參數的選擇分析與優化。因此,本文對森林火險因子大數據深度約簡機制的探討具有很強的理論與現實意義。
3? 研究機制
3.1? 重要的火險因子的過濾機制
在森林火險預警系統中,影響森林火險的因子眾多。如果將這些火險因子全部導入預測模型中,會造成模型的冗余、運行速度變慢以及預測精度下降等問題。所以模型進行預測之前,大數據的預處理與因子篩選是一項重要的工作。在可燃物因子、氣象因子、火源以及火災歷史數據等火險因子中,有不少火險因子在預測劃分森林火險等級時具有相關性。本文可以通過灰色相關分析與模糊集理論篩選出在特定區域或環境下具有代表性的火險因子。這樣通過小部分的參數就可以對森林火險進行有效預警,以提高模型的準確度。在保持信息的決策能力不變的前提下,可以剔除輸入大數據中不必要的一些數據來建立動態有效的森林火險因子體系。
3.2? 關鍵火險因子的補償修正機制
在特定區域或環境下具有代表性的火險因子通常具有不同程度的相關性。通過將人工魚群算法中魚群初始化方式、視野和步長以及擁擠度因子的適用于過濾得到的火險因子的研究,可以得到改進的人工魚群算法。采用改進的人工魚群算法對反向傳播神經網絡的初始權值閾值進行全局尋優,再用尋優后的權值閾值建立反向神經網絡,對篩選過濾得到火險因子進行相關性補償修正。修正后的火險因子輸入系統后可以有效降低恒定的預警誤差。
3.3? 預警模型參數選擇的分析優化機制
通過對BP(Back Propagation,反向傳播)神經網絡模型的參數選擇進行分析,得出最合適的參數組合進神經網絡的模型訓練。針對神經網絡在面對大數據量,特別是高維輸入矢量時收斂速度較慢并且容易陷入局部極值的缺陷,采用遺傳算法、模擬退火算法等進行全局搜索,找出基于本項目數據的優化初始權值與閾值,并建立優化的人工神經網絡模型,對森林火險進行預警并進行危險等級的劃分。由此,我們得到基于深度約簡后的森林火險預警模型火險因子體系,建立基于優化的BP神經網絡的森林火險預警機制。
4? 結? 論
在大數據時代,林業相關部門已經提出建立建成森林、濕地、荒漠等林業資源大數據采集、分析、預測和應用的一體化林業智慧決策平臺。本文利用機器學習算法從多個維度深度剔除了冗余的森林火險因子,并建立了深度約簡機制。不同于現有利用粗糙集理論對預處理神經網絡的輸入數據進行獨立簡化的方法,本文考慮了輸入火險因子數據之間的相關性,采用灰色關聯分析、模糊集理論以及人工魚群算法對各火險因子大數據進行更為徹底的剔除,同時利用遺傳算法,改良處理大數據時神經網絡自身易陷于最小化和收斂速度慢的缺點,對模型的參數選擇進行分析優化。過濾和修正后的數據輸入經過優化后的神經網絡,可以更加動態有效地預測森林火險。
參考文獻:
[1] 梁慧玲,林玉蕊,楊光,等.基于氣象因子的隨機森林算法在塔河地區林火預測中的應用 [J].林業科學,2016,52(1):89-98.
[2] 李曉戀.基于MODIS數據的多因子協同作用下森林火災預測監測研究 [D].合肥:中國科學技術大學,2016.
[3] 高德民,林海峰,劉云飛,等.基于無線傳感網的森林火災FWI系統分析 [J].林業科技開發,2015,29(1):105-109.
[4] 徐虹,程晉昕,余凌翔.基于GIS的云南省森林火險區劃研究 [J].中國林業產業,2016(10):199-202.
作者簡介:陳俊雹(1990.02-),男,漢族,江蘇南京人,就職于信息技術學院,講師,博士,主要研究方向:機器學習、信息安全和激光感知技術。