李星星 段超
摘 要: 森林作為陸地上重要的生態(tài)系統(tǒng),具有環(huán)境與資源雙重屬性。一旦發(fā)生火災(zāi),將對環(huán)境和大氣造成無法彌補的破壞。數(shù)據(jù)挖掘技術(shù)在森林防火中具有重要的的作用,能夠?qū)ι只馂?zāi)進行預(yù)測,從而達到預(yù)防的效果。
關(guān)鍵詞: 森林火災(zāi);數(shù)據(jù)挖掘;應(yīng)用研究
【中圖分類號】 TP311.4 【文獻標(biāo)識碼】 A【文章編號】 2236-1879(2018)14-0027-01
一、研究背景及意義
森林是極其珍貴的自然資源,在凈化空氣、調(diào)節(jié)氣候等方面具有巨大的功能,對維持人類生活環(huán)境方面發(fā)揮著關(guān)鍵作用,且還是珍貴的野生動物的棲息地。一旦發(fā)生火災(zāi),將對環(huán)境和大氣造成毀滅性的、無法彌補的破壞(大氣中30%的二氧化碳來自森林火災(zāi)),甚至造成重大人身事故和巨大的財產(chǎn)損失。破壞森林資源的自然災(zāi)害除了火災(zāi),還有病災(zāi)和蟲災(zāi),但是火災(zāi)是破壞性和危害性最大的。
森林作為陸地上重要的生態(tài)系統(tǒng),具有環(huán)境與資源雙重屬性,它提供了豐富多彩的資源產(chǎn)品,營造了優(yōu)美的環(huán)境,維持著地球的生態(tài)平衡。火災(zāi)的發(fā)生,不但會造成巨大的經(jīng)濟損失和人員的傷亡,而且對整個大氣的污染是巨大的,將持續(xù)影響人們的健康生活。因此,對火災(zāi)發(fā)生規(guī)律進行預(yù)測并對潛在危險區(qū)進行監(jiān)測,及早發(fā)現(xiàn)火災(zāi),可以大大縮短反應(yīng)時間,減少火災(zāi)潛在損失和滅火成本。“預(yù)防為主,積極消滅”是我國森林防火方針。如何從大量的歷史森林火災(zāi)數(shù)據(jù)中挖掘出有用的知識以供決策者參考是現(xiàn)在急需解決的問題。
二、數(shù)據(jù)挖掘技術(shù)在森林火災(zāi)中應(yīng)用研究
數(shù)據(jù)挖掘是一個融合了多項技術(shù)的研究范疇,它集成了數(shù)據(jù)庫技術(shù)、機器學(xué)習(xí)、人工智能、統(tǒng)計學(xué)、知識庫系統(tǒng)、信息檢索等最近技術(shù)的研究成果。還有許多與其相近的術(shù)語,如從數(shù)據(jù)庫中發(fā)現(xiàn)知識(Knowledge Discovery in Database, KDD)、數(shù)據(jù)分析(Date Analysis)、數(shù)據(jù)融合(Data Fusion)以及決策支持等。2001年,Gartner Group在一次高級技術(shù)調(diào)查中將數(shù)據(jù)挖掘和人工智能列為“未來三到五年內(nèi)將對工業(yè)產(chǎn)生深遠影響的五大關(guān)鍵技術(shù)”之首,還將并行處理體系和數(shù)據(jù)挖掘列為未來的五年內(nèi)投資焦點的十大新興科技前兩位[1]。
20世紀(jì)80年代末開始出現(xiàn)了發(fā)現(xiàn)知識(KDD)一詞,在1989年8月美國底特律市舉辦了第一屆KDD國際學(xué)術(shù)會議上第一次提到了該詞的概念。起初每兩年舉辦一次KDD 會議,到1993年后一年舉辦一次。直到1995年加拿大的蒙特利爾舉辦了首屆KDD &Data Mining的國際會議,才開始流行知識發(fā)現(xiàn)和數(shù)據(jù)挖掘。之后,在國外有關(guān)數(shù)據(jù)挖掘相關(guān)的論文發(fā)表得十分多,并形成了比較熱門的研究方向,比較集中發(fā)表的論文期刊如:《Data Mining and Knowledge Discovery》、《Artificial Intelligence Review》[1]。
在國內(nèi),1993年中科院合肥分院獲得我國自然科學(xué)基金首次在數(shù)據(jù)挖掘領(lǐng)域的研究的支持。通過檢索被科學(xué)引文數(shù)據(jù)庫(SCI)、工程索引數(shù)據(jù)(EI)和清華全文期刊數(shù)據(jù)庫(CNKI)收錄有關(guān)數(shù)據(jù)挖掘方面的文章,可知:1997年中國有關(guān)數(shù)據(jù)挖掘的文章在SCI收錄了2篇,CNKI中收錄了3篇,這說明在數(shù)據(jù)挖掘方向的研究,中國與國外在時間上相差不大。國內(nèi)有關(guān)數(shù)據(jù)挖掘論文的發(fā)表也逐年增加,說明中國的數(shù)據(jù)挖掘研究也正在加強[1]。
數(shù)據(jù)挖掘是面向?qū)嶋H應(yīng)用的技術(shù)。現(xiàn)已廣泛地應(yīng)用在金融、電信、保險、農(nóng)業(yè)、制造業(yè)、醫(yī)療衛(wèi)生等領(lǐng)域,數(shù)據(jù)挖掘在農(nóng)林火災(zāi)中的應(yīng)用研究也引起了國內(nèi)外專家學(xué)者的關(guān)注。
Tao Cheng等探討了時空數(shù)據(jù)挖掘在森林防火中的應(yīng)用,特別關(guān)注森林火災(zāi)的時空預(yù)測,提出了一種集成時空預(yù)測ISTFF框架:使用一個動態(tài)遞歸神經(jīng)網(wǎng)絡(luò)的空間預(yù)測,然后以加拿大森林火險區(qū)預(yù)測為例,與其他方法做了比較。Paulo Cortez等探索了數(shù)據(jù)挖掘方法來預(yù)測森林火災(zāi)的燃燒面積,在基于最近葡萄牙東北部收集的真實數(shù)據(jù),測試了五種不同的DM技術(shù)(如支持向量機(SVM)和隨機森林)和四種不同的特征選擇設(shè)置(使用空間、時間、火災(zāi)森林指數(shù)(FWI)和天氣屬性)。最好的配置是使用了一個支持向量機(SVM)和四個氣象輸入(即溫度、相對濕度、雨、風(fēng)),它能預(yù)測更加頻繁小火的燃燒面積。這對提高消防管理尤其有用。
劉芳[2]針對K均值中容易出現(xiàn)局部最優(yōu)的缺點,引入了蟻群算法ICACA對其進行優(yōu)化,提出一種改良的蟻群聚類算法,利用實驗對比,新的算法能夠在時間上和聚類的準(zhǔn)確性上獲得一個平衡,然后運用在預(yù)測分析實際的森林火災(zāi)中。蘇成偉[3]將模擬退火算法與遺傳算法結(jié)合起來,形成了模擬退火遺傳算法,將該算法應(yīng)用于關(guān)聯(lián)規(guī)則的挖掘中,然后在森林火災(zāi)數(shù)據(jù)中應(yīng)用改良的算法。印世樂針對傳統(tǒng)的遺傳算法容易陷入局部最優(yōu)和早熟的缺點,提出了一種改進的多種群遺傳算法,然后將算法應(yīng)用于森林火災(zāi)數(shù)據(jù)進行關(guān)聯(lián)規(guī)則挖掘。王軒為了能夠?qū)崟r監(jiān)控林中的溫度、相對濕度等火災(zāi)因子,運用ZigBee無線傳感器網(wǎng)絡(luò)、Internet網(wǎng)絡(luò)、GPRS數(shù)據(jù)通信等技術(shù)構(gòu)建了基于物聯(lián)網(wǎng)技術(shù)的遠程監(jiān)測系統(tǒng)。許志卿在研究中運用半正規(guī)規(guī)劃建模方法,建立了自定義核函數(shù)的SVM模型,對比了線性核函數(shù)的模型、基于自定義核函數(shù)的SVM模型和基于高斯核函數(shù)SVM模型三種林火預(yù)測模型的預(yù)測效果,設(shè)計并實現(xiàn)了基于這三種模型的林火預(yù)測系統(tǒng)。
參考文獻
[1] 李菁菁,邵培基,黃亦瀟.數(shù)據(jù)挖掘在中國的現(xiàn)狀和發(fā)展研究[J].管理工程學(xué)報,2004(03):10-15.
[2] 劉芳.改進的蟻群聚類算法在森林火災(zāi)預(yù)測中的應(yīng)用研究:[碩士學(xué)位論文].阜新:遼寧工程技術(shù)大學(xué),2009.
[3] 蘇成偉.一種改進的遺傳算法在數(shù)據(jù)挖掘中的應(yīng)用研究:[碩士學(xué)位論文].合肥:合肥工業(yè)大學(xué),2013.