【摘要】:在國家可持續發展的理念倡導下,環境保護受到越來越多的關注,在大數據時代,環境保護管理系統的出現,為環境保護工作的質量與效率提升提供了重要作用。基于此,本文就數據挖掘技術在環境保護綜合管理系統中的應用展開分析,首先,對環境數據采集與關鍵因素分析環節所應用的大數據挖掘技術進行簡要分析,進一步探究大數據技術在包括預測方法與預測驗證在內的,環境預測方面的應用分析。
【關鍵詞】:數據挖掘技術;環境保護;數據采集
前言:環境保護的實施質量與效率,對城市的生態建設與可持續發展具有極大的管理。本文以S市環境保護綜合系統的應用為例,分析新時期,數據挖掘技術的應用過程及效果,對提升系統的應用價值具有重要作用。因此,要以生態健康和城市居民的身體健康為保護目標,充分運用數據挖掘技術,提升環境保護綜合管理系統的實踐性能,最終實現環境保護的長效管理。
1.環境數據的采集與關鍵因素分析
筆者以S市的水質污染與治理狀況為基礎,對數據挖掘技術的應用進行如下分析:
1.1數據采集
對S市的相關水質數據進行采集,主要目標是自動監測子站數據以及周邊污染企業排污數據。利用環境保護綜合管理系統進行數據采集,數據來源主要依賴于污染源在線監控子系統。
污染源在線監控子系統主要的監控對象為工業污染源,監控手段即對區域排污狀況以及排污趨勢進行了解和掌握,通過監測結果與監控資料等,能夠進一步執行環境保護法規與標準,進而推動環境管理工作的順利執行。在污染源在線監控子系統當中,主要包括三個重要內容,即現場在線監控點、監控中心以及數據傳輸網絡,現場監控點包括在線監測儀器、通訊器等硬件設施,在捕捉到數據信息之后,及時利用數據傳輸網絡,傳送至監控中心,以視頻或信號等形式呈現監控狀況。數據挖掘技術主要應用于監控中心,在其接收到各類環保信息之后,進一步展開數據分析、計算以及數據處理操作,以全面滿足環境保護工作的業務管理需求與保護決策需求[1]。監控中心為環境保護綜合管理系統提供各項數據服務,是重要的信息交互支撐平臺,
1.2關鍵因素分析
基于數據挖掘技術的環境保護綜合管理系統,在數據采集的基礎上能夠進一步利用數據挖掘算法當中的樸素貝葉斯分類算法,分析得出影響因素以及關鍵影響因素。
貝葉斯定理的基本求解公式導出過程如下:P(A|B)=P(AB)/P(B);P(A|B)表示的是事件B發生下事件A的條件概率,即事件B事先已經發生,求解此種基礎上事件A的發生概率;P(AB)則表示事件A與事件B同時發生的概率;P(B)表示的是事件B發生的概率。無論事件A與事件B是否互為獨立事件,都能夠得出公式P(AB)=P(A|B)·P(B)=P(B|A)·P(A)。由此能夠進一步導出貝葉斯定理:P(B|A)=[P(A|B)·P(B)]/P(A)。
運用貝葉斯定理,從Excel數據挖掘工具當中對影響環境能的關鍵因素進行分析,需要經歷以下三個步驟:第一,要完善建立數據挖掘結構,并將與數據相關的關鍵信息進行導入存儲;第二,利用Microsoft貝葉斯概率分類算法,進一步構建數據挖掘模型;第三,針對模型當中的相對屬性發出預測查詢命令,進而達到識別區分明顯目標屬性之間的因素。
2.環境預測及效果分析
2.1預測方法的選擇
構建神經網絡模型的過程中,將人為影響因素全部剔除,進而獲得水質本身特點,與傳統的水質預測方法有著本質的區別,此種方式所獲得的輸出結果更具有客觀性。神經網絡模型的應用,需要應用大量的歷史數據,如,S市環境綜合管理系統中由污染源在線監測系統與水質自動監測系統獲取的大量數據,是構建神經網絡模型、推動神經網絡模型運算與分析的重要條件。基于神經網絡方法的多種適用性,在水質預測中的應用較為廣泛。尤其是其建模方法的靈活性,能過采用多種非線性函數,來有效構建、模擬其過程的非線性特征。
2.2預測驗證
利用Excel數據挖掘工具中的神經網絡算法,能夠對采集到的全部數據進行有效預測。S市的環境保護綜合管理系統中,共包含17個水質自動監測項目、7個周邊污染源排放數據,總計34個屬性。針對這34個屬性,按照每個屬性半年期限內184個日均值數據來看,共有6358個數據需要參與到模型運算當中。神經網絡模型的多屬性、大數據量的特點,直接影響運算時間較長。在此基礎上,運用基于粗糙集的神經網絡預測技術,對模型進行數據處理,約簡屬性后再次進行運算,能夠顯著降低神經網絡預測誤差[2]。約簡屬性至9個,極大的簡化了運算過程與運算量,從而有效縮短運算時間。
這種基于粗糙集的神經網絡預測技術,與其他的時序算法、一般神經網絡算法、邏輯回歸算法等相比,性能更好,效率更高,在很大程度上提升了預測效果的準確性,應用于環境綜合管理系統當中,具有更高適用性。隨著水質自動監測項目的增加,監測數據量也會越來越多,因此,在上述技術的基礎上,要進一步增加訓練數據,以有效提升環境預測的精確度。
結束語:綜上所述,對數據挖掘技術在環境保護綜合管理系統中的應用進行分析,有利于促進城市的生態建設與可持續發展。通過上述分析,能夠充分意識到大數據時代為環境保護工作帶來的優勢與便利,進而充分數據挖掘技術,能夠顯著提升數據采集與應用效率,提升環境保護的效果,促進系統建設與運行的社會效益增強。因此,在未來的研究與發展過程中,要以數據挖掘為核心,不斷拓展先進技術的有效應用,以促進其信息化、智能化發展。
【參考文獻】:
[1]李愛霞,曹占江,譚會娟. 沙坡頭站荒漠生態環境長期定位監測數據信息管理系統的建設與發展[J]. 中國沙漠,2014,34(02):617-624.
[2]巴愛軍,張富林. 企業環境保護監測管理系統的設計與實現[J]. 信息與電腦(理論版),2012,(02):38-39.
作者簡介:王勇(1980.06.05);性別:男,籍貫:黑龍江省寧安人,學歷:本科,畢業于黑龍江八一農墾大學;現有職稱:環境工程師;研究方向:環境保護;