楊 婕,魏 凱
(臨沂市平邑縣環境監控中心,山東 臨沂 273300)
環境保護是推動社會整體可持續發展的重要途徑和措施,近年來,隨著數字技術、信息技術的不斷發展,國內外學者將研究重點集中到促進環保技術與數字信息技術的融合中,提出設計構建“智慧環保系統”的理念?;诖?,本文在充分考慮算法這一內容在各個行業和領域中應用情況的前提下,將數據挖掘技術應用到智慧環保系統中,著重基于脫硫監測這一具體類型來驗證數據挖掘技術的應用效果,對研究優化設計智慧環保系統具有積極的意義。

圖1 數據挖掘的結構
智慧環保系統是開展環保監測工作的重要前提,環保系統數據庫中儲存的海量信息可以成為數據挖掘技術應用的有利條件。
數據挖掘的基本流程見圖2?,F階段在應用數據挖掘技術時,通常將其劃分為三個主要階段:數據選擇和預處理是第一階段,數據轉換和挖掘是第二階段,數據分析是第三階段。在選擇和預處理數據時,需要基于客戶的需求,從邏輯數據庫中選取與任務目標相關的數據,經由集成和再加工的方法,檢查數據的完整性并清除重復數據,填補丟失的數據信息;在數據轉換和挖掘階段,需要考慮系統程序格式,在對數據信息進行轉換后,從被抽象的信息中找出符合任務目標的信息;數據分析階段主要是將被同化的知識進行表達和解釋,在將保留的知識傳遞給客戶之后,為客戶的決策及相關工作提供支持[2]。

圖2 數據挖掘的基本流程
通過對數據庫中海量信息的挖掘分析,并基于分析結果為環境治理工作選擇合適的環境治理方法提供依據。
關聯性算法規則是數據挖掘技術能夠實現海量數據分析處理的重要保障。為了確保數據挖掘技術在智慧環保系統中的應用效果,需要理清關聯算法應用中涉及到的各個子項集合之間相互關系[3]。在數據挖掘技術的實際應用中,關聯規則算法主要在獲取數據后發揮作用,通過發現獲取數據擁有的共同點,構建一個能夠將相關數據關聯起來的過程。在具體應用關聯規則算法的過程中,以X?Y代表基本的公式算法,其中,X代表關聯規則的前項項集,Y代表關聯規則的后項項集。利用這一公式,可以明確從數據庫中獲取的信息在X屬性值和Y屬性值的真假。而在實際的關聯規則中,由于存在支持度和置信度兩個反應知識興趣度的度量,在假設數據項集X?I,B代表事務集D中包含X的事務數目,而A代表事務集D中包含Y的事務數目,則可以用以下公式來表示數據集X的支持度定義:
當數據集中同時包含X和Y的事務數與所有事務數之比能夠代表關聯規則X?Y的支持度,則可以將其記為:
這樣就可以表示關聯規則X?Y的支持度代表關聯規則的重要性。而如果關聯規則X?Y的置信度代表同時包含X和Y的事務數與包含X的事務數之比,則可以將其記為:
這樣可以表示關聯規則X?Y的支持度代表關聯規則的可信程度。
基于以上原理,在實際應用關聯規則算法時,需要事先從數據庫中找出事務數據項集中的所有頻繁數據,然后基于產生的頻繁項目集得到強關聯規則。將關聯規則算法應用到智慧環保系統當中,能夠為處理環保系統中的海量檢測數據提供一個更為嚴謹的邏輯程序,對于提升數據處理分析效率和質量具有重要作用。
在智慧環保系統中,脫硫監測與大氣環境質量之間有著密切的聯系。現階段的脫硫監測更多應用于工業企業的生產環境。例如,以火力發電方式為主的發電廠會受到煤炭資源的影響,在生產中排放二氧化硫等對大氣環境破壞較為嚴重的污染物質?;谶@一要求,脫硫檢測系統需要結合脫硫設備的應用情況,充分發揮互聯網技術、數據采集技術、人工神經元網絡、分布式數據處理等技術,以在線監測污染物排放情況和污染凈化治理設備運行情況的方式,通過數據采集和處理實現對環境污染的綜合管理,從而為后續規范污染物排放和環境治理工作提供更為科學可靠的參考依據。在此過程中,考慮到需要進行脫硫監測的數據范圍較大,且不同數據間的關系較為復雜,具有較為明顯的實時性特點,所以在設計脫硫檢測智慧環保系統時,需要注重在保證檢測數據結果可靠性的同時,提升脫硫監測的效率,確保獲取的數據能夠滿足環境監測和治理的要求。
隆化縣農村金融服務主體較少,機構網點分布密度較低,數量不足。“政銀企戶?!蹦J较罗r村信用社發放小額貸款的比重較大,但農信社網點少,業務人員不足,ATM 機、POS機等設備數量稀少,金融服務落后。滯后的金融服務和金融覆蓋空白區使金融精準扶貧的能力受到制約。并且隆化縣農戶信用體系建設滯后,農村金融在信貸資金、農業保險等領域的創新非常有限,現有金融產品與企業貸款需求不匹配,影響扶貧的精準性。隨著保險在“政銀企戶?!蹦J街械牡匚煌癸@,相關的農業、產業保險對于保障貧困戶利益起到重要的兜底作用,但農業產業的險種不健全、創新性不強,客觀上阻礙了保險保障作用的進一步發揮。
環境監測作為環境保護的重要組成部分,能夠為環境治理工作的開展提供更加準確的數據信息,在判斷監測區域范圍環境污染程度和受到污染的主要因素后,可以及時采取適合的措施,對提升環境保護的效率和效果具有重要作用。將數據挖掘技術應用到脫硫檢測的智慧環保系統設計中,需要結合監測區域的實際情況進行分析。基于此,本文選擇發電廠這一需要脫硫監測的環境作為研究對象,著重探討利用關聯規則算法的數據挖掘技術在脫硫監測智慧環保系統中的應用情況。
以發電廠的企業區域為主要研究對象,在選擇脫硫監測數據時,首先需要在充分考慮電廠脫硫設施工序的前提下,對每個脫硫設施設置一個監測點。結合電廠應用的脫硫處理方法不同,明確脫硫監測應考慮的具體指標。例如,應用石灰石石膏濕法進行脫硫處理,需要進行監測的數據主要包括工廠煙囪監測參數、煙氣脫硫設施監測參數等。其中,脫硫設施的監測應體現脫硫設施出入口溫度,鍋爐側的主蒸汽壓力大小、二氧化硫濃度、pH值等指標。利用數據挖掘技術,能夠分析工廠實際運行中存在的工況不穩定、異常及非正常工作下得到的監測數據,并基于數據分析結果發現監測數據變化的規律?;谶@一目標,在對監測數據進行預處理時,主要選擇應用脫硫技術前的脫硫監測數據與應用脫硫技術后得到的監測數據、應用脫硫技術后不同時間的監測數據結果進行對比,從中找出監測數據存在較大波動的情況,并對其產生波動變化的原因進行分析。
在完成數據的選取和預處理后,應明確要進行屬性分析的脫硫監測數據,本文主要選擇電廠脫硫設施中的機組負荷A1、設備出口煙氣二氧化碳濃度A2、設備旁路擋板出口壓力A3、設備煙氣進口氧氣濃度A4、設備煙氣出口溫度A5、脫硫塔出口處煙氣量A6、設備煙氣出口的氧氣濃度A7、設備升壓風機前溫度A8、設備旁路擋板進口壓力A9、設備進口煙氣二氧化硫濃度A10、增壓風機的電流A11、燃煤量A12、吸收塔pH值A13、漿液循環泵的電流A14作為研究對象。
在基于關聯性規則算法構建脫硫數據結構模型時,考慮到每個參數屬性的單個計算數據之間缺少一定的關聯,首先要通過構建參數波動模型的方式,應用a priori算法來分析以上參數間的相關性,得到脫硫效率曲線,如圖3所示。

圖3 脫硫效率曲線
為方便研究,本文主要列舉部分參數的相關性:
在對以上數據的屬性參數進行標準化處理后,以差值計算的方法得出電廠脫硫監測設備在滿足4個條件的情況下才能夠代表其處于正常工作狀態,即:
以上條件就是電廠脫硫監測設施的參數波動模型。結合電廠生產經營的實際情況,在建立參數波動模型過程中,相關屬性參數都是由脫硫設施運行產生的。在得到一個脫硫設施的參數波動模型后,可以通過電廠的其他監測點位的脫硫設施參數波動情況對模型條件進行驗證,以此來確保得到的參數波動模型符合實際的脫硫檢測需求。
在完成參數波動模型的構建后,就需要構建參數預測模型。在基于關聯規則算法的前提下,可以在應用數據挖掘技術的情況直接利用關聯規則的屬性對脫硫監測得到的數據屬性進行選擇。
在選擇數據的過程中,主要可以應用CFS評價算法和Best First的搜索算法?;诖?,在選擇數據屬性的過程中,需要盡可能減少數據集中相關性不大的參數屬性,從而降低實際進行數據挖掘的成本,以更簡化的數據模型來滿足數據監測和挖掘分析的要求。在此前提下,可以設置xi的線形性組合方式,并利用其建立y的模型,在對響應輸出屬性y與一組預測輸入屬性的關聯進行分析后,就可以得到與脫硫效率相關的屬性參數值,然后應用多元線性回歸方程對其進行計算。設預測的脫硫效率值為Z,則可以應用以下公式計算預測的脫硫效率值:
得到的這一計算公式即電廠脫硫監測數據參數的預測模型。將實際測得的監測數據與預測模型中得到的數據進行對比,可以通過是否位于誤差范圍內來驗證脫硫設施是否處于正常的運行狀態。在得到預測參數模型之后,以某電廠的脫硫設施監測情況為例,可以得到如圖4的數據監測結果對比散列圖。

圖4 脫硫數據預測結果與實際監測結果的對比散列圖
結合電廠脫硫監測數據及圖3中的對比結果,發現預測數據結果與實際監測結果相差最大值為4%,由此可以發現,盡管應用數據挖掘技術構建模型,仍會導致實際監測結果與預測存在出入,但在考慮電廠實際生產環境變化的情況下,應用數據挖掘技術能夠將監測數據的誤差控制在5%以內,對于提升數據挖掘分析結果的準確性具有重要的意義。
將數據挖掘技術應用于脫硫監測智慧環保系統中,能夠充分發揮數據挖掘技術全面感知、智能化、較強的可靠性和傳遞性,支持智能處理等方面的特點,直接基于數據挖掘來獲取相應的環保監測信息,并使其在環保事業發展中發揮更大作用。結合本文對數據挖掘技術應用的分析,發現雖然數據挖掘技術具有一定的應用優勢,但作為近年來興起不久的技術,其在發展中仍會受到噪聲數據或缺損數據的影響。由于當前需要進行挖掘處理的環保數據信息內容較為豐富,數據結構形式也較為復雜,所以在應用數據挖掘技術時,應充分考慮更高的算法效率,在融合知識領域的前提下,補充優化數據挖掘技術的不足和局限性。例如,在應用數據挖掘技術時,可以將可視化技術與算法內容結合起來,簡化構建數據模型的流程,為提升關聯規則挖掘算法的應用效率創造良好的條件。在研發數據挖掘技術的過程中,也需要注重保障數據信息的安全,確保數據挖掘技術的應用效果。考慮到智慧環保系統中含有的數據信息較為廣泛,對于數據挖掘技術的研發還需要將其與實際應用領域需求相結合,注重提升數據挖掘技術應用的針對性效果。
綜上所述,將數據挖掘技術應用到脫硫檢測智慧環保系統設計中,能夠充分發揮現代科學技術的作用,提升環保決策的科學性、有效性及環保工作的效果?;跀祿诰蚣夹g的應用原理,在設計脫硫監測智慧環保系統時,應注重選取真實有效的脫硫監測數據,在充分結合關聯性規則的前提下構建脫硫數據結構的模型。考慮到當前脫硫監測是以工業企業的生產經營環境為主,在實際進行脫硫監測系統設計時,應考慮企業生產經營的實際情況,充分發揮數據挖掘技術與關聯規則算法的作用,利用參數波動和參數預測模型滿足對脫硫環境效果進行監測的要求。