999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數(shù)據(jù)挖掘技術(shù)在水質(zhì)自動監(jiān)測站管理中的應(yīng)用

2016-08-30 09:02:30
治淮 2016年1期
關(guān)鍵詞:規(guī)范性數(shù)據(jù)挖掘水質(zhì)

章 俊 倪 薇

?

數(shù)據(jù)挖掘技術(shù)在水質(zhì)自動監(jiān)測站管理中的應(yīng)用

章俊倪薇

水質(zhì)自動監(jiān)測站的水質(zhì)數(shù)據(jù)質(zhì)量和儀器狀態(tài)、外界環(huán)境(水、電、天氣等)、運維狀態(tài)等息息相關(guān),干擾因素很多,因此水質(zhì)數(shù)據(jù)經(jīng)常會有異常值產(chǎn)生,而且有些異常數(shù)據(jù)很難依靠人工判斷,處理難度較大。近年來,由于大數(shù)據(jù)的迅速發(fā)展,使得數(shù)據(jù)挖掘技術(shù)逐漸成熟,各種挖掘算法被廣泛運用于數(shù)據(jù)處理,并有許多成功應(yīng)用的案例。本文嘗試使用數(shù)據(jù)挖掘技術(shù)對新汴河團結(jié)閘水質(zhì)自動監(jiān)測站2014年1~6月的水質(zhì)監(jiān)測數(shù)據(jù)進行處理,剔除異常值,使有效數(shù)據(jù)能夠均勻分布,從而提高數(shù)據(jù)質(zhì)量和規(guī)范性,并通過人工監(jiān)測數(shù)據(jù)進行驗證,取得了好的效果。

一、數(shù)據(jù)處理方法的選擇

數(shù)據(jù)挖掘有很多成熟的技術(shù),但是在水質(zhì)處理和預(yù)測計算方面運用的并不多。本文分析水質(zhì)數(shù)據(jù)的特點,就單個水質(zhì)參數(shù)而言,除非遇到突發(fā)性水污染事故,否則數(shù)據(jù)變化幅度不大,且都是正實數(shù),不包含向量等復(fù)雜數(shù)據(jù)。目前水質(zhì)自動監(jiān)測站每天上傳監(jiān)測數(shù)據(jù)2~4條,頻度不大。聚類分析法處理數(shù)據(jù)過程簡單易懂,實用性較強,選擇聚類分析法可以方便地解決數(shù)據(jù)處理問題,達(dá)到預(yù)期效果。

聚類分析是依據(jù)樣本間關(guān)聯(lián)的度量標(biāo)準(zhǔn)將其自動分成幾個類,且使同一類中的樣本相似,而屬于不同類的樣本相異的一組方法。一個聚類分析系統(tǒng)的輸入是一組樣本和一個度量兩個樣本間相似度(或相異度)的標(biāo)準(zhǔn),聚類分析的輸出是數(shù)據(jù)集的幾個類(簇),這些類構(gòu)成一個分區(qū)或分區(qū)結(jié)構(gòu)。聚類分析的一個附加結(jié)果是對每個類的綜合描述,這種結(jié)果對于進一步深入分析數(shù)據(jù)集的特征尤為重要。這樣應(yīng)用聚類分析法可以將水質(zhì)數(shù)據(jù)中的離群數(shù)據(jù)即異常數(shù)據(jù)剔除掉,提高數(shù)據(jù)質(zhì)量。

二、聚類分析法應(yīng)用分析

聚類分析可以根據(jù)聚類中心點來進行數(shù)據(jù)篩選,一方面可以剔除孤立點,另一方面還可以剔除一些距離中心點過遠(yuǎn)的異常數(shù)據(jù),不僅可以剔除異常數(shù)據(jù),還可以使過濾后的數(shù)據(jù)具有良好的規(guī)范性。

本文選擇的水質(zhì)影響因子為高錳酸鹽指數(shù)(CODmn)與氨氮(NH4),這兩項都是影響水質(zhì)的重要指標(biāo),具有很強的代表性。根據(jù)新汴河團結(jié)閘水質(zhì)自動監(jiān)測站從2014年1~6月的日監(jiān)測數(shù)據(jù),去除各種不完整數(shù)據(jù)后共有798組。按照月份分期,將每個月的數(shù)據(jù)分為3組(按旬劃分),選取K-平均算法進行聚類分析,剔除樣本數(shù)目過少的類。在計算中,如果每組的數(shù)據(jù)樣本數(shù)少于該月樣本總數(shù)的10%,剔除該類,并重新進行劃分計算并不斷重復(fù)此過程,直到最終劃分的類中沒有少于樣本總數(shù)10%的類,確保沒有異常樣本點,從而使所獲得的數(shù)據(jù)具有較好的規(guī)范性。

三、處理過程及結(jié)果分析

應(yīng)用聚類分析法時采用SPSS(StatisticalPackagefortheSocial Science)軟件,其是目前世界上最著名的數(shù)據(jù)分析軟件。SPSS最突出的特點是操作界面友好,使用Windows的窗口方式即可展示各種管理和分析數(shù)據(jù)方法的功能,使用對話框就可展示出各種功能選擇項,無需編程,只根據(jù)需要進行圖形用戶界面操作就可以實現(xiàn)數(shù)據(jù)的分析和處理。

在本文聚類分析研究中采用K-平均算法,其具體流程:(1)任意選擇3個樣本作為初始類的中心;(2)根據(jù)類中對象的平均值,將每個樣本重新聚合到最相似的類;(3)更新類的平均值,即計算每個樣本由樣本的平均值,將其作為中心點;(4)重復(fù)(2)、(3)直到不再發(fā)生變化。

使用K-平均算法進行聚類,根據(jù)各個類的樣本數(shù)目來剔除孤立點。第一次聚類結(jié)果見表1。

從表1中選取樣本數(shù)少于該月樣本總數(shù)10%的類進行剔除,得到新的數(shù)據(jù)并繼續(xù)進行聚類和剔除異常樣本,經(jīng)過6次迭代最終得到不再有少于樣本總數(shù)10%的類存在的表,其結(jié)果見表2。

每個月都有樣本被剔除,因為水質(zhì)變化非常復(fù)雜,受很多因素影響,本文在剔除異常數(shù)據(jù)時是以水域某一時段(某月)內(nèi)的通常狀況為標(biāo)準(zhǔn),對于非正常狀態(tài)對水域的影響因素考慮較少,為避免過多的刪除數(shù)據(jù),規(guī)定在某一時段內(nèi)(某月)因機械或者人為等因素產(chǎn)生一些異常數(shù)據(jù)不應(yīng)該大于該時段內(nèi)所有監(jiān)測數(shù)據(jù)的30%,若大于此上限,說明該月可能存在一些水質(zhì)異常變化,比如突發(fā)水污染事故,則這些偏離常規(guī)的監(jiān)測值也是水質(zhì)真實狀態(tài)的反映,不應(yīng)被刪除。經(jīng)過6次迭代聚類,最終結(jié)果樣本總數(shù)為583,剔除的樣本數(shù)占原樣本總數(shù)的27%,說明2014年上半年團結(jié)閘水質(zhì)自動監(jiān)測站的水質(zhì)數(shù)據(jù)不是很穩(wěn)定。

表1 K-平均算法聚類結(jié)果表

表2 K-平均算法聚類結(jié)果表

圖1 高錳酸鹽指數(shù)相關(guān)性圖

圖2 氨氮指數(shù)相關(guān)性圖

四、數(shù)據(jù)結(jié)果驗證

新汴河團結(jié)閘水質(zhì)自動監(jiān)測站位于皖蘇兩省省界,該站人工監(jiān)測數(shù)據(jù)采用淮河流域水環(huán)境監(jiān)測中心監(jiān)測成果,數(shù)據(jù)具有很高的準(zhǔn)確性和規(guī)范性。

因為每個月人工數(shù)據(jù)與自動監(jiān)測站數(shù)據(jù)相比樣本數(shù)過少,因此對其采取復(fù)制插值法,即每個人工數(shù)據(jù)復(fù)制一樣的數(shù)量使其樣本總數(shù)滿足分析要求。相關(guān)性分析一樣采用SPSS軟件進行,并采用距離法,度量采用余弦來計算相似度矩陣,計算結(jié)果如圖1和圖2所示。

其中聚類相關(guān)性是指經(jīng)過6次聚類后的數(shù)據(jù)與人工監(jiān)測數(shù)據(jù)的相關(guān)度,原始相關(guān)度是指自動監(jiān)測站原始監(jiān)測數(shù)據(jù)與人工監(jiān)測數(shù)據(jù)的相關(guān)度。

五、結(jié)論

從圖1和圖2中可以看出,無論是高錳酸鹽指數(shù)因子還是氨氮因子,經(jīng)過聚類后的數(shù)據(jù)與人工監(jiān)測數(shù)據(jù)都表現(xiàn)出很高的相關(guān)度,尤其是數(shù)據(jù)變化幅度較大的高錳酸鹽指數(shù)相關(guān)度提升更為明顯。這說明了經(jīng)過數(shù)據(jù)挖掘處理后的數(shù)據(jù)更能反映實際水質(zhì)狀況,比原始監(jiān)測數(shù)據(jù)質(zhì)量更好,規(guī)范性更強。綜上所述,通過新汴河團結(jié)閘2014年1~6月的水質(zhì)數(shù)據(jù)驗證,說明數(shù)據(jù)挖掘技術(shù)能夠較好的剔除水質(zhì)自動監(jiān)測站監(jiān)測數(shù)據(jù)中的異常值,提高數(shù)據(jù)質(zhì)量和規(guī)范性,更好地反映水質(zhì)實際狀況,為水資源保護工作提供技術(shù)支撐■

(作者單位:淮河流域水資源保護局233001南京市循環(huán)經(jīng)濟促進中心210008)

猜你喜歡
規(guī)范性數(shù)據(jù)挖掘水質(zhì)
水質(zhì)抽檢豈容造假
環(huán)境(2023年5期)2023-06-30 01:20:01
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
自然資源部第三批已廢止或者失效的規(guī)范性文件目錄
一月冬棚養(yǎng)蝦常見水質(zhì)渾濁,要如何解決?這9大原因及處理方法你要知曉
作為非規(guī)范性學(xué)科的法教義學(xué)
法律方法(2018年3期)2018-10-10 03:20:38
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
我國知識產(chǎn)權(quán)判例的規(guī)范性探討
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
水質(zhì)總磷測定存在的問題初探
河南科技(2014年23期)2014-02-27 14:19:07
水質(zhì)總氮測定方法改進探究
河南科技(2014年18期)2014-02-27 14:14:54
主站蜘蛛池模板: 国产精品私拍在线爆乳| 91国内视频在线观看| AⅤ色综合久久天堂AV色综合| 国产激情无码一区二区APP| 制服丝袜亚洲| 亚洲天堂精品在线观看| www.狠狠| 亚洲欧美精品日韩欧美| 一区二区三区四区精品视频| 一级毛片免费观看不卡视频| 久久国产亚洲偷自| h网站在线播放| 色综合中文| 色视频国产| 99热6这里只有精品| 美女扒开下面流白浆在线试听| 亚洲视频三级| 亚洲永久免费网站| 99国产精品国产| 美女毛片在线| 成人国产免费| 久热re国产手机在线观看| 亚洲精品成人片在线观看| 精品国产成人av免费| 国产欧美日韩在线一区| 国产精品分类视频分类一区| 久99久热只有精品国产15| 四虎影视库国产精品一区| 国内精品小视频在线| 亚洲综合日韩精品| 成人免费网站久久久| 欧美97色| 无码精品国产dvd在线观看9久| 狠狠ⅴ日韩v欧美v天堂| 中文无码毛片又爽又刺激| 成人在线观看不卡| 精品福利一区二区免费视频| 亚洲精品第一在线观看视频| 欧美午夜视频| 精品成人免费自拍视频| 婷婷99视频精品全部在线观看| 国产91色| 色老头综合网| 亚洲成aⅴ人片在线影院八| 99热这里只有精品2| 青青草国产精品久久久久| 国产精品一区二区在线播放| 粉嫩国产白浆在线观看| 国产人成午夜免费看| 国产一区二区视频在线| 国产永久在线视频| 国产午夜一级毛片| 欧美亚洲激情| 亚洲经典在线中文字幕| 97久久精品人人| 久久黄色一级视频| 久久性妇女精品免费| 五月婷婷亚洲综合| 亚洲精品天堂自在久久77| 精品国产成人av免费| 一本大道视频精品人妻 | 久久久精品国产SM调教网站| 日韩 欧美 国产 精品 综合| 欧美国产日韩在线播放| 国产亚洲精品91| 国产免费观看av大片的网站| 亚洲一区二区成人| 欧美另类图片视频无弹跳第一页| 精品成人一区二区三区电影| 性视频久久| 老色鬼久久亚洲AV综合| 亚洲中文久久精品无玛| 99re热精品视频中文字幕不卡| 老熟妇喷水一区二区三区| 国产交换配偶在线视频| 韩国v欧美v亚洲v日本v| 国产91av在线| 国产激情无码一区二区APP| 久久精品国产国语对白| 亚洲综合色婷婷中文字幕| 夜夜操天天摸| 国产精品亚洲а∨天堂免下载|