魏 媛,馮天恒,黃平捷,侯迪波,張光新
(浙江大學 工業控制技術國家重點實驗室,浙江 杭州 310027)
?
管網水質多指標動態關聯異常檢測方法
魏媛,馮天恒,黃平捷,侯迪波,張光新
(浙江大學 工業控制技術國家重點實驗室,浙江 杭州 310027)
摘要:為了提高城市供水管網水質監測系統的污染檢測能力,利用污染物所引起多個指標變化之間的關聯特性,提出基于多常規水質指標動態關聯分析的水質異常檢測方法.應用動態時間規整算法(DTW)衡量多個常規水質指標時間序列間的動態距離,刻畫各指標波動的相似程度和動態關聯特性.利用D-S證據理論融合各指標單獨的異常概率,將融合后得到的供水管網水質異常概率與所設定的多指標融合異常概率閾值進行比較,作出當前時刻水質是否存在水質異常的綜合判斷.依托課題組模擬供水管網實驗系統,設計不同濃度的硫酸銅和鐵氰化鉀污染物的注入實驗,利用在線監測的pH值、濁度、余氯、溶解氧等8種常規水質指標進行動態關聯分析和水質異常檢測,方法的可行性和異常檢測性能通過受試者工作特征曲線(ROC)進行驗證.
關鍵詞:常規水質指標;數據融合;水質異常檢測;時間序列分析;動態時間規整;相關性分析
水是人類賴以生存的自然資源,飲用水的質量與人們生產生活息息相關.城市供水系統中任一環節出現問題,均可能對居民的日常生活用水造成嚴重影響[1].建立一套能夠準確挖掘異常水質狀況并及時進行預警處理的飲用水污染預警系統對于保障廣大居民的用水安全意義重大.水質異常檢測作為后續響應操作的基礎,在整個水質預警系統中起著非常重要的作用.
供水管網中的水質監測數據在日常觀測中的變化稱為水質波動.引起管網水質發生波動的原因包括日常背景變化、工藝操作變化、儀表傳輸噪聲以及水質污染事件等.在水質異常檢測中,最受關注的是由于水質污染事件所引起的水質波動,如何能夠將因污染物注入所引起的異常變化從常規水質波動中剝離出來,是水質異常檢測的核心.
早期的研究主要依據統計學方法,通過判斷單一水質指標測量值是否超出背景數據均值3倍標準差的范圍來判斷是否存在異常[2];為了克服水質數據本身存在的波動性對檢測結果的影響,之后的研究逐漸向時間序列分析的方向過渡[3];近年來,隨著數據挖掘技術的發展,水質異常檢測逐漸打破單一參數的束縛,研究人員開始利用機器學習的相關方法將多個傳感器的檢測結果進行融合,以期達到更好的檢測效果.貝葉斯網絡[4]、決策樹[5]、人工神經網絡[6]、支持向量機[7]等有監督的學習算法以及K平均聚類[8]、軌跡聚類[9]、最小橢球體積聚類[10]、多維最近鄰聚類[11]等無監督的學習算法都在水質異常檢測領域得到了廣泛的應用;此外,針對空間分布傳感器檢測結果的融合逐漸成為研究的熱點[12-13].雖然上述研究的方法不同,但結果都體現出了多指標異常檢測性能的優勢.
多指標水質信息融合并非簡單的數據疊加.污染物進入水體后,會引起多個水質指標之間的聯動變化,且由于受到水體緩沖、儀器檢測原理等因素的影響,各指標對污染物的響應速度及持續時間不同[14].現有的多傳感器信息融合的異常檢測方法多是通過統計一段時間窗口內出現異常的指標個數來對各指標的決策結果進行直接融合[15-16],往往對于污染物注入前、后指標之間的相關性變化挖掘不夠充分,且由于各指標時間序列的波動變化并非完全同步,往往會導致融合后的判斷結果存在滯后和誤判.
本文針對該問題,提出基于動態時間規整算法的水質異常檢測方法.動態時間規整算法是一種將時間規整與距離測度結合起來進行相似性度量的方法.因該算法對序列在時間軸的伸縮、扭曲和異位等形變具有較好的包容性,在語音識別、機器學習等領域的序列相似度比較中得到了很好的應用.本文將動態時間規整算法引入到多水質指標的變化相似度分析中,通過滑動時間窗讀取一定長度窗口內各個水質參數的時間序列,利用動態時間規整算法來計算任意兩個指標時間序列之間的動態距離,得到兩兩指標間波動的動態關聯系數.利用D-S證據理論的方法融合每個參數各自的基本異常概率,判斷當前時刻的水質是否存在異常.該方法旨在通過多指標關聯特性的挖掘來提高異常檢測的靈敏程度,同時減少因各指標響應速度不同所導致的檢測誤判和滯后.
1管網水質異常檢測算法
水質異常是指一個或多個水質指標在一定時間內所呈現出的偏離正常行為的波動狀況[17].由污染物所引起的水質異常通常會造成一個或多個水質指標產生波動,且不同指標的變化之間呈現一定的關聯性,這與因傳感器故障、儀器傳輸噪聲等因素所引起的水質監測數據波動有著本質的區別.這種關聯特性的利用可以在單一指標檢測的基礎之上,進一步提高異常檢測的準確性和靈敏程度.本文將單參數的基本異常概率和多參數的動態關聯系數進行融合,通過D-S證據理論的基本概率分配函數定義基于單參數的異常概率,利用動態時間規整算法來計算水質參數兩兩間的動態關聯系數.依據合成規則將單參數層面的異常概率與多參數層面的相關程度進行融合,對當前時刻水質是否存在異常作出綜合判斷.
1.1單參數基本異常概率計算
對于單指標的時間序列,異常的定義通常是指一段時間內的觀測值相對于參考值的偏移程度.本文通過D-S證據理論的基本概率分配函數來定義每個指標(證據)各自的異常概率.
D-S證據理論由Dempster[18]提出,并由Shafer進一步完善[19].D-S證據理論依靠證據(即多源信息)的積累,逐漸縮小假設范圍,從而實現多源信息的融合.證據理論最基本的內容包括3個部分:識別框架、基本概率分配函數和合成規則.
識別框架是一個元素可窮舉的集合,集合內互斥的各元素代表所有的可能性.在水質異常檢測中,識別框架中只包含正常(normal)與異常(abnormal)兩個元素.基本概率分配函數是從識別框架的冪集到[0,1]的映射,框架中所有可能性的概率之和為1.在水質異常檢測的實際應用中,單參數的基本異常概率須能夠反映出水質時間序列在短時間內的動態變化,因此引入短時均方根[20]來衡量水質時間序列在時間窗口內的波動情況.定義基本概率分配函數如下:
(1)
式中:m(Abnornal)為當前時刻該水質指標發生異常的概率;D為當前時刻向前一個時間窗內各個觀測值的短時均方根;σ為水質正常波動下歷史數據的短時均方根平均值,由歷史數據訓練而得.當水質時間序列的波動為零時,m(Abnormal)=0;當水質時間序列的波動趨于無窮時,m(Abnormal)=1.定義的單參數的基本異常概率符合實際物理含義.
1.2多參數關聯系數計算
在污染物注入系統之后并非所有的監測指標都會有響應.不同的污染物可能會引起不同指標的變化,且各指標的變化之間存在較強的關聯性.在將多個指標的檢測結果進行融合前,需要引入各個指標之間變化的關聯程度.
度量多指標時間序列相關性的主要方法包括Minkowski距離、動態時間規整、奇異值分解和基于點分布特征的方法等[21].動態時間規整算法(dynamictimewarping,DTW) 最早用于語音信號處理方向,由Berndt等[22]引入到時間序列分析中,用于度量兩個任意長度的時間序列的相似度.DTW算法對時間序列的同步問題穩健性較好,允許時間序列長度不同,且允許不同步的點進行對應計算,因此對于在時間軸上存在伸縮、扭曲和異位的時間序列,采用該算法能夠較好地度量兩時間序列之間的相似性.
DTW算法的原理如圖1所示,圖中,γ為電導率.依據兩點間的歐式距離可以構造距離矩陣d.

(2)
DTW算法的實質是在所有的點點匹配中尋找一種使得平均距離最短的匹配模式,即

(3)

圖1 DTW算法原理圖Fig.1 Schematic diagram of DTW
考慮到各指標在時間軸上可能存在響應不同步的情形,引入最大允許時間偏差ξ.ξ為兩序列對應點進行匹配時最大可以允許的時間軸異位,定義t0時刻兩時間序列間在最大允許時間偏差為ξ時的動態距離為

(4)
得到當前時刻兩序列的動態距離之后,將該距離值映射到[0,1]內,得到動態關聯系數為

(5)

(6)

1.3概率合成
合成規則是用于計算同一識別框架下不同證據信息的基本概率融合方法,根據實際情況不同,存在很多不同的合成規則.在水質異常檢測中,正常的水質波動情況下各參數的聯動性較弱,污染事件通常會引發兩種或兩種以上水質指標的聯動變化,因此本文的概率融合選擇將DTW算法得到的任意兩參數之間關聯系數與兩參數各自的單參數基本異常概率進行相乘,得到融合后的異常概率關聯矩陣.從矩陣各元素中選取最大值作為當前時刻的水質異常概率,通過與所設定的異常概率報警閾值進行比較,給出當前時刻水質是否存在異常的判斷結果.


(7)
綜上所示,提出的水質異常檢測方法計算流程如圖2所示.
概率合成規則是取單指標異常概率與多指標關聯系數乘積的最大值,因此如果只是單一指標因信號傳輸故障、瞬時噪聲引入等原因導致的波動,不會對乘積結果產生大幅度影響;當兩個或兩個以上水質指標監測值同時出現大幅波動,且各參數的波動具有較強的相關性時,融合概率有可能超過閾值形成異常報警.這樣的融合結果不僅能夠利用多參數之間的相關性實現準確的異常挖掘,而且可以有效地避免因傳感器噪聲、信號干擾等造成的誤報,盡量在保證檢出率的前提下降低誤報率.

圖2 異常判斷流程圖Fig.2 Anomaly detection flow chart
2管網污染物注入實驗
2.1污染物注入實驗設計
整個實驗是在課題組的供水管網模擬實驗系統上進行的.管網構造如圖3所示,包括自動加藥混合系統以及在線監測系統兩個部分.加藥過程通過PLC控制加藥支路的蠕動泵來實現,全部在線監測儀器都安置在主管路沿線上.

圖3 污染注入模擬實驗管網示意圖Fig.3 Experimental pipeline system structure diagram
根據《生活飲用水衛生標準》(GB5749-2006)的有關規定可知,城市飲用水的主要監測指標可以分為感官性狀與一般理化指標、微生物指標、毒理指標、消毒劑指標以及放射性指標.雖然近幾年傳感器技術的迅猛提升使得針對特定污染物的專用指標分析技術得到了快速的發展,然而整個自然界污染物質種類繁多,專用指標分析技術很難覆蓋全部種類.最常用的是諸如溫度、濁度、pH、電導率等感官性狀與一般理化指標.在該實驗系統中,進行在線測量的水質指標包括pH、濁度(turb)、溶解氧(dissolvedoxygen,DO)、總有機碳(totalorganiccarbon,TOC)、化學需氧量(chemicaloxygendemand,COD)、氨氮(NH3-N)、硝氮(NO3-N)和余氯(Cl),具體檢測內容及測量精度如表1所示.表中,TD為濁度.所有傳感器的采樣間隔統一設置為1min.實驗藥品選用硫酸銅溶液和鐵氰化鉀溶液.這兩種物質是電鍍、制銅、顏料、制革等領域中常用的工業原料,也是《污水綜合排放指標》和飲用水衛生標準中嚴控的指標,且這兩類污染物一旦注入供水管網,將會引起多種常規水質監測指標的異常波動.
實驗分為正常情況下的水質監測和污染物注入后的水質監測兩個階段,全部實驗持續5h,包含301個采樣時間點.前100min為正常情況下的水質監測實驗,該過程開啟主管路,關閉加藥支路,通過在線監測儀器對各個水質參數進行在線測量.隨后開展6組污染物注入實驗,分別通過加藥桶注入3組不同濃度的硫酸銅溶液和3組不同質量濃度的鐵氰化鉀溶液,具體加入的污染物溶液質量濃度如表2所示,每組注入實驗持續時間為10min.表中,ρ1~ρ3分別為第1~3次注入質量濃度.

表1 污染注入模擬實驗儀器儀表信息與對應檢測項目

表2 污染注入模擬實驗加藥質量濃度

圖4 正常的水質監測和污染物引起的異常Fig.4 Fluctuation in normal observation and contamination injection
圖4記錄的是正常情況下的水質波動和污染物注入后引起異常的監測結果.圖中,t為時間.其中前100個點為正常水質的監測結果,用于訓練窗口短時均方根和兩兩參數間動態距離的平均值.從第101點開始出現的灰色陰影部分表示污染物添加時刻.前3個灰色陰影分別對應于三次硫酸銅溶液注入,后3個分別對應鐵氰化鉀溶液的注入.
2.2單參數的基本異常概率計算
利用前100min系統正常運行情況下的水質監測數據,分別計算出8個參數歷史情況下短時均方根的均值σ.從第101個時間點開始進行污染物注入實驗,通過比較各參數在當前窗口內的短時均方根D與歷史均值σ的偏離程度來計算單參數的基本異常概率.分別選取硫酸銅注入實驗中t1=105時刻和鐵氰化鉀注入實驗中t2=205時刻的監測值進行分析,得到各參數的基本異常概率Pab,如表3所示.

表3 單參數基本異常概率計算
由基本異常概率可以看出,在硫酸銅溶液注入實驗中,pH、COD、TOC反應強烈,氨氮、硝氮、余氯反應不明顯;在鐵氰化鉀溶液注入實驗中,TOC、氨氮、硝氮、余氯反應強烈,pH、濁度沒有明顯變化.若基于單一參數的檢測結果進行異常判斷,則非常容易產生漏報.接下來考慮引入多參數間的關聯分析.
2.3多參數的動態關聯矩陣計算



圖5 正常情況下各參數的平均動態距離矩陣Fig.5 Average dynamic distance matrix under normal observation

圖6 t1=105時刻多指標動態關聯程度示意圖Fig.6 Multi-parameters dynamic correlation diagram at t1=105

圖7 t2=205時刻多指標動態關聯程度示意圖Fig.7 Multi-parameters dynamic correlation diagram at t2=205
2.4概率合成與異常判斷
利用提出的合成規則,將單指標的基本異常概率和多指標的關聯系數進行相乘,并從中選取最大值,可以得到t1=105和t2=205兩個時刻融合后的異常概率分別為
P(t1)=0.670 3,P(t2)=0.764 9.
(8)
得到融合的概率后,通過與設定的閾值進行比較,可以作出異常判斷.
3實驗結果分析
3.1檢測結果統計分析
對各參數所有時刻的監測數據進行分析處理,將融合概率的異常判斷結果按真陽性(truepositive,TP)、假陽性(falsepositive,FP)、真陰性(truenegative,TN)及假陰性(falsenegative,FN)進行統計,具體定義參見表4.根據統計的判定結果,可以定義算法的判斷準確度(accuracy,ACC).

表4 異常檢測混淆矩陣

(9)
基于以上定義,記錄301個采樣點的判定結果,如表5所示.設置觸發異常報警的概率閾值為0.65,得到融合后的檢測結果,如圖5所示.從實驗的統計結果可以看出,6次污染事件都成功檢出,檢測準確度可達95.3%.

表5 水質檢測統計結果
如表5所示,在整組實驗的301個時間點中,共產生3個誤報(FP)的時間點,其中有2個誤報點是發生在整組實驗開始的階段.對比圖4可以看出,由于系統剛剛啟動,濁度、溶解氧等指標相對不穩定,造成誤判.針對產生的11個漏報(FN)的時間點進行深入分析.圖8中,AE、AR分別為實際情況和檢測結果.由圖8可以看出,這些漏報點都發生在事件開始的階段,即在事件發生與產生報警之間存在一定的遲延,平均每次事件的遲延為1.0~2.0個時間步長.

圖8 實際事件與檢測結果對比圖Fig.8 Comparison between actual events and detection results
3.2ROC曲線和異常檢測性能分析
ROC曲線[23](受試者工作特征曲線)是使用最廣泛的算法性能評價方法.ROC曲線是以誤報率(falsepositiverate,FPR)為橫坐標、檢出率(truepositiverate,TPR)為縱坐標繪制而成的,曲線與橫軸和直線x=1所圍成的圖形面積被稱為ROC曲線下面積.ROC曲線下面積越大,算法的性能越好.此外,從原點引出的對角線意味著隨機判定的結果,因此一個算法的ROC曲線應在對角線左上方,才能說明該方法是有效的.

圖9 ROC曲線效果圖Fig.9 Roc curve comparison diagram
如圖9的虛線所示為采用動態時間規整算法得到的ROC曲線.為了凸顯動態時間規整在處理時間軸存在形變問題時的有效性,引入直接利用皮爾遜相關系數法(具體算法參見文獻[16])計算兩兩指標之間的波動相關性的方法進行對比,ROC曲線如點劃線所示.從圖9可以看出,雖然皮爾遜相關系數法相較于其他的多指標融合水質異常檢測算法而言,將多個參數之間的相關性納入水質評價當中,但由于受各參數在時間軸上表現不一致的影響,ROC曲線下面積明顯小于基于動態時間規整算法的ROC曲線下面積.特別是當誤報率較小時,動態時間規整算法的檢出率遠高于相關系數法.這說明基于動態時間規整的異常檢測算法不僅能夠較好地挖掘各參數之間的波動相關性,更避免了因參數反應速度不一致所帶來的影響,具有較好的檢測效果.
4結語
針對目前城市供水水質污染種類眾多、現有報警技術未充分利用多指標內在關聯信息等問題,本文提出基于多水質指標間動態關聯分析進行水質異常檢測的方法.通過衡量單參數層面的異常概率以及多參數兩兩之間的動態相關性,得到融合后的水質異常概率,從而判斷當前水質是否存在異常.選取多組不同濃度的硫酸銅溶液和鐵氰化鉀溶液進行管網模擬實驗,利用實驗所得的數據對方法的有效性進行驗證.實驗結果表明,采用該方法可以有效地挖掘污染物注入前、后水質指標間的內在聯系,利用關聯信息對因污染物引起的水質異常波動進行檢測和識別,在保證了檢出率的情況下盡可能降低誤報率,同時能夠較好地克服各參數在時間軸上表現不一致所帶來的干擾,實現更加及時、準確地水質異常檢測.城市供水管網的空間跨度遠大于實驗室模擬系統,因此在實際應用中,算法的性能可能會受制于傳感器安裝位置以及響應速度的影響.未來的研究可以著眼于如何利用供水網絡中多個檢測站點的信息來提升異常檢測的準確性.
參考文獻(References):
[1]TAMMINENS,RAMOSH,COVASD.WatersupplysystemperformancefordifferentpipematerialspartI;waterqualityanalysis[J].WaterResourcesManagement, 2008, 22(11): 1579-1607.
[2]BYERMD,CARLSONK.Real-timedetectionofintentionalchemicalcontaminationinthedistributionsystem[J].JournalAmericanWaterWorksAssociation, 2005, 97(7): 1-34.
[3]FARUKD.AhybridneuralnetworkandARIMAmodelforwaterqualitytimeseriesprediction[J].EngineeringApplicationsofArtificialIntelligence, 2010, 23(4): 586-594.
[4]BABINSM,BURKOMHS,MNATSAKANYANZR,etal.Drinkingwatersecurityandpublichealthdiseaseoutbreaksurveillance[J].JohnsHopkinsAplTechnicalDigest, 2008, 27(4): 403-411.
[5]OLIKERN,OSTAFELDA.Acoupledclassification-evolutionaryoptimizationmodelforcontaminationeventdetectioninwaterdistributionsystems[J].WaterResearch, 2014, 51(6): 234-245.
[6]PERELMANL,ARADJ,HOUSHM,etal.Eventdetectioninwaterdistributionsystemsfrommultivariatewaterqualitytimeseries[J].EnvironmentalScienceandTechnology, 2012, 46(15): 8212-8219.
[7]MODARESIF,ARAGHINEJADS.Acomparativeassessmentofsupportvectormachines,probabilisticneuralnetworks,andk-nearestneighboralgorithmsforwaterqualityclassification[J].WaterResourcesManagement, 2014, 28(12): 4095-4111.
[8]ZOUH,ZOUZ,WANGX.AnenhancedK-meansalgorithmforwaterqualityanalysisoftheHaiheriverinChina[J].InternationalJournalofEnvironmentalResearchandPublicHealth, 2015, 12(11): 14400-14413.
[9]MCKENNASA,VUGRINED,HARTDB,etal.Multivariatetrajectoryclusteringforfalsepositivereductioninonlineeventdetection[J].JournalofWaterResourcesPlanningandManagement, 2013, 139(1): 3-12.
[10]OLIKERN,OSTFELDA.Minimumvolumeellipsoidclassificationmodelforcontaminationeventdetectioninwaterdistributionsystems[J].BulletinoftheAtomicScientists, 2014, 57(6): 1-12.
[11]MCKENNASA,KLISEKA.Multivariateapplicationsfordetectinganomalouswaterquality[C] ∥ 2006WaterDistributionSystemsAnalysisSymposium.Cincinnati: [s.n.], 2006: 1-11.
[12]YANGYJ,HAUGHTRC,GOODRICHJA.Real-timecontaminantdetectionandclassificationinadrinkingwaterpipeusingconventionalwaterqualitysensors:techniquesandexperimentalresults[J].JournalofEnvironmentalManagement, 2009, 90(8): 2494-2506.
[13]OLIKERN,OSTFELDA.Waterqualityeventdetectioninwaternetworksthroughmultiplesensorsdata[C] ∥ProceedingsofWorldEnvironmentalandWaterResourcesCongress.Austin:IEEE, 2015: 902-906.
[14]BENSALEHMS,QASIMSM,OBEIDAM,etal.Areviewonwirelesssensornetworkforwaterpipelinemonitoringapplications[C] ∥ 2013CollaborationTechnologiesandSystems(CTS)ofIEEE.SanDiego:IEEE, 2013: 128-131.
[15]JONATHANA,MASHORH,LINAP,etal.Adynamicthresholdsschemeforcontaminanteventdetectioninwaterdistributionsystems[J].WaterResearch, 2013, 47(5): 1899-1908.
[16]SHUMINGL,HANC,KATES,etal.Contaminationeventdetectionusingmultipletypesofconventionalwaterqualitysensorsinsourcewater[J].EnvironmentalMonitoringandAssessment, 2014, 16(8): 2028-2038.
[17]MUNIZCD,NIETOPJ,FERNANDEZJR,etal.DetectionofoutliersinwaterqualitymonitoringsamplesusingfunctionaldataanalysisinSanEstebanestuary(NorthernSpain) [J].ScienceoftheTotalEnvironment, 2012, 439(1): 54-61.
[18]GIAOBC,ANHDT.Similaritysearchinmultiplehighspeedtimeseriesstreamsunderdynamictimewarping[C] ∥ 2015NationalFoundationforScienceandTechnologyDevelopmentConferenceonInformationandComputerScience.HoChiMinhCity:IEEE, 2015: 82-87.
[19]ZHUQY,ZHANGGX,FENGTH,etal.Studyonwaterqualityanalysisandearly-warningtechnologybasedonroughsetandevidencetheory[J].JournalofZhejiangUniversity, 2012, 38(6): 747-754.
[20] 楊將新,鄭華文,曹衍龍,等. 基于自適應AR模型的核電站松動件報警方法[J]. 原子能科學技術, 2010, 44(6): 701-705.
YANGJiang-xin,ZHENGHua-wen,CAOYan-long,etal.Alarmingmethodofloosepartsinnuclearpowerplantbasedonadaptiveauto-regressivemodel[J].AtomicEnergyScienceandTechnology, 2010, 44(6): 701-705.
[21] 李正欣,張鳳鳴,李克武. 基于DTW的多元時間序列模式匹配方法[J]. 模式識別與人工智能, 2011, 03(4): 425-430.
LIZheng-xin,ZHANGFeng-ming,LIKe-wu.DTWbasedpatternmatchingmethodformultivariatetimeseries[J].PatternRecognitionandArtificialIntelligence, 2011, 03(4): 425-430.
[22]BERNDTDJ,CLIFFORDJ.Findingpatternsintimeseries:adynamicprogrammingapproach[J].AdvancesinKnowledgeDiscoveryandDataMining, 1996, 1(1): 229-248.
[23]FAWCETTT.AnintroductiontoROCanalysis[J].PatternRecognitionLetters, 2006, 27(8): 861-874.
收稿日期:2015-11-15.浙江大學學報(工學版)網址: www.journals.zju.edu.cn/eng
基金項目:國家自然科學基金資助項目(61573313;U1509208);浙江省科技廳公益資助項目(2014C33025);浙江省重點研發計劃資助項目(2015C03G2010034).
作者簡介:魏媛(1990-),女,碩士生,從事多源信息融合水質異常檢測技術研究. ORCID: 0000-0002-5312-8791. E-mail: vera_wy@zju.edu.cn 通信聯系人:黃平捷,男,副教授. ORCID: 0000-0002-5487-6097. E-mail: huangpingjie@zju.edu.cn
DOI:10.3785/j.issn.1008-973X.2016.07.025
中圖分類號:X 832
文獻標志碼:A
文章編號:1008-973X(2016)07-1402-08
Contaminationeventdetectionmethodbasedondynamiccorrelationanalysisofmultiplewaterqualityparameters
WEIYuan,FENGTian-heng,HUANGPing-jie,HOUDi-bo,ZHANGGuang-xin
(State Key Laboratory of Industrial Control Technology, Zhejiang University, Hangzhou 310027, China)
Abstract:A multivariate correlation analysis method was proposed by exploring the internal correlation within conventional water quality parameters before and after the occurrence of contamination event in order to improve the performance of the existing water quality anomaly detection methods. The dynamic distance between each two monitored parameters was calculated to define the fluctuation correlation of the two time series by using the dynamic time warping (DTW) method. The correlation coefficient was fused with univariate basic abnormal probability based on D-S evidence theory in order to obtain the fused probability. The synthesis alarm decision was made by comparing the fused probability with the threshold. The proposed method was tested with experimental monitoring data collected from the laboratory pipeline system. Different concentrations of copper sulfate and potassium ferricyanide were separately injected into the pipeline system. Eight conventional monitoring parameters were measured by sensors installed along the pipeline. The collected monitoring data was applied to correlation analysis and probability fusion based on the proposed method. The ROC analysis was introduced to verify the performance and validity of the techniques.
Key words:conventional water parameter; data fusion; water quality event detection; time series analysis; dynamic time warping; correlation analysis