樊東紅,曾 彥,王明娟
FCM算法在欽州灣不同時期水質預測中的應用
樊東紅,曾 彥,王明娟
(欽州學院 物理與材料科學學院,廣西 欽州 535000)
對欽州灣2008-2009年6個航次的調查資料進行分析,數據共有24個指標,15個站點。由于指標過多,數據處理不方便并且也不準確。利用FCM模糊聚類算法對欽州灣水體中的污染物進行分析 ,通過預測,得到2010年春、夏、秋、冬四個季度各個指標的數據,旨在了解欽州灣不同時期水質污染狀況以及其趨勢,為該灣的環境治理以及生態環境的可持續發展提供科學依據。
生態環境;水質預測;FCM;模糊聚類
欽州灣位于北部灣西北部海域,東鄰欽州市欽南區,西鄰企沙半島,北與欽州市接壤,南臨北部灣,為典型的溺谷型半封閉式海灣。茅嶺江和欽江兩條常年河流輸入灣內,近年來,隨著沿海經濟的迅猛發展,工業廢水與生活污水也大量排進,水域的污染負荷明顯加重[1]。為保證城市供水系統安全,必須實施水質監控、水質預測和對突發性水質風險進行準確預警,這對城市供水的精細化管理具有十分迫切的現實意義。
水質預測是在水污染控制單元內建立水域功能區水質指標與陸域相應污染之間的輸入相應關系,為水質量管理提供科學依據。水質預測通常是利用歷史數據,通過一定方法推求環境變量推求環境變量與待測水質指標之間的非線性關系或待測水質指標本身隨時間的變化規律[2]。
作為基于目標函數的動態優化算法FCM(Fuzzy C-Means)模糊聚類算法,廣泛應用在數據挖掘、圖像分割、模式識別、市場營銷等領域,并取得了良好的效果[3]。我們根據欽州灣2008-2009年6個航次的調查資料,利用FCM模糊聚類算法對欽州灣水體中的污染物進行了分析[4],通過預測得到2010年春、夏、秋、冬四個季度的15個站點各個指標的數據,旨在了解欽州灣不同時期污染狀況以及其趨勢,為該灣的環境治理以及生態環境的可持續發展提供科學依據。
通過觀察欽州灣2008~2009年的水質數據,共有24個指標,15個站點。指標包括:鹽度、pH值、溶解氧、COD、磷酸鹽、亞硝酸鹽、銨鹽、油類、硅酸鹽、油類、葉綠素a、懸浮物、總磷、總氮、總貢、銅、鉛、鋅、鉻、水深、水溫、水色、透明度。由于指標過多,對數據處理起來不方便并且也很不準確。所以我們將這24個指標分為6個小類[5-6]:鹽度、pH、溶解氧、COD一類,稱為基本類;磷酸鹽、亞硝酸鹽、銨鹽、油類、硅酸鹽一類,稱為鹽類;油類、葉綠素a、懸浮物一類,稱為有機物類;總磷、總氮一類,稱為非金屬類;總貢、銅、鉛、鋅、鉻一類,稱為金屬類;水深、水溫、水色、透明度一類稱為水的性質類,分類情況見表1。根據這幾個小類,對6個航次的數據分別作聚類分析,運用的方法是FCM算法[7]。

表1 水質指標分類Table 1 Classification of water quality indexes
根據FCM算法的Matlab程序對數據進行聚類分析[8]。
(1)對2008年秋季航次的基本類進行聚類(聚為3類),聚類結果如表2所示,3D聚類結果圖如1所示。
(2)對2008年冬季航次的鹽類進行聚類(聚為4類),聚類結果如表2所示,3D聚類結果圖如圖2所示。
(3)對2009年春季航次的有機物類進行聚類(聚類5類),聚類結果如表2所示,3D聚類結果圖如圖3所示。
(4)對2009年夏季航次的水的性質類進行聚類(聚為6類),聚類結果如表3所示,2D聚類結果圖如圖4所示。
(5)對2009年秋季航次的金屬類進行聚類(聚為4類),聚類結果如表3所示,3D聚類結果圖如圖5所示。
(6)對2009年冬季航次的水的性質類進行聚類(聚為6類),結果結果如表3所示,3D聚類結果圖如圖6所示。
由于篇幅問題,以上只列出少數聚類結果。

表2 2008年秋季、2008年冬季、2009年春季聚類Table 2 Cluster results of data in autumn of 2008, winter of 2008 and spring of 2009

表3 2009年夏季、秋季、冬季聚類結果Table 3 Cluster results of data in summer of 2009,autumn of 2009 and winter of 2009
通過對所有的聚類情況進行觀察,一個季度中的幾種聚類沒有大概相似的情況,所以本文提出一種方法,就是對一個季度中聚為相同類數的幾種情況進行交運算。這樣,經過運算后的結果是符合所有的聚類情況的。
對各個季度各種聚類情況進行處理后得到兩種比較好的結果:
(1)2009年春季航次聚為3類的情況
6個小類經過FCM算法聚類后的結果如表3所示。
經過對表3的集合進行交運算后得到11類,結果如下:
{1}、{2}、{3}、{4,5,6}、{7}、{8}、{10}、{11}、{12}、{14}、{9,13,15}。
(2)2009年冬季航次聚為3類的情況
6個小類經過FCM算法聚類后的結果如表 4所示。
經過對表4的集合進行交運算后得到11類,結果如下:
{1}、{2}、{3}、{4,5}、{6}、{7}、{8,9,13,14}、{10}、{11}、{12}、{15}。

圖1 2008年秋季3D聚類結果Fig.1 3D cluster results in autumn of 2008

圖2 2008年冬季3D聚類結果Fig.2 3D cluster results in winter of 2008

圖3 2009年春季3D聚類結果Fig.3 3D cluster results in spring of 2009

圖4 2009年夏季2D聚類結果Fig.4 2D cluster results in summer of 2009

圖5 2009年秋季聚類Fig.5 3D cluster results in autumn of 2009

圖6 2009年冬季聚類Fig.6 3D cluster results in winter of 2009

表4 2009年春季經過集合交運算后的聚類結果Table 4 Cluster results of intersection operation in spring of 2009
我們以欽州灣2008年秋季航次到2009年冬季航次的水質數據為例,進行預測2010年四個季度的水質情況,觀察結果進行分析。
通過指數平滑法季節性中的三個基本條件結果和實際數據做對比,得出冬季相乘法最適合次預測模型[9]。
在這里只列出鹽度的預測結果,其他的可以根據實際數據和預測數據選擇最適合的預測方法[10]。
通過預測得到2010年春、夏、秋、冬四個季度的15個站點各個指標的數據,然后通過和第2節中的聚類方法對預測出來的數據進行處理。最終得到結果:

圖7 指數平滑法的冬季相乘性結果Fig.7 Multiply results of exponential smoothing method in winter

表5 2009年冬季經過集合交運算后的聚類結果Table 5 Cluster results of intersection operation in winter of 2009

表6 選擇模型Table 6 Selection of model
(1)2010年春季航次預測后聚類結果如表7所示。進行集合交運算后得到的聚類結果為:
{1}、{2}、{3}、{4}、{5}、{6}、{7}、{8}、{9}、{10}、{11}、{12}、{13}、{14}、{15}。
(2)2010年夏季航次預測后聚類結果如表8。進行集合交運算后得到的聚類結果為:
{1}、{2}、{3}、{4}、{5}、{6}、{7}、{8,9,10,11}、{12}、{13}、{14}、{15}。
(3)2010年秋季航次預測后聚類結果如表9所示。進行集合交運算后得到的聚類結果為:
{1}、{2}、{3}、{4}、{5}、{6}、{7}、{8}、{9}、{10}、{11}、{12}、{13}、{14}、{15}。
(4)2010年冬季航次預測后聚類結果如表10所示。進行集合交運算后得到的聚類結果為:
{1,2}、{3}、{4}、{5}、{6}、{7,11}、{8,10}、{9}、{12}、{13}、{14}、{15}。
通過上一節的聚類結果,2010年夏季航次和冬季航次最終的聚類結果都聚為了12類,春季航次和秋季航次都是一個站點一個類。2010年秋季和冬季航次的聚類結果與2009年秋季航次和冬季航次的聚類結果類似,聚類次數相近:2009年秋季15類,2010年秋季15類;2009年冬季11類,2010年冬季12類。實際結合證明:預測結果是可行的。

表7 2010年春季航次預測后聚類結果Table 7 Cluster results of voyage forecast in spring of 2010

表8 2010年夏季航次預測后聚類結果Table 8 Cluster results of voyage forecast in summer of 2010

表9 2010年秋季航次預測后聚類結果Table 9 Cluster results of voyage forecast in autumn of 2010

表10 2010年冬季航次預測后聚類結果Table 10 Cluster results of voyage forecast in winter of 2010
[1] 何本茂,韋蔓新.欽州灣的生態環境特征及其與水體自凈條件的關系分析[J].海洋通報,2004年第4期,51-54
[2] 胡海清,周小麗,宋 毅. LM-BP神經網絡在水質預測的應用[J].微型電腦應用,2011年第9期,44-46
[3] 邢 婷,邢治國,王鳳領.基于信息熵的FCM聚類算法[J].計算機工程與設計,2010,31(23):5092-5095
[4] 付 輝.模糊C-均值(FCM)聚類算法的改進[J].科學技術與工程,2007,7(13):3121-3123.
[5] 李銳祈,胡興宜,周金星,等.基于主成分分析與聚類分析的灘地環境抑螺效果評價[J]. 中南林業科技大學學報,2010,(6): 27-31.
[6] 王 穎,彭省臨,劉 峰.模糊數學理論及其在大氣環境測評中的應用[J]. 中南林業科技大學學報,2008,(6):139-143.
[7] 張新波.兩階段模糊C-均值聚類算法[J].電路與系統學報[J],2005,10(2):117-120.
[8] 蔡靜穎.模糊C-均值算法的研究[D].遼寧師范大學,2010.4.
[9] 吳 文.長三角遙感水質分類技術研究[D].南京理工大學.2006. 6.
[10] 宮改云,高新波,伍忠東.FCM聚類算法中模糊加權指數m的優選方法[J].模糊系統與數學,2005,19(1):143-148.
Application of FCM algorithm on water quality prediction of different periods in Qinzhou Bay area
FAN dong-hong, ZENG Yan, WANG Ming-juan
(School of Physics and Material Science, Qinzhou University, Qinzhou 535000, Guangxi, China)
The aerial survey data of Qinzhou Bay area by six times taken in 2008~2009 were studied, and the data involve 24 observation indexes and 15 aerial survey sites. Because of too many indexes, the data processing was not convenient and accurate. By using FCM Fuzzy clustering algorithm, the pollutants in Qinzhou Bay area waters were analyzed, and through prediction, the data of every indexes in spring, summer, autumn and winter in 2010 were obtained, thus understanding the water pollution state and trend, providing scientific basis of ecological environment's sustainable development and environmental control for Qinzhou Bay area.
ecological environment; prediction of water quality; FCM algorithm; fuzzy cluster
S718.51+2.3;X173
A
1673-923X(2012)11-0158-05
2012-08-10
廣西自然科學基金項目(2011GXNSFA018151);廣西教育廳科研資助項目(201012MS194);廣西科學研究與技術開發計劃課題(桂科攻0895004-4)
樊東紅(1964-),女,廣西忻城人,副教授,主要研究方向為計算機應用技術、智能推理與智能控制
曾 彥(1961-),男,廣西浦北人,副教授,主要研究方向為智能推理與智能控制
[本文編校:歐陽欽]