周美姣,董俐香,吳 佳,顧 桔
(青山綠水(江蘇)檢驗檢測有限公司,江蘇 常州 213000)
隨著國內經濟的快速發展,國民的生活水平不斷提升,促使國內工業化發展速度不斷加快,而帶來的負面影響就是我國的環境污染問題日益嚴重[1]。地表水污染是其中最突出的問題,地表水污染導致水生物大量死亡,多種水生物因無法在水體中繼續生存而面臨滅絕。地表水是人類生存所需的生命源泉,改善地表水的污染情況迫在眉睫。
當前國內地表水水源正面臨水體質量持續惡化、水體功能喪失、安全保障體系偏弱等問題。我國的地表水水源地主要包括湖庫型水源地、河流型水源地等。地表水水源地因不斷受到人類生產活動和自然條件變化等因素影響而引發安全性問題,包括各類水源地的水量減少、水體垃圾增多而引發水質惡化,使水源地的水量和水質得不到保障,無法滿足人們生產生活對地表水的需求,最終影響人類的生存和社會的穩定發展。
由于各類水源地的地表水存在體系復雜、管理風險多、各類污染事件突發性強等客觀情況,國內有學者把水源地地表水存在的安全風險進行了分級,包括:水量、水質、生態環境、工程和管理等方面存在的安全風險,但目前針對水源地地表水的安全風險評價大多是根據地表水水質的安全風險程度進行的[2]。在特定的時間、空間、環境等條件下水質的安全風險主要來自自然環境變化或人類活動影響導致的水體污染或水質惡化事件,地表水水質安全風險主要包括突發性和非突發性安全風險。水質突發性安全風險主要指因突發性自然災害、人類生產事故等造成的地表水水質污染、超標問題。而水質非突發性安全風險則指因水體自身污染物不斷積累、超過了自身環境容量而引起的地表水水質惡化事件。伴隨著社會經濟的快速發展,各類化學原料的大量使用導致水質突發性污染事件對地表水造成的損害越來越嚴重。隨著我國《水污染防治法》、《水污染防治行動計劃》(水十條)等水污染相關法律規范的發布和實施,社會各界對地表水水質安全問題和保護地表水水質安全發出了越來越高的呼聲,地表水安全風險防控思想逐漸得到社會各界的重視。
我國的水質安全風險評價主要通過水質監測分類、水環境質量評價,水質安全風險等級評估等指導水質安全防控工作。水環境質量等級分類及評價是將水質的監測結果與水質標準進行比較,從而確定水質狀況,是水環境安全管理的基礎工作?,F階段,我國主要依據《地表水環境質量標準》(GB 3838-2002)[3]要求對地表水水質等級進行分類和評價工作,質量標準根據地表水保護目標和水域環境功能,將水質分為5 個等級,從好到壞依次為Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ。
目前我國地表水水質的監測方法主要有以下三類:常規方法監測、自動在線監測以及突發應急監測。其中利用常規方法監測時,現場監測人員需合理確定現場采樣斷面、進行水樣采集、運輸,經實驗室檢測分析并出具檢測結果。采用常規方法監測時必須考慮到各方面的資源,不能有效保證監測的時效性與全面性,而且實驗室分析會消耗大量的化學試劑,并產生很多實驗室廢水和固體廢物,對環境造成了二次污染。而利用自動在線監測方法時,現場人員需要在指定的測試水段放置在線監測設備,實現對水質監測數據的自動化傳輸、遠程控制,然而自動監測設備需要人員進行定期的現場維護,人工和設備維護成本較高。突發應急監測是針對突發水污染事件需要快速了解水質情況,需要采用專業高效的應急監測設備,包括便攜式氣相-質譜儀、便攜式金屬分析儀等。應急監測設備可以實現對地表水環境污染物質的快速監測,但在實際應用時,該方法所涉及的設備成本非常高,應急方法需要專業的現場監測人員進行科學選用。
傳統監測方法通過單因子監測結果評價水質情況,過于保守,不能體現真實的水質水平,也無法解決各項水質參數與水質水平之間復雜的、非線性的因果關系,同時繁瑣的監測過程和成本過高的軟、硬件配置,不能滿足突發性水質應急監測的需求。為了解決傳統監測方法在水質安全風險評價過程中的短板,國內外學者已提出多種水質安全評價方法,如水質指數法、污染指數法、模糊綜合指數法、灰色聚類法等,建立的地表水環境質量分類模型都屬于傳統的模型,沒有很好地解決目前水環境質量分類中的評價因子和水質等級之間存在的非線性關系,也未形成統一的評價模式,無法應用于實際工作中。
機器學習是人工智能的一個分支,可以實現自動分類。通過機器學習方法,可以模擬環境變量和水質水平之間的關系。在此之前,已有學者將機器學習方法應用到水質分類中。Yan 等人首次將自適應神經模糊推理系統(ANIFS)(模型結構見圖1)應用于水質分類,取得了高達89.59%的分類精確率[4]。

圖1 ANIFS 模型結構
Modaresi 等對德國黑蘭平原主要含水層的水質數據進行了研究,并指出在支持向量機(SVM)、概率神經網絡(PNN)和K-鄰近算法(KNN)中SVM(模型結構見圖2)的性能最佳[5]。

圖2 支持向量機模型結構
2020 年初,國內有學者提出采用基于協方差自適應調整進化策略算法(CMAES)的集成學習方法,構建地表水質分類模型。CMAES 是一種求解連續無約束優化問題的進化算法,核心思想是通過對正態分布協方差矩陣的調整,使種群收斂到全局最優解。CMAES 算法具有收斂速度快、保序性強等優點,而且不易早熟,對種群大小也不會過分依賴[5]。
深度學習是在神經網絡的基礎上進行疊加隱層層數的一種學習網絡,它伴隨著當今信息時代的發展而誕生。1998 年研究者在對神經網絡的訓練過程中,遇到了“梯度爆炸”問題,問題表現為神經網絡訓練中越遠離輸出層的參數就越難以訓練,從而使神經網絡訓練進入了低潮期。為了解決上述問題,Hinton 等[6]人在2006 年提出了深度學習新的訓練方法,克服了神經網絡訓練的瓶頸問題。在這之后,隨著互聯網科技的快速發展,深度學習的應用也得到了快速發展。近年來還有學者將深度學習應用于人臉和自然圖像的識別,大大提高了圖像識別的準確性。這些應用成果都讓人們相信在不久的將來,以深度學習為基礎工具,各個領域的研究一定會給社會帶來更大的變化。
深度學習研究目前仍然處于比較基礎的研究和淺顯的應用階段,目前將深度學習算法應用在水質等級分類研究的國內外相關報道還非常少。2020 年3 月由同濟大學劉春教授帶領的研究團隊發表的文章[7],提出了一種基于深度學習的圖像像素級標注算法。通過數據預處理、數據集建立、全卷積神經網絡設計和訓練流程,實現水體的水質等級分類及像素級標注[8]。該算法使用了上海市某區域的無人機低空遙感影像進行了驗證研究,通過研究獲得的平均水質等級分類精度達到了87.96%的水平,這一結果支持該算法的可行性。
基于深度學習對環境地表水源質量等級進行分類研究及應用是一項十分重要的工作,本文提出通過進一步優化深度學習算法,選擇合適的深度學習CNN 網絡模型,包括但不限于VGG16、DenseNet、Resnet50、AlexNet、Faster R-CNN 等中的圖像識別技術,分別對不同的模型選擇合適的參數,進行訓練和調參,找到最合適的訓練模型和參數設置。聯合環境水質檢測技術,將地表水源水質檢測數據和地表水現狀圖片相結合,進行關聯性研究分析,建立水質參數檢測結果與水質水平之間復雜的、非線性的因果關系,從而建立地表水水源質量等級分類系統,實現了通過水質現狀圖片快速、準確地對未知地表水進行水質分類識別。
基于深度學習對環境地表水源質量等級進行分類研究的結果可為相關部門的政策制定提供依據,也可為進一步開展地表水水源地安全風險評估奠定基礎。分類系統可代替常規的檢測技術在水質污染事件、日常防控、檢測等工作中發揮更加及時、有效的預測預報作用,可以讓水質調查者、監控者快速獲取水質現狀情況,避免延后工作給決策者帶來的時機延誤。同時,通過減少對傳統檢測分類方法的使用,可以降低水質調查等部門的運行成本,避免常規檢測等技術手段對環境造成的二次污染。