劉軒,趙同謙,蔡太義,肖春艷,陳曉舒,張文靜
(1.河南理工大學資源環境學院,河南 焦作 454000;2.河南理工大學測繪與國土信息工程學院,河南 焦作 454000)
南水北調工程是具有重大國際影響的跨流域調水工程,是我國跨流域水資源優化配置和保障民生的重大戰略性基礎設施。而丹江口水庫作為南水北調工程的水源地,是國家最為重要的水源保護區之一,輸水水質安全保障極其重要[1]。近年來,庫區通過調整周邊農業種植結構、減少工業排污、加大水土保持力度,使庫區水質總體良好,水質常年保持Ⅱ類標準以上[2]。但是,隨著庫區周邊經濟不斷發展,許多城鎮在山地中發展水產業、中藥材加工業、林產品加工業,由于建設用地較少制約經濟發展,部分區域土地過度開發影響生態環境的可持續發展,對丹江口水庫的水質安全造成了一定威脅[3]。丹江口水庫的水質狀況不僅直接影響庫區水質和生態環境,更關系到南水北調中線工程沿線大中城市的經濟發展,以及居民生活用水安全。
傳統的水質監測方法主要是通過實地水質采樣結合實驗室分析來獲取水質信息,雖然準確度較高,但是無法對斷面進行實時監測,難以及時全面地反映水體水質的時空變化狀況,具有一定的局限性。近年來,隨著遙感技術不斷發展,水質遙感監測技術作為一種非傳統監測技術,監測范圍廣、能夠快速實時地獲取湖泊區域水質的時空分布并反映污染物主要來源[4]。同時,水質遙感監測還可以預測污染物的流動趨勢,滿足大范圍水域水質時空監測的要求,彌補傳統水質監測方法的不足[5]。常規的遙感水質參數反演方法主要有經驗方法[6]、半經驗法[7]和半分析法[8]。其中,半經驗法隨著高光譜遙感數據在水質監測中的應用逐步得到發展,其原理是將已知水質參數光譜特征與最佳波段或波段組合,通過數學統計方法進行相關分析后,反演水質指標含量,是目前水質反演最常用的一種方法[9]。常用的數學方法有線性回歸[10]、多項式回歸[11]、模糊綜合評價[12]、貝葉斯分析[13]、灰色系統理論[14]和神經網絡模型[15]等方法。如BUCKTON等[16]利用人工神經網絡,借助MERIS數據反演了葉綠素、非葉綠素懸浮物和溶解有機物3 種水質指標[16]。冼翠玲等[17]利用高分辨率遙感影像和實測水質數據,對溫瑞塘河總氮和總磷遙感構建反演模型進行遙感反演,發現多元線性回歸和人工神經網絡模型,均能有效地體現溫瑞塘河的水質狀況和空間分布。
氮素是引起水體富營養化和影響藻類繁殖的重要因素,對水體水質具有非常重要的影響。因此監測水體中的氮含量,對防止氮污染、加強湖泊水生態環境治理極其關鍵[18]。總氮(TN)與氨氮(NH3-N)是體現水質中氮含量的兩項重要指標。但是,TN 與NH3-N由于不存在顯著的光學特性無法直接進行遙感反演,通常需要分析其與水體中不同物質之間的相互關系進行間接分析[19]。雷坤等[20]利用CBERS-1 數據建立了太湖表層水體葉綠素a 和TN 的遙感信息模型,反演了葉綠素a 和TN 的分布狀況后發現,監測數據的同步性和覆蓋范圍對建立的水質遙感反演模型的準確性和適用性有重要影響。DEWIDAR 等[21]利用9 月份的Landsat-5 TM 各波段與總磷(TP)、TN、溶解氮(DO)、pH 值和含鹽量等水質指標的相關性進行分析,研究發現TN與波段1和波段2的相關性最強。與其他水質指標相比,氮元素受區域和季節影響程度較高,同時缺少物理機理支撐,對其進行遙感反演需要更多的波段信息進行驗證[22]。深入研究TN 與NH3-N等非光學活性物質光學特性,特別是光學特性與水體表面反射率、輻射亮度之間的相互關系,進一步深入拓展TN 與NH3-N 反演模型,可以為不同地域、不同特點水體的水質遙感反演尋求更為精確的反演模型。
目前,常用的水質遙感反演方法雖然達到一定的精度要求,但也存在各自的缺點。如線性回歸簡單易實現,但其忽略了水質參數與遙感數據之間的非線性關系,無法更好地提高遙感反演的精度[23]。使用經驗方法結合機器學習和深度學習方法,能夠揭示更高層次和非線性的統計關系,并將水質參數中的關鍵變量與非光學活性物質參數聯系起來[24]。BP 神經網絡是基于人工智能的一種非線性數據建模工具,具有較強的自適應和自學習能力[25]。引起水質變化的影響因素較多,傳統的反演模型無法很好地解決影響因素對水質作用呈現出的復雜非線性關系,而BP 神經網絡能夠較好地擬合影響因素與水質指標之間的相互關系,從而降低人為干擾使評價結果更客觀準確[26]。
不同遙感傳感器的時空分辨率、回訪時間均會對水質遙感反演精度產生一定程度影響。如KUTSER等[27]的研究發現在提取黑色湖泊懸浮物方面Sentinel-2 優于Landsat 8 OLI。早期的水質遙感反演研究常用的遙感數據有MODIS[28]、HJ-1[29]、Landsat TM/OLI[30]和GF-1 WFV[31]等。部分衛星數據的空間分辨率相對較低,適用于尺度較小的典型區域,而在大型湖泊進行TN 與NH3-N 含量遙感反演具有一定局限性。Sentinel-2 影像是新一代多光譜影像,搭載MSI傳感器,共有13 個波段,重訪時間為5 d。其中可見光到近紅外波段空間分辨率為10 m,4 個紅邊波段和2 個短波紅外波段空間分辨率為20 m。Sentinel-2 綜合了其他衛星遙感數據的優勢,其重訪時間短、分辨率高且光譜識別能力強的特點,非常適用于大型湖泊水體監測并可確保結果更加精確[32]。
綜上,本研究結合丹江口水庫實際監測數據和Sentinel-2遙感影像,對TN與NH3-N含量的敏感波段進行分析并構建BP 神經網絡反演模型,采用BP 神經網絡對丹江口水庫2016—2020 年TN 和NH3-N 含量進行反演,獲取更具實際意義的TN 和NH3-N 時空變化特征,為積累區域性與季節性水體固有光學特性數據提供科學的參考依據。
南水北調中線工程水源地丹江口水庫位于豫、鄂、陜三省交界處,地處漢江干流及其支流丹江交匯處下游0.8 km處,由漢江庫區和丹江庫區兩個庫區組成。南水北調中線工程輸水的源頭主要位于丹江庫區,該庫區水源主要來自流經陜西、河南兩省的丹江流域(圖1)。南水北調中線工程從河南省南陽市淅川縣境內陶岔閘引水,2013 年大壩壩頂高程加高至176.6 m,水域面積增至1 050 km2,其中丹江口庫區范圍擴大至506 km2,水庫因河流切割大部分地貌為塊狀山林,地形起伏變化較大。氣候屬北亞熱帶大陸性季風氣候,年平均降水量804.3 mm,年平均氣溫15.8 ℃。近年來,庫區及其周邊地區重點發展金銀花、核桃、獼猴桃等特色林果業,并推廣生物有機肥和低毒無毒農藥,一方面防止土壤中氮磷流失,另一方面可以起到固土保水的作用。

圖1 南水北調中線工程水源地丹江口水庫區域位置Figure 1 Location of water source area in the middle route of South to North Water Diversion Project
(1)水質監測斷面及數據獲取
以水質參數總氮(TN)與氨氮(NH3-N)為研究對象,依托丹江口水庫渠首管理局已建成的6 個自動監測站點,收集了2016年2月和2020年2月在丹江口水庫布設的共70 個采樣點的水質監測數據。其中,2016 年水質數據用于敏感波段分析和構建反演模型,2020 年水質數據用于精度驗證。同時,為進一步分析丹江口水庫的TN 與NH3-N 空間變化,本研究設置了1 條庫區水體TN 與NH3-N 含量的剖面線,并以此線繪制縱向剖面圖(圖2)。

圖2 水質監測采樣點分布Figure 2 Distribution of sampling points for water quality monitoring
(2)遙感影像數據采集與預處理
選取Sentinel-2 為影像數據,選擇水質監測數據時間(月份)相近且云量小于5%的三景影像,即2016年2 月16 日(Sentinel-2A),2018 年3 月11 日(Sentinel-2A)和2020 年3 月12 日(Sentinel-2B)。利用SNAP 軟件的Sen2cor 模塊對所有影像進行大氣校正和輻射定標。對大氣校正和輻射定標處理后的影像,計算歸一化差異水體指數(MNDWI),通過掩膜統計功能提取丹江口水庫的水體信息,結果見圖3。最后,利用植被指數(NDVI)剔除水生植被分布區域,獲得無水生植被覆蓋的水體遙感影像。

圖3 2016、2018、2020年丹江口水庫水域圖Figure 3 Water area of Danjiangkou reservoir in 2016,2018 and 2020
BP 神經網絡是一種多層前饋網絡,最早由RUMELHART 等[33]提出。基本原理為:輸入樣本數據到神經網絡輸入層中,由隱含層處理并輸出計算結果到輸出層;同時,計算神經網絡輸出層實際計算結果與期望值之間的誤差,將誤差值沿網絡反向傳播,并修正連接權值;然后再給定另一個輸入層,重復上述過程,當神經網絡輸出結果的誤差達到允許范圍或達到設定訓練次數為止,即得到目標神經網絡模型[34]。
1.3.1 TN與NH3-N含量的敏感波段選取
首先利用2016 年實測TN 與NH3-N 數據,與Sentinel-2 影像的全部波段進行Pearson 相關性分析,結果表明Sentinel-2 各波段與TN、NH3-N 均呈正相關,其中B2 藍波段(0.490 nm)、B3 綠波段(0.560 nm)、B4紅波段(0.665 nm)和B8 近紅外波段(0.842 nm)與TN、NH3-N 含量的相關性較強。波段組合的水質參數值相關性與單波段相比相關性較高。因此,本研究對B2、B3、B4 和B8 四個波段的遙感反射率進行不同的波段組合(求和、求差、相乘等),分別與實測TN、NH3-N數據進行相關性分析,結果見圖4。
在圖4 中,56 個不同的波段組合方式中,B2×B8與TN 含量實測值的相關系數為0.930 1,在所有波段組合中相關性最高;B3/B2 與NH3-N 含量實測值的相關系數為0.944 4,在所有波段組合中相關性最高。因此,選用B2×B8 和B3/B2 兩種波段組合構建丹江口水庫TN和NH3-N含量反演模型。

圖4 不同波段組合相關系數(r)Figure 4 Correlation coefficients(r)of different band combinations
1.3.2 TN與NH3-N的BP神經網絡模型構建
BP 神經網絡結構為3 層時,任意精度接近連貫的非線性函數,可以解決各種非線性數據問題。因此,本文選取2016 年70 個采樣點TN 和NH3-N 含量為輸入層節點,評價結果作為輸出層結點,建立3 層BP神經網絡模型。
神經網絡模型建立后,進一步設定相關參數規格。其中,選用Sigmod 函數和Purelin 函數分別作為輸入層與中間隱含層之間及中間隱含層與輸出層之間的網絡轉移函數。設定神經網絡學習步長為0.05,訓練次數50 000 次,誤差期望值0.001。對建立的神經網絡模型反復訓練后,分別得到TN 和NH3-N 的最優r值(表1)。

表1 BP神經網絡模型相關系數(r)Table 1 Correlation coefficients(r)of BP neural network model
為進一步驗證建立的BP神經網絡模型預測值精度,將2020 年水質數據的實測值與預測值進行對比,結果見圖5。
從圖5 可以看出,TN 和NH3-N 含量的預測值與實測值基本接近,變化趨勢也相對一致,預測效果較好。其中R2分別為0.863 和0.877,均方根誤差RMSE分別為0.011 2 mg·L-1和0.086 3 mg·L-1,表明所建立的TN 和NH3-N BP 神經網絡模型具有較高的預測精度,適用于Sentinel-2 影像的庫區TN 和NH3-N 含量遙感反演研究。

圖5 BP神經網絡模型預測值與實測值對比圖Figure 5 Comparison between predicted and measured values based on BP neural network model
在空間柵格尺度上,應用建立的TN 和NH3-N 含量的BP 神經網絡模型,采用2016 年TN 和NH3-N 數據,對2017、2019 年丹江口水庫3 月的TN 和NH3-N含量進行反演,估算TN 和NH3-N 含量的年平均值,分析2016—2020 年丹江口水庫水質的年際變化情況,揭示TN 和NH3-N 的空間分異與變化特征,結果見圖6和表2。
圖6 表明,研究時期內TN 和NH3-N 的年平均值沒有表現出波動狀態,均呈下降趨勢。TN 與NH3-N含量均呈現較明顯的下降趨勢,其中TN 由2016 年的1.02 mg·L-1下降到2020 年的0.928 mg·L-1;而NH3-N含量由2016 年的0.024 6 mg·L-1下降到2020 年的0.017 3 mg·L-1。

圖6 2016—2020年TN和NH3-N含量變化趨勢Figure 6 Change trends of TN and NH3-N concentrations from 2016 to 2020
表2 中TN 和NH3-N 變化狀況顯示,2016、2018、2020 年NH3-N 含量最小值分別為0.002、0.001、0.001 mg·L-1,最大值分別為0.067、0.061、0.060 mg·L-1,符合Ⅱ類水質標準;TN含量最小值分別為0.820、0.747、0.639 mg·L-1,最大值分別為1.230、1.204、1.174 mg·L-1。其中NH3-N 含量最大值為0.067,符合國家地表水環境質量標準中Ⅰ類水質的規定要求(小于0.15 mg·L-1),TN 含量最大值為1.230,基本符合Ⅳ類水質標準(小于1.5 mg·L-1)。從TN 和NH3-N 占總水體面積來看,TN Ⅲ類水質標準的面積由2016年的41.30%上升至2020 年的73.49%,Ⅳ類水質標準的面積由2016年的58.70%下降至2020年的26.51%。

表2 2016、2018、2020年TN和NH3-N變化狀況Table 2 Changes of TN and NH3-N in 2016,2018 and 2020
從2016—2020 年丹江口水庫TN 和NH3-N 含量變化來看,NH3-N含量保持Ⅰ類水質標準;而TN含量在Ⅲ類水質標準與Ⅳ類水質標準之間。總體來看,2016—2020 年丹江口水庫水質較好,年際變化表明近年來水庫水質指標TN 和NH3-N 含量均呈下降趨勢,水質整體呈向好趨勢。
根據TN 和NH3-N 的反演結果,得到不同年份丹江口水庫的TN 和NH3-N 空間分布狀況(圖7)。根據設置的TN 與NH3-N 含量剖面線,繪制TN 與NH3-N含量縱向剖面圖(圖8)。以此分析TN和NH3-N含量的時空分布特征,探究污染物變化趨勢及主要的污染源。
從圖7 可以看出,丹江口水庫研究時期內TN 和NH3-N 表現出以點和面為中心的部分含量較高的特點,含量降低的水域均表現為擴大趨勢。在丹江流域和水庫入口處區域以及庫區中部部分區域TN含量主要集中在1~1.174 mg·L-1之間,高于庫區其他區域,且2018 年該區域范圍有所擴大。而NH3-N 含量的較高范圍為0.03~0.059 6 mg·L-1,總體上呈現由中間向東西兩側遞增,其中庫區南部東西兩側邊緣部分區域NH3-N 含量較高,呈面狀集中趨勢,2020 年該區域NH3-N 含量明顯下降,面積進一步縮小。而丹江流域前端NH3-N 含量較高的區域至2020 年有一定程度擴大。

圖7 2016—2020 TN和NH3-N含量的時空分布特征Figure 7 Temporal and spatial distribution characteristics of TN and NH3-N concentrations from 2016 to 2020
由圖8 可知,庫區北部三個年份的TN 含量整體上高于其他區域,南部區域的TN含量僅次于北中部,中部TN 含量較低。庫區中部和北部的NH3-N 含量均較低,庫區區域研究時期內的NH3-N 含量未出現較明顯的含量較高的區域,且三個年份的變化趨勢基本一致。

圖8 TN 與NH3-N 含量縱向剖面圖Figure 8 Longitudinal profile of TN and NH3-N concentrations
利用遙感數據構建反演模型反演水質參數的關鍵是選擇準確的光譜特征以及更先進的遙感數據。而目前,TN 和NH3-N 光譜特征和遙感監測機理仍不十分明確。本研究在選取Sentinel-2 遙感數據的B2藍波段(0.490 nm)、B3 綠波段(0.560 nm)、B4 紅波段(0.665 nm)和B8近紅外波段(0.842 nm)4個波段進行各種組合后,B2×B8 與TN 含量的相關性和B3/B2 與NH3-N含量的相關性在所有波段組合中最高,由此可知B2×B8 和B3/B2 的光學特性及水體表面反射率、輻射亮度分別與TN 和NH3-N 具有一定相關性。統計分析結果表明,BP 神經網絡模型對TN和NH3-N的反演結果準確度較高,而對實測數據依賴性較低。進一步表明,Sentinel-2 衛星數據具有足夠的潛力來反演大型水庫水體的TN 和NH3-N 含量。雖然Sentinel-2數據的波段范圍可以用于湖泊、水庫中的TN 和NH3-N 反演,但由于獲取Sentinel-2數據有限,夏季時段的大多數遙感影像受到云層遮擋而無法處理,沒有對庫區豐水期與枯水期的TN 和NH3-N 含量進行對比,且無法表征植物生長和微生物對氮素的凈化作用,未能很好地探析冬季與夏季TN 和NH3-N 含量之間的異同。
水體富營養化是由氮素引起的,氮素主要來源包括土壤養分、植物殘體分解和外源輸入三個方面[35]。研究發現丹江口水庫TN 和NH3-N 含量的主要來源是土壤養分和外源輸入。在整個研究時期內,水庫TN 和NH3-N 含量整體呈下降趨勢,表明丹江口水庫水質在不斷改善,說明水源地農業非點源的污染控制措施和沿線的生態建設取得了非常明顯的成效。
在TN 和NH3-N 含量時間變化方面,2016—2020年丹江口水庫TN 和NH3-N 含量沒有出現較大的波動,其最小值和最大值均呈下降趨勢。研究期內,NH3-N 含量保持Ⅰ類水質標準,而TN 含量在Ⅲ類與Ⅳ類水質標準之間。總體來看,2016—2020 年丹江口水庫水質較好,年際變化表明近年來水庫水質指標TN 和NH3-N 含量均呈下降趨勢,水質整體呈向好趨勢。在TN 和NH3-N 含量空間變化方面,庫區中部部分區域TN 含量較高。本研究選用了2 月份枯水期水質數據,該時期內庫區中部會形成滯留區水體并形成獨立水位較低的小湖,湖中心水體底部易發生攪動,從而引起沉積污染物懸浮并釋放氮,因此庫區中部部分區域TN 明顯較高。朱媛媛等[36]的研究指出丹江口水庫的10 條主要入庫河流中,漢江的TN 輸入量最大,其次為堵河和老灌河。李中原等[37]的研究發現,老灌河產生的污染物最多,其次是丹江、淇河、滔河。丹江、老灌河、滔河均是丹江口水庫北部入庫的主要支流,盡管丹江、滔河、老灌河入庫和環庫支流水量較小,但其TN入庫負荷較大,在匯入水庫后流速減弱使氮元素易在入口處集聚。這與本研究中TN含量較高的區域主要集中在水庫入庫河流入口處的現象相一致。這進一步表明水質的時空變化是由懸浮沉積物的再懸浮和營養物點源流入等過程在較小的空間尺度上引起的。NH3-N 濃度含量較高的區域范圍位于庫區南部東西兩側邊緣部分,呈面狀集中趨勢。這是由于上述區域周邊地形復雜、坡度落差較大,導致水土流失的防護能力較弱。水土流失一旦發生,流失的水土中攜帶的化肥是造成該區域水體中NH3-N 含量較高的原因。一般而言,流域內居民用地和耕地所占面積比例越大,水體中N含量的濃度越高。對庫區南部東西兩側區域實地調查后發現,該區域耕地面積比例較高,農業是該區域的主要生產活動,當地居民為增加產量不合理地施用農藥化肥,地面徑流攜帶大量氮素進入水體,造成入庫河流含氮量指標本底值較高,故該區域NH3-N含量較高。
NH3-N 在TN 中占有重要地位,NH3-N 含量會直接影響TN 含量。國家在實行禁磷的環境保護政策后,氮是主要控制對象。相對于TN,NH3-N 對水體水質有更為直接的影響。研究區域TN 與NH3-N 含量在空間分布上沒有表現出一致性,通過計算2016、2018、2020 年所有樣點NH3-N 與TN 含量的平均值,得到三個時期NH3-N 占TN 的比例分別為1.43%、1.22%、1.13%,說明庫區水體中其他形態氮所占TN比例較大。水體中的NH3-N 含量高于2.5 mg·L-1時,總氮含量與氨氮含量表現出一定的線性相關[38]。本研究對2016、2018、2020 年TN 與NH3-N 進行線性分析后發現,二者并沒有呈現出較好的線性關系,說明庫區水體中NH3-N 含量較低,也一定程度上驗證了反演結果具有一定準確度。
本研究通過構建BP神經網絡模型,對南水北調中線水源地丹江口水庫2016—2020年TN和NH3-N兩個水質指標進行反演并分析其時空變化,結論如下:
(1)利用Sentinel-2影像波段反射率,分別建立了基于B2×B8 和B3/B2 波段組合的TN 和NH3-N 的BP神經網絡模型,同時采用水質數據的實測值與預測值進行精度驗證,結果表明,利用Sentinel-2影像波段所建立的BP 神經網絡模型適用于TN 與NH3-N 含量的遙感反演。
(2)丹江口水庫TN和NH3-N年際變化表明水質整體呈向好趨勢。2016—2020年間NH3-N含量保持Ⅰ類水質標準,而TN含量在Ⅲ類與Ⅳ類水質標準之間。
目前,雖然通過遙感技術可以動態監測大型湖泊的水質時空分布,但是由于受地理位置、天氣云量等影響,獲取時間間隔相等且分辨率高的遙感數據難度較大;同時,由于水質反演的精度對實測數據的依賴程度高,因此要實現高精度的水質反演,需進一步合理地設置采樣點。在下一步研究中,可以結合高光譜的波譜分析進行水質反演,以此分析不同季節適合的反演模型,為大型湖泊水生態環境改善及水質監管提供技術支撐。