周 正,萬茜婷
(1.長江流域水環境監測中心,湖北武漢430010;2.長江水利委員會長江年鑒社,湖北武漢430010)
東湖是我國最大的城中湖,位于湖北省武漢市內。近年來,隨著城市經濟的快速發展,東湖水環境承受的壓力與日俱增,不僅破壞了湖泊生態環境,而且影響到了周邊的人居環境,造成了不小的經濟與生態損失。湖泊水質惡化的直接表現是藻類物質大量繁殖,而葉綠素a是浮游植物生物體的重要組成成分之一,葉綠素a含量的高低與該水體中藻類的種類、數量等密切相關,是浮游植物現存量的重要指標,是反映內陸湖泊水質狀況的重要參數。
中分辨率成像光譜儀(moderate-resolution imaging spectroradiometer,MODIS)是當前世界上新一代“圖譜合一”的光學遙感儀器,有36個離散光譜波段,光譜范圍寬,從 0.4 μm(可見光)到 14.4 μm(熱紅外)全光譜覆蓋,可用于對陸表、生物圈、固態地球、大氣和海洋進行長期全球觀測,建立基于MODIS數據的內陸水體葉綠素a遙感反演模型,對于內陸湖泊水質監測具有重要的現實意義。
本研究選擇東湖污染較為嚴重的郭鄭湖區及廟湖區作為研究試驗區。通過研究試驗區的相關資料,并結合實地考察,采樣區的布設綜合考慮了數據采集的可行性、湖體面積、湖區主要排污口的分布等問題。在布設采樣點的過程中,設置了10個主采樣點位,均勻分布于湖區范圍內。由于本研究在利用遙感影像進行水質反演時采用的是中低分辨率的衛星遙感影像,因此主采樣點位之間的距離均設置在1000 m左右,以保證各主采樣點位在遙感影像上對應不同的像素;并在每個主采樣點位的輻射范圍內以150 m左右的間隔采樣3次,將3次采樣的平均值作為主采樣點位的相關地面數據,用于反映500 m×500 m區域的水質平均情況,從而在最大限度上實現地面采樣點的“點數據”和遙感影像的“面數據”的對應。
根據衛星過境的同步要求,分別于2012年1月9日、1月29日、3月20日、10月26日及11月6日分批對試驗區10個主采樣點位進行了地面數據同步或準同步的野外測量。
其中,1月9日及3月20日在 a、b、c、d點位各采樣兩次,1 月29 日在 g、h、i、j點位采樣一次,10 月26 日在 a、d、e、f點位采樣一次,11 月6 日在 d、g、i、j點位采樣一次,因此共有21組地面實測數據。每組數據包括:各主采樣點位地面光譜數據、水質參數數據、各主采樣點的GPS定位信息,以及現場風速、水溫、氣溫與濕度數據。通過預處理,從所采集的光譜數據中導出各測點水體出水反射率,并進一步確定各測點所對應的水質參數及其他輔助數據,用以研究試驗區目標水體光譜特性、各水體組分吸收與散射特性,從而為遙感反演波段選擇、模型構建及精度評價提供參考和依據。
根據經驗與試驗分析,相比于原始光譜,歸一化后的光譜與水質組分濃度呈現較高相關性,并且特征突出。因此,將歸一化后的水體出水反射光譜各波段進行組合,并將其與葉綠素a濃度進行相關性分析,結果如圖1所示。其中波段組合采用了比值Ri/Rj(i≠j)、差值 Ri- Rj(i≠j),以及和差組合算法(Ri-Rj)/(Ri+Rj)(i≠j)。

圖1 葉綠素a濃度與歸一化波段反射率組合相關分析結果
由圖1(a)、(c)、(e)與圖1(b)、(d)、(f)的對比可知,光譜數據與葉綠素a原始濃度的相關系數基本上都分布在-0.95~0.95范圍內,而光譜數據與葉綠素a濃度對數值的相關系數則分布于-0.8~0.8的范圍內,說明光譜數據與葉綠素a原始濃度的相關系數絕對值在總體上要大于其與葉綠素a濃度對數值的相關系數絕對值。可見對于本研究中的目標水體,應采用相關性較高的歸一化處理后的波段組合與葉綠素a原始濃度構建反演模型。
比較圖1(a)、(c)、(e)的不同波段組合與葉綠素a原始濃度的關系:在波段比組合中,相關系數絕對值大于0.8的組合集中于波段625~675與波段500~640,以及波段700~780與波段500~750的波段比組合,前者是葉綠素紅波段吸收峰與550 nm處反射峰的比值,后者是葉綠素715 nm處反射峰與550 nm處反射峰的比值。其中波段406與波段557的比值即葉綠素藍波段吸收峰與550 nm反射峰之比的相關系數絕對值最高,為0.951 6。而在波段差組合中,相關系數絕對值較大的組合集中于波段750~790與波段760~770之間的波段差值組合,是葉綠素715 nm處反射峰及其峰值移動范圍內各波段的差值。最大值出現在波段879與波段857組合上,其相關系數達到了0.966 0。在波段和差比組合中,波段400~470與波段740~761,以及波段600~750與波段650~750波段和差比組合與葉綠素a濃度存在較強相關性,前者是葉綠素藍波段吸收峰與715 nm處反射峰范圍波段的比值,后者是葉綠素685 nm熒光峰與680~715 nm處反射峰的比值。最大正相關和差比組合為(R761-R457)/(R761+R457),相關系數為0.954 0;而最大負相關和差比組合為(R402-R748)/(R402+R748),相關系數為 -0.925 7。
在經驗模型的構建與分析中,變量間多元共線的現象十分普遍。偏最小二乘法(PLS)是構造回歸方程的一種較新穎的方法,它能在建立兩數據塊之間關系的同時,消除數據之間的冗余信息,從而達到降維的目的,可用于多目標回歸分析。PLS與主成分分析法類似,數據中存在共線性時,構造新的解釋變量,對新的解釋變量使用最小二乘來確定因變量和自變量間的回歸方程;PLS還考慮了因變量矩陣即水色要素矩陣的信息相關性。另外,PLS方法比較適用于處理變量多而樣本數少的情況,因此更適合二類水體的信息提取。
將經過大氣校正后的MODIS波段反射率各種組合與葉綠素a濃度實測值進行相關分析發現:MODIS單波段反射率及其歸一化結果與葉綠素a濃度相關性都不高。這些分析組合的相關系數絕對值大部分集中在0.5以下,相關系數絕對值大于0.5的組合僅占所有分析組合的3.85%,其中最大的相關系數絕對值也僅為0.604 3。另外,相同波段組合與葉綠素a濃度的相關性高于其與葉綠素a濃度對數值的相關性。因此,對于本研究的目標水體,宜采用歸一化后的MODIS多波段組合建立經驗模型,這與第3部分地面波段選擇的分析結果一致。在MODIS不同波段組合與葉綠素a濃度的相關性分析中,同樣采用了第3部分的比值、差值,以及和差組合算法。相關系數較高的波段組合見表1。
表1顯示了與葉綠素a濃度的相關系數絕對值大于0.7的19個波段組合,其中最大相關系數絕對值為0.808 4。不同波段的比值類組合在整體上相關性大于其他類型的波段組合,不同類型的波段組合所涉及的波段集中于MODIS的第3、4、9至11,以及13波段,這是因為這些波段覆蓋了葉綠素藍光范圍吸收峰、550 nm主反射峰,以及685 nm熒光峰等特征波段,而由于750 nm波段范圍的大氣校正效果影響導致第15波段相關系數較低。

表1 葉綠素濃度反演MODIS波段組合選擇結果
基于以上分析,利用PLS方法進行解算,選取不同時間具有不同水質參數濃度的7個樣點,即01091、01291、03202、03204、10262、11062 及 11064樣點作為檢查點對模型進行精度評價。對于葉綠素a濃度的PLS模型,如圖2所示,從圖2(a)PRESS值隨PLS因子個數的變化可以看到,PRESS值在因子數為9時,達到極小,其值為0.065 1;之后隨著因子數的繼續增加,PRESS值有所上升并穩定在0.260 2左右。

圖2 PLS模型葉綠素a濃度預測分析
根據PRESS的分析結果,選擇PLS方法所得前9個主因子進行葉綠素a濃度反演模型的構建,模型具有最佳的預報能力,其預測結果見表2。通過統計分析可得,PLS方法所建葉綠素a濃度預測模型的相關系數平方R2為0.901 7,說明模型對建模數據的擬合程度較高;顯著性概率為0.003 2,遠小于0.05,方差比F為311.3,模型有意義。觀察圖2(b),7個樣點的葉綠素a濃度的預測估值與實測值較為吻合,殘差值大部分集中在 -10~10 μg/L之內,平均相對誤差為26.04%,最小相對誤差為14.59%,最大相對誤差為36.59%。從結果分析來看,模型對葉綠素a濃度范圍在低于20 μg/L、20~30 μg/L,以及大于30 μg/L的各個樣點的反演精度比較平均,并沒有出現對某個濃度范圍測點具有更好精度的情況,說明模型對不同葉綠素a濃度都具有一致的敏感性。

表2 葉綠素a濃度PLS模型預測結果
綜上所述,對于經驗模型,將MODIS反演結果與地面數據反演結果相比可知:在波段相關分析中,葉綠素a濃度與地面實測光譜數據的相關系數絕對值總體上要高于與MODIS波段的相關系數絕對值;在相同測點上,利用地面數據所建模型的反演精度都要高于MODIS數據所建模型。前者對大部分測點的估算誤差在10%以下,而后者對大部分測點的估算誤差在20%至30%范圍內,對個別測點的估算誤差達到了40%以上。總體上來看,雖然利用MODIS數據估計的精度比地面實測數據估計的精度低,但前者仍較好地反映了各水質參數不同濃度的分布趨勢,其對葉綠素 a濃度反映的精度為26.04%,也符合目前國際上水體水質參數測量平均誤差范圍(10% ~40%)的要求。
根據以上所建模型,得到東湖秋冬季水體葉綠素a濃度的分布情況,如圖3所示。

圖3 東湖秋冬季葉綠素a濃度分布
從MOIDS數據所反演的葉綠素a濃度分布來看,對于秋冬季的東湖水體,污染相對嚴重的水域集中在湯林湖與郭鄭湖交界區域、郭鄭湖西岸、廟湖西岸、牛巢湖,以及后湖的西南沿岸,體現為這些水域都具有較高的葉綠素a濃度;而小湯林湖、郭鄭湖湖心區及后湖東南沿岸水質狀況較好,水中葉綠素a濃度都較低。其中郭鄭湖及廟湖西岸周邊以學校、住宅小區及餐館等為主,牛巢湖南岸則為東湖磨山風景區,可見,人為活動對東湖水質變化的影響較大。由 PLS經驗模型所得反演結果可知,利用MODIS數據進行葉綠素a濃度反演所得結果較好地反映了實際水質的概況。
因此,在中等精度的要求下,利用MODIS數據建立經驗模型,可快速獲取大范圍內陸湖泊水體水質狀況,具有一定可行性。
本文以主要水質遙感監測指標葉綠素a為主要研究對象,針對內陸湖泊二類水體的特點,較系統地研究了利用地面實測光譜數據反演湖泊主要水質組分的方法和技術,并構造了針對內陸湖泊二類水體的水質反演經驗模型;在此基礎上,進一步構建了基于MODIS數據的水質遙感反演模型,并利用地面實測數據對其進行精度評價與分析,以探索中低分辨率下內陸湖泊水質參數遙感定量反演的可行性,取得了較好的結果。
[1]周正,何連,劉良明.基于HJ-1A/B CCD數據的東湖葉綠素 a濃度反演可行性研究[J].測繪通報,2011(3):11-14.
[2]黃昌春,李云梅,徐良將,等.內陸水體葉綠素反演模型普適性及其影響因素研究[J].環境科學,2013,34(2):525-531.
[3]呂恒,江南,李新國.內陸湖泊的水質遙感監測研究[J].地球科學進展,2005,20(2):185-192.
[4]VOS R J,HAKVOORT J H M,JORDANS R W J,et al.Multiplatform Optical Monitoring of Eutrophication in Temporally and Spatially Variable Lakes[J].The Science of the Total Environment,2003,312(1):221-243.
[5]李素菊,吳倩,王學軍,等.巢湖浮游植物葉綠素濃度與反射光譜特征的關系[J].湖泊科學,2002,14(3):228-234.
[6]馬超飛,蔣興偉,唐軍武,等.HY-1 CCD寬波段水色要素反演算法[J].海洋學報,2005,27(4):38-43.
[7]馬榮華,唐軍武.湖泊水色遙感參數獲取與算法分析[J].水科學進展,2006,17(5):720-726.
[8]疏小舟,尹球,匡定波.內陸水體藻類葉綠素濃度與反射光譜特征的關系[J].遙感學報,2000,4(1):41-45.
[9]聞建光,肖青,楊一鵬,等.基于Hyperion數據的太湖水體葉綠素a濃度遙感估算[J].湖泊科學,2006,18(4):327-336.
[10]楊燕明,劉貞文,陳本清,等.用偏最小二乘法反演二類水體的水色要素[J].遙感學報,2005,9(2):123-130.