陳文波,謝 濤,鄭 蕉,吳 雙
1 南昌市景觀與環境重點實驗室, 南昌 330045 2 江西農業大學國土資源與環境學院, 南昌 330045 3 江西農業大學計算機信息與工程學院, 南昌 330045
近年來,隨著我國城市化、工業化進程的加速,大多數城市面臨著日益嚴峻的大氣環境問題[1-2]。其中以PM2.5為主要污染物的大氣環境污染因為影響范圍廣、程度深,對人類健康產生嚴重威脅而備受關注,制約著城市可持續發展[3]。當前對PM2.5的研究主要集中在PM2.5的來源和形成機制[4]、時空分布特征[5]、影響因素[6]等方面。研究表明,PM2.5在某一區域段時間尺度上(如,日)主要受氣象條件影響[7-8],氣象條件主要通過對污染物的稀釋、清除、擴散與轉化等作用,改變并影響污染物的分布情況[9],風速、降水量、溫度、濕度、相對濕度、風向等氣象氣候條件是導致PM2.5濃度出現分布差異的顯著影響因子[10]。但在較長時間尺度上(如季,年),由于氣象條件基本相似,則PM2.5濃度主要受土地利用特別是地表植被景觀的影響。即使在在氣象條件相對一致的情況下,區域尺度的PM2.5濃度仍呈現出顯著的空間差異,這種差異與土地覆蓋,特別是地表植被覆蓋有較大關系,因為植被具有對顆粒物的組織吸收作用和適宜顆粒物沉降環境的營造作用[11-12]。不同的土地覆蓋類型,呈現出的氣體的調節效益也不同,是影響PM2.5空間分布的重要因素[13], 以往相關研究主要集中在不同植被類型[14-16]與分布格局[17-18],如不同林種、樹種、綠地等分布格局對PM2.5濃度的影響。
在研究植被景觀格局對PM2.5的的影響中,基于景觀鑲嵌性特征的方法如景觀格局指數是最常用的方法[19]。研究者通過計算景觀格局指數及其對應監測點PM2.5濃度的相關性大小來表達植被分布格局PM2.5的影響。由于PM2.5分布具有外溢性,即PM2.5影響不僅受到對應景觀組分的影響,也受到來自相鄰景觀組分的影響,導致不同區域、不同時間、不同研究者研究結果有較大差異[20]。且由于采用的景觀格局指數生態學意義不夠明確,研究結果易受到質疑。對于區域尺度而言,如何表達植被分布格局并在空間上耦合PM2.5,定量分析其對PM2.5分布的影響需要充分考慮植被景觀梯度性特征,基于遙感反演的地表植被覆蓋度是植被景觀梯度性格局表征有效方法[21]。
如何高精度模擬PM2.5濃度分布是在區域尺度上研究地表植被覆蓋度對PM2.5濃度分布影響的前提與基礎。國內外學者研究發展了多種模型構建方法,主要有地統計空間插值模型[22]、大氣擴散模型[23]、神經網絡以及土地利用回歸(Land Use Regression, LUR)模型[24-25]。現階段,城區的大氣環境日常監測主要通過固定監測點進行,由于監測站點個數有限,不能滿足空間插值對樣點數量的要求,需要借助模型模擬配合空間插值來客觀反映出城市空氣污染物濃度分布。多數研究表明,LUR模型對PM2.5濃度的模擬過程在考慮周圍地理變量的基礎上,還結合了PM2.5的來源與影響因素,能在一定程度上從機制層面解釋PM2.5濃度的時空分布特征[26-27],是模擬大氣污染物空間分布的科學、有效方法,可以利用有限的空氣質量監測站點數據模擬高精度的PM2.5濃度分布。
為了顯化地表植被景觀對PM2.5分布的影響,需要在研究中盡量減少氣象條件對研究的影響。本研究基于相同季節氣象條件基本一致的科學假設,采用了PM2.5季平均濃度。以南昌市中心城區為研究區域,采用2016—2018年間研究區9個實時空氣質量監測點PM2.5的實測數據,選擇對PM2.5有顯著影響作用的因子構建LUR模型,進行空間插值,分四季高精度模擬研究區三年各季PM2.5平均濃度空間分布。其次采用對應2016—2018年間四季典型月份的Landsat8 OLI影像,運用像元二分模型,基于歸一化植被指數估算研究區三年植被平均覆蓋度。最后采用隨機抽樣,以像元樣點為中心,構建大小不同緩沖區,耦合分析兩者關系特征并構建最優回歸模型,探討地表植被覆蓋度對PM2.5的影響形式與尺度效應。本研究為定量分析城市地表植被對PM2.5濃度的影響提供了新思路與方法,也為通過優化城市土地利用緩解大氣污染提供一定參考。
南昌市是江西省省會,位于江西省中北部,下轄六區三縣(圖1)。南昌市全境處于亞熱帶季風氣候區,氣候濕潤溫和,日照充足,是典型的南方城市。本次選擇的研究區是南昌市土地利用總體規劃確定的中心城區,面積為562.46 km2。據統計,2018年南昌市全年有313天的AQI指數低于100,低于50的有125 d;有312天的PM2.5濃度值低于75 μg/m3,低于35 μg/m3的有195d,但時空分布差異顯著。中心城區范圍內分布有較豐富的植物種類與人工綠地,分布差異也較為顯著。

圖1 南昌市中心城區與空氣質量監測點 Fig.1 Air quality monitoring sites in the center area of Nanchang city
2016—2018年南昌市氣象數據來源于中國氣象科學數據共享服務網(http://data.cma.cn/)。研究所用的南昌市2016—2018年的PM2.5監測數據來源于南昌市環境監測中心。考慮到遙感影像時間與監測點數據的對應性,采用的遙感數據為2016—2018年3月、5月、8月、12月這4個季度典型月份的Landsat8 OLI數據,該遙感數據來源于“地理空間數據云”遙感數據共享平臺(http://www.gscloud.cn/),空間分辨率為30 m,影像數據平均云量均低于5%,數據質量良好。土地利用數據來源于南昌市自然資源局的《土地利用總體規劃》(2006—2020)、南昌市各縣(市、區)的2018土地利用變更數據。
本研究主要分為4步進行:1)高精度模擬中心城區PM2.5濃度分布。基于LUR模型,利用所收集的9個監測樣點2016—2018年PM2.5監測數據,與道路、人口等影響因子數據,構建關系模型,加密樣點,并通過Kriging空間插值法分四季模擬南昌市中心城區PM2.5濃度空間分布,插值的精度與遙感數據分辨率保持一致,為30 m。2)基于2016—2018年四季典型月份遙感數據,運用像元二分模型,采用歸一化植被指數,估算研究區四季植被覆蓋度平均值;3)采用隨機抽樣的方法,在研究區2240個像元中隨機抽取約10%的數量, 構建不同半徑建立緩沖區,統計每個緩沖區(不同尺度)內PM2.5濃度、植被覆蓋度的平均值,并進行相關性分析;4)結合相關分析結果,構建植被覆蓋度與PM2.5濃度的回歸方程并進行精度檢驗,選擇最優模型,研其對PM2.5的影響與尺度效應。
土地利用回歸(Land use regression,LUR)模型通常包含一個因變量或多個自變量,模型基本公式為:
Y=?0+?1X1+?2X2+......?nXn+ε
式中,y為因變量,表示監測點的月均PM2.5濃度,X1X2…Xn為自變量,代表與PM2.5濃度相關的地理變量,?1?2…?n為待定系數,ε為隨機變量。采用時間序列的PM2.5濃度數據與地理相關變量分別進行雙變量相關分析,識別出與PM2.5濃度相關性最強的目標地理要素。對識別出的地理要素與對應的PM2.5季平均濃度進行多元線性回歸分析。然后在研究區生成一定空間分辨率的網格(本研究為1 km×1km),利用得到的回歸方程計算各個預測點的相關地理變量,標準化處理后根據模型方程算出各個網格點的PM2.5濃度預測值,加密樣點并采用Kriging空間插值法得到南昌市中心城區各季PM2.5濃度空間模擬圖。
像元二分模型的基本原理是:假設某像元信息由植被部分和無植被覆蓋部分(裸土)構成。因此得到像元信息的計算公式:
R=Fc×Rv+(1-Fc)×Rs
式中,任意像元信息的值為R,植被部分像元信息為Rv,無植被覆蓋部分為Rs,Fc為植被覆蓋度。
植被覆蓋度是指植被冠層垂直投影面積與土壤總面積的比值。歸一化植被指數是反映地表植被狀況的最佳定量值之一,與植被覆蓋度具有顯著的正相關關系。因此將NDVI與像元二分模型相結合,將像元信息選擇為NDVI時,植被覆蓋度計算公式可表示為:
式中,NDVI為柵格圖上某像元的NDVI實際值,NDVIsoil代表全裸土區域的NDVI值,NDVIveg代表完全被植被覆蓋區域的NDVI值。由于遙感影像受大氣環境和地表溫濕度變化的影響,存在干擾和噪音產生誤差,NDVIsoil與NDVIveg的值會隨著時間的變化而改變。利用ENVI 5.3軟件統計分析,得到NDVI累計概率分布表,選擇合適的置信度,選取5%附近的NDVI值作為NDVIsoil,選取95%附近的NDVI值為NDVIveg。
本研究首先采用隨機抽樣的方法,在研究區域內2240個像元中選取10%,以選取柵格為中心,以LUR模型構建尺度為參考,設定系列半徑的緩沖區,統計每個緩沖區內PM2.5濃度、植被覆蓋度的平均值。對四季的PM2.5濃度與各不同緩沖區范圍內的植被覆蓋度進行相關性分析,結合相關分析結果,建立最優回歸模型,并進行尺度效應分析。
3.1.1LUR模型變量的確定
根據已有關于LUR模型的研究,常用于LUR模型構建的自變量有土地利用、道路交通、人口密度、地理要素(氣候、氣象、位置等)[24,27]。本文基于LUR模型常用的地理變量,在綜合考慮數據可獲取性和影響PM2.5濃度的主要因素的基礎上,選取了人口、土地利用、道路與氣象等4大類預測因子共12個變量作為模型的自變量(表1)。參照陽海鷗等對南昌市中心城區的相關研究成果[25],考慮城市規模與研究尺度,以研究區9個監測點為中心,建立6種半徑(300、600、900、1200、2400、4800 m)的緩沖區。道路因子用緩沖區內道路密度表示,統計緩沖區內各類道路長度除以緩沖區的面積得到道路密度比;土地利用因子中選取了對PM2.5濃度影響最為明顯的生態用地與工業用地兩個變量,生態用地面積比用研究區域內林地、草地等綠地與大型水體面積除以緩沖區面積表示;南昌市流動人口較多,通常使用的戶籍人口不能完全反映人口現狀,而且戶籍人口是按行政單位統計的,與構建的緩沖區范圍的對應性不強。綜合分析認為,南昌市人口主要依附于居住用地,與居住用地具有正相關關系,因此人口因子在本研究中采用緩沖區內居住用地面積近似表示[11]。

表1 預測變量分類與處理Table 1 Classification and processing of predictive variables
3.1.2LUR模型構建和精度檢驗
在將自變量與PM2.5進行相關分析之后,根據相關性分析的結果,進行變量篩選,最終構建的最優多元回歸如表2所示。從表2可知,春、夏、秋、冬四季的LUR模型調整的R2值分別為0.86、0.76、0.87、0.54,構建模型的自變量能解釋50%以上的PM2.5濃度變化,模型擬合情況好,解釋能力強。

表2 四季最優LUR模型結果Table 2 Results for the optimal LUR models of four seasons
根據得到的四季最優LUR模型,對研究區進行四季PM2.5濃度模擬。先對研究區進行1km×1km網格化處理生成400個預測點,計算各個預測點的相關地理變量,標準化處理后根據模型方程算出各個網格點出PM2.5濃度預測值,從中抽取80%的預測點,利用Kriging空間插值法生成四季的PM2.5濃度空間分布圖(圖2),再用剩余20%的濃度數據,采用交叉檢驗法對插值結果進行檢驗。檢驗結果表明,春、夏、秋、冬平均絕對誤差率分別為0.01、0.05、0.03、0.05;均方根誤差分別為0.76、2.89、4.58和5.52,說明四季PM2.5指標插值誤差較小,PM2.5濃度模擬效果良好。

圖2 PM2.5濃度空間分布圖Fig.2 Spatial distribution of PM2.5 concentrations of the four seasons
從圖2可以看出,南昌市中心城區PM2.5分布具有明顯的時空分異特征。不同季節PM2.5濃度具有明顯差異。相對而言,冬季高,夏低。冬季低溫少雨的氣候氣象條件不利于污染物擴散,使得南昌市冬季PM2.5濃度一直處于較高水平。而夏季的氣象條件有利于PM2.5擴散,因此濃度相對較低。從空間上來看,PM2.5濃度分布由城市中心向城市周邊遞減的層次明顯。全年的高值區都集中在市中心,冬季尤其明顯;低值區則主要分布在城市周邊的植被與水體較多區域,如梅嶺風景區、瑤湖和揚子洲附近。
南昌市中心城區植被覆蓋度計算結果如圖3所示。統計分析表明,研究區2016—2018年四季植被覆蓋度均值分別為0.52、0.57、0.55和0.50(圖3)。研究區域內植被高度覆蓋區主要分布在梅嶺風景區,中低度覆蓋區主要在青云譜區、青山湖區。

圖3 植被覆蓋度空間分布圖Fig.3 Spatial distribution of vegetation coverage of four seasons
初步對比PM2.5濃度與植被覆蓋度空間分布結果發現,PM2.5濃度高(低)值分布區與植被覆蓋度低(高)值分布區相近。不同季節而言,夏秋兩季PM2.5濃度值較低,冬春偏高;而研究區植被覆蓋度則正好相反,夏秋高、冬春低。為了進一步研究植被覆蓋度對PM2.5的影響及其對尺度的依賴性,我們在研究區2240個像元中,隨機抽取了約10%的像元,共生成230個樣點,并以各樣點為中心,以LUR模型模擬尺度為基礎,保證了研究尺度的對應性,構建300、500、1000、1500 m為半徑的緩沖區,統計各緩沖區內的PM2.5濃度與植被覆蓋度的平均值,進行相關分析(表3)。

表3 植被覆蓋度與PM2.5的相關性分析Table 3 Correlation between vegetation coverage and PM2.5
從表3可以看出,植被覆蓋度與PM2.5濃度在本研究所選擇的任何尺度上,都呈顯著負相關關系,但同一個季節不同尺度下以及同一個尺度下不同季節,植被覆蓋度與PM2.5濃度相關系數存在明顯差異。春季、夏季和冬季的植被覆蓋度與PM2.5濃度相關性在500 m尺度上表現最顯著,而秋季則是在300 m尺度上相關性最顯著。總體而言,四季均在500 m尺度上表現出較強的相關性,這個關系可以近似理解為地表植被覆蓋對PM2.5影響作用范圍為500 m。
為進一步研究南昌市中心城區植被覆蓋度以何種方式影響PM2.5濃度與分布,結合相關分析結果,選擇四季最優尺度(春、夏、冬季為500 m,秋季300 m)下植被覆蓋度與PM2.5濃度值數據,選用了線性、對數、逆函數、二次曲線、三次曲線、冪函數、復合模型、Logistic回歸模型、增長模型以及指數分布等10個模型進行回歸分析,并對各擬合曲線進行擬合度以及檢驗精度進行比較,選擇每季最優回歸模型,結果如表4與圖4所示。

表4 四季最優回歸模型及參數Table 4 The results of the optimal regression models and parameter evaluation in four seasons

圖4 四季PM2.5與植被覆蓋度最優回歸方程Fig.4 Optimal equation models of PM2.5 and vegetation coverage in four seasons
由表4可知,四季最優回歸模型的R2分別為0.601、0.464、0.516、0.549。除夏季R2略低于0.5,其余都在0.5以上,說明回歸模型具有良好的解釋能力。運用交叉檢驗法對建立的四季PM2.5與植被覆蓋度關系最優模型進行精度檢驗,得出春、夏、秋、冬四季檢驗樣本均方根誤差分別為5.423、5.486、5.836、5.149,說明構建的四季擬合模型誤差小,效果良好。春、秋兩季植被覆蓋度與PM2.5濃度之間二次曲線模型擬合度最高,夏季則是線性模型表現較好,冬季的植被覆蓋度與PM2.5濃度之間呈顯著的指數關系。總體而言,植被覆蓋度與PM2.5濃度之間存在非線性關系,影響方式比較復雜。
進一步研究發現,不同的PM2.5濃度水平下,植被覆蓋度對PM2.5濃度的影響程度也存在差異。PM2.5濃度越高,PM2.5隨植被覆蓋度變化的幅度就越大。通過圖4結合計算結果可知,當PM2.5濃度水平低于35 μg/m3,擬合的曲線比較平緩,植被覆蓋度的增減對PM2.5濃度的影響相對較小;當PM2.5濃度在30—50 μg/m3之間,曲線變化幅度開始加速;當PM2.5濃度水平達到55 μg/m3以上,曲線變化幅度繼續增大,每增加10%的植被覆蓋度,PM2.5質量濃度大約下降3—6 μg/m3。
本文利用南昌市中心城區9個空氣質量監測點2016—2018年三年PM2.5日均濃度數據,在收集相關地理要素的基礎上,建立LUR模型加密樣點,并采用Kriging空間插值法高精度模擬研究區四季PM2.5濃度分布;基于NDVI的像元二分模型,基于2016—2018年三年典型月份遙感數據,估算南昌市中心城區四季平均植被覆蓋度;基于統計回歸與隨機抽樣,耦合不同尺度上PM2.5濃度與植被覆蓋度,構建最優回歸模型,研究植被覆蓋度對PM2.5濃度的影響方式。研究結果表明:
1)基于同一季節氣象條件基本相似的假設,分別季節,通過構建LUR模型加密樣點,采用Kriging空間插值能高精度模擬PM2.5空間分布。這種模擬方法與思路在很大程度上彌補了監測點不足、難以單純采用空間插值法高精度模擬的問題,使得準確、定量分析植被覆蓋度對PM2.5濃度的影響成為可能。
2)植被覆蓋度與PM2.5濃度在本研究選擇的空間尺度上,都是呈顯著負相關關系。不同尺度下,植被覆蓋度與PM2.5濃度的相關性有一定差異,春、夏、冬季500 m尺度下,秋季則在300 m尺度下相關性最強,。
3)植被覆蓋度對PM2.5濃度影響的方式比較復雜,不同的季節,表現方式具有一定差異。總體來說,曲線回歸模型的擬合度優于線性回歸模型擬合度,植被覆蓋度與PM2.5濃度之間存在較為復雜非線性關系。
4)不同的PM2.5濃度水平下,植被覆蓋度對PM2.5濃度的影響程度也存在差異。PM2.5濃度越高,構建的模型曲線變化幅度越大,植被覆蓋度對PM2.5濃度的影響越明顯。
本研究提出的基于景觀梯度性特征的耦合植被景觀格局與PM2.5濃度的研究思路,有效的揭示了地表植被景觀對PM2.5濃度分布的影響與尺度效應,與基于景觀鑲嵌性特征的相關研究相互補充,完善了地表植被景觀格局對PM2.5濃度影響研究的理論與方法。需要指出的是,本研究雖然得出了植被覆蓋度對PM2.5濃度的影響與尺度效應,構建了最優回歸模型,但這是基于宏觀區域尺度而言的。在更為微觀的尺度研究影響機理還不夠,這需要從PM2.5產生的源、植被生理過程對PM2.5的吸附影響等方進行解析。只有這兩方面的研究都齊全,研究結論才能為編制科學合理的城市綠地空間規劃提供依據。此外,為了盡量使得PM2.5季平均濃度與植被覆蓋度對應,本研究采用了與PM2.5監測時期較為一致的各季節代表性月份數據。由于遙感數據是某一天的瞬時數據,與真實的季平均數據有差異,存在一定誤差,結果還要經過實踐的檢驗,這些都是是本研究下一步深入的方向。