葉景山,周富杰,黎哲鎮,溫永仙
(福建農林大學 計算機與信息學院,福建 福州 350002)
改革開放以來,我國經濟發展迅速,人民生活水平不斷提高,對健康越來越重視。空氣污染是影響人民健康的一個重要因素,它會引發多種疾病,甚至死亡,世界衛生組織(WHO)提供的數據表明,每年因空氣污染造成的死亡數達700萬[1-3]。因此我國對空氣質量十分重視,為了更好地監測、管控空氣質量,環保部在新發布的《環境空氣質量標準》(GB 3095—2012)中增加了PM2.5、CO與O3指標,同時降低了PM10、SO2及NO2標準限值[4-5]。分析城市的空氣質量指數,可為環保部門應對污染風險、增強環境保護手段提供參考依據,具有重要的理論意義與實踐價值。
空氣質量指數(air quality index,AQI)是定量描述空氣質量狀況的無量綱指數[6],它是將幾種常規監測的空氣污染物濃度按一定的標準綜合成為單一的數值形式[7-8]。AQI具有比空氣污染指數 (air pollution index,API)更加權威,更加全面地衡量空氣質量狀況等優勢[9],因此,AQI被廣泛用于空氣質量的研究中。首先是空氣質量的預測,能提前知道空氣質量情況,就能更好地應對空氣質量差的情況,更有利于人的健康。在AQI預測方面,有基于神經網絡及其改進的方法[10-13],薛儉和徐艷利用O-U模型對北京、天津以及石家莊的AQI進行預測[14],劉洪通等基于Storm建立了AQI實時預測模型[15],楊豐玉等考慮了風力因素[16],王曉玲等考慮了氣象因素對AQI進行預測[17]。其次針對空氣質量時空分布的問題,劉華軍和杜廣杰結合了基尼系數測度、空間統計分析以及核密度方法對中國城市大氣污染的空間格局與分布動態演進進行了研究[18]。姜磊等結合全域空間自相關、自然正交函數和空間描述性統計的方法來探索研究城市AQI的時空動態變化特征[9]。還有一些其他的相關研究,例如,高慶先等通過研究中美AQI的差異,提出AQI計算方法的一些問題[19]。謝珺怡研究了AQI對股市的影響[20],姜磊等對AQI的社會經濟影響因素進行分析[21]。
本文對福建省空氣質量情況進行研究,目前對福建省空氣質量的研究比較少,曾藝芳等利用多元回歸分析方法結合Arc GIS圖分析了福州市的AQI時空分布特征及其影響因素[22]。楊春霖利用灰色聚類分析方法對閩侯縣空氣質量進行評價[23]。本研究擬采用函數型主成分分析方法提取主成分,結合Arc GIS圖對福建省空氣質量情況進行分析,同時利用函數型主成分分析得分圖對福建省9個地級市的空氣質量進行分類、分析。
福建省地處中國東南沿海,東經115°50′~120°43′,北緯23°33′~28°19′之間,與臺灣島隔海相望。福建土地總面積相對較小,約為1.21×105km2,排在全國23位。福建大部分屬于亞熱帶季風氣候,又處于沿海地區,所以雨熱資源豐富且雨熱同期,十分適宜植物生長。再加上地形并不平坦,多丘陵,素有“八山一水一分田”的說法,導致很多地方并不適宜耕種。福建的地形及氣候條件適合林木的生長,第九次全國森林資源清查結果表明,福建省森林覆蓋率連續四十年居全國第一,森林覆蓋率達到66.8%[24]。森林覆蓋率越高,在一定程度上意味著環境會越好,空氣質量也就越好,因此福建省的空氣質量相對較好。
數據取自于PM2.5歷史數據網站(https://www.aqistudy.cn/historydata/),本研究中截取2018年福建省各市每日的AQI數據以及2015—2018年各市的月度AQI數據。寧德市的數據在2018年4月29日和2018年4月30日有缺失,采用2018年數據完整的363天的AQI平均值代替缺失值。
2.2.1 主成分分析
主成分分析也稱主分量分析,是Hotelling在1993年提出來的[25]。主成分分析是將原有的多個指標簡化成較少且具有代表性的綜合性指標。假設有x1,x2,…,xp個變量,首先尋找一個線性組合f1。

并使其包含最多的變異性信息,也就是使得f1的方差達到最大,f1就是其第一主成分。隨后,再尋找下一個線性組合f2。
在f1與f2互不相關條件下使得f2的方差達到最大,f2就是其第二主成分。依此類推,直至所有的變量信息被提取完畢。所以主成分分析就是用綜合性指標代替原有的變量,即線性組合f1,f2,…,fk代替變量x1,x2,…,xp(k≤p),使其在包含絕大多數變量信息的條件下達到降維的目的。
提取的主成分個數與fi的貢獻率有關,fi的貢獻率是fi的方差與總方差的比值,第i個主成分fi的方差等于第i個特征值λi[25](所求出的特征值按照從大到小的順序排列,第i個特征值代表該特征值在排序中第i位),所以主成分fi的方差貢獻率可以用一個指標ωi來表示。
其中,第一主成分的貢獻率最大,第二、第三主成分等的貢獻率依次減少,而用于判斷主成分提取個數的指標是前k個主成分的累計貢獻率:

它是前k個主成分的貢獻率之和,它表明前k個主成分綜合原始變量xj(j=1,2,…,p)信息的能力,通常我們要求累計貢獻率達到85%以上[26]。
2.2.2 函數型主成分模型
函數型數據分析[27](functional dataanalysis,FDA)最早是由Ramsay提出的,函數型數據是將數據以函數的形式表現出來[28],通常為光滑的曲線或連續的函數,其數據具有函數性。函數型主成分分析(functional principle components analysis,FPCA)是主成分分析的一種擴展[29-30],傳統主成分分析的數據一般是向量形式,而FPCA的數據是連續的,是經典多元分析的曲線[31],是有限維度函數線性組合對無限維度的近似[32]。函數型主成分分析中離散的變量xj通過基函數平滑變為連續的函數x(s),此時,權重向量β變為權重函數β(s),所以

本研究利用R語言中傅里葉基函數對離散數據進行平滑,基函數個數K為65,用pca.fd函數計算函數型主成分,并畫出相應的圖進行分析。
原數據通過整理得到2018年福建各市每日AQI數據均值表(表1),2015—2018年福建各市每月AQI數據均值表(表2),2018年福建各市空氣質量等級天數表(表3),并畫出AQI的散點圖(圖1)。其中質量等級劃分根據環保部于2012年發布的《環境空氣質量指數(AQI)技術規定(試行)》里規定的質量等級標準進行劃分[6](表4)。

表1 2018年福建省各市每日AQI數據均值表Tab.1 Daily average values of AQIof Fujian each city in 2018

表2 2015—2018年福建各市每月AQI數據均值表Tab.2 Monthly average value of AQI in Fujian each city from 2015 to 2018

表3 2018年福建各市空氣質量等級天數表Tab.3 The number of days for air quality levels of Fujian each city in 2018

表4 AQI質量等級劃分標準Tab.4 AQI quality level classification criteria

圖1 福建省九個市在365天中每天AQI平均值的散點圖Fig.1 Scatter plot of average daily AQI for nine cities in Fujian over 365 days
從圖1的散點圖可以看出,2018年福建省各市的AQI數據比較均勻,基本都在100以下,說明福建省空氣質量總體很好,表3表明每個市都僅有少數幾日有空氣污染發生。而在第50 d(2月中旬)左右出現AQI數值異常偏高,該時間為2018年春節,AQI偏高可能是燃放煙花爆竹所致。
利用R語言進行函數型主成分分析,得到特征值及貢獻率(表5),同時繪出特征值(圖2),綜合表5與圖2,取前四個主成分pca1,pca2,pca3,pca4進行分析,累計總貢獻率達到98.1%,包含原始變量絕大部分信息。

表5 函數型主成分特征值及貢獻率Tab.5 Eigenvalue and contribution rate of functional principal components

圖2 函數型主成分分析特征值Fig.2 Eigenvalues of functional principal component analysis
函數型主成分的結果給出了前四個主成分對均值函數的擾動圖(圖3),同時繪出主成分得分圖(圖4)。

圖3 函數型主成分對均值函數的擾動圖Fig.3 Perturbation diagram of the functional principal component to the mean function
從圖3可以看出,第一主成分解釋了58.5%的方差,其對均值函數的擾動與均值函數的趨勢是相同的,說明第一主成分是能夠影響污染物濃度的因素,是全年影響的,即非突發也非季節性,所以是工業廢氣,汽車尾氣等污染源的排放導致AQI升高的重要因素。第二主成分解釋了22.9%的方差,1月至3月中旬,5月下旬至8月下旬,11月中旬至12月末這些時間段促進AQI的升高(稱為正效應),3月下旬至5月中旬,9月至11月上旬這些時間段使得AQI降低(稱為負效應)。第二主成分的三個正效應時間段與福建農田休耕期一致,負效應時間段處于作物生長階段,作物生長進行光合作用,凈化空氣,同時葉片等還能吸附一些固體顆粒物,減少了空氣中污染物濃度。福建植被覆蓋率大,影響效果較明顯,所以第二主成分反映了作物對AQI的影響。第三主成分解釋了11.6%的方差,其正效應出現在4月至7月,其它都以負效應為主。第三主成分效應比較集中,可能反映了一些人類活動的因素。例如,建設施工時會產生大量粉塵,完成清理后揚塵比原來少,因此后期出現負效應。第四主成分解釋了5.1%的方差,其正效應主要是在1月至4月以及11月至12月,負效應主要出現在4月至9月,10月則基本持平,根據2018年的福建省氣候公報可知,2018年秋季,主要是11月份,出現罕見的陰雨寡照天氣,冬季容易出現連晴天氣,春季多陰雨天氣,2018年的雨季開始于5月1日,6月24日結束,同時6月至9月受多個臺風影響,降水較多。鄒琳等在研究南昌AQI時提到,降水會影響空氣質量,降水量大時會降低AQI,而降水量小的時候會使空氣中污染物濃度增大,從而增大AQI,同時連陰和連晴也會增大AQI。[33]這些正好與出現正負效應的時間及天氣情況相吻合,所以第四主成分反映了降水對福建省AQI的影響。

圖4 函數型主成分得分圖Fig.4 Functional principal component score chart
利用ArcGIS軟件對2018年福建省每日AQI均值數據,它是2018年福建省九個市365天的AQI數據平均值,即每個市2018年365天的AQI總和除以365(圖5),2015—2018年福建省每月AQI均值數據,它是2015—2018年總共四年福建省每個月九個市的AQI數據平均值(圖6),以及2018年福建各市的六種污染物的均值數據進行繪圖(圖7)。
圖5反映的是2018年福建省AQI均值情況,從均值上看,2018年福建各市的AQI均值都在70以下,表明福建省總體空氣質量良好。從區域上看,沿海城市總體空氣質量差于非沿海城市,沿海城市經濟發展更快,人口密度大,城市化程度高,汽車數量多,容易導致污染物濃度提升,使得AQI大于非沿海城市。具體來看,2018年南平、三明、龍巖及廈門的AQI均值不大于50,空氣質量為優。其余市為良。圖6顯示的則是過去4年每月的AQI均值情況,其中廈門和福州的AQI均值大于2018年,通過計算得廈門和福州2015—2017的AQI均值分別為52和57,2018年為50和54,說明其2015—2017年的AQI均值大于2018年,表明2018年與前幾年的綜合情況相比,廈門和福州在改善空氣質量方面有成效。

圖5 2018年福建省各市的AQI均值空間分布圖Fig.5 The spatial distribution of the average AQI for Fujian cities in 2018

圖6 2015—2018年福建省各市每月AQI均值空間分布圖Fig.6 Spatial distribution of monthly average AQI values in Fujian each city from 2015 to 2018
從圖7可知六種污染物分布的具體情況,大體呈現出南北差異、沿海與非沿海的差異。從總體上來說,福建北部地區PM2.5、PM10和NO2的濃度相對福建南部較低些。SO2濃度呈現出非沿海地區高于沿海地區,而O3則正好相反,沿海地區O3濃度較高是因為沿海地區汽車數量較多,汽油揮發、尾氣排放產生O3,導致其濃度高于非沿海地區。SO2主要來源是化石燃料的燃燒和硫化物礦石冶煉等,受重工業影響,非沿海地區SO2濃度高于沿海地區。CO濃度則是廈門、泉州和莆田一帶較低,CO主要來源是原料燃燒和汽車尾氣排放,而這一帶需要通過原料燃燒的工業較少,所以CO濃度相對低些。具體來看,2018年漳州空氣質量較差,除SO2外污染物濃度都較高,三明的SO2和CO濃度較高,南平空氣質量較好,污染物濃度都較低。

圖7 2018年福建省六種污染物的均值時空分布圖Fig.7 Spatiotemporal distribution of the mean of six pollutants for Fujian each city in 2018
結合圖4、圖5和表2,對九個城市的空氣質量進行分類。龍巖、三明、南平和廈門在同一個象限且AQI均值在同一區間,表明這四個城市的空氣質量情況相似,歸為一類。這四個城市空氣質量以優為主,主要造成污染的是春節燃放煙花。寧德、泉州和莆田在同一個象限,歸為第二類,特點是污染天數較多,空氣質量為優和良的天數接近,漳州獨在一個象限,卻在泉州、莆田和寧德所在象限邊緣附近,這是由于漳州污染天數與泉州、莆田和寧德相近,但漳州空氣質量以良為主。福州獨自在一個象限,與其他城市相比,福州空氣質量天數都在中等的水平,所以福州自成一類。綜上所述,如分成四類,則第一類為龍巖、三明、南平和廈門,第二類為寧德、泉州和莆田,第三類為福州,第四類為漳州。
隨著科技發展,數據獲取變得越來越容易,數據越來越密集,當數據無限稠密時會接近曲線,這時傳統的離散數據分析方法變得不適用,函數型數據分析方法能解決這個問題,而主成分分析又有降維和簡化指標的作用,所以用函數型主成分分析方法來研究空氣質量指數特征是有意義的。通過函數型主成分分析方法對福建省AQI進行分析,提取的四個主成分是對AQI造成影響的四個因素,結合時空分布特征分析可知,AQI與經濟發展程度、經濟發展模式、人們生活習慣和氣候條件等息息相關。經濟發展程度越高,消耗資源越多,容易產生更多污染。經濟發展模式則主要說明產業的不同,如重工業、輕工業以及農業、服務業等,會導致主要污染物類型的不同。人們生活習慣,例如出行,是選擇公共交通、共享單車等較為環保的方式,還是自駕開車等。氣候條件則是,降水,風力因素、溫度、日照等等。福建省空氣質量總體優良,但也存在一些差異,沿海地區的空氣質量會略差于非沿海地區。
在上述分析中也發現了一些問題。首先是政策落實不是很到位,2018年春節福建省各市燃放了大量煙花爆竹,導致空氣污染,龍巖和南平甚至重度污染。其次是汽車尾氣以及工業廢氣排放很大程度上影響著空氣質量,稻桿等作物剩余物的處理,人類建設活動導致的空氣污染問題等。針對這些問題,提出一些建議。第一,必須繼續堅持禁燃煙花爆竹的政策,并加強監督力度,一些重大活動必須得到特殊批準,可以適量燃放。第二,必須對工業廢氣嚴加管控,處理不達標的廢氣必須嚴禁排放,經濟的發展不能以破壞環境為代價。同時相關部門應該督促有關企業進行技術革新,提高能源利用率。第三、建立相關的獎懲制度,違規了就應當按規定進行處罰,對做出較大貢獻者也應該給予適當獎勵。第四,提倡綠色出行,加強人民群眾的環保意識,組織人員下基層宣傳,學校學習教育等,只有每個人都有了這種意識,才會主動做到低碳、環保。總而言之,對于有些不可抗的自然因素,我們要學會預防,而人為的因素,則要努力從源頭處理它,將它不好的影響降至最低限度。