李文青 史雨梅



摘 ? 要:空氣污染問題近年來備受社會關注,而造成空氣污染的因素繁雜,各因素對空氣污染造成的影響水平值得深究。因此,利用方差分析(ANOVA)方法,對滁州市的三個監測點收集到的數據進行處理,利用SPSS軟件檢驗監測點、時間對監測數據是否存在顯著性影響及其影響水平的分析,進一步探尋滁州市空氣污染的主要來源。
關鍵詞:方差分析;環境監測;空氣質量
中圖分類號:FX8 ? ? 文獻標志碼:A ? ? ? 文章編號:1673-291X(2021)26-0044-03
一、研究準備
(一)研究背景
空氣環境的好壞是影響環境質量的一大重要因素。它是由空氣中的懸浮顆粒物濃度度量的,通過實時環境監測對當前的空氣質量指數,可以了解到空氣污染物主要由二氧化氮、臭氧、PM10和PM2.5組成,通過對各影響空氣質量的因素(時間、監測點)進行分析和分解,從而可以對癥下藥減輕空氣污染問題對我們生活造成的不便。
(二)方差分析的基本思想
方差分析(ANOVA),又名“變異數分析”、“F檢驗”,是指對于兩個及兩個以上樣本,通過分析樣本誤差來檢驗總體均值是否存在顯著性差異,也就是初步判斷給出的一個或多個自變量對因變量是否獨立。
組成復雜系統的各因素分為不可控的隨機因素和為了研究施加的可影響結果的可控因素兩類,各因素相互聯系、相互制約,因此,在此條件下得到的實驗數據往往呈現波動性。而方差分析的基本思想正是通過分析研究實驗數據波動的規律,將各組實驗數據在某影響因素下可能存在的系統性波動與隨機波動做比,據此推斷各總體均值之間有無顯著差異,若存在顯著差異,就說明這一因素對因變量影響顯著。
(三)實時監測數據
通過查詢獲取安徽省生態環境廳的往年空氣質量記錄數據,我們從中選取了2019年8月至2020年2月中構成空氣污染的主要部分,分別為氮氣、臭氧、PM10以及PM2.5,利用EXCEL表格進行AVERAGE計算,得出各主要污染物月平均數值,如表1所示。
二、方法綜述
在數理統計中,精密度通常使用標準差來表示。標準差亦稱均方誤差,用σ表示。但通常情況下測定平均值不等于實際值,因此測定值與平均值之差不等于測定值與真值之差。為要表示有限測定次數的精密度采用符號s代替σ,有限測定次數標準偏差的計算公式為:
其中,N-1在數理統計中說明在N次測定中只有N-1個可變的偏差,代表自由度。
方差分析就是分析構成總體的方差的各個成分,然后利用顯著性檢驗來分析判斷,得出結論。常用的方差分析有單因素方差分析和雙因素方差分析。
(一)單因素方差分析
假定存在m(i=1,2,…,m)個監測點,第i個監測點存在ni個監測值,用Xi1,Xi2,…,Xin表示監測值,易得各監測點平均監測值:
方差分析的目的就是為了通過Q1,Q2的大小判斷各監測點間是否存在顯著性差異,若Q2顯著性大于Q1,則說明各監測點存在顯著差異。
Q1,Q2,Q的自由度分別為n-m,m-1,n-1,由此可以借助F檢驗判斷各監測點是否存在顯著差異:
用上式計算出來的F值與附表的值進行比較,通常分為4種情況:F>F99%,方法影響特別顯著;F99%≥F>F99.5%,方法影響顯著;F99.5%≥F>F99%,方法有一定影響;F90%≥F,看不出方法對結果有較大影響。
(二)雙因素方差分析
雙因素方差分析在實時環境監測中的應用主要為同時考慮時間與地區不同對空氣質量的影響,兩者之間不存在交互關系,由此可以得出時間因素和地區因素的平方和Q2、Q3,分別為:
三、實際應用
(一)時間因素
由于時間與地區兩因素之間不存在交互關系,通過SPSS軟件直接對表2中獲取的實時監測數據進行雙因素方差分析,得出在時間因素不同的情況下空氣環境中NO2對應的顯著性水平為近似于0,小于設定的值0.05,表明不同時間點的NO2數值具有顯著差異。用此方法同樣計算O3、PM10、PM2.5對應的顯著水平,均為0,且同樣,空氣質量指數(AQI)在不同時間條件下亦存在顯著差異。
(二)空間因素
進一步考慮不同站點因素對空氣環境質量的作用。操作數據顯示,由于監測站點不同,AQI、NO2、O3、PM10、PM2.5各F值對應的顯著水平分別為0.130、0.201、0.130、0.421、0.165,均大于設定的0.05,表明滁州市老年大學、人大賓館、市政府原辦公樓三個站點環境空氣質量不存在顯著差異,三個地區均處于同一污染水平。
四、結論與改進
(一)結論
本文根據滁州市空氣質量數據的特征構建了方差檢驗(ANOVA)模型,通過SPSS軟件對時間與空間兩個影響因素進行方差分析檢驗的運行結果可以清晰看出,地區不同對空氣污染物及AQI數值幾乎沒有影響,因此滁州市內三個站點間的空氣環境污染差距并不大。
而從選取的7個月數據得出的結果來看,在時間條件不同的情況下搜集到的空氣環境數據有顯著變化,因此可以得出季節與氣候的變化能夠對空氣環境造成顯著性影響。
方差分析能夠得出影響滁州空氣環境的主要因素為時間,而滁州市在地域上整體空氣質量處于同一水平。同時能夠從均值、方差中看出,在幾大主要空氣環境污染物中,臭氧是對空氣質量造成最大傷害的物質。因此,方差分析能夠檢驗時間、空間等因素是否對空氣質量具有影響,及其影響是否顯著。該方法可以廣泛應用于環境質量評價中。
(二)改進建議
第一,在觀測過程中,僅選擇滁州市三個觀測站進行數據收集,模型的可信度有待提高。
第二,在模型的設定上還可以考慮人均GDP以及所在地區的工業產業、交通、人口規模等因素,這樣將大大提高模型的復雜度,可以進一步細化模型。
第三,本文只重點分析了的空氣污染成分中的PM2.5、PM10和O3,其他空氣污染的組成成分有待進一步分析。
第四,在使用的數據上,本文的數據從采集到整理還有一些缺失值(地區范圍較小,可供收集渠道不足),有待進一步提高收集數據的連續性。
參考文獻:
[1] ? 許榕,徐淑霞.方差分析在環境質量評價中的應用[J].江蘇環境科技,2002,(4):19-20,22.
[2] ? 楊小勇.方差分析法淺析——單因素的方差分析[J].實驗科學與技術,2013,11(1):41-43.
[3] ? 鄒 ? .SPSS軟件單因素方差分析的應用[J].價值工程,2016,35(34):219-222.
[責任編輯 ? 張宇霞]
收稿日期:2021-01-27
基金項目:國家級大學生創新訓練項目“基于實時環境監測數據的函數型統計方法研究”(201910377019)
作者簡介:李文青(2000-),女,安徽銅陵人,學生,從事經濟統計學研究;通訊作者:史雨梅(1990-),女,安徽安慶人,講師,從事計計算研究。