王娟
(咸陽職業技術學院 基礎部, 陜西 咸陽 712000)
空氣污染是當前人類面臨的亟待解決的環境問題[1],空氣中的各大有害物質(氮氧化物、硫氧化物、碳氧化物、飄塵及懸浮顆粒等)給人們的健康帶來了嚴重的威脅[2-3]。隨著人們生活水平的不斷提高,人們對空氣污染情況及自身健康狀況的重視程度日益增強,環境污染問題成了公眾關注的焦點[4-5]。人們通過對大氣中“兩塵四氣”(PM2.5、PM10、CO、NO2、SO2、O3)濃度的實時檢測可以及時掌握空氣質量,從而對污染源采取相應措施。國家監測控制站點(國控點)能夠對“兩塵四氣”數據進行有效檢測,且較為準確,但不足之處是國控點的布控較少,不能實時發布檢測結果且花費較大。微型空氣質量檢測儀(自建點)花費小,并且可對任一地區空氣質量進行實時檢測,但由于自建點所使用的電化學氣體傳感器在長時間使用后會產生一定的零點漂移和量程漂移,非常規氣態污染物濃度變化對傳感器存在交叉干擾,以及受天氣因素影響,在同一時間,其檢測結果與其近鄰的國控點檢測結果存在一定差異。推廣使用微型空氣質量檢測儀,必須對其檢測結果進行處理,即對檢測數據進行校準。文中對自建點數據與國控點數據進行了探索性研究,對導致自建點數據與國控點數據產生差異的因素進行了分析,并利用國控點每小時的數據對國控點近鄰的自建點數據進行了校準。
本文數據來自2019年全國大學生數學建模競賽試題D題。利用國控點數據對自建點數據進行篩選,采取就近原則,只保留與國控點數據檢測時間最接近的自建點數據,使自建點數據與國控點數據以時間為基準相互匹配。國控點數據包括PM2.5、PM10、CO、NO2、SO2、O3數據,自建點數據包括PM2.5、PM10、CO、NO2、SO2、O3數據及風速、壓強、降水量、溫度、濕度數據。
1.2.1 灰色關聯度
灰色關聯度是將因素之間發展趨勢的相似或相異程度作為衡量因素間關聯程度的一種方法。根據參考文獻[6],其定義如下。
(1) 灰色絕對關聯度


(2) 灰色相對關聯度

(3) 灰色歸一關聯度
若序列x0和xi長度相等,且初值皆不為零,則稱ρ0i=θξ0i+(1-θ)R0iz其中,θ∈[0,1])為x0和xi的灰色歸一關聯度。
利用灰色關聯度定義可對國控點、自建點“四氣”對“兩塵”及自建點中環境因素對“四氣”的影響程度進行分析[7]。
1.2.2 逐步回歸
逐步回歸是一種線性回歸模型自變量選擇方法,其選擇過程包含以下幾個基本步驟[8]。

(2) 建立因變量y與自變量子集{xi1,x1},…,{xi1,xi1-1},{xi1,xi1+1},…,{xi1,xp}的二元回歸模型。計算變量回歸系數的F檢驗統計量的值,在給定的顯著性水平下,若其最大值不小于相應的臨界值,則將xi2引入回歸模型。否則,終止變量引入過程。
(3) 建立因變量y對變量子集{xi1,xi2,xk}的三元回歸模型,重復步驟(2)。
每次從未引入回歸模型的自變量中選取一個,直至沒有變量引入為止。
自建點中,“兩塵四氣”數據由于受環境因素的影響而產生偏差,應用逐步回歸法可構建自建點“兩塵四氣”數據的校準模型。
根據灰色絕對關聯度、灰色相對關聯度以及灰色歸一關聯度的定義,借鑒參考文獻[9-11]中的思想,利用MATLAB軟件計算得到國控點中PM2.5、PM10與“四氣”的灰色關聯度,如表1、表2所示。

表1 國控點PM2.5與“四氣”的灰色關聯度

表2 國控點PM10與“四氣”的灰色關聯度
由表1、表2可以看出,國控點中,“四氣”對“兩塵”的影響情況為:CO、NO2對“兩塵”的影響較大,而SO2、O3對“兩塵”的影響較小,且CO、NO2對PM2.5的影響比其對PM10的影響顯著。
利用上述方法,同理可得自建點中PM2.5、PM10與“四氣”的灰色關聯度,如表3、表4所示。

表3 自建點PM2.5與“四氣”的灰色關聯度

表4 自建點PM10與“四氣”的灰色關聯度
由表3、表4可以看出,自建點中,“四氣”對“兩塵”的影響情況為:O3、SO2對“兩塵”的影響較大,而CO、NO2對“兩塵”的影響較小,而且O3對PM2.5的影響比其對PM10的影響顯著。
這與國控點中“四氣”對“兩塵”的影響情況不同,究其原因,自建點中“兩塵”不僅受“四氣”的影響,同時還受環境因素的影響。
自建點檢測數據受環境因素的影響較大,下面利用MATLAB軟件對自建點“四氣”與環境因素的關聯度進行分析,如表5—表8所示。

表5 CO與各環境因素的灰色關聯度

表6 NO2與各環境因素的灰色關聯度
由表5—表8可以看出,環境因素中,溫度和壓強對CO、NO2的檢測結果影響較大,濕度、風速、降水量對SO2、O3的檢測結果影響較大。

表7 SO2與各環境因素的灰色關聯度

表8 O3與各環境因素的灰色關聯度
由2、3研究結果可以看出,自建點中,PM2.5、PM10檢測結果容易受“四氣”影響產生偏差,“四氣”的檢測結果容易受環境因素影響產生偏差。下面,應用逐步回歸法[12-14]構建“兩塵”與“四氣”的校準模型。其中,選取第3 001至3 200行共計200個數據用于模型檢驗,其余數據用于模型構建。
首先構建PM2.5的校準方程。利用EXCEL對自建點和國控點的PM2.5數據取差值,以差值為因變量,以“四氣”數據為自變量建立校準模型[15]。
調用stepwise命令得:
(其中,y:誤差值,x1:CO,x2:NO2,x3:SO2,x4:O3)
故PM2.5的校準方程為:yjiaozhun=yjiance-y
(其中,yjiaozhun:校準值,yjiance:檢測值)
將用于檢驗的200個數據代入上述校準方程,校準值與國控點數據進行比對,如圖1所示。

圖1 自建點PM2.5校準值與國控點PM2.5的比對結果
其中,紅(淺)色為國控點數據,藍色(深)為自建點校準值。
同理可得PM10的校準方程及檢驗結果,如圖2所示。

圖2 自建點PM10校準值與國控點PM10的比對結果
其中,y=-22.206 7+53.731 2x1+0.250 136x2+2.001 56x3-0.253 844x4
根據4.1中的方法,分別得到CO、NO2、SO2及O3的校準方程及其與國控點數據的比對結果,如表9和圖3所示。

表9 CO、NO2、SO2及O3的校準方程

圖3 自建點“四氣”數據的校準值與國控點“四氣”數據的比對結果
本文針對微型空氣質量檢測儀(自建點)數據校準問題進行了研究,采用灰色關聯度分析了國控點、自建點中“四氣”對“兩塵”的影響情況以及自建點中環境因素對“四氣”的影響情況,以此為基礎構建了自建點“兩塵”與“四氣”數據的校準模型。主要結論有:國控點中,CO、NO2對“兩塵”的影響較大,SO2、O3對“兩塵”的影響較??;自建點中,在環境因素的作用下,O3、SO2對“兩塵”的影響較大,CO、NO2對“兩塵”的影響較??;環境因素中,溫度和壓強對自建點CO、NO2的檢測結果影響較大,濕度、風速、降水量對自建點SO2、O3的檢測結果影響較大。從“兩塵” “四氣”的校準值與國控點相關數據的比對結果來看,模型較為可靠。