張世龍
(川北幼兒師范高等專科學校 初等教育系, 四川 廣元 628017)
空氣污染對人類健康、工農業生產及全球環境等都會造成很大的危害, 實時掌控空氣質量非常重要。雖然大氣污染種類繁多,性質復雜,但是若能對“兩塵四氣”(PM2.5、PM10、CO、NO2、SO2、O3)進行實時監測及預報,就能對污染源采取措施,大大改善空氣質量[1]。
國家對“兩塵四氣”有較為準確的監測數據,但因布控點少,數據發布滯后且花費較大,空氣質量監測和預報的實時性有待提高[2]。鑒于此,擬在國控點附近建立自控監測點,對地區空氣質量進行實時網格化監控。由于各種因素的影響,自控點所測數據與國控點數據有一定誤差,需通過建立數學模型對自測點數據進行校準。
利用Excel 對2019 年全國大學生數學建模競賽D 題給出的國控點與自建點“兩塵四氣”濃度進行數據透視分析。初步分析發現,數據透視表中兩組數據存在不完全對應現象。如:國控點數據里有2019 年1 月14 日數據,而未發現相應日期自建點數據;在自建點數據里有2019 年1 月12 日與2019 年4 月10 日數據,而在國控點數據中無此日期的相應數據。因此,刪去這三組數據以便對應分析。計算數據表中自建點的一個小時時間段各污染物濃度的算術平均值,對應于國控點的整點時刻污染物濃度,得到國控點與自建點“兩塵四氣”的部分數據走勢,如圖1—圖5(篇幅所限,不能給出全部數據走勢圖)。
根據數據透視圖1 可知,自建點PM2.5 濃度大多高于國控點,二者整體波動較大。在2018 年11 月30 日國控點 P M2.5 濃度達到最高,接近180 μg/m3。在 2 018 年 1 1 月 2 6 日自建點 P M2.5濃度達到最高,接近160 μg/m3。自建點PM10 濃度大多高于國控點,但在5~6 月國控點PM10 濃度基本都高于自建點,二者整體波動較大。在2018 年11 月30 日國控點與自建點PM10 濃度均達最高,國控點濃度超過230 μg/m3,自建點濃度接近 3 30 μg/m3。
圖2 顯示,國控點CO 濃度基本都高于自建點,尤其在 2 019 年 2 月 1 日~5 月 1 8 日這段時間內國控點CO 濃度遠高于自建點,且國控點CO濃度波動起伏大,相較國控點而言自建點CO 濃度波動較小。在2019 年2 月24 日國控點CO 濃度達到最高,接近 2 .5 mg/m3。在 2 019 年 5 月 2 3 日自建點 C O 濃度達到最高,超過 1 .1 mg/m3。
由圖3 可見,自建點NO2濃度大多高于國控點,在2019 年1 月上旬自建點NO2濃度遠高于國控點,且二者波動起伏不大。在2019 年1 月23日國控點濃度NO2達到最高,超過83 μg/m3。在2019 年3 月27 日自建點NO2濃度達最高,超過114 μg/m3。

圖1 國控點與自建點“兩塵”的部分數據

圖2 國控點與自建點CO 的部分數據
圖4 表明,在2018 年11 月 1 4 日—12 月31日國控點SO2濃度均高于自建點,之后二者SO2濃度幾乎接近,但在1 月23 日自建點SO2濃度急劇增至118 μg/m3,后又急劇下降。

圖3 國控點與自建點NO2 的部分數據

圖4 國控點與自建點SO2 的部分數據
由圖5 可見,自建點O3濃度均高于國控點,1月25 日后二者濃度變化趨勢相同,波動較大。在2019 年6 月 11 日國控點 O3濃度達到最高,為176 μg/m3。在 2019 年 6 月 5 日自建點O3濃度達到最高,為 132 μg/m3。

圖5 國控點與自建點O3 的部分數據
綜上所述,國控點與自建點數據間均存在較大差異。
利用SPSS 分析“兩塵四氣”與風速、壓強、降水量、溫度、濕度等指標的相關性。首先,對所得國控點與自建點每小時的平均值數據透視表進行數據篩選,刪除了62 個國控點數據、759 個自建點數據(如:國控點1 月14 日測得的13 個小時數據在自建點數據里均沒有,同樣在自建點2019 年1 月1 日0 時與11~16 時的數據在國控點數據中也沒有,等等,予以刪除。)。再利用SPSS[3]對篩選后的數據表分析“兩塵四氣”數據與風速、壓強、降水量、溫度、濕度的相關性,結果如表1。
由表 1 可見,PM2.5 與濕度的皮爾遜相關性系數r=0.6,呈中度相關,大于其與壓強的相關性(r=0.35)。PM2.5 與降水量的相關系數 r=0.190,說明相關程度弱,基本不相關。PM2.5 與風速、溫度都呈負相關。
PM10 與濕度的相關系數r=0.61,呈中度相關,與壓強的 r 為 0.39,表明 PM10 與濕度相關性大于而其與壓強的相關性。PM10 與降水量相關程度弱,基本不相關,與風速、溫度都呈負相關。
CO 與風速、壓強、溫度的 r 值都小于 0.3,說明與其相關程度弱,基本不相關。CO 與降水量、溫度的r 值均為負數,說明呈負相關性。
NO2與降水量、濕度的r 值分別為0.441、0.364,均為低度相關關系。NO2與壓強、風速、溫度基本不相關。
SO2與風速、濕度基本不相關,與其他均為負相關。
O3與壓強、降水量、濕度的 r 都大于 0.3 且小于0.5,都呈低度相關,其他與之均為負相關。
綜上表明,自建點數據與國控點數據之間的差異與風速、壓強、降水量、溫度和濕度有關。PM2.5 和PM10 的差異主要跟自建點和國控點的濕度成正相關,跟風速和溫度都呈負相關。PM10的差異主要跟自建點和國控點的濕度成正相關,跟風速和溫度都成負相關。CO 的差異主要跟自建點和國控點的降水量和溫度成負相關。NO2的差異跟自建點和國控點的降水量和濕度成低度正相關。SO2的差異主要跟自建點和國控點的壓強、降水量和溫度成負相關。O3的差異主要跟自建點和國控點的壓強和降水量成低度正相關,跟風速、濕度和溫度都成負相關。實際上,除上述原因外,造成這兩者間的差異還有很多其他因素,如所使用的電化學氣體傳感器在長時間使用后會產生一定的零點漂移和量程漂移,非常規氣態污染物(氣)濃度變化對傳感器存在交叉干擾,以及天氣因素對傳感器的影響,自建點的地理環境因素,等等,由于篇幅所限對這些因素不加討論。

表1 “兩塵四氣”數據與風速、壓強、降水量、溫度、濕度的相關性結果
根據表1 中自建點數據-國控點數據得出“兩塵四氣”的差值(Yi,i=1,2,3,4,5,6),利用[4]MATLAB 多元線性回歸函數求出差值與風速(X1)、壓強(X2)、降水量(X3)、溫度(X4)、濕度(X5)的函數關系式。PM2.5、PM10、CO、NO2、SO2和 O3的差值函數式分別如下:

利用此模型,根據 Y校準值=Y自建點-Yi分別對自建點 PM2.5、PM10、CO、NO2、SO2和 O3的數據進行校準,計算模型的相對誤差,并做出誤差分析,最后檢驗模型的準確性和可行性。
隨機選取給出的部分數據,代入上述差值函數式,計算自建點數據矯正結果如表2 所示。

表2 自建點“兩塵四氣”的數據矯正結果
由表2 可知,“兩塵四氣”的數據矯正相對誤差平均值在 8.27 %~20.27 %范圍內,說明多元線性回歸模型能起到預期校準作用,但仍有不小的誤差。造成誤差的主要原因有:一方面對國控點數據和自建點數據(取算術平均值)作平滑處理存在一定的數據偏差;另一方面,多元線性回歸是對兩個或兩個以上的自變量作回歸分析,而一種現象常常與多個因素相關,由多個自變量的最優組合共同預測或估計因變量,比用單個自變量進行預測或估計更有效,也更符合實際,但可能忽略了交互效應和非線性的因果關系。
空氣污染對生態環境和人類健康危害巨大,通過對“兩塵四氣”(PM2.5、PM10、CO、NO2、SO2、O3)濃度的實時監測可以及時掌握空氣質量情況,對污染源采取相應措施。本文對自建點數據與國控點數據進行探索性數據分析, 并對數據造成差異的因素進行了分析,在此基礎上利用國控點數據構建了自建點數據校準的數學模型,模型檢驗表明效果達到預期。