黨 紅 韓浩田
(長(zhǎng)治學(xué)院數(shù)學(xué)系 山西長(zhǎng)治 046011)
空氣質(zhì)量指數(shù)(Air Quality Index,簡(jiǎn)稱AQI)就是根據(jù)環(huán)境空氣質(zhì)量標(biāo)準(zhǔn)和各項(xiàng)污染物對(duì)人體健康、生態(tài)、環(huán)境的影響,將常規(guī)監(jiān)測(cè)的幾種空氣污染物濃度簡(jiǎn)化成為單一的概念性指數(shù)值形式,它包括了空氣的潔凈、污染程度以及對(duì)健康的影響[1]。一共分為六級(jí),分別對(duì)應(yīng)空氣質(zhì)量的六個(gè)類別,空氣質(zhì)量指數(shù)取值范圍在0~500,當(dāng)范圍在0~100 時(shí),對(duì)大多數(shù)市民正常活動(dòng)沒(méi)有影響,當(dāng)空氣質(zhì)量指數(shù)在150 以上時(shí),對(duì)兒童和老年人以及心臟病、肺病患者的戶外活動(dòng)有極大的影響。影響空氣質(zhì)量評(píng)估的主要污染物有細(xì)顆粒物(PM2.5)、可吸入顆粒物(PM10)、一氧化碳(CO)、二氧化氮(NO2)、二氧化硫(SO2)、臭氧(O3)等六項(xiàng)。PM2.5是指環(huán)境空氣中直徑小于或等于2.5 微米的顆粒物,又被稱作可入肺顆粒物[1]。盡管PM2.5 在地球大氣成分中所占比例很小,但是它卻對(duì)空氣的品質(zhì)、能見(jiàn)度等產(chǎn)生了重大的影響。PM2.5 顆粒具有直徑小,活性強(qiáng)的特質(zhì),并且在空氣中可以停留較長(zhǎng)時(shí)間,傳輸距離也比其它物質(zhì)遠(yuǎn),會(huì)吸附在口腔黏膜上,因此對(duì)人體健康和大氣環(huán)境質(zhì)量會(huì)產(chǎn)生很大的影響。
國(guó)內(nèi)許多學(xué)者對(duì)于PM2.5 進(jìn)行過(guò)大量的研究,利用主成分分析、相關(guān)性分析、多元線性回歸分析等多種分析方法,研究了多個(gè)地區(qū)的空氣質(zhì)量,取得了一定的成果。宋紅鳳等通過(guò)對(duì)杭州地區(qū)的AQI 及其6 項(xiàng)指標(biāo)建立多元線性回歸模型,并對(duì)PM10、SO2、CO、NO2、O3五項(xiàng)指標(biāo)進(jìn)行主成分分析,消除強(qiáng)影響點(diǎn)得到回歸方程,進(jìn)行最終PM2.5 影響因素的研究[2]。李波等對(duì)長(zhǎng)沙市的AQI 指標(biāo)進(jìn)行相關(guān)性分析,建立時(shí)間序列模型對(duì)長(zhǎng)沙市的PM2.5 進(jìn)行了短期預(yù)測(cè),并通過(guò)最優(yōu)模型提出相關(guān)建議[3]。叢琳等人建立了北京市PM2.5 與PM10、SO2、CO、NO2、O3的線性回歸模型,同時(shí)基于主成分分析建立精確度更高的的多元回歸模型,研究得出PM10、CO、NO2對(duì)北京市PM2.5 的影響最大[4]。
長(zhǎng)治市近年來(lái)經(jīng)濟(jì)發(fā)展迅速,同時(shí)給環(huán)境帶來(lái)了較大的破壞,大氣環(huán)境被嚴(yán)重污染,譬如機(jī)動(dòng)車(chē)廢氣帶來(lái)的污染,施工帶來(lái)的揚(yáng)塵污染,燃煤導(dǎo)致的污染,凡此種種,對(duì)市民的正常生活及出行造成了一定的影響。近年來(lái),通過(guò)實(shí)施秋冬季大氣污染綜合治理攻堅(jiān)行動(dòng),長(zhǎng)治市空氣質(zhì)量持續(xù)改善,為了徹底消除重污染天氣,本文通過(guò)研究2021 年P(guān)M2.5 與PM10、SO2、CO、NO2、O3之間的關(guān)系,采用主成分分析法找到長(zhǎng)治市空氣質(zhì)量被影響的關(guān)鍵因素,以便為政府部門(mén)的治理提供有參考價(jià)值的信息和有針對(duì)性的建議,打好重污染天氣攻堅(jiān)戰(zhàn)。
本文研究所用的數(shù)據(jù)全部源自中國(guó)空氣質(zhì)量在線監(jiān)測(cè)分析平臺(tái),長(zhǎng)治市2021 年每天的AQI 指數(shù)及其6項(xiàng)指標(biāo)含量數(shù)據(jù)不存在丟失情況,研究數(shù)據(jù)中CO 的單位是mg/m3,而PM2.5 與PM10、SO2、NO2、O3單位是μg/m3,各變量單位不一致,因此要先將數(shù)據(jù)中心標(biāo)準(zhǔn)化,對(duì)CO 的數(shù)據(jù)乘以1000 進(jìn)行單位換算,以此來(lái)消除量綱對(duì)數(shù)據(jù)分析所產(chǎn)生的影響。
對(duì)長(zhǎng)治市2021 年空氣質(zhì)量評(píng)價(jià)進(jìn)行匯總分析,從表1 中可以看到長(zhǎng)治市2021 年空氣質(zhì)量為良的頻率是63.01%,空氣質(zhì)量為優(yōu)良的累計(jì)頻率為79.17%,說(shuō)明長(zhǎng)治市空氣質(zhì)量較好,優(yōu)良天氣居多,輕度污染的頻率為16.99%,中度污染的頻率為2.19%,而重度污染和嚴(yán)重污染的頻率僅為1.10%和0.55%。這表明,作為“2+26”城市大氣污染防治城市之一,經(jīng)過(guò)一年的“轉(zhuǎn)型、減煤、降塵、控車(chē)、治企”,長(zhǎng)治市空氣質(zhì)量得到穩(wěn)步提升,但中度污染、重度污染及嚴(yán)重污染的情況還會(huì)不時(shí)發(fā)生,因此空氣質(zhì)量的改善和治理工作一刻也不能放松,仍然需要繼續(xù)落實(shí)。

表1 2021年長(zhǎng)治市空氣質(zhì)量情況
在多元線性回歸模型中,如果變量之間存在多重共線性,將對(duì)統(tǒng)計(jì)檢驗(yàn)、參數(shù)估計(jì)及模型估計(jì)值的穩(wěn)定性、可靠性產(chǎn)生不利的影響。因此,在建立多元線性回歸模型時(shí),檢驗(yàn)變量之間是否存在多重共線性是非常有必要的。
皮爾森相關(guān)系數(shù)R[6]被廣泛用于衡量?jī)蓚€(gè)變量間的相關(guān)性,相關(guān)系數(shù)R 的取值范圍在1 到-1 之間。其中相關(guān)系數(shù)的絕對(duì)值愈接近1,兩個(gè)變量之間的相關(guān)性愈強(qiáng);等于1 表示這兩個(gè)變量是完全相關(guān)的;相關(guān)系數(shù)的絕對(duì)值愈接近0,則兩者的相關(guān)性愈低。
使用EVIEWS 軟件錄入原數(shù)據(jù),得到了影響PM2.5 濃度的各項(xiàng)指標(biāo)數(shù)據(jù)之間的相關(guān)系數(shù)矩陣如表2 所示。

表2 相關(guān)系數(shù)表
從表2 各變量之間的相關(guān)系數(shù)值可以看出,PM2.5 與PM10、CO、SO2、NO2、O3五個(gè)監(jiān)測(cè)指標(biāo)間都有著不同程度的相關(guān)性。具體表現(xiàn)為:PM2.5 與PM10 相關(guān)性系數(shù)R 為0.8962,是最高的,說(shuō)明PM10 對(duì)PM2.5的影響最大;其次PM2.5 與CO 的相關(guān)性系數(shù)R 為0.7090,說(shuō)明與CO 之間的相關(guān)性較高;另外PM2.5 與SO2、NO2的相關(guān)性系數(shù)R 分別為0.6662 和0.6434,說(shuō)明PM2.5 與SO2、NO2之間也存在較大的相關(guān)性;以上相關(guān)系數(shù)均為正數(shù),說(shuō)明PM2.5 與PM10、CO、SO2、NO2之間的關(guān)系均為正相關(guān),而PM2.5 與O3間的相關(guān)性系數(shù)R 為-0.2392,和O3之間的關(guān)系為負(fù)相關(guān),表明現(xiàn)有的研究結(jié)果具有一定的合理性,即在PM2.5 形成之前,一氧化碳(CO)、二氧化氮(NO2)、二氧化硫(SO2)是主要的氣態(tài)物質(zhì);而PM2.5 與O3間呈負(fù)相關(guān)關(guān)系,在降低PM2.5 時(shí),保護(hù)大氣層中的臭氧是非常關(guān)鍵的,分析表明,解釋變量之間存在著嚴(yán)重的多重共線性關(guān)系,不能用線性回歸方法來(lái)建立模型。因此,本文采用了主成分分析法[7],以克服多重共線對(duì)線性回歸模型所造成的影響。
多元回歸分析方法可以對(duì)一個(gè)因變量與多個(gè)自變量之間的相關(guān)性進(jìn)行分析,通過(guò)對(duì)不同因子組合的數(shù)值進(jìn)行多元統(tǒng)計(jì)分析,得出因變量與自變量之間的數(shù)量關(guān)系[8]。本文針對(duì)PM2.5 與PM10、CO、SO2、NO2、O3五個(gè)因子進(jìn)行多元統(tǒng)計(jì),進(jìn)而分析PM2.5 與這五個(gè)因子之間的具體量化關(guān)系。通過(guò)上文分析發(fā)現(xiàn),PM2.5 與五個(gè)因子之間存在較為顯著的相關(guān)性。但直接建立PM2.5 與PM10、CO、SO2、NO2、O3五個(gè)指標(biāo)的多元回歸模型時(shí),SO2會(huì)由于顯著性檢驗(yàn)結(jié)果不顯著而被剔除,這與SO2與PM2.5 的相關(guān)性很高的結(jié)論相違背。為了能夠更好地解釋SO2與PM2.5 之間的關(guān)系,需對(duì)PM10、CO、SO2、NO2、O3五個(gè)指標(biāo)進(jìn)行主成分分析,并建立主成分之間的多元回歸模型。使用SPSS 軟件對(duì)所得數(shù)據(jù)進(jìn)行分析,并用最大方差法[9]進(jìn)行旋轉(zhuǎn),提取出主成分,結(jié)果如表3 所示。
從表3 中可以看出,主成分的數(shù)量要少于原來(lái)的變量數(shù)目,且絕大多數(shù)的信息都能用主成分進(jìn)行解釋,減少了變量信息的損失,所以主成分提取的整體結(jié)果是令人滿意的;第一個(gè)元素的主成分的特征值是3.068,它解釋了總信息的61.361%,第二個(gè)元素的主成分的特征值是0.928,它解釋了總信息的18.554%,第三個(gè)元素的主成分的特征值是0.528,它解釋了總信息的10.553%,前3 個(gè)主成分的累計(jì)貢獻(xiàn)率高達(dá)90.468%,遠(yuǎn)大于80%,這表明,主成分分析的結(jié)果較為理想,前面三個(gè)主成分所包含的信息較為完整,而損失的部分則是各變量間存在著相互重疊的信息,因此,選擇前面三個(gè)主成分進(jìn)行分析是合理的。

表3 解釋的總方差
由表4 可以看出,PM10、NO2在第一個(gè)主成分上的載荷量比在第二、三主成分上的載荷量大,均大于0.85,接近于1;而O3在第二個(gè)主成分上的載荷量比在第一、三主成分上的載荷量大,大于0.85,接近于1,因此不能確定該變量屬于哪個(gè)主成分。

表4 成分矩陣
為了使變量在三個(gè)主成分上的載荷量能清楚的區(qū)分,需要使用統(tǒng)計(jì)軟件SPSS 對(duì)載荷矩陣進(jìn)行旋轉(zhuǎn),從而使因子載荷系數(shù)[10]向0 和1 兩極分化,使載荷大的旋轉(zhuǎn)后變得更大,載荷小的旋轉(zhuǎn)后變得更小,旋轉(zhuǎn)后的因子載荷矩陣如表5 所示。
旋轉(zhuǎn)后的各個(gè)主成分的含義更加突出,旋轉(zhuǎn)成分矩陣表中的一行是一個(gè)變量在不同因子上的載荷,如果這些載荷都小于0.5(建議值),則考慮刪除或修改這個(gè)變量[11];只要大于0.5,則認(rèn)為該變量與這個(gè)成分有對(duì)應(yīng)關(guān)系,由表5 可以看出,所有變量在自己所在行中的載荷值都存在至少有1 個(gè)大于0.5(建議值)的。PM10、CO、NO2這三個(gè)變量在成分一上載荷量最大,表明成分一對(duì)PM10、CO、NO2這三個(gè)變量影響最大,將該成分命名為工業(yè)因子;SO2變量在成分二上載荷量最大,表明成分二對(duì)SO2變量影響最大,相應(yīng)的成分可命名為生活因子;O3變量在成分三上載荷量最大,表明成分三對(duì)O3變量影響最大,將該成分命名為環(huán)保因子。

表5 旋轉(zhuǎn)成分矩陣
利用SPSS 軟件求出主成分的特征向量[12]。結(jié)果如表6 所示。

表6 特征向量矩陣
同時(shí)得到三個(gè)主成分與原始變量之間的關(guān)系式:
在主成分分析操作中,三個(gè)主成分之間保持相互獨(dú)立,故對(duì)PM2.5 與三個(gè)主成分進(jìn)行多元回歸分析,結(jié)果如表7 所示。

表7 主成分回歸結(jié)果
綜上所述,得到如下多元回歸方程:
由回歸方程可知:PM2.5 與工業(yè)因子F1呈正比例關(guān)系,與生活因子F2呈正比例關(guān)系,與環(huán)保因子F3呈反比例關(guān)系,當(dāng)生活因子F2、環(huán)保因子F3保持不變時(shí),工業(yè)因子F1每變化一個(gè)單位會(huì)導(dǎo)致PM2.5 變化30.099 個(gè)單位;同理,當(dāng)工業(yè)因子F1、環(huán)保因子F3保持不變時(shí),生活因子F2每變化一個(gè)單位會(huì)導(dǎo)致PM2.5 變化19.804 個(gè)單位;當(dāng)工業(yè)因子F1、生活因子F2保持不變時(shí),環(huán)保因子F3每變化一個(gè)單位會(huì)導(dǎo)致PM2.5 變化3.231 個(gè)單位。同時(shí)也反映了PM10、CO、NO2這三個(gè)變量對(duì)PM2.5 的影響最大。
文章對(duì)長(zhǎng)治市2021 年AQI 指數(shù)和具體的監(jiān)測(cè)指標(biāo)進(jìn)行整理,并進(jìn)行統(tǒng)計(jì)分析,研究引起長(zhǎng)治市空氣質(zhì)量問(wèn)題的主要因素PM2.5 與PM10、SO2、CO、NO2、O3間的相關(guān)關(guān)系,利用主成分分析法消除了多重共線性的影響,提取三個(gè)主成分,并建立了多元線性回歸模型,得到PM2.5 與PM10、SO2、CO、NO2、O3間的線性回歸方程。
研究發(fā)現(xiàn),PM2.5 與第一主成分工業(yè)因子存在較大的相關(guān)關(guān)系,即與PM10、CO、NO2的相關(guān)程度比較大,其中PM10 對(duì)PM2.5 的影響最大,二者同為空氣中的顆粒物,PM2.5 與第二主成分生活因子也存在相關(guān)關(guān)系,即與SO2有一定的相關(guān)關(guān)系;而PM2.5 與第三主成分環(huán)保因子的相關(guān)關(guān)系就比較弱,即與O3間的相關(guān)程度不大。
為改善長(zhǎng)治市的空氣質(zhì)量,需控制空氣中塵土的含量,防治城市施工作業(yè)中的飛塵,減少煤炭開(kāi)采運(yùn)輸過(guò)程中產(chǎn)生的揚(yáng)塵;同時(shí)冬季煤炭燃燒會(huì)產(chǎn)生大量的SO2,為減少冬天煤炭使用量,可以使用新能源供暖替代燒煤供暖;汽車(chē)尾氣及工業(yè)廢氣中含有大量的CO和NO2,因此,需降低汽車(chē)尾氣的排放量,嚴(yán)格管控工廠的廢氣排放,低碳出行,減少私家車(chē)出行,大力發(fā)展公共交通。此外,政府還應(yīng)該向大眾講解空氣質(zhì)量的相關(guān)知識(shí),提升大眾的環(huán)保意識(shí);出臺(tái)更加嚴(yán)格完善的監(jiān)督管理制度,堅(jiān)持“轉(zhuǎn)型、減煤、降塵、控車(chē)、治企”,鞏固現(xiàn)有空氣治理成果的同時(shí),積極利用科技改善人們賴以生存的環(huán)境,創(chuàng)建美好家園。文章只收集了2021 年的空氣質(zhì)量數(shù)據(jù),存在研究數(shù)據(jù)不充足的問(wèn)題,這也是后續(xù)研究需要完善的地方。