摘 要:文章采用因子分析法對全國31個省、自治區、直轄市的環境污染進行了分析、評價,并運用統計軟件SPSSl8.0對數據進行了處理、計算。通過分析表明我國目前環境污染較為嚴重,其中河北、山東、廣東、重慶幾省的綜合污染最為嚴重。文章的分析評價可以為我國的環境污染防治提供一定的數據支持。同時因子分析模型能簡化數據結構,減少信息冗余,識別環境污染的主要因素,為各地區環境整治提供了客觀、科學、準確的量化指標。
關鍵詞:因子分析 環境污染 貢獻率
中圖分類號:F205 文獻標識碼:A
文章編號:1004-4914(2013)03-008-02
一、引言
由于人們對工業高度發達的負面影響預料不夠,預防不利,導致了全球性的三大危機:資源短缺、環境污染、生態破壞。環境污染不僅會給生態系統造成直接與間接的破壞和影響,如沙漠化、森林破壞、溫室效應、酸雨和臭氧層破壞,而且影響人類的生活質量、身體健康和生產活動。嚴重的污染事件不僅帶來健康問題,也造成社會問題。據統計,我國2010年度環境污染治理投資總額已高達2566億元,環境保護刻不容緩。評價各地區環境污染程度以及確定污染類型,能夠為環境保護的科學決策提供基礎的數據支持。當前,國家統計局提供的關于各地區環境污染程度的統計數據有23大類之多,且各組數據間有大量的信息交叉和冗余,很難以直觀的方式予以表達。為此,本文將因子分析模型引入到環境污染處理中,首先通過降維技術把多個相關的數據組轉換成少數主因子,簡化了數據結構;其次通過因子旋轉使主因子之間互不相關,減少了信息的交叉;最后根據因子載荷矩陣分別計算各地區主因子得分情況,然后根據各因子的方差貢獻率,計算總因子得分。這時即可直觀地看出各個地區環境污染的主要影響因素。
二、因子分析理論
(一)因子分析概述
因子分析的最初設想的基本思想是用少數幾個潛在指標(因子)的線性組合來表示實際存在的多個指標。因子分析的主要應用有兩個方面:一方面是尋求基本結構,簡化觀測系統,即構造一個因子模型,確定模型中的參數,然后根據分析結果進行因子解釋;另一方面是對變量或樣本進行分類,對公共因子進行估計,并進一步分析。因子分析的基本目的是用少數幾個隨機變量來描述多個變量間協方差關系,其基本思想是,根據相關性大小對變量分組,使組內變量間高相關、組間變量低相關,每組變量代表一個基本結構就是因子。
(二)因子分析的數學模型
用矩陣表示:X=AF+ε且滿足:
(1)m≤p;
(2)即F與ε是不相關的;
(3)D(F)=Im即F1……Fm不相關且方差皆為1,Im表示m階單位矩陣。ε1……εm不相關且方差不同。
其中X是可觀測的p個指標所構成的p維隨機向量,F=(F1……Fm)'是不可觀測的向量,F稱為X的公共因子;aij成為因子載荷,是第i個因子在第j個公共因子上的負荷,它反映了第i個因子在第j個公共因子上的相對重要性,ε是特殊因子,它包含了隨機誤差。
(三)模型的統計意義
模型中公共因子F1……Fm是在各個原觀測變量的表達式中都共同出現的因子,F=(F1……Fm)'是對所有的Xi(i=1,2,…,p)都起作用的因子,故稱為X的公因子,且公因子是相互獨立的不可觀測的理論變量,它們的含義必須結合具體問題的實際意義而定。εi叫做特殊因子,是向量X的分量Xi(i=1,2,…,p)所特有的因子,即εi只對Xi起作用,并且各特殊因子之間以及特殊因子與所有公共因子之間都是相互獨立的。
模型中載荷矩陣A中的元素(aij)pm為因子載荷,因子載荷aij是Xi與Fi的協方差也是Xi與Fj的相關系數,它表示Xi依賴Fj的程度,反映了第i個變量在第j個公共因子上的相對重要性。aij的絕對值越大,表明Xi與Fj的互相依賴的程度越大或稱公共因子Fj對于Xi的載荷量越大。為了得到因子分析結果的經濟解釋,因子載荷矩陣A中有兩個統計量十分重要,它們是變量共同度和公共因子的方差貢獻。
因子載荷矩陣A中第i行元素之平方和記為hi2,稱為變量Xi的共同度。它是全部公共因子對Xi的方差所做出的貢獻,反映了全部公共因子對變量Xi的影響。hi2大表明X的第i個分量Xi對于F的每一分量F1……Fm的共同依賴程度大。
將因子載荷矩陣A的第j列(j=1,2,…,m)的各元素的平方和記為gj2,我們稱其為公共因子Fj對X的方差貢獻。gj2就表示第j個公共因子Fj對于X的每一分量Xi(i=1,2,…,p)所提供方差的總和,它是衡量公共因子相對重要性的指標。gj2越大,表明公共因子Fj對X的貢獻越大,或者說對X的影響和作用就越大。如果將因子載荷矩陣A的所有gj2(j=1,2,…,m)都計算出來,使其按照大小排序,就可以依此提煉出最有影響力的公共因子。
(四)因子分析的一般步驟
1.原始數據的標準化。標準化的目的在于消除不同變量的量綱影響,而且標準化不會改變變量的相關系數。
2.計算標準化數據的相關系數矩陣,并求出相關系數矩陣的特征值和特征向量。
3.進行正交變換,通過使用方差最大法。其目的是使因子載荷兩極分化,而且旋轉后的因子仍然正交。
4.確定因子個數,計算因子得分,進行統計分析。
三、環境污染的因子分析
(一)原始數據的選取
原始數據(2010年統計年鑒)為我國各省、直轄市工業和生活污染物排放量。其中:x1為生活污水排放量(萬噸),x2為生活污水中化學需氧量排放量(萬噸),x3為生活二氧化硫排放量(萬噸),x4為生活煙塵排放量(萬噸),x5為工業固體廢物排放量(噸),x6為工業廢氣排放量(億平方立米),x7為工業廢水排放量(萬噸)。
(二)因子分析的輸出結果
將上述原始數據標準化處理后,經SPSS18.0統計軟件分析可以得到變量相關系數矩陣。結果表明7個變量之間的相關性很高,適合用因子分析來研究變量之間的內部依賴關系。
因子分析的關鍵就是利用相關系數矩陣求出相應的因子特征值和累計貢獻率,用SPSS18.0統計軟件可得到總方差解釋表。結果表明取其中3個因子已提供了原資料85.333%的信息,滿足因子選取原則:m個因子的累計貢獻率大于或等于85%。同時還表明旋轉前后的總累計貢獻率沒有發生變化,即總的信息量無損失。
因子分析的主要目的是將具有相近的因子載荷的各變量置于一個公因子之下,當初始因子不能典型的代表變量的含義時,對因子載荷矩陣采用旋轉方法,并施以25次正交旋轉,使因子載荷值向兩極端發展,以便對因子的意義作出更合理的解釋。
成分矩陣和旋轉成分矩陣表明:旋轉前后因子載荷的變量結果基本一致,第一類公因子在變量x1,x2,x6,x7上的因子載荷比較大,命名為水污染因子f1,第二類公因子在x3,x4上的因子載荷比較大,命名為氣體污染因子f2,第三類公因子在x5上的因子載荷比較大,命名為固體污染因子f3。
為更好地進行分析評價,可運用spss得出各因子在主因子上的得分系數矩陣。計算三個公因子得分函數為:
通過公因子得分表達式,可以算出公因子得分。發現河北、江蘇、山東、廣東幾個省在f1上的得分較大,所以可知這幾個省的水污染嚴重,應注意加強對工業和生活污水的治理,使之達到國家污水排放標準。同時可以看出,河北、山西、內蒙古、遼寧、山東幾個省的氣體污染嚴重,這是因為這幾個省有的省份屬于國家老工業基地,工業污染的企業多,有的企業對環境污染的處理不重視,有的省份鄉鎮企業發展迅速,由于鄉鎮企業對環境保護意識不強,所以污染嚴重。重慶的固體污染最為嚴重說明該省在生產建設、日常生活和其他活動中產生污染環境的固態、半固態廢棄物質較多。從得分f可以看出河北、山東、廣東、重慶幾個省的cpufrkdT2F1TgD7gHCfIicjWN5RVVdzbhyd+bwdghUA=綜合污染嚴重。說明這幾個省的環境污染嚴重,應采取措施治理環境污染,促進經濟社會和環境的和諧發展,可持續發展。
四、結束語
從以上可驗證因子分析在我國環境污染分析中應用的可行性,可減少甚至避免選取綜合評價指標和權重的主觀性,不合理性。因子分析模型作為一種分析多元數據的強有力工具,能將復雜的數據結果化簡,信息交叉冗余減少,挖掘出直觀有用的數據,在社會經濟狀況普查,環境污染監測,空間數據處理等方面有著廣泛的應用。伴隨著未來信息源的飛速增多,能否從紛繁復雜的信息中快速提取有價值的信息,這將是因子分析模型與相關學科專業結合的最具生命力的生長點,也將促使更多的專業人士拓展它的應用范圍。
參考文獻:
1.高惠璇.應用多元統計分析[M].北京大學出版社,2004
2.黃潤龍.SPSS軟件實用教程[M].高等教育出版社,2004
3.國家統計局.全國統計年鑒2010.北京:中國統計出版社,2010
4.牛瑞濤.因子分析模型在環境污染專題制圖中的應用[J].技術交流,2009(6)
5.鄧朝生,尚金城,陳鵬.我國環境污染的因子分析[J].內蒙古環境保護,2003(15)
6.吳靜,其木格,于洪文.應用SPSS軟件包對我國化境污染的因子分析[J].內蒙古統計,2000(5)
7.劉旭華,王勁峰,孟斌.中國環境污染的原因分析[J].地理研究,2004(23)
8.張永生,房靖華.森林與大氣污染[J].環境科學與技術,2003(4)
9.Sehmel G A.Particle and Gas Dry Deposition.Atmospheric Environment [J].1980(14)
10.K Paul Becett, P H Freer-Smith, Gail Taylor.Particulate pollution capture by urban trees: effect of species and windspeed[J].Global Change Biology,2000(6)
(作者單位:大同大學商學院 山西大同 037009)
(責編:賈偉)