曹文軍,張思濛,薛偉鋒
(1.中國檢驗認證集團遼寧有限公司,遼寧 大連 116600;2.大連海關技術中心,遼寧 大連 116600)
地下水是水資源中重要組成部分。近年來,隨著地下水開采量的增加以及惡劣氣候變化,導致地下水環境質量急劇惡化,隨之而來的與地下水有關的環境問題日益突出,已引起國內外廣泛關注[1-4]。地下水一旦遭受污染,由于其自凈能力較弱,會對生態環境造成嚴重影響,直接或間接危害人類[5-7]。為了能夠及時有效的采取措施,保護和改善地下水水質,需要對地下水環境質量進行評價。
水質評價是將不確定性監測結果與確定性評價標準相結合的分析過程,水質評價沒有一個統一的評價方法,故難以建立統一的評價模型[8]。目前,國內外圍繞水質評價已開發多種方法,如單因子評價法[9]、綜合指數評價法[10]、模糊綜合評價法[11]、神經網絡法[12]、灰色評價法[13]、主成分分析法[14]和集對分析法[8,15]等。每種方法都有其側重點,但每種方法都無法全面地反映復雜的水質狀況。因此,在實際研究工作中將多種方法結合使用,能夠更加全面、準確了解水質情況。集對分析是近年提出的一種新型的處理模糊性和不確定性的數學模型,該模型通過計算評價因子與水質之間的聯系度達到對地下水水質做出評價[8,15]。主成分分析法則是充分考慮不同指標之間的信息重疊,對多維數據進行標準化,在盡可能地保留原有信息的基礎上,對多維數據進行降維處理,更加客觀地篩選出獨立的綜合因子,避免了主觀隨意性,已被廣泛應用于水源水質評價[16-19]。本研究通過主成分分析法對新鄉市地下水水質進行評價,并與文獻15中使用熵權集對分析法預測結果進行比較,分析不同水質評價模型差異原因,為新鄉市地下水水質保護和改善提供更加全面可靠的科學依據。
采用SPSS 17.0軟件進行分析,具體步驟如下:
(1)根據文獻15報道結果,選取水質評價指標,包括:總硬度、溶解性總固體、硫酸鹽、氯化物、氨氮和錳。
(2)對相關數據進行標準化,以消除不同指標間的量綱和數量級影響。
(3)采用Kaiser-Meyer-Olkin(KMO)檢驗統計量和Bartlett球形度檢驗判斷指標間的相關性,以確定原始變量是否適合進行因子分析。當KMO值大于0.5時,可進行因子分析。Bartlett球形度檢驗對應的顯著性小于0.05時,原始變量間存在相關性,可進行主成分分析。
(4)確定主成分個數。一般選取累計方差貢獻率大于80%,特征值大于1的主成分。
(5)根據計算結果,確定主成分Fi的表達式。
(6)計算主成分分值,綜合得分越高,表明水質污染越嚴重,從而給出不同監測斷面水質排名。
為消除原始數據不同量綱和數量級的影響,需要對數據進行標準化處理,結果如表1所示。

表1 標準化后數據
采用相關分析法對6項水質指標進行分析,相關系數結果見表2。兩個指標之間的相關系數絕對值越大,說明兩個指標的相關性越強。相關系數為正,說明兩個指標之間存在正相關關系,反之為負相關關系。由表2可知,指標之間相關系數絕對值大部分均在0.5以上,說明各指標信息存在重疊,具有較高的相關性,原始變量適合因子分析。主成分分析以變量相關性檢驗為前提,地下水KMO和Bartlett檢驗結果如表3所示。由表3分析可知,地下水KMO檢驗度量值大于0.5,Bartlett球形檢驗顯著性小于0.05,表明原始變量之間存在相關性,適合做主成分分析。

表2 相關系數矩陣

表3 KMO和Bartlett檢驗結果
特征值表示成分對指標變量影響力的大小,若特征值小于1,說明主成分的解釋力度不夠。主成分的方差及方差貢獻如表4所示。由表4分析可知,特征值大于1的有2個成分,累積的方差占比為96.464%,即可用2個主成分替代6個水質指標,其包含的信息量可以解釋監測指標表征的絕大部分信息,可利用其進行地下水水質的評價研究。

表4 解釋的總方差
初始因子載荷矩陣系數表征監測水質指標與主成分的相關程度,用于解釋各個主成分變量的變異情況。其中,正值表示水質指標與主成分之間呈正相關,負值表示水質指標與主成分之間呈負相關;其絕對值越接近1,表明相關程度越高,則該指標可以作為評價地下水水質的主要控制指標。地下水主成分初始因子載荷矩陣如表5所示。主成分1在總硬度、溶解性固體和硫酸鹽等3個變量上具有高載荷,表明主成分1主要反映這3個指標的信息;主成分2在錳上具有高載荷,表明主成分2主要反映錳的信息。

表5 主成分初始因子載荷矩陣
用主成分初始因子載荷矩陣中數據除以主成分對應特征值平方根,得到主成分相對應的特征向量,即每個指標相應的系數,與標準化的后的數據ZXi相乘,即可得出主成分F1和F2相應的表達式。根據初始特征值方差的百分比λ1和λ2,進而獲得F值表達式。F1、F2和F相應的表達式如下所示:
F1=0.465ZX總硬度+0.465ZX溶解性固體+0.464ZX硫酸鹽
F2=0.775ZX錳
F =[λ1/(λ1+λ2)]F1+[λ2/(λ1+λ2)]F2
由上述公式,獲得地下水水質主成分F值,結果見表6。根據F值越大,水質污染越嚴重進行不同采樣點水質排名,由優至劣依次為封丘縣(10#)-原陽縣(15#)-衛輝市(4#)-封丘縣(27#)-長恒縣(36#)-長恒縣(15#)-獲嘉縣(19#)。

表6 F值綜合得分

表7 不同水質評價模型預測結果比較
在文獻15使用熵權集對分析法預測7個采樣點水質結果中,按照水質級別可以分為3類,其中水質最好的采樣點為封丘縣(10#),水質II級;其次是原陽縣(15#)和衛輝市(4#),水質III級;最差的是封丘縣(27#)、獲嘉縣(19#)、長恒縣(15#)和長恒縣(36#),水質均為V級。水質排名由優至劣依次為封丘縣(10#)-原陽縣(15#)/衛輝市(4#)-封丘縣(27#)/獲嘉縣(19#)/長恒縣(15#)/長恒縣(36#)。本研究采用主成分分析法預測7個采樣點水質優劣排名為封丘縣(10#)-原陽縣(15#)-衛輝市(4#)-封丘縣(27#)-長恒縣(36#)-長恒縣(15#)-獲嘉縣(19#)。封丘縣(10#)在2個預測模型中均排名第1,說明該點水質相對最好。在熵權集對分析法中列為水質III級的原陽縣(15#)和衛輝市(4#),無法通過該模型進一步判斷水質優劣,但是通過主成分分析法預測后發現原陽縣(15#)要比衛輝市(4#)水質相對好一些。同理,在熵權集對分析法中列為水質V級的封丘縣(27#)、獲嘉縣(19#)、長恒縣(15#)和長恒縣(36#),也可通過主成分分析法對該4個采樣點水質進一步判斷其優劣順序,結果為封丘縣(27#)-長恒縣(36#)-長恒縣(15#)-獲嘉縣(19#)。
由上述分析可知,采用主成分分析法和熵權集對分析法對新鄉市7個采樣點水質預測結果非常吻合。熵權集對分析法是一種新型的處理模糊性和不確定性的數學模型,該模型通過計算評價因子與水質之間的聯系度達到對地下水水質做出評價,預測結果可靠,但該模型對同一級水質不能區分優劣,主成分分析法卻有效地解決了該問題。主成分分析法能有效地降低數據維度,篩選出主要污染因子,最大限度地降低了評價因子選取主觀性對評價結果的不利影響,而且能對同一級水質結果按照水質污染程度進行排序,更好地對水質優劣進行區分,使評價結果更加客觀合理。盡管主成分分析法無法直接獲得水質類別,但結合熵權集對分析法后,不僅可以獲得水質類別,還能夠針對同一級水質進行水質排名,使結果更加詳實。以上分析說明,主成分分析法和熵權集對分析法兩種模型結合使用后預測結果要比單一預測模型更加全面可靠。
本研究以新鄉市地下水為研究對象,運用主成分分析法對水質主要影響指標進行分析,并對綜合水質進行了評價,結論如下:
(1)針對新鄉市7個地下水水質監測斷面,主成分分析法指出,可將6個水質指標綜合為2個主成分進行解釋,解釋率為96.464%。其中,第1主成分貢獻率為74.838%,第2主成分貢獻率為21.626%,第1主成分控制指標為總硬度、溶解性固體和硫酸鹽,第2主成分控制指標為錳。主成分分析法預測水質由優至劣順序為封丘縣(10#)-原陽縣(15#)-衛輝市(4#)-封丘縣(27#)-長恒縣(36#)-長恒縣(15#)-獲嘉縣(19#)。
(2)本研究使用的主成分分析法和文獻中使用的熵權集對分析法對新鄉市7個地下水水質排名預測結果非常吻合。主成分分析法有效彌補了熵權集對分析法無法區分同一級水質優劣的缺陷,說明兩種模型結合使用后綜合預測結果要比單一預測模型更加可靠。