黃冉(成都農業科技職業學院,四川 成都 611130)
要分析某城市土壤污染問題,一是要研究重金屬在城區的分布情況,需將5 個不同功能區分開考慮,通過griddata 插值法對采樣點數據非網格插值[1],得到各重金屬濃度模型,再采用地統計學方法描述重金屬元素的統計特征值,用軟件作出各重金屬的分布圖,描述其空間分布特征,采用地積累指數法評估污染程度。二是要評估不同區域重金屬污染[2-3]的程度,采用聚類分析法分析采樣點數據,將污染源分類,再確定具體污染原因。三是要確定污染源,用主成分分析法分析哪些重金屬的污染是比較嚴重的,由此確定主要污染源。
(1) 假設題中采樣點分布均勻、全面;(2) 假設題目中數據真實可靠,能夠反映客觀情況;(3)假設采樣點的金屬元素濃度保持不變;(4) 假設同一區域內的環境基本相同。
Xi:采樣點橫坐標;Yi:采樣點縱坐標;Cij:第i個采樣點重金屬元素As,Cd,Cr,Cu,Hg,Ni,Pb,Zn 的濃度分別為Ci1,Ci2,…,Ci8;Bj:8 種重金屬元素的背景值分別為B1,B2,…,B8;Zkj:插值后估計點處8 種金屬元素濃度分別為Zk1,Zk2,…,Zk8。
刻畫8 種重金屬元素在此城區的分布情況,需將5 個不同功能區分開考慮。以生活區為例,用griddata插值法對散點數據非網格插值的公式如下:
其中,m,n和V4表示Matlab 軟件提供的插值算法,取Zkj的最大值與最小值。
計算Zkj的均值、標準差、偏度、峰度,公式為:
峰度:
利用Matlab 軟件求解后結果如表1 所示。

表1 生活區土壤重金屬元素統計特征值
各重金屬元素的濃度分布如圖1 所示。

圖1 各重金屬元素的濃度分布
由表1 和圖1 可知,生活區土壤重金屬在不同地點存在明顯分布差異。8 種重金屬含量分布均屬于正偏斜分布,表明8 種重金含量偏高的樣點多、偏低的樣點少。8 種重金屬的峰度大于3,表明樣點數據比較集中。生活區的As、Cd、Cu、Pb 為正態分布,Cr、Ni 為左偏態分布,Hg、Zn 為右偏態分布。同樣可得工業區的As、Cd、Ni 是正態分布,其他都是右偏態分布;山區的Hg 是左偏態分布,Ni、Cr、Zn 是右偏度分布,其他是正態分布;主干道路區的As、Cd、Cr、Pb 是正態分布,其他是右偏度分布;公園綠地區的As、Ni 是左偏度分布,Hg 是右偏度分布,其他是正態分布。
為更直觀地觀察,作出各元素的空間分布圖。如圖2 和圖3 中陰影顏色越淺,As 和Cd 濃度越高。

圖2 As 濃度分布圖

圖3 Cd 濃度分布圖
觀察各圖像可知,各種重金屬元素的污染相對集中,向周圍均勻擴散的過程中污染程度逐漸減小。
本文用地積累指數模型來評價污染程度。地積累指數法的公式如下:
式中,Cn是土壤中n元素的含量,Bn是n元素的地球化學背景值(取平均值),k為系數(一般取1.5),用來表征沉積特征、巖石地質及其他影響。
地積累指數大小對應的污染程度分級如表2 所示。

表2 地積累指數分級標準
用Matlab 編程得到各區域各重金屬元素的地積累指數[4],反映生活區的污染情況如表3 所示。

表3 生活區的污染情況
同樣可得到其他區域的污染情況,工業區的As是輕度-中等污染,Cd 輕度-中等污染,其他無污染;山區的Cd 是中等-強污染,Zn 輕度-中等污染,其他無污染;主干道路區的As、Ni 無污染,Cr、Cu 強污染,Pb強-極嚴重污染,其他極嚴重污染;公園綠地區的Hg、Zn 輕度-中等污染,其他無污染。
問題的解決方案用生活區舉例。求解流程為:先對采樣點金屬濃度進行聚類分析,再找出屬于同一污染原因的金屬元素,最后查閱資料確定具體污染原因。
用聚類分析法將所有采樣點金屬濃度聚類,用SPSS 軟件得到結果如圖4 所示。

圖4 各重金屬在各區域內的聚類分析圖
由圖4 知,各區域都將8 種重金屬元素分為5 類,其中生活區As、Ni 是一類,Cr、Cu、Pb 是一類,其余各屬一類;工業區As、Ni 是一類,Cr、Cu、Pb 是一類,其余各屬一類;山區As、Cu、Pb 是一類,Hg、Ni 是一類,其余各屬一類;主干道路區As、Ni 是一類,Cr、Cu、Pb是一類,其余各屬一類;在公園綠地區As、Ni、Cu 是一類,Cr、Pb 是一類,Hg、Zn、Cd 各屬一類。
最后,經過查閱資料查找原因:As 主要來源于煤炭燃燒,由于煤的大量使用,排放量很高,因此,居民區的As 含量較高;Cu 主要源于冶煉、金屬制品業;Ni主要源于采礦業、金屬制品的電鍍、電池、燃油電廠廢氣等;Cd、Pb、Zn 污染主要是工業和礦產廢水灌溉;Hg主要是工業污染,其次是汽車尾氣排放的顆粒物導致。
將5 個區分類分析,先用主成分分析法[5]處理數據。主成分分析法是一種常見的多變量分析法,用于從原變量中降維導出幾個新的互不相干的主要變量,且能保留原變量的信息。篩選出主成分指標的具體做法和步驟如下:
設原變量有xi(i=1,2,…,p),降維后新變量為zi(i=1,2,…,n且n≤p),即:
上式中i取任意值都有越大,z1包含信息就越多,故變量Var(z1)應取最大,z1就是第一主成分;若第一個主成分不能代表原變量指標信息,就繼續構造z2,則有(c21,c22,…,c2p) 與(c11,c12,…,c1p)相互垂直,同時Var(z2)取最大值。依次類推,可組合得到第三,第四……,第n個主成分zn。分析主成分的步驟如下:
(1)指標數據標準化處理如表4 所示。

表4 原指標數據標準化
原指標數據標準化后有公式:第j個指標數據對應樣本地均值是:
樣本方差S2:
得出標準化矩陣如下:
(2)指標的相關性判斷:
相關系數rij的計算公式如下:
由上式得相關系數矩陣:
(3)特征值和特征向量的計算:
解如下特征方程|R-λE|=0 的特征值λi(i=1,2,…,p)
再按照|R-λiE|ei=0 求出對應λi(i=1,2,…,p)的n個單位特征向量,組成了一個正交矩陣:
(4)主成分計算式表達
n個主成分表示為下式:
其中,aij,(i=1,2,…,n;j=1,2,…p)是X的協方差陣的特征值對應的特征向量,X是原變量通過標準化處理后的取值。
(5)主成分的貢獻率和累計貢獻率計算
設λi是矩陣R的第i個特征根,那么第k個主成分zk的貢獻率:
(k=1,2,…,p),且前r個主成分zk的累計貢獻率。
當前k個主成分zk的累計貢獻率Pr取值范圍為85%≤Pr≤95%,則令前i個主成分Zi為新的指標。用Matlab 編程計算后得各區域結果,其中生活區、工業區和山區結果如表5 所示。

表5 三個區域土壤重金屬主成分分析表
用生活區舉例分析,主成分1 中,Cd、Cu、Pb 具有較高的載荷,Cd 主要源于工業活動;Cu 來源于汽油、車體磨損等;Pb 源于汽車尾氣排放,說明因子1 主要代表交通的影響;主成分2 中,Zn 具有較高的載荷,Zn源于汽車輪胎磨損與生活垃圾污染,說明因子2 主要受生活區活動影響;主成分3 中,Cr,Ni 具有較高的載荷,其污染源主要在于電鍍、電池和機器制造等工業廢水的排放,所以因子3 主要受工業活動的影響。
本文采用的griddata 插值法很好地解決了空間散點難以擬合的復雜難題;統計特征值模型能與實際緊密聯系,模型具有較好的通用性和推廣性;評估不同區域的重金屬污染程度時采用的地積累指數(Lego)法可以分離自然異常中的人為異常,使得結果更客觀真實;分析重金屬污染的主要原因中采用的聚類分析法可以準確簡單的顯示出屬于同一類別的污染物,簡單便于操作,利于分析;對于確定污染源的位置,綜合運用多種來源解析方法,相互輔助,從而便于更準確地解釋和鑒別土壤重金屬污染的來源。
由于信息數據不充分,使得在確定污染源的位置時建立的模型不能更準確地找出污染源位置。同時,有些重金屬在水中反應微弱,故模型求解的結果具有定性分析意義,但作為定量分析結果可能與實際尚有一定誤差。
本文研究運用數值模型分析法,從三個方面重金屬對土壤的污染問題,可以將其推廣到重金屬對植物和動物的影響,從而有利于對農作物的培育和動物的養殖,確定對人體的危害;也可應用到其他金屬元素對土壤的污染和影響,從而研制促進農作物生長的化肥,有利于農業的發展;本文采用的模型和分析方法可以分析其他地區的污染情況,便于居民選擇遠離污染的區域居住,有利于城市合理規劃,為人類的健康和安全帶來了可靠的理論和實踐依據。