石先羅,章 衛
(江西水利職業學院,南昌 330013)
集約化農業是近幾年來迅速發展的一種經營方式,主要是將先進的生產資料及勞動力集中于較少的土地上,利用集中經營的方式開展的農業活動[1~3]。與傳統農業相比具有主要是利用先進的農業技術來提高農作物的產量及質量。但是集約化農業的發展同時也帶來了一些新的環境污染問題,集約化種植業中大量的使用化肥、農藥、地膜等都會產生環境問題。如農藥化肥等通過地表及地下徑流進入到附近水體造成水污染及水體富營養化等問題,地膜的使用會導致殘留在土壤中破壞了土壤的生態環境[4-5]。目前集約種植業面源污染特點主要有:局部產生污染負荷大、污染范圍廣、污染具有一定的隱蔽性和分散性、污染后果嚴重難以消除等特[6~8]。本文將以南京市高淳縣龍墩湖流域為例,構建集約化種植業面源污染驅動因子指標體系,并利用主成分分析法識別出集約化種植業面源污染主要驅動因子,以揭示集約化種植業面源污染特征,為集約化種植業面源污染的治理提供依據。
龍墩河流域位于南京市高淳縣東北部的漆橋鎮漆橋河上游龍墩頭,距高淳縣城淳溪鎮17km,距漆橋鎮鎮區約3km,如下圖所示。龍墩湖現代農業科技示范園規劃總面積75 000畝,其中核心區22 500畝,發展區52 500畝。建設現代高效園藝產業、高效生態農作產業、農業旅游休閑產業、農業文化博覽產業、農產品交易物流產業等5類產業形態。

圖 龍墩湖流域地理概況Fig. Geographical situation of Longdun Lake basin
2.2.1 主成分分析法原理
主成分分析法,也被稱為主分量分析法,最早于 1901 年由美國統計學家Pearson引入生物學理論研究。1933年,Hotelling將此思想在心理學研究中進一步發展。1947年,Karhunen應用概率論的思想將其再次研究,隨后,Loe’ve將該理論進一步充實和完善。其原理是利用降維的思想把原來眾多具有一定相關性的指標,重新組合成一組新的互相無關的綜合指標來代替原來的指標,達到簡化計算的目的,同時又不影響分析結果。
2.2.2 熵權綜合指數法
熵本來是一個熱力學概念,由申農(Shannon)
最先引入信息論,現已在工程技術、社會經濟等領域得到相當廣泛的應用。根據信息論基本原理,信息是系統有序程度的度量而熵是系統無序程度的度量。兩者絕對值相等,但符號相反[9]。它最初描述的是一種單項不可逆轉的能量傳遞過程。后來隨著熵的思想和理論的發展,熵概念逐步形成了3種思路,即熱力學熵、統計熵和信息熵。信息熵越少,系統無序化程度越大;信息熵越大,系統無序化程度越小。
2.2.3 相關性分析法
相關性分析法是分析客觀事物之間關系的統計分析方法,其中,計算相關系數可以精確的展現變量之間的統計關系[10]??刹捎肧PSS分析軟件進行,SPSS(社會科學統計軟件包)軟件是世界上最早最優秀的分析軟件之一,廣泛應用于自然科學、技術科學、社會科學等各個領域中,并在國際學術界享有很高的聲譽。主成分分析法可以借助該軟件進行分析。
基于集約化種植業面源污染特點,根據收集到的相關環境基礎資料,分析集約化種植業面源污染的與哪些因子有關,并結合實地調查來確定指標體系[11]。本文將從種植因子、肥料因子、自然因子和社會因子這4個方面識別出集約化種植業產排污的主要驅動因子[12-13]。根據實際情況及現有數據確定龍墩湖流域種植業面源污染評價選取了17個評價指標A11~A43,見表1。選取典型區域,以8個采樣點的數據為基礎數據進行綜合評價。

表1 集約化種植業面源污染評價指標體系Tab.1 Evaluation index system of non-point source pollution of intensive planting industry
3.2.1 主成分分析法分析
通過實地調查,將所收集的數據進行匯總分析,以種植因素A1為例。首先,將種植因子數據進行“正向化”處理,其過程在excel中進行[14]。然后,用“Z-Score”法在 SPSS 中對已完成“正向化”指標進行“標準化”處理,結果如表2所示。對“標準化”結果ZA11-ZA14進行主成分分析可得到主成分的特征值和方差貢獻率,可以確定兩個主要成分,其貢獻率分別達到了67%和29%,其累積貢獻率達到了97%以上[15]。見表3。

表2 龍墩湖流域面源污染種植業指標標準化結果Tab.2 Standardized results of planting index of non-point source pollution in Longdun Lake basin

表3 特征值和方差貢獻率Tab.3 Eigenvalues and variance contribution rates
依據累積方差貢獻率>85%的原則,確定主成分個數為2。其累計貢獻率達到97%,由此可知兩個主成分可代表97%的信息量。用2個指標表示主成分的系數,其值為初始因子載荷矩陣所對應的值除以對應主成分的特征值的平方根,見表4。

表4 A11~A14主成分系數Tab.4 Principal component coefficient of A11~A14
于是,得到主成分表達式為:
F1=-0.49×ZA11-0.48×ZA12
+0.51×ZA13+0.51×ZA14
(1)
F2=0.50×ZA11+0.52×ZA12
+0.49×ZA13+0.48×ZA14
(2)
以方差貢獻率為主成分權重則種植因素FA1表達式為:
FA1=0.67854×F1+0.29259×F2
(3)
依次計算出肥料因素 FA2、自然因素 FA3、社會因素 FA4 計算得到評價結果如表5。
首先,為了各指標具有同向可比性,將主成分分析評價結果進行數據“正向化”處理,認為 FA1-FA4 均為“正指標”。設fij為指標 i 對于全部樣本的比重,rij原始數據正向化值。并假定時fij=0,fijlnfij=0。

表5 主成分分析評價結果Tab.5 Evaluation results of principal component analysis
(4)
計算各指標對全部樣本的比重,見表6。

表6 各指標比重Tab.6 Proportion of each index
計算各指標的熵值和熵權,見表7。
設Hi 為指標 i 的熵值,
(5)
(i=1,2,3……,m)
設ωi為指標 i 的熵權,m 為指標數量

表7 各指標熵值和熵權Tab.7 Entropy value and entropy weight of each index
則龍墩湖流域集約化種植業面源污染綜合評價得分FA表達式為:
FA=0.36×FA1+0.18×FA2+0.13×
FA3+0.32×FA4
(7)
根據上述主成分分析法及熵權綜合指數法得出龍墩湖流域集約化種植業面源污染評價綜合得分(表8),從結果中可以得出以下結論:其中采樣點4和點5得分分別為0.71和0.79,說明污染較嚴重;采樣點2和點6污染得分分比為0.16和0.09,說明污染較輕。

表8 龍墩湖流域集約化種植業面源污染評價綜合得分Tab.8 Comprehensive evaluation score of non-point source pollution of intensive planting in Longdun Lake basin
將最終評價結果與原始數據進行正態分布檢驗,再計算FA與 ZA11-ZA43 的相關系數,結果見表9。根據相關性分析結果,認為相關系數值大于0.80為顯著相關,則龍墩湖流域集約化種植業面源污染主要驅動因子為:作物類別、化肥總施用量、地形坡度、土壤砂粒及植被覆蓋率。

表9 FA 與 ZA11~ZA42 的相關系數Tab.9 Correlation coefficient of FA and ZA11~ZA42
4.1 本文在借鑒國內外農業面源污染評價指標體系研究成果和方法的基礎上,提出了一套適合龍墩湖流域集約化種植業面源污染驅動因子識別及源分級的指標體系和評價方法,對于集約化種植業面源污染評價體系完善和評價方法研究具有較好的理論和實際意義,為集約化種植業管理提供依據。
4.2 指標體系的構建是基于龍墩湖流域集約化種植業面源污染特點,構建分層次分類別的集約化種植業面源污染指標體系,其中分為種植因素、肥料因素、自然因素及社會因素等4大方面17個驅動因子。采用主成分分析法與熵權法相結合確定評價指標的權重,結合相關性分析,最終確定了集約化
種植業面源污染的主要驅動因子為作物類別A13、化肥總施用量A24、地形坡度A32、土壤砂粒A35及植被覆蓋率A43。
4.3 集約化種植業面源污染的驅動因子的識別及源分級的劃分是一個涉及到多學科的復雜問題,已成為農業學、環境學等相關領域的研究熱點與關注重點,但相關概念、理論、方法等仍處于摸索階段,目前尚未形成較為統一、系統和完善的指標體系與評價模型。