摘 要:為了解縣域單元內部鄉鎮之間農業經濟信息的空間格局及結構,以山東省禹城市11個鄉鎮為研究對象,重點選取了反映農業經濟信息的農業機械總動力等9項指標,運用主成分分析的統計方法,建立了農業經濟信息的主成分載荷矩陣,計算了農業經濟信息主成分綜合得分,從計算機學科圖論的角度入手,結合Kruskal求解最小生成樹算法從定量的角度分析了禹城市11個鄉鎮農業經濟信息的綜合潛力狀況,利用Kruskal算法和主成分結合的方法對鄉鎮單元尺度進行農業經濟信息分析,確定最佳的區位優勢、分類和組合,以便于農業的集約化和耕作的合理化,較好地配置農業的產業結構,為農業可持續發展和實現合理的農業地域分工提供科學依據。
關鍵詞:Kruskal算法;主成分分析;農業經濟信息;尺度
中圖分類號:F302.4 文獻標識號:A 文章編號:1001-4942(2010)02-0024-03
農業生產與宏觀決策需要及時、準確的農業經濟信息為支撐,定量研究農業經濟信息狀況有利于促進農業經濟的發展,通過農業經濟信息的空間分析,可形象直觀地展現農業經濟信息的地域分異規律,提高農業經濟信息服務水平,豐富農業信息分析的理論和方法。基于空間分析技術,結合多種方法和算法進行農業經濟信息定量分析,開展農業經濟信息的評價研究是農業信息分析和經濟監測的重要內容,有利于促進區域可持續發展模擬研究,實現農業信息的區域模擬和預測。
1 研究對象及概況
禹城市位于山東省西北部,是中國科學院野外觀測站點之一,位于東經116°22′~116°45′,北緯36°40′~37°12′,南北長58 km,東西寬33 km,全市總面積990 km2。禹城市傳統農業優勢明顯,大宗農產品供給能力強,屬于魯北低洼平原大宗農產品供給功能區,農業生產的自然和社會經濟條件諸方面在整個黃淮海平原上具有典型性,是黃淮海平原的一個縮影,勞動力資源豐富,農業機械化發展程度較高,以禹城市轄區內11個鄉鎮作為農業經濟信息分析對象,有廣泛的代表性,而且鄉鎮單元農業經濟信息的模型化研究是縣域單元研究的組成部分,也是縣域尺度農業經濟信息空間特征驗證的重要環節,是山東省農業功能區細化的延伸。另外,農業經濟信息評價的開展有利于禹城市區域農產品安全及形成可持續發展的農產品品質體系。基于此,筆者從鄉鎮單元出發,運用圖論Kruskal算法,結合主成分分析統計方法,開展了禹城市11個鄉鎮農業經濟信息的空間綜合評價研究。
2 研究材料與方法
2.1 數據預處理
本文所選取的數據來自《禹城統計年鑒2003》中2002年的統計數據,選取反映禹城市11個鄉鎮農業信息狀況的9個指標,其代碼和意義如下:X1-總人口,X2-非農業人口,X3-鄉村勞動力人口,X4-農業機械總動力,X5-有效灌溉面積,X6-機電排灌面積,X7-機電井數量,X8-農用化肥使用量,X9-糧食作物總產量。空間數據主要來自1∶50 000的禹城市地形圖(共7幅,編號分別為10-50-101-丁,10-50-102甲,10-50-102-丙,10-50-113-乙,10-50-113-丁,10-50-114-甲,10-50-114-丙)和禹城市行政區劃圖,各圖幅經過配準、校正,形成了投影變換后的數字化矢量地圖,結合屬性數據庫補加了相應的屬性。
2.2 研究方法
綜合Kruskal算法和主成分統計分析開展禹城市11個鄉鎮單元農業經濟信息研究。用主成分分析的方法進行農業經濟信息9項指標的降維和建模,有關基本原理參考相關文獻;基于最小生成樹Kruskal 算法開展各鄉鎮單元空間相關性分析和空間通達性研究。結果見表1,可知禹城市總人口與非農業人口、鄉村勞動力人口、農業機械總動力、有效灌溉面積、機電排灌面積、機電井數量、糧食作物總產量這幾個指標存在著極其顯著的關系。
筆者選擇主成分分析法進行降維處理,以解決指標間信息上的重疊問題,獲得如表2的方差分解主成分提取表。
從表2可知,前2個主成分累計貢獻率86.594%,大于85%,可基本反映全部指標的信息,所以決定用2個新變量代替原來的9個變量指標信息。基于初始因子載荷矩陣計算出特征值,獲得特征向量矩陣,得到主成分載荷矩陣,以2個主成分(F1,F2)對應的特征值占所提取主成分總的特征值之和的比例作為權重計算主成分綜合模型,根據主成分綜合模型計算綜合主成分值(F),并對其按綜合主成分值進行排序,即可對禹城市11個鄉鎮進行農業經濟信息的綜合評價比較研究,綜合得分如表3。
圖論作為離散型模式分類的一種工具,具有直觀、清晰的優點。更重要的是能夠把一個模式分類問題轉化為一個很簡單的圖,然后通過該圖的特征來分析原模式的分類復雜度等。在研究過程中,根據拼接好的地形圖配準禹城行政區劃圖,提取質心點經緯度坐標作為評價單元的坐標,分析各點之間的空間位置,進行空間相關性分析,然后進行樹的生成與分割。由于圖是空間點與連接這些點的線(邊線)的集合,即G=(V,E),其中V表示點的集合,E表示邊的集合;若分區用無向圖來表示,則V 是各分區單元集合,E是各單元鄰接關系集合。由于分區在考慮空間鄰接性的同時,更重要的是考慮各分區單元之間的內在相似性,因此,分區需用加權連通圖(網絡)來表示,即G=(V,E,D),其中D在圖論的樹算法中表示各點之間的權值。采用各分區單元間的鄰接關系來構造鄰接矩陣|W|,即首先采用圖論最小樹法求得一個最小生成樹,然后根據區內分異小而區間分異大的原則,選擇適當的A值,將最小生成樹分割成m個子樹,即將研究區域分成m個區域。
針對本研究,筆者編制Kruskal算法的MatLab代碼進行計算,獲取禹城縣域單元內部鄉鎮之間的圖論通達性。分區采用加權連通圖表示,得到無向圖,在無向圖中,按照邊的權值從小到大依次進行排序,從而獲得邊的權值遞增序列,進而在圖中依次遞增序列選擇邊的集合。如果新選擇的邊與已經確認的邊構成了回路(即首尾相連的環形邊序列),則放棄該邊,繼續選擇權值遞增的邊序列中的下一條邊,直到序列中的最后一條邊,最終獲取各個點(鄉鎮)之間的空間鄰接性和內在相似性,其中,空間鄰接性表示地理位置信息,內在相似性表達了農業經濟信息資料或條件的相似程度。直接相連的鄉鎮表示進行評價的農業經濟信息指標條件相似,在農業經濟信息功能區研究中易形成鮮明的集聚特征。
在考慮表3得分基礎上,結合11個鄉鎮農業經濟信息的最小生成樹Kruskal算法聚類結果,獲得11個鄉鎮農業經濟信息的綜合評價結果,綜合排名如下:市中辦>房寺鎮>倫鎮>莒鎮鄉>梁家鎮>辛寨鎮>辛店鎮>張莊鎮>十里望鄉>李屯鄉>安仁鎮。
3 結論與討論
基于生成樹Kruskal算法的兩維圖論聚類分析考慮了地理位置,但沒有區分相同子樹位置的大小比較,而主成分分析的綜合得分則欠考慮空間位置的協調性。因此,兩種方法可以相互補充,有機結合。綜合Kruskal算法和主成分分析得出的農業經濟信息綜合評價結果,由于使評價過程具有更好的科學性,因此具有更強的說服力。禹城市11個鄉鎮單元農業經濟信息的綜合評價結果強度為:市中辦>房寺鎮>倫鎮>莒鎮鄉>梁家鎮>辛寨鎮>辛店鎮>張莊鎮>十里望鄉>李屯鄉>安仁鎮。
鄉鎮是縣域發展的基礎,既是尺度從上到下轉換過程中研究的難點之一,也是點尺度到區域尺度擴展研究的重要區域單元。在鄉鎮單元尺度上,如何實現多尺度研究的無縫結合,各種算法的融合研究將提供很好的研究契入點,本研究正是基于此進行了農業信息空間分析的探討。農業經濟信息作為農業信息分析的重要內容,其本身復雜指標體系的選取是另外研究的課題之一,也是進一步研究的重要內容。
參 考 文 獻:
[1] 山東省農業功能區劃方案(2009年11月18日)[EB/OL].http://www.sdny.gov.cn/art/2009/11/18/art-767-213989.
html,2009-12-15.
[2] 曹 陽,卞 科,陳春剛,等.基于兩維圖論聚類分析的中國儲糧區域劃分[J].中國糧油學報,2005, 20(4):122-124.
[3] 羅罡輝,吳次芳,徐保根.土地整理優先度評價方法及其應用研究[J].浙江大學學報(農業與生命科學),2004,30(3):347-352.
[4] 張文彤.SPSS11統計分析教程(高級篇)[M].北京:北京希望電子出版社,2002,67-98.