屈 清,田永中,王 龍,郭金銘,刁德彬
(1.西南大學(xué) 地理科學(xué)學(xué)院,重慶 北碚 400715;2.內(nèi)江師范學(xué)院 地理與資源環(huán)境學(xué)院 ,四川 內(nèi)江 641112)
基于FME與ArcGIS的空間數(shù)據(jù)連接與數(shù)值模擬
屈 清1,田永中1,王 龍1,郭金銘2,刁德彬1
(1.西南大學(xué) 地理科學(xué)學(xué)院,重慶 北碚 400715;2.內(nèi)江師范學(xué)院 地理與資源環(huán)境學(xué)院 ,四川 內(nèi)江 641112)

在已有GIS理論與空間數(shù)值模擬的基礎(chǔ)上,根據(jù)涪陵區(qū)DEM、降水、溫度、農(nóng)用地質(zhì)量等級(jí)和永久基本農(nóng)田等數(shù)據(jù),綜合使用FME與ArcGIS的數(shù)據(jù)鏈接集成、可視化與圖解建模等功能,并結(jié)合數(shù)據(jù)統(tǒng)計(jì)分析軟件SPSS,發(fā)現(xiàn)農(nóng)用地利用等指數(shù)分布與其他地理要素存在線性相關(guān)關(guān)系;并在此基礎(chǔ)上構(gòu)建了多元線性回歸模型。此模型主要用于解決永久基本農(nóng)田劃定中利用等指數(shù)部分缺失問(wèn)題。
基本農(nóng)田;GIS;空間數(shù)據(jù);模擬
地理空間數(shù)據(jù)是用來(lái)表示地理實(shí)體或現(xiàn)象的位置、形狀、大小及其分布等諸方面特征的數(shù)據(jù)[1,2]。從眾多的地理空間數(shù)據(jù)中獲取有用的地理空間數(shù)據(jù)是比較困難的,本文以區(qū)域性的地理數(shù)據(jù)處理為例,將FME與ArcGIS相結(jié)合進(jìn)行了空間數(shù)據(jù)處理并實(shí)現(xiàn)了數(shù)值模擬,探尋未知區(qū)域的數(shù)據(jù)[3]。
1.1 研究區(qū)概況
涪陵區(qū)位于北緯29°21′~30°01′,東經(jīng)106°56′~107°43′之間,地處四川盆地和盆邊山地過(guò)渡地帶,長(zhǎng)江與烏江交匯處。該區(qū)域地貌以低山丘陵為主,地勢(shì)總體上東南高而西北低[4],整體條件優(yōu)異,有利于農(nóng)作物的生長(zhǎng)。
1.2 地形特征分析
根據(jù)中國(guó)科學(xué)院研究員李炳元[5]對(duì)陳志明[6]及歐洲地貌形態(tài)的總結(jié)分類,總體上涪陵區(qū)地形可歸納為4大類型(見(jiàn)表1):微起伏平原、平壩,起伏丘陵,山地起伏低山和山地起伏低中山。

表1 涪陵區(qū)地表形態(tài)歸類
利用ArcGIS10可實(shí)現(xiàn)地表形態(tài)的可視化分類,實(shí)驗(yàn)過(guò)程分4步進(jìn)行(見(jiàn)圖1)。結(jié)合ArcGIS10的圖解建模功能,利用涪陵區(qū)的DEM與地表起伏度數(shù)據(jù)建立涪陵區(qū)地表形態(tài)分類組合圖解模型。圖解模型中最主要部分是要實(shí)現(xiàn)柵格數(shù)據(jù)的擦除功能,以及海拔數(shù)據(jù)與起伏度兩者相結(jié)合的涪陵區(qū)地表形態(tài)分類(見(jiàn)圖2),并在此基礎(chǔ)上將每個(gè)結(jié)果合并為一個(gè)數(shù)據(jù)集,最終得到涪陵區(qū)的地表形態(tài)分類(見(jiàn)圖3)。由此可見(jiàn),涪陵區(qū)地表形態(tài)主要是起伏丘陵山地,其次是平原、平壩,起伏較大的山地比較少。

圖1 涪陵區(qū)地表形態(tài)分類過(guò)程圖

圖2 ArcGIS10擦除功能實(shí)現(xiàn)圖解模型圖

圖3 涪陵區(qū)地表形態(tài)分類圖

圖4 數(shù)據(jù)推導(dǎo)模型構(gòu)建流程圖
1.3 氣候特征分析
涪陵全區(qū)總體上降水量比較充沛,但仍然存在空間上的不均,降水主要集中在東南武陵山丘陵、山地起伏區(qū),西南微起伏平原、平壩區(qū),長(zhǎng)江、烏江一線降水量相對(duì)偏少。涪陵區(qū)常年均溫較高,年均高溫區(qū)主要集中在長(zhǎng)江、烏江一線,年均中溫區(qū)主要位于臺(tái)地和丘陵地區(qū),年均低溫區(qū)包括東南山地起伏和山地區(qū)。
1.4 農(nóng)用地等級(jí)空間分布
根據(jù)涪陵區(qū)農(nóng)用地分等定級(jí)成果數(shù)據(jù),通過(guò)空間可視化定性分析,全區(qū)利用等級(jí)較高的區(qū)域主要分布在平原、平壩區(qū)域以及年均溫較高降水適中的區(qū)域;利用等級(jí)較低區(qū)域大都分布在起伏山地與丘陵區(qū)域,年均溫較低區(qū)域。從可視化角度,結(jié)合上述地形與降水、氣溫圖分析發(fā)現(xiàn),利用等級(jí)與地形分類的相關(guān)程度較高,吻合度較好,具有一定的規(guī)律性。
為了探尋未知區(qū)域的數(shù)據(jù),需把不同來(lái)源但相同空間位置的數(shù)據(jù)通過(guò)疊加,將上述海拔、地表起伏度、氣溫、降水、坡度、農(nóng)用地利用等數(shù)據(jù)集成在一起進(jìn)行空間統(tǒng)計(jì)分析,并構(gòu)建相關(guān)的數(shù)學(xué)模型,實(shí)現(xiàn)對(duì)未知區(qū)域數(shù)據(jù)的求解。首先需要構(gòu)建數(shù)據(jù)分析處理總體流程,如圖4所示。
2.1 數(shù)據(jù)鏈接輸入
FME重投影是在缺少轉(zhuǎn)換七參數(shù)的前提下首選的方式。首先需要在FME Workbench中將原始基于北京54坐標(biāo)系的土地利用等數(shù)據(jù)*.shp格式文件輸入FME,然后調(diào)用Reprojector函數(shù)模塊,設(shè)置輸出的坐標(biāo)系統(tǒng)為西安80坐標(biāo)系,通過(guò)這種方法可很好地將基于北京54的農(nóng)田分等定級(jí)數(shù)據(jù)與基于西安80的基本農(nóng)田數(shù)據(jù)實(shí)現(xiàn)空間位置配準(zhǔn)。在空間數(shù)據(jù)校正的基礎(chǔ)上,以基本農(nóng)田圖斑為統(tǒng)計(jì)單位,利用ArcGIS中的分區(qū)統(tǒng)計(jì)將需要融入分析的空間位置相同的數(shù)據(jù)以標(biāo)識(shí)碼為統(tǒng)計(jì)單位和數(shù)據(jù)鏈接依據(jù),將所涉及的空間數(shù)據(jù)集成為一張表,便于數(shù)據(jù)統(tǒng)計(jì)分析。這里所涉及的空間數(shù)據(jù)主要包括海拔、地表起伏度、氣溫、降水、坡度、基本農(nóng)田圖斑和農(nóng)用地利用等。
2.2 利用等指數(shù)反演數(shù)學(xué)模型構(gòu)建
采用上述數(shù)據(jù)集成方法將海拔、氣溫和降水等數(shù)據(jù)合并為一張表格(見(jiàn)表2),建立基本農(nóng)田圖斑標(biāo)識(shí)碼與這些數(shù)據(jù)的對(duì)應(yīng)關(guān)系,總計(jì)涉及83 764個(gè)圖斑,其中缺失質(zhì)量數(shù)據(jù)部分總計(jì)15 530塊圖斑,此部分利用等指數(shù)的獲取作為空間數(shù)值模擬的重點(diǎn)。
結(jié)合諸多要素?cái)?shù)據(jù)以及回歸模型,其基本構(gòu)建流程為:①對(duì)多要素與基本農(nóng)田質(zhì)量指數(shù)的相關(guān)性進(jìn)行分析;②提取相關(guān)性明顯的要素進(jìn)行回歸分析,選取構(gòu)建模型構(gòu)建回歸模型。
2.2.1 數(shù)據(jù)的量化分析
根據(jù)表2中數(shù)據(jù),采用地理學(xué)中的經(jīng)典統(tǒng)計(jì)分析方法,分別分析5類地理要素與利用等指數(shù)之間的相關(guān)程度,分別記為相關(guān)系數(shù)Rei、Rqi、Rsi、Rri和Rti。將上述空間變量代入Pearson的相關(guān)系數(shù)計(jì)算公式可求出相關(guān)系數(shù)。

表2 基本農(nóng)田圖斑地理要素對(duì)應(yīng)表
利用SPSS數(shù)據(jù)分析軟件對(duì)上述數(shù)據(jù)進(jìn)行相關(guān)分析,得到各要素與土地質(zhì)量等級(jí)的相關(guān)性程度表(表3)。可以看出,在樣本容量為66 948且置信水平為0.01的情況下,質(zhì)量等級(jí)與坡度、起伏度表現(xiàn)出強(qiáng)烈的負(fù)相關(guān);與年均降水量和海拔高度呈負(fù)相關(guān),但相關(guān)性較弱;與年均氣溫呈正相關(guān),且正相關(guān)較強(qiáng)。總之,這5類地理要素與質(zhì)量等級(jí)之間表現(xiàn)為較強(qiáng)的線性關(guān)系,從相關(guān)程度上選取起伏度、坡度和年均氣溫作為構(gòu)建土地質(zhì)量估計(jì)模型的參數(shù)。

表3 各地理要素與土地利用等指數(shù)相關(guān)系數(shù)表
2.2.2 構(gòu)建回歸模型及模型顯著性檢驗(yàn)
在構(gòu)建回歸模型之前,需明確地理要素變量的多寡,如果要素變量在一個(gè)以上,則需要選擇多元線性回歸模型,多元線性回歸 模型更具有普遍意義[7]。
假設(shè)土地利用等指數(shù)這一因變量i受3個(gè)自變量s、p、q的影響,其n組觀測(cè)值為(ia,sa,pa,qa),a=1,2,…,66 948,那么多元線性回歸模型的結(jié)構(gòu)形式為:

式中,β0、β1、β2、β3為待定參數(shù);εa為隨機(jī)變量。
如果b0、b1、b2、b3分別為β0、β1、β2、β3的擬合值,則回歸方程為:

式中,b0為常數(shù);b1、b2、b3分別為偏回歸系數(shù)。其意義在于當(dāng)其他自變量sj、tj、qj(j≠w)固定時(shí),sw、tw、qw中一個(gè)自變量每變化一個(gè)單位而使因變量i平均改變的數(shù)值。
根據(jù)最小二乘法原理,β0、β1、β2、β3的估計(jì)值b0、b1、b2、b3應(yīng)該使擬合值與觀測(cè)值之間的離差平方和趨近于最小,將樣本數(shù)據(jù)代入向量計(jì)算公式得到:

套用公式,進(jìn)行矩陣運(yùn)算,得到回歸系數(shù):

坡度(s)、溫度(t)和起伏度(q)之間的線性回歸方程為:

將所需參數(shù)代入公式得:

在置信水平α=0.05上,通過(guò)使用Excel中的F值計(jì)算函數(shù)FINV( ),可以查出F0.05(3,66 948)= 2.61。由于F> 2.08,所以回歸方程是顯著的。
2.2.3 對(duì)基本農(nóng)田缺失土地質(zhì)量的反演
通過(guò)以上的定量化分析,土地利用等指數(shù)與地表起伏度、坡度和氣溫線性關(guān)系明顯,從而利用擬合線性回歸模型并根據(jù)起伏度、坡度和氣溫的值就能計(jì)算出基本農(nóng)田中缺失土地利用等指數(shù)部分的指數(shù)。
1)通過(guò)數(shù)值的回歸模擬,解決了涪陵區(qū)基本農(nóng)田數(shù)據(jù)中部分圖斑缺失利用等指數(shù)部分的數(shù)據(jù)。
2)綜合使用FME與ArcGIS等主流數(shù)據(jù)處理軟件,對(duì)空間數(shù)據(jù)集成的一般技術(shù)步驟做了進(jìn)一步探析。
3)對(duì)涪陵區(qū)的地表形態(tài)分類做了一定的探討,不足之處在于對(duì)空間數(shù)值模擬結(jié)果需要進(jìn)一步驗(yàn)證,并在驗(yàn)證的基礎(chǔ)上對(duì)模型做改進(jìn)。
[1] Chang Kang-tsung. Introduction to Geographic Information Systems[M].北京:科學(xué)出版社,2003
[2] 田永中.地理信息系統(tǒng)基礎(chǔ)與實(shí)驗(yàn)教程[M].北京:科學(xué)出版社,2010
[3] Guo Diansheng, Mennis J. Spatial Data Mining and Geographic Knowledge Discovery—An Introduction [J].Computers, Environment and Urban Systems,2009,33: 403-404
[4] 重慶市涪陵區(qū)統(tǒng)計(jì)局.涪陵統(tǒng)計(jì)年鑒2011[G].2011
[5] 李炳元.中國(guó)陸地基本地貌類型及其劃分指標(biāo)探討[J].第四紀(jì)研究, 2008, 28(4): 535-543
[6] 陳志明.1∶400萬(wàn)中國(guó)及其毗鄰地區(qū)地貌圖說(shuō)明書(shū)[M].北京:中國(guó)地圖出版社, 1993
[7] 徐建華.計(jì)量地理學(xué)[M].北京:高等教育出版社,2006
P208
B
1672-4623(2014)01-0114-03
10.11709/j.issn.1672-4623.2014.01.039
屈清,碩士,研究方向?yàn)榈貓D制圖技術(shù)與土地信息系統(tǒng)。
2013-05-03。
項(xiàng)目來(lái)源:“十二五”農(nóng)村領(lǐng)域國(guó)家科技項(xiàng)目(2012BAJ231300)。