鐘永友
(陜西理工大學(xué) 數(shù)學(xué)與計算機(jī)科學(xué)學(xué)院,陜西 漢中 723000)
?
空間數(shù)據(jù)挖掘技術(shù)在城鎮(zhèn)土地定級中的運(yùn)用
鐘永友
(陜西理工大學(xué) 數(shù)學(xué)與計算機(jī)科學(xué)學(xué)院,陜西 漢中 723000)
計算機(jī)與空間數(shù)據(jù)獲取等相關(guān)技術(shù)的不斷發(fā)展,使地理信息體系里面所包含的數(shù)據(jù)急劇增加。然而當(dāng)前處理相關(guān)數(shù)據(jù)的方式相對滯后,造成存在于空間數(shù)據(jù)里面極其豐富的知識無法被人們所掌握。為了能夠滿足人們對于空間信息不斷增強(qiáng)的層次相對較高的需要,與空間數(shù)據(jù)挖掘技術(shù)有關(guān)的理論與科技手段逐漸產(chǎn)生。著重研究了空間數(shù)據(jù)挖掘技術(shù)在城鎮(zhèn)土地定級中的相關(guān)運(yùn)用。
空間數(shù)據(jù)挖掘;土地定級;運(yùn)用
1.1空間數(shù)據(jù)挖掘的定義
空間數(shù)據(jù)挖掘又被叫做“從空間數(shù)據(jù)庫中發(fā)現(xiàn)知識”,其所表示的是從空間數(shù)據(jù)庫里面獲得人們所關(guān)注的空間形式和相關(guān)的特征、空間和非空間數(shù)據(jù)之間存在的聯(lián)系以及那些隱藏于數(shù)據(jù)庫里面的一般性特征。簡而言之,是從相應(yīng)的空間數(shù)據(jù)庫里面獲取隱藏的、人們所關(guān)注的空間與非空間的形式、一般性的特征以及相關(guān)知識的環(huán)節(jié)。
1.2空間數(shù)據(jù)挖掘的過程
空間數(shù)據(jù)挖掘技術(shù)的主要環(huán)節(jié)與大部分?jǐn)?shù)據(jù)挖掘和探索知識的環(huán)節(jié)是相似的,通常涵蓋了對于數(shù)據(jù)的選擇、相關(guān)數(shù)據(jù)的提前處理、數(shù)據(jù)轉(zhuǎn)變、挖掘相關(guān)的數(shù)據(jù)、模式闡述以及知識評判等過程[1]。數(shù)據(jù)選擇也就是對人們所關(guān)注的事物以及相關(guān)的特征進(jìn)行概括;數(shù)據(jù)的提前處理通常都是去除其間所不含有的噪聲、處理所遺失的相關(guān)數(shù)據(jù)等;對于數(shù)據(jù)的轉(zhuǎn)變使用降維的方式對相關(guān)的特征實施提取,使得轉(zhuǎn)變以后所獲得的數(shù)據(jù)能夠更加符合要求;數(shù)據(jù)挖掘是最為重要的環(huán)節(jié),其由發(fā)生變換之后所獲的相關(guān)數(shù)據(jù)里面發(fā)現(xiàn)主要的特征;對于模式所進(jìn)行的闡述以及相關(guān)知識的評判運(yùn)用人機(jī)交互的方法完成,即使所挖掘出的規(guī)范與形式存在著部分興趣度與置信度等方面的檢驗,經(jīng)過相關(guān)演繹推理便能夠完成相關(guān)的檢驗,然而這部分規(guī)范與形式是否具備相應(yīng)的價值,最后還需要工作人員進(jìn)行評判,如果獲得的結(jié)果不符合要求便要重復(fù)之前的過程。
2.1城鎮(zhèn)土地定級的概念
城鎮(zhèn)土地定級指的是將城鎮(zhèn)范圍內(nèi)所包含的土地當(dāng)作進(jìn)行區(qū)位分析的重要對象,將目前所具備的全部的地理方面的因素與經(jīng)濟(jì)行為的分布當(dāng)作重要的區(qū)域要素,探索上述區(qū)位要素在土地上的改變特征以及其互相融合對于土地的價格所產(chǎn)生的影響,更加好的體現(xiàn)出城鎮(zhèn)范圍內(nèi)所包含土地的空間改變相關(guān)的規(guī)律以及主要的數(shù)量特征。
2.2城鎮(zhèn)土地定級的任務(wù)與目的
對于城鎮(zhèn)的土地進(jìn)行等級評定最為重要的任務(wù)便是按照經(jīng)濟(jì)以及相關(guān)的自然特征及它們在社會的經(jīng)濟(jì)行為里面所處的位置,運(yùn)用意義實施全方面的研究,向人們展示出城鎮(zhèn)土地品質(zhì)間的區(qū)域性差距,同時對城鎮(zhèn)土地的等級進(jìn)行確定。然而土地等級確定最為主要的目的便是使相關(guān)的決策機(jī)構(gòu)能夠全方位的了解土地的品質(zhì)以及具體的運(yùn)用情況,增強(qiáng)土地的使用效率。
2.3空間聚類土地定級原理
空間聚類是目前使用最多的方式。空間數(shù)據(jù)挖掘的知識大致涵蓋了空間之間的聯(lián)系、特點以及類型等。通常展示成相關(guān)定義、準(zhǔn)則、形式以及約束等方式的相互融合,對于數(shù)據(jù)庫里面所包含數(shù)據(jù)的屬性、形式以頻度和等內(nèi)容進(jìn)行描繪。
在城鎮(zhèn)范圍內(nèi)對于土地的價格進(jìn)行不同的區(qū)域的區(qū)分,經(jīng)過對于土地相關(guān)的數(shù)據(jù)實施計算、相關(guān)的數(shù)據(jù)進(jìn)行驗證、去除錯誤的數(shù)值之后,計算出相關(guān)區(qū)域單位土地的價格,接著實施空間聚類,完全對于土地級別的區(qū)分。
2.4運(yùn)用實例
2.4.1 數(shù)據(jù)源準(zhǔn)備
數(shù)據(jù)源大致有土地的出售與出租這兩個不用的來源,其間與出售相關(guān)的數(shù)據(jù)涵蓋了轉(zhuǎn)讓、房屋買賣、房地產(chǎn)評估、土地聯(lián)營入股以及以地易房等相關(guān)的資料;出租資料所代表的是與土地使用權(quán)以及房屋出租相關(guān)的資料。將某市的5大城區(qū)(a區(qū)、b區(qū)、c區(qū)、d區(qū)和e區(qū))選定為此次土地價格定級的范疇,一共采集了3 168個樣本點,包含了827個商服樣點,656個工業(yè)樣點,1 685個住宅樣點。
2.4.2 樣本空間的獲取
1) 測算樣點定價
在針對某市的樣本單位土地價格進(jìn)行計算的時候,針對那些運(yùn)用于住宅或者是商服的區(qū)域運(yùn)用樓面地價的方式進(jìn)行展示;對于工業(yè)用地使用地面價的方式展示。
2) 剔出異常值
目前,存在著非常多的方式可以收集到與樣本相關(guān)的數(shù)據(jù),在使用所搜集到的樣點數(shù)據(jù)以前,需要對其進(jìn)行清洗,對于異常數(shù)值的剔除是最為常規(guī)的做法。異常值所代表的是相同基本區(qū)片范圍內(nèi)的相同的土地運(yùn)用種類的樣本里面,因為其它外界環(huán)境所造成的干擾導(dǎo)致與其它樣本之間有著非常大的差異[2]。在正常情況下,在相同的區(qū)片、相同的土地運(yùn)用類別的地價應(yīng)該是相同的。所以,需要對樣本中的異常數(shù)值進(jìn)行剔除。主要過程如下:
根據(jù)式(1)對樣點的單位地價的算術(shù)平均值進(jìn)行測算:
(1)
式中P1——基本片區(qū)內(nèi)樣點地價的平均數(shù)值;
Pi——此片內(nèi)范圍內(nèi)第個i樣點的地價;
n——此地價范圍內(nèi)樣點的全部數(shù)目。
根據(jù)式(2)對樣點的單位地價的標(biāo)準(zhǔn)差(S1)進(jìn)行測算:

(2)
明確剔除的相關(guān)標(biāo)注。當(dāng)Pi∈[P1-2S1,P1+2S1]時,那么就認(rèn)定Pi是異常的數(shù)值,需要將其從樣本里面去除。
對于除異常數(shù)值之后的樣本總體的P1和S1進(jìn)行重新計算,使用P1±2S1實施剔除,一直到樣本空間里面不存在任何的異常數(shù)值。以上所闡述的數(shù)據(jù)檢驗與剔除異常值均是在相同的基本區(qū)片、相同的樣點種類以及相同的土地運(yùn)用類別里面所完成的。
3) 測算基本區(qū)域的單位地價
在將所有的異常數(shù)值去除之后,運(yùn)用所獲得的無異常值的樣本的平均數(shù)值當(dāng)作基礎(chǔ)區(qū)域的單位土地價格。能夠運(yùn)用中位數(shù)以及眾數(shù)等方式對平均數(shù)值進(jìn)行明確。根據(jù)式(3)進(jìn)行相關(guān)的測算:
(3)
式(3)中m的取值范圍是去除異常數(shù)值之后的樣本空間(m 2.4.3 用空間類聚法進(jìn)行土地定級 空間聚類的樣本屬性數(shù)據(jù)為基本區(qū)片的地價。在對此種群進(jìn)行初始化的時候,運(yùn)用以聚類中心為基礎(chǔ)的編碼形式,將聚類的數(shù)目設(shè)定成5,種群的規(guī)模Population size設(shè)定為70,交叉的概率Pc設(shè)定為0.6,由于市區(qū)土地價格的差異較小,所以將變異的概率確定為0.001,通過以遺傳算法為基礎(chǔ)的空間聚類方式對所獲得的結(jié)果實施相應(yīng)的解碼。 從聚類所獲得的結(jié)果我們能夠發(fā)現(xiàn),某市的156個住宅區(qū)可以分成5個不同的等級,一級地的平均價格是5 163元/m2,一共涵蓋了44個住宅區(qū)域;二級地的平均價格是3 830元/m2,一共涵蓋了57個住宅區(qū)域;三級地的平均價格是2 860元/m2,共涵蓋了45個完全不一樣的住宅區(qū)域;四級地的平均價格是2 279元/m2,其涵蓋了12個不一樣的住宅區(qū)域;五級地的平均價格是1 730元/m2個,其涵蓋了8個完全不一樣的住宅區(qū)域。 伴隨獲取數(shù)據(jù)科技手段的不斷進(jìn)步與相關(guān)方式的不斷豐富化,非常多的和空間區(qū)位有關(guān)的數(shù)據(jù)被逐漸收集到,就需要對相關(guān)的數(shù)據(jù)進(jìn)行研究,人們創(chuàng)新出的空間數(shù)據(jù)挖掘技術(shù)便實現(xiàn)了上述的要求,使相關(guān)挖掘的方式與其獲得了比較好的融合。本篇文章以具體的城鎮(zhèn)土地定級為前提,使用改善之后所獲得的空間聚類方式,針對某市的住宅區(qū)域?qū)嵤┒▋r級別的區(qū)分。研究發(fā)現(xiàn)此方式在土地定級環(huán)節(jié)里面具有無可替代的作用。 [1] 邵峰晶, 于忠清. 數(shù)據(jù)挖掘: 原理與算法[M]. 北京: 中國水利水電出版社, 2005. [2] 楊春金, 潘玲. 空間數(shù)據(jù)挖掘在GIS中的應(yīng)用研究[J]. 通訊和計算機(jī), 2007, 4(27): 15-18. AnAnalysisontheApplicationofSpatialDataMiningTechnologyinUrbanLandGrading ZHONG Yongyou (Schoolofmathematicsandcomputerscience,ShaanxiSCI-TECHUniversity,Hanzhong,Shanxi723000,China) With the development of computer and data space acquisition and other related technology, the data of the geographic information system data will increase rapidly. However, the way to deal with the relevant data is lagging behind, resulting that extremely rich knowledge which exists in the spatial data cannot be mastered. To meet the high level demand of the spatial information, the theory and technology of spatial data mining have been developed. This paper analyzes the application of data mining technology in urban land grading. Spatial data mining; Land grading; Application 2016-07-18 陜西理工學(xué)院校級科研基金項目(SLGKY14-21) 鐘永友(1978-),男,江西萬載人,講師,研究方向:數(shù)據(jù)挖掘、信息系統(tǒng)研究與開發(fā),手機(jī):13689168943,Email:zhongyongyou@163.com. F293.2 :Bdoi:10.14101/j.cnki.issn.1002-4336.2016.04.0403 結(jié) 論