999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

地理視角下深圳市房價及其影響因素研究
——基于隨機(jī)森林模型

2022-05-09 02:08:22鐘艾妮答星喻靜敏
城市勘測 2022年2期
關(guān)鍵詞:特征影響模型

鐘艾妮,答星,喻靜敏

(武漢市測繪研究院,湖北 武漢 430022)

1 引 言

隨著我國經(jīng)濟(jì)發(fā)展和人民生活質(zhì)量的穩(wěn)步提升,城市房價成為社會關(guān)切的重要問題。房價是多因素作用下的高度復(fù)雜問題,其變化規(guī)律具有非線性、動態(tài)性和偶然性[1]。關(guān)于住房的調(diào)查研究顯示,房價不僅受經(jīng)濟(jì)、政策的影響,還和房屋地理區(qū)位、房屋配套設(shè)施、人的行為、城市規(guī)劃等諸多因素有關(guān)。從空間視角探索城市房價特征和影響因素,是地理空間分析的重要研究范疇。

傳統(tǒng)的房價研究著重于分析房屋銷售價格的特征和趨勢,相關(guān)方法主要來源于經(jīng)濟(jì)學(xué)與統(tǒng)計學(xué),包括灰色理論[2]、傳統(tǒng)的時間序列法[3]等。以往的文獻(xiàn)研究是研究區(qū)域的經(jīng)濟(jì)發(fā)展指標(biāo)和住宅本身的建筑屬性等進(jìn)行房價預(yù)測和影響因素分析,大多是基于前期累積的房價統(tǒng)計結(jié)果進(jìn)行推演[4~7]。而我國區(qū)域房價格通常呈現(xiàn)出空間分異特征,城市內(nèi)部房屋銷售價格也頻繁出現(xiàn)起伏,傳統(tǒng)的研究方法在小尺度的房價分析上不具有適用性。

從當(dāng)前的房屋市場交易情況來看,城鎮(zhèn)居民在選擇住房時,已經(jīng)不單單是考慮房屋自身的內(nèi)部結(jié)構(gòu)等建筑屬性,更多的關(guān)注與房屋地理空間位置相關(guān)的交通、公共服務(wù)、未來規(guī)劃等配置屬性。這些空間配置屬性對居民生活品質(zhì)的提升有極大影響,與房價存在關(guān)聯(lián)關(guān)系[8,9],近年來學(xué)者們開始關(guān)注住宅的空間屬性,探究房價的地理影響因素。方曉萍等人根據(jù)全國35個大中城市房價波動發(fā)現(xiàn)其具有地理擴(kuò)散特征[10];顧衡宇等人基于改進(jìn)的空間句法研究路網(wǎng)形態(tài)對房價的影響[11];楊兵分析了大連市二手房價格的空間相關(guān)性及聚集特征[12]。GIS領(lǐng)域研究者大多利用多元線性回歸、地理加權(quán)回歸等模型探索地理環(huán)境對房價影響的空間差異并實現(xiàn)房價預(yù)測[13~15],但這類方法進(jìn)行回歸分析會存在多重共線性,不能較好分析預(yù)測房價。與全局線性和多項式回歸模型相比,隨機(jī)森林模型是多個決策樹的集成,借助決策樹算法,可以將輸入空間分割為更小的區(qū)域,使結(jié)果可管可控,更適用于動態(tài)非線性特征的房價預(yù)測和分析。

借助隨機(jī)森林模型,本文以深圳市二手房房價為研究對象,充分考慮房屋住宅的地理空間屬性,參考已有研究[16,17],選取教育資源、醫(yī)療設(shè)施、交通便捷度、環(huán)境因素、規(guī)劃因素方面的7個指標(biāo)作為房價影響因子。通過研究深圳市房價的空間分布特征及規(guī)律,分析小尺度上居民對房屋不同地理環(huán)境因素的關(guān)注度差異,從地理視角下推測房價,以期輔助城市住宅規(guī)劃建設(shè),為相關(guān)部門提供參考以便科學(xué)制定相應(yīng)方針政策。

2 基于隨機(jī)森林模型的房價研究

作為新興起的、高度靈活的一種機(jī)器學(xué)習(xí)算法,隨機(jī)森林(Random Forest)是由Leo Breiman提出的一種機(jī)器學(xué)習(xí)算法[18],其本質(zhì)屬于集成學(xué)習(xí),具有學(xué)習(xí)速度快、分類準(zhǔn)確度高、泛化誤差小、參數(shù)敏感度低、計算開銷少等特點。隨機(jī)森林模型主要用于回歸和分類,在估計推斷映射方面有準(zhǔn)確率優(yōu)勢,目前已被廣泛應(yīng)用到眾多領(lǐng)域,如生物信息、金融經(jīng)濟(jì)、新能源、化工產(chǎn)業(yè)等,都取得了非常好的效果[19]。

2.1 隨機(jī)森林相關(guān)知識

隨機(jī)森林模型的基本單元是決策樹。決策樹是通過構(gòu)造一種樹形結(jié)構(gòu)來進(jìn)行問題決策,是直觀運(yùn)用概率分析的一種圖解法,每個內(nèi)部節(jié)點表示某種特征的測試,每個分支代表一個測試輸出,每個葉節(jié)點是輸出結(jié)果。

決策樹中進(jìn)行特征選取的依據(jù)和條件是熵值下降最快,提高數(shù)據(jù)集的純度。CART樹通過基尼(Gini)指數(shù)計算每個變量對決策樹每個節(jié)點上觀測值的異質(zhì)性的影響,該指數(shù)值越小純度越高。若選取的屬性為A,那么分裂后的數(shù)據(jù)集D的基尼指數(shù)的計算公式為:

(1)

2.2 房價研究的隨機(jī)森林模型原理

由于單決策樹分類或回歸結(jié)果可能不穩(wěn)定,隨機(jī)森林的基本思想則是將許多決策樹集成為一個強(qiáng)組合。通過多個相互獨立的決策樹之間的互補(bǔ)作用,隨機(jī)性選擇訓(xùn)練集并隨機(jī)選取特征,以隨機(jī)森林模型進(jìn)行房價分析預(yù)測,避免了過擬合問題且能一定程度上糾正局部過擬合,相較以往研究使用的方法,具有很好的泛化性能、魯棒性和模型穩(wěn)定性[20]。

本文采用的隨機(jī)森林模型是由分類回歸樹(classification and regression trees,CART)(基決策樹)集合{h(X,βk),k=1,2,…,i}組成的集成器。以Gini指數(shù)作為指標(biāo)來分裂屬性,h(X,βk)表示第k棵基決策樹,βk表示第k棵基決策樹的隨機(jī)向量,X是獨立分布的隨機(jī)向量,i表示隨機(jī)森林中基決策樹的個數(shù)。對于輸入向量X的分類結(jié)果,隨機(jī)森林模型基于每棵基決策樹的判斷投票結(jié)果做出最終輸出決策。

圖1 隨機(jī)森林模型原理

算法流程如下:

(1)以樣本房價作為訓(xùn)練集,隨機(jī)分成k個訓(xùn)練樣本分別訓(xùn)練房價決策樹,選取的房價地理環(huán)境影響因素作為特征,輸入特征構(gòu)成的多維向量;

(2)在每棵決策樹的節(jié)點隨機(jī)選取特征進(jìn)行Gini指標(biāo)計算,不斷劃分,得到最終的所有決策樹;

(3)本文使用隨機(jī)森林模型進(jìn)行回歸分析,預(yù)測值取所有樹預(yù)測值的平均。

3 研究區(qū)域與數(shù)據(jù)源

本文選取的研究區(qū)域為深圳市,深圳市作為一線城市,社會經(jīng)濟(jì)發(fā)展迅速,建設(shè)用地資源緊缺,房價存在明顯空間差異。

研究的數(shù)據(jù)源包括深圳市房價數(shù)據(jù)和電子地圖數(shù)據(jù)。①房價數(shù)據(jù)。深圳市二手房住宅交易活躍,是市場交易的主流,因此本文以住宅小區(qū)二手房交易價格為研究對象,通過爬蟲技術(shù)從深圳市二手房交易網(wǎng)站獲取住宅小區(qū)地址坐標(biāo)并計算2019年各小區(qū)單價平均值,共 1 225條記錄。②深圳市電子地圖數(shù)據(jù)。深圳市基礎(chǔ)設(shè)施及相關(guān)空間數(shù)據(jù),包括深圳市小學(xué)、中學(xué)、醫(yī)院、軌道站點的POI數(shù)據(jù),路網(wǎng)數(shù)據(jù),及公園綠地、重點規(guī)劃區(qū)面狀數(shù)據(jù)。

本文以居民享受的生活服務(wù)及基礎(chǔ)設(shè)施為切入點,考慮環(huán)境和規(guī)劃因素,選取深圳市各小區(qū)的7個地理空間因子作為影響房價的指標(biāo),以住宅小區(qū)一公里范圍緩沖區(qū)為基礎(chǔ)研究單元,具體信息如表1所示。

影響房價的地理空間因素及指標(biāo) 表1

4 實驗設(shè)計與結(jié)果分析

4.1 深圳市房價空間分異特征

根據(jù)安居客網(wǎng)站公開的深圳市房價數(shù)據(jù)可知,各區(qū)縣存在顯著差異,南山區(qū)均價最高,坪山區(qū)最低。通過對爬取的 1 225條房價實驗數(shù)據(jù)及公開的均價統(tǒng)計數(shù)據(jù)進(jìn)行可視化(如圖2所示),結(jié)果顯示二手房均價較高的住宅小區(qū)集中在南山區(qū)和福田區(qū),且交易量也較多。深圳市房價在整體上呈現(xiàn)出南高北低、西高東低的特征,以南山區(qū)和福田區(qū)為中心向外逐漸減低。從空間視角看,這與深圳市公共服務(wù)設(shè)施的分布特征呈現(xiàn)出相似性。

圖2 深圳市房價空間分異特征

4.2 房價研究隨機(jī)森林模型建立

通過整理所有1 225條房價及其影響因素數(shù)據(jù),隨機(jī)選取共925條數(shù)據(jù)作為隨機(jī)森林模型的訓(xùn)練樣本,以7個影響因素指標(biāo)作為自變量,住宅小區(qū)均價作為因變量,利用OpenCV2的隨機(jī)森林模型工具進(jìn)行回歸分析。用剩余的300條數(shù)據(jù)作為測試數(shù)據(jù)進(jìn)行后續(xù)預(yù)測分析。深圳市房價隨機(jī)森林模型的訓(xùn)練參數(shù)如表2所示。

隨機(jī)森林模型訓(xùn)練參數(shù) 表2

根據(jù)本文選取的房價影響指標(biāo),預(yù)選的特征變量個數(shù)為7,設(shè)置最大分類數(shù)為10,由于特征數(shù)量相對較少,決策樹的最大分類深度設(shè)為5,節(jié)點最小樣本數(shù)為10,其余均選擇默認(rèn)值,訓(xùn)練完成后隨機(jī)森林中生成了50顆決策樹。對所有的輸入特征變量進(jìn)行分析,計算決策樹中每個節(jié)點處的Gini指數(shù)反映不純度轉(zhuǎn)化值,取均值即獲取每一個自變量對因變量的解釋程度,用來評價各特征變量的相對重要性。

4.3 影響因素重要性分析

根據(jù)建立的房價研究隨機(jī)森林模型的輸出數(shù)據(jù)進(jìn)行計算,結(jié)果如表3所示,Gini指數(shù)的取值越小,代表自變量對因變量的影響越大。

對各特征變量Gini指數(shù)進(jìn)行標(biāo)準(zhǔn)化處理,通過直方圖反映相對重要性,如圖3所示,7個指標(biāo)因子在房價模型中的重要性排序如下:X3>X2>X7>X6>X1>X5>X4。該結(jié)果反映出深圳市的二手住宅小區(qū)單價在選取的以上7個指標(biāo)因子中,受到醫(yī)療設(shè)施因素的影響最甚,小區(qū)附近的醫(yī)療資源越充分,房價越高,這和深圳市醫(yī)療資源分布的不均衡有很大關(guān)系。其次小區(qū)附近的中學(xué)分布數(shù)量也是影響房價的一個重要因素,僅次于醫(yī)院,教育資源配置對房價有提升作用。重點規(guī)劃區(qū)因素是重要性排在第三位的因素,反映深圳市的房價越昂貴的小區(qū),往往是位于深圳市重點規(guī)劃區(qū)的附近,政府的規(guī)劃決策等對城市的房價有著重要的影響。公園綠地的分布面積影響次之,然后是小學(xué)的分布數(shù)量,交通便捷方面的影響因素對小區(qū)單價的影響最低。

各個特征變量在模型中的Gini指數(shù) 表3

圖3 變量相對重要性

4.4 預(yù)測分析

利用生成的深圳房價隨機(jī)森林預(yù)測模型對300條測試數(shù)據(jù)進(jìn)行運(yùn)算,根據(jù)各影響因子的指標(biāo)值得出了預(yù)測房價。通過對預(yù)測結(jié)果和實際房價數(shù)據(jù)建立折線圖進(jìn)行可視化表達(dá),結(jié)果如圖4所示。在整體上預(yù)測結(jié)果能夠大致吻合測試數(shù)據(jù)中的實際房價,但隨機(jī)森林生成的預(yù)測結(jié)果在各個極大值處均小于實際房價值,各個極小值處均高于實際房價,即預(yù)測結(jié)果偏向于均值上下浮動,不如實際房價值的差異那么顯著。針對價格相對穩(wěn)定在深圳市房價均值上下的住宅小區(qū),本文使用的模型能夠較好地實現(xiàn)價格預(yù)測;對于較高的住宅小區(qū)單價,隨機(jī)森林模型的預(yù)測結(jié)果會存在較大偏差,僅利用地理視角的因素不能較好推測該類房價,存在其他主要影響因素。

圖4 預(yù)測結(jié)果與實際價格對比折線圖

預(yù)測房價和實際房價的統(tǒng)計特征計算結(jié)果如表4所示,預(yù)測房價的均值與實際房價的均值大致相同;然而實際房價的標(biāo)準(zhǔn)差遠(yuǎn)大于預(yù)測房價,標(biāo)準(zhǔn)差是用來衡量一組數(shù)自身的離散程度的指標(biāo),因此說明實際房價數(shù)據(jù)較為離散,數(shù)據(jù)間偏差大于預(yù)測房價,預(yù)測房價值相對趨于均值;預(yù)測房價的最大值低于實際房價最高值約2萬元,而對于最小值的情況,預(yù)測房價的最小值要高于實際房價。結(jié)合圖4和表4中結(jié)果,顯示出模型對于處于高值和低值的房價難以進(jìn)行很好的模擬,但對于位于均值附近的房價能夠?qū)崿F(xiàn)較好的預(yù)測,相對誤差較小。

預(yù)測房價和實際房價的統(tǒng)計特征 表4

(2)

圖5 實際價格與預(yù)測誤差散點圖

5 結(jié) 論

本文通過網(wǎng)絡(luò)爬取深圳市二手房住宅小區(qū)均價 1 225條,以小區(qū)一公里范圍內(nèi)的醫(yī)療設(shè)施、教育資源、交通便捷度、環(huán)境、規(guī)劃的享有程度,從地理視角下選取小學(xué)、中學(xué)共7個指標(biāo),通過機(jī)器學(xué)習(xí)中的隨機(jī)森林建立研究模型,分析深圳市房價的地理空間影響因素。

根據(jù)本文建立的深圳市房價研究隨機(jī)森林模型,對所選7個地理空間變量的回歸分析,通過輸出的變量重要性評價指標(biāo)反映各個特征變量對深圳市二手房住宅小區(qū)均價的影響程度,結(jié)果顯示醫(yī)院分布特征是對房價影響最大的因子,反映出深圳市醫(yī)療設(shè)施的不充分和不均衡,在今后的城市規(guī)劃中需重點考慮布局;其次是中學(xué)的分布,教育資源配置是居民選購房屋時會著重考慮的因素,對住宅小區(qū)的價格有重要影響;重點規(guī)劃區(qū)因素是重要性排在第三位的因素,政府的規(guī)劃決策等對城市的房價有著重要的影響,周邊區(qū)域的發(fā)展?fàn)顩r影響居住區(qū)銷售價格;公園綠地面積排在第四位,居民享有的公共綠色開敞空間也對房價有一定影響;再次是小學(xué)分布數(shù)量特征,反映交通便捷度的路網(wǎng)、軌道站點在房價影響上相對重要性最低。通過對測試數(shù)據(jù)進(jìn)行房價預(yù)測,本文提出的方法在住宅小區(qū)單價處于均值附近的情況下,能夠較好吻合實際房價統(tǒng)計數(shù)據(jù),地理環(huán)境影響因子對該類房價具有較好的解釋和預(yù)測效果。

猜你喜歡
特征影響模型
一半模型
是什么影響了滑動摩擦力的大小
哪些顧慮影響擔(dān)當(dāng)?
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
如何表達(dá)“特征”
不忠誠的四個特征
抓住特征巧觀察
3D打印中的模型分割與打包
擴(kuò)鏈劑聯(lián)用對PETG擴(kuò)鏈反應(yīng)與流變性能的影響
中國塑料(2016年3期)2016-06-15 20:30:00
主站蜘蛛池模板: 国产又粗又猛又爽| 亚洲天堂视频在线播放| 色综合中文综合网| 91po国产在线精品免费观看| 中文成人在线视频| 囯产av无码片毛片一级| 九色视频一区| 一本大道无码日韩精品影视| 综合社区亚洲熟妇p| 色哟哟国产精品| 91久久国产综合精品| 国产精品亚洲а∨天堂免下载| 久久6免费视频| 久久99国产综合精品1| 无码国内精品人妻少妇蜜桃视频| 国产青青草视频| 国产av剧情无码精品色午夜| 欧美视频免费一区二区三区| 无码高潮喷水专区久久| 欧美视频免费一区二区三区| 国产精品一线天| 2021国产乱人伦在线播放| 精品视频一区二区三区在线播| 国产乱人激情H在线观看| 黄色网址免费在线| 国产精品密蕾丝视频| 97视频在线精品国自产拍| 欧美一级在线播放| 国产高清不卡视频| 噜噜噜久久| 欧美亚洲第一页| 亚洲欧洲国产成人综合不卡| 国产精品一区在线观看你懂的| 国产精品观看视频免费完整版| 国产男人的天堂| 免费国产小视频在线观看| 亚洲精品波多野结衣| 久久亚洲中文字幕精品一区| 日韩无码黄色网站| 成年A级毛片| 欧美日韩动态图| 四虎成人精品在永久免费| 狠狠操夜夜爽| a毛片免费看| 亚洲av综合网| 制服丝袜亚洲| 国产va在线观看免费| 婷婷五月在线视频| 久久精品人人做人人爽电影蜜月| 国产欧美日本在线观看| 色欲综合久久中文字幕网| 亚洲电影天堂在线国语对白| 国产精品久久久久久久久久久久| 国产真实二区一区在线亚洲| 91精品国产综合久久香蕉922 | 国产产在线精品亚洲aavv| 国产99视频在线| 欧美日韩北条麻妃一区二区| 国产成人精品亚洲日本对白优播| 国产午夜看片| 成人无码一区二区三区视频在线观看 | 国产AV无码专区亚洲精品网站| 欧美精品伊人久久| 亚洲中字无码AV电影在线观看| 欧美人与动牲交a欧美精品| 亚洲精品国产日韩无码AV永久免费网| 国产91无码福利在线| 国产成人av一区二区三区| 免费看a级毛片| 青青热久免费精品视频6| 色丁丁毛片在线观看| Jizz国产色系免费| 亚洲第一成网站| 国产成人a在线观看视频| 日韩精品一区二区三区大桥未久 | 老司机午夜精品网站在线观看| 国产日韩欧美在线视频免费观看| 精品无码国产自产野外拍在线| 无码精品一区二区久久久| 亚洲精品你懂的| 专干老肥熟女视频网站| 免费在线a视频|