999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于表征學習的地理空間收入分異探測
——以深圳市為例

2023-01-29 10:13:10張燕旋
經緯天地 2022年6期
關鍵詞:高峰區域

錢 佩 黃 威 張燕旋

(廣東省國土資源測繪院,廣東 廣州 510500)

0.引言

空間分異是城市空間中社會要素不均衡分布的體現,引起城市地理學、社會學、人口學領域的廣泛關注[1]。經濟不斷發展,引發了包括收入水平、貧富差距等資源配置方面不平衡的問題,進而導致了居民的收入分異問題[2]。國內外研究主要局限于居住空間的靜態分異,而在交通出行不斷發展的今天,活動空間下的分異研究顯得尤為必要,并且傳統模型難以對海量數據進行高效計算,從而難以準確挖掘活動空間下的居民分異規律。

本文提出一種基于表征學習的地理空間收入分異探測方法,通過深圳市POI數據、公交出行數據構造屬性相似矩陣、區域間接觸度、均質度矩陣,并通過圖嵌入方法得到每個區域的低維向量表達,最后以層次聚類方法得到不同尺度下深圳市居民收入分異程度。本文的貢獻包括:(1)基于人群出行的分異指數提出區域間分異強度矩陣的構建方法;(2)改進了異構信息圖嵌入模型,能夠結合靜態的屬性信息和動態的屬性信息。

1.相關理論

1.1 空間接觸度與空間均質度

空間分異是城市社會學與城市地理學的經典研究議題,也是當前我國社會所面臨的現實問題。Reardon在2004年的一篇文章中,Massey在1988年提出的表示分異的五個維度重新歸類成兩個維度:空間接觸度與空間均質度[3]。

空間接觸度常常被用來表示群體與個體之間的關系,定義為個體所接觸到其他群體的人口與接觸到總人口的占比[4]。Schnell提出了個體分異程度的分異指數[4],該指數分為兩部分,一部分反映了個體與其他群體的孤立程度,另一部分反映了個體與其他群體的接觸程度,計算人群中不同群體的比例且按照個體所接觸的空間與時間進行加權。傳統的接觸度方法只考慮群體各自所在單元內的直接接觸,而未考慮群體在其他單元內的間接接觸。

空間均質度在早期使用D指數來進行描述,它能夠很好地探測居住空間的分異程度,但并不能反映群體所在空間的關系,也并不能像接觸度那樣反映出研究群體的人口占比等特性。學者們嘗試對D指數進行修正,Morgan提出的基于多群體計算的差異性指數被廣泛認可,能測算多群體空間的社會分異,如式(1)所示:

其中,式(1)中,ti與pi代表的含義為i單元內總人口數以及研究群體的占比;T為整個研究區域內的總人口數;P為研究群體占比;n代表的含義為不同的研究區域。

1.2 圖嵌入

圖嵌入(也叫網絡嵌入)模型包括鏈路預測、節點分類和社區檢測,它以高維真實網絡或圖形處理為核心,生成節點的低維矢量表示,從而對網絡進行下游計算。圖嵌入可歸納為三大類:基于因子分解的方法、基于隨機游走的方法和基于深度學習的方法。基于因子分解的方法是將圖轉換成矩陣的形式,對這些矩陣進行因式分解,從而保持節點之間的相似度;基于隨機游走的方法核心思想是在網絡中不斷重復地隨機漫游,最終形成一條完整地通過網絡的路徑,隱式地保留節點間的相似度,獲取圖中局部上下文信息;基于深度學習的方法主要是將深度神經網絡應用于圖的表示中。

2.活動空間分異度量測

2.1 相關定義

定義1:屬性相似度圖Ga(V,Ea)是通過對兩節點之間的自身屬性的相似程度進行描述,Ea={Wa,ij}表示的是兩節點相似度,其值越大相似度越高。如式(2)所示:

式(2)中,||Hi-Hj||22代表相似性的量測值,γ是一個可選擇的參數。

定義2:空間接觸度圖GE={V,EExp,WExp},V為城市中單元的集合,EExp為單元之間基于可達性的接觸程度,接觸度越大,兩個單元間聯系越密切,WExp為單元間的接觸度集合,其子集WExp,i,j=Expij。M為各經濟層次的集合,M={Rich,Middle,Poor},區域i與區域j的之間的可達性Acci→j,如式(3)所示:

式(3)中,ti→j為i區域到j區域的時間,tj表示其他區域到j區域的平均時間,duri→j表示i區域在j區域的逗留時間,表示其他區域到j區域后在j區域的逗留平均時間。i區域到j區域行程時間越久,意味著j區域對i區域的吸引力越大;在某個區域逗留的時間越久,與這個區域人口的接觸可能性就越大。定義i到j區域的局部接觸水平,如式(4)所示:

其中,

式(4)中,Trj,g表示j區域的g群體的數量;Acci→j表示i區域到j區域的可達性;Tri→j,k表示i區域到j區域的k群體數量;Trj→t,g表示j區域到t區域的g群體數量;Tri→t,k表示i區域到t區域的k群體數量。

定義3:空間均質度圖,GEv={V,EEv,WEv},如式(7)所示:

式(7)中,Acci,j為i區域和j區域與其他區域的累積可達性,I為辛普森系數,Acci,j→cm為i區域和j區域流出到m群體的可達性,Acccm→i,j為m群體從其他區域流入到i,j區域的可達性;Rij→cm為i,j區域流出到m群體占整個區域流出的比例,Rcm→ij是指m群體流入到i,j區域與整個流入流量的比值。

Rj,m為j區域內m群體占整個區域m群體的比例,Ri→j,m是指i區域流向j區域m群體數量與i區域m群體數量的比值;Rm表示整個城市中m群體人口占比。

2.2 聯合嵌入

上文已經定義了三類圖,為了得到公交出行的日常活動數據特征信息,需把三類圖嵌入一個相同的空間,本文引入了一種全局的聯合嵌入方法。以自編碼模型基礎模型,并加以改進。自編碼模型分為編碼和解碼,整體框架,如圖1所示。

圖1 聯合嵌入框架

編碼部分如式(10)所示:

式(10)中,Yk表示第K層表達;Wk、bk分別為第K層的權重和偏移量;σ為激活函數。

解碼部分如式(11)所示:

2.3 損失函數

(1)損失函數的重建

目的是使輸入向量與輸出向量的誤差值最小,來維持屬性相似圖節點之間的相似性,屬性相似圖中的原始結構應該保持不變。

(2)接觸度屬性圖近似

要使得節點在低維空間具有接觸度圖的特征,損失函數可以被定義為:

(3)均質度屬性圖近似

兩節點在均質度方面表現十分相似,在重建加權誤差中它也是最小的。

最終的損失函數為:

式(16)中,α和β是可學習的參數,用于對損失函數lp和ls進行加權計算。從公交出行模型中的三個獨立方面構建的圖進行模擬和近似計算損失函數。在后面的實驗中把損失函數的最終公式中的可變的加權參數設置為α=1和β=0.2。

2.4 分異探測

分層的社區結構由兩個等級構成:(1)比較低級的社區結構是由K均值聚類得到;(2)比較高級的社區結構是由低級社區結構聚類而成。

低級社區結構通過間隔統計來確定最佳的簇數,當間隔統計量G(k)取到最大值時得到了最佳的聚類數k,如式(17)所示:

式(17)中N是生成的數據集的個數,這些數據集在圖嵌入向量的時候獲得;Dkn是第n個數據集與其他數據集之間的距離之和,用蒙特卡羅抽樣法來計算這些距離;Dk是所有K個聚類之間的距離之和。

通過K均值聚類方法,在最佳的聚類數k已經確定的情況之下生成低級社區結構。在低級的社區結構中,對組成的嵌入向量進行平均值計算來提取嵌入向量;通過層次聚類,根據各個簇之間的平均距離生成高級社區結構。通過使用樹狀圖對高級社區的結構進行描述,最終完成不同尺度的收入分異探測。

3.實驗結果與分析

3.1 數據描述

根據國家統計局統計資料,2019年深圳市人均GDP達3萬美元,其中收入水平較高的南山區人均GDP為5.93萬美元,這只是一個市區級的粗略比較,在更加精確的區域劃分內,人均GDP的差距會進一步拉大。在這樣一個人均GDP位于國內前列的城市,其內部存在的收入分異值得去分析研究。更高的收入往往意味著能夠買得起更貴的房子,收入與房價之間存在正相關關系。通過深圳市房價分布反映收入分異,如圖2所示。

圖2 研究區分異情況

收入等級劃分為三個:高收入、中等收入以及低收入。且中等收入的上限與下限分別是高收入的下限以及低收入的上限。按照人均GDP來設置中等收入的下限,按照平均的人均GDP兩倍來設置中等收入的上限。

深圳市有8條地鐵線路、808條公交線路以及6425個公交以及地鐵站點。這些龐大而復雜的交通路線與節點共同構成了支撐深圳市日常公共交通出行的交通網絡。在這些公共交通出行數據中,使用了開始時間、結束時間、上下車站臺、交通路線等數據項。交通數據類型如表1所示。

表1 公交數據示例

3.2 結果與分析

根據聚類方法對社區進行檢測,以工作日早晚高峰交通出行數據為數據源,對早晚高峰的社區類型進行提取與分析。當K=14時聚類最為明顯,因此將早晚高峰的嵌入結果分為14類。

(1)低級社區結構

在所有的類別中,類別0(藍色框內)和類別6(紅色框內)所占的比重最大。通過與經濟分區圖相對比再綜合交通流量數據發現:類別0處于低收入水平單元且表現出交通流出比例遠大于流入比例;類別6處于中高收入水平單元且表現出交通流入比例遠大于流出比例。再進一步結合居住、辦公、游玩等社會功能性區域劃分信息,在類別0中:多數單元位于距離市中心商業辦公區2.5千米內的居住區,而剩下的多數位于距離市中心商業辦公區5千米以上的市郊。在類別0中的流出群體大多在類別6中聚集,類別6中的一個普遍情況是:處于較為發達的深圳市中心地區,幾乎囊括了所有的中高收入單元,區域內集中了大量的辦公區、交通樞紐、商業中心、娛樂場所、金融中心。與類別0相比,類別1雖然也是屬于高流出低流入類型,但是類別1主要為短距離出行,類別0則是中長距離出行。如圖3所示。

圖3 早高峰低層次社區結構

與早高峰類似,通過對晚高峰的低級社區結構進行分析,得出了與早高峰類似的結果。在晚高峰的14個低級社區結構當中,類別3(與早高峰類別0相對應)與類別5、7(與早高峰類別6、2)占了研究總單元的大部分。

在類別3中,群體在通過中長途的公交出行之后流入到低收入的居住區。

早晚高峰交通出行數據體現了高度的對稱性,市民在早高峰階段從居住區流向辦公場所,結束了一天忙碌的工作之后,在晚高峰由辦公場所流向居住區,然而這只是低收入群體在工作日的流動情況,中高收入群體在這方面則表現得不如低收入群體明顯。幾個比較合理的解釋是:中高收入群體居住區域原本就位于市中心辦公場所附近,上班過程中無需使用交通工具;中高收入群體對公共交通的依賴程度較低;中高收入群體上下班時間相對來說不是十分地固定。

在對早晚高峰的低層次社區結構分析中發現,分異現象在不同的類別和表現的程度上也不同。以早高峰為例,在類別0、10、12中,分異現象十分明顯,類別0前文已作解釋,而類別10、12都有一個共同的特點:位于城市邊緣的郊區或城市中心之間的低收入地區。而在類別1、4、9中,分異現象則表現得不是那么明顯,這幾個類別交錯散落在城市較發達的高收入地區。

(2)高級社區結構

圖4 晚高峰低層次社區結構圖

圖5 早高峰高級社區結構樹狀圖

表2 高級社區統計

通過使用層次聚類的方法,對上面的14個低級社區結構重新生成了6個高級社區結構。以早高峰為例對這6個高級社區結構進行了統計:

對這6個類別的模式進行分析得到:

類別Ⅰ:由低級類別2組成,占比為6.06%,主要的模式是低收入區域與中高收入區域之間的中短距離出行,流入比例高于流出,范圍較為分散。

類別Ⅱ:由低級類別4、9、12、13組成,占比為18.16%,主要的模式是低收入區域與中高收入區域內部的短距離出行,流入比例高于流入,范圍十分集中。

類別Ⅲ:由低級類別0、6組成,占比為35.42%,主要模式是低收入區域與中高收入區域之間的中長距離出行,流入與流出比例差別較大,范圍較為集中。

類別Ⅳ:由低級類別3、7、10組成,占比為17.75%,主要模式是中高收入區域內部之間的中距離出行,流入比例大于流出,范圍較為集中。

類別Ⅴ:由低級類別1組成,占比為6.06%,主要模式是低收入區域與中高收入區域之間的中短距離出行,流出比例大于流入,范圍較為集中。

圖6 早高峰高級社區結構圖

類別Ⅵ:由低級類別5、8、11組成,占比為13.22%,主要模式是低收入區域與高收入區域之間的中段距離出行,流出比例大于流入,范圍較為集中。

在對6個高級類別的所在區域的分異情況可視化后,發現在藍色框內的區域存在著較強的分異現象,這與低級社區的情況相吻合。這些區域內的單元大多都是低收入單元,且離辦公場所有一段較遠的距離,所以在早高峰出行中表現出中長距離的流出模式。而在類別Ⅰ、Ⅴ較為集中的區域,可以明顯地發現分異水平較低。

由此得出:分異在低收入區域的強度高于高收入區域,即位于低收入區域的群體往往更容易感受到分異現象。原因是:辦公場所往往位于城市中心地區,而城市中心地區承載著大量的金融中心、娛樂場所、商業中心,所以辦公場所與高收入區域有著緊密的聯系,當來自不同群體的個體聚集到辦公場所時,高收入區域將會表現出不同群體的流入模式。同時,低收入區域通常位于城市的住宅區,所以低收入區域表現的只是低收入群體的流出模式,因此低收入區域更容易感受分異現象。位于城市偏遠地區的低收入區域,距離高收入區域較為遙遠且缺乏對高收入群體的吸引,導致分異現象尤其明顯,而這類區域在早高峰的出行過程中一般表現為中長距離的流出模式。

4.結束語

本文利用公共交通出行數據、POI數據提出了構建城市節點之間局部接觸度和均質度的矩陣構建方法,通過數據驅動的方式對城市內部的收入分異情況進行探測,為空間分異的研究提供了一種新思路;在圖嵌入過程中,融合了靜態的屬性特征和動態的出行特征,并將出行信息抽象為接觸度圖和均質度圖;最后以非監督的聚類方法完成了深圳市地理空間的收入分異探測,可為城市管理與建設、公交線路優化等提供決策參考。

猜你喜歡
高峰區域
永久基本農田集中區域“禁廢”
今日農業(2021年9期)2021-11-26 07:41:24
病毒病將迎“小高峰”全方位布控巧應對
今日農業(2021年8期)2021-07-28 05:56:04
分割區域
石慶云
書香兩岸(2020年3期)2020-06-29 12:33:45
努力攀登文藝高峰
中華詩詞(2017年1期)2017-07-21 13:49:54
求真務實 開拓創新 不忘初心 再攀高峰
中國核電(2017年1期)2017-05-17 06:09:54
關于四色猜想
分區域
雨天早高峰,自在從容時。
基于嚴重區域的多PCC點暫降頻次估計
電測與儀表(2015年5期)2015-04-09 11:30:52
主站蜘蛛池模板: 日韩毛片在线播放| 久久久久国产一区二区| 久久精品91麻豆| 国产手机在线观看| 日本一区二区三区精品AⅤ| 欧美伊人色综合久久天天| 亚洲码一区二区三区| 亚洲精品日产AⅤ| 性欧美在线| 中文字幕人妻无码系列第三区| 国产成人综合网| 2021亚洲精品不卡a| 国产在线自乱拍播放| 欧美黄网站免费观看| 第一页亚洲| 精品久久久无码专区中文字幕| 免费看久久精品99| 1级黄色毛片| 刘亦菲一区二区在线观看| 亚洲欧洲日韩国产综合在线二区| 国产最新无码专区在线| 在线播放真实国产乱子伦| 孕妇高潮太爽了在线观看免费| 国产 日韩 欧美 第二页| 久久久久久尹人网香蕉| 国产第一页第二页| 亚洲欧洲日本在线| 国产欧美日韩精品综合在线| 精品国产一区91在线| 成年女人a毛片免费视频| 国产成人91精品| 91伊人国产| 免费jjzz在在线播放国产| 国产精品美人久久久久久AV| 国产成人精品在线| 日韩免费成人| 国产精品一老牛影视频| 国产第四页| 黄色网在线| 久久黄色一级视频| 亚洲视频欧美不卡| 日韩毛片在线视频| 成人午夜福利视频| 久久婷婷六月| 人妻丰满熟妇av五码区| 色老二精品视频在线观看| 国产精品福利社| 人妻出轨无码中文一区二区| 91麻豆精品视频| 92午夜福利影院一区二区三区| 亚洲美女操| 久久精品人人做人人综合试看| 日韩a级片视频| 高潮爽到爆的喷水女主播视频| 国产偷国产偷在线高清| 日韩在线播放中文字幕| av在线无码浏览| 亚洲无码精品在线播放 | 欧美日韩国产高清一区二区三区| 久无码久无码av无码| 亚洲久悠悠色悠在线播放| 玖玖精品在线| 热re99久久精品国99热| 国产精品所毛片视频| 91久久青青草原精品国产| 制服丝袜无码每日更新| 中文字幕无码制服中字| 亚洲第一天堂无码专区| 国产乱子伦无码精品小说| 国产一区二区三区精品久久呦| 亚洲三级色| 色老二精品视频在线观看| 91九色视频网| 四虎综合网| 欧美第九页| 国产成人精品日本亚洲| 幺女国产一级毛片| 亚洲 欧美 中文 AⅤ在线视频| 在线观看国产小视频| 亚洲国产成人精品无码区性色| 国产欧美日韩免费| 久久久亚洲国产美女国产盗摄|