■ 邰虹月 TAI Hongyue
在智能手機應用融入日常生活的互聯網時代,人們逐漸意識到大數據對于日常生活的重要性。在我們每天使用百度相關應用軟件的同時,百度可以通過對用戶數據的匯總,整理成可以為城市服務的“大數據”。國內已有學者結合百度熱力圖進行相關研究:如汪程采取百度熱力圖與問卷調查相結合的形式,總結了城市中心城區人群在空間利用方面的時空特征[1];冷炳榮使用百度熱力圖對重慶市區的職住關系進行了研究[2];李娟通過百度熱力圖識別6 5 8個城市中心,對中國城市多中心發展進行了展開研究[3]。此外,由于巨大的數據樣本量,百度熱力圖在各個領域內的研究價值得到了持續關注[4]。
本文以大連市內五個行政區為研究對象,分別為中山區、西崗區、沙河口區、甘井子區、高新園區,五個區面積共2 4 7 0.7 7 k m2,人口3 7 6.2 7萬。
百度地圖熱力圖是百度公司推出的大數據可視化產品,以手機用戶地理坐標為基礎,對于數據進行后臺分析、處理和轉換,通過色塊冷暖表達人群在城市平面上的聚集程度。需要說明的是,人群的聚集程度僅由顏色的冷暖體現,是一個相對的表達,軟件中沒有明確的人口密度或聚集程度數值,對于大眾而言更加便于理解和感知。使用此數據進行城市研究,需要對數據進行爬取、存檔、處理等轉換工作。
由于移動數據代表的人口分布與真實的人口分布數據可能存在誤差[5],雖然百度地圖熱力圖數據的樣本量已經十分龐大,但在研究中也只能說明一定的人群聚集與分布情況或趨勢,不能將其看作城市人口的真實分布情況。因此,基于數據本身的特點,本研究忽略對于人口聚集情況真實量值的探討,重點研究大連市五區內人口聚集或分布的相對情況。
本文通過基于Ar Map軟件的百度大數據采集V 1.1工具箱(圖1),調試好相關參數,分別爬取2 0 1 8年6月1 0號(周末)與6月1 1號(工作日)兩天的熱力圖數據,從7:0 0~2 1:0 0,每隔1 h爬取數據一次,共爬取熱力圖3 0張(6月1 0日1 5張,6月1 1日1 5張)。
通過對爬取熱力圖的初步分析,人群聚集隨時間的變化在部分時間段內變化不大,所以選擇7:0 0、9:0 0、1 1:0 0、1 3:0 0、1 8:0 0、2 1:0 0六個變化較為明顯的重要時間節點。圖2中分別為工作日和休息日7:0 0、9:0 0、1 1:0 0、1 3:0 0、1 8:0 0、2 1:0 0大連市五區百度熱力圖,由于爬取的數據為P N G格式的圖片,想要獲得具體的數據,需對爬取到的熱力圖進行再次處理。
將圖2中的圖片導入Arc Map中,該圖片自身具有四個通道,其中命名為“b a n d_4”的第四通道使用2 5 6級灰度來表達圖片中數據信息。另外三個通道為R G B色彩通道,第四通道相比之下更利于對于數據進行分類對比。因此,在Arc Map軟件中加載第四通道,對于圖片本身擁有的數據量值,使用軟件自帶的自然間斷法進行重分類操作。將原有的數值重新分類為7個等級,研究中將第六級和第七級定義為高熱區,第四級和第五級定義為次熱區。使用該方法對爬取的所有P N G圖片數據進行處理,需要注意的是,每張圖片本身的數據不同,但對其進行重分類操作中級別劃分數值是不變的。完成對于數據的處理之后,各張圖片數據就擁有了可以一起對比的基礎和依據。處理之后的熱力圖如圖3所示。

圖1 軟件操作界面截圖

圖2 工作日、休息日百度熱力圖
在Arc Map工具箱中,利用柵格計算工具,使用不同等級的熱力區像素數值代表該區的面積,分別計算出不同時間點高熱區面積占比與次熱區面積占比。計算公式為高(次)熱區面積占比=第六、七(四、五)級像素數值之和/總像素數值。得出二者隨時間變化的折線圖(圖4、5)。
2.1.1 工作日

圖3 工作日、休息日處理數據
總體上,次熱區變化明顯,高熱區變化較小。次熱區隨時間推進呈現先下降后增加最后下降的趨勢,高熱區呈現先緩慢上升后下降的趨勢。
對于由圖表體現出的人口集聚而言,早晨人口相對集中,早晨7:0 0,絕大部分居民還在家中,即對于大連五區而言,人口在居住用地中處于一種相對集聚的狀態。到了9:0 0,次熱區占比明顯下降,可以理解為居民由居住地位移到工作地點,在空間上是一種分散的過程。上午1 1:0 0,次熱區占比進一步下降,1 3:0 0,次熱區占比基本穩定,與1 1:0 0相比,小幅度下降。證明次熱區集聚的人口在午飯時間段沒有進行遠距離的位移。1 8:0 0,次熱區出現了增加,證明居民由工作單位回到了居住地。2 1:0 0,次熱區出現小幅度下降,高熱區占比也到達最低值。
2.1.2 休息日
由休息日高熱區、次熱區折線對比圖可得,總體上,次熱區變化明顯,高熱區變化趨勢較小。
次熱區隨時間推進呈現波浪趨勢,可以理解為,休息日人群的流動與集聚更加隨意,并沒有呈現工作日那種隨時間變化的明顯規律。高熱區呈現先上升后下降的趨勢,即城市人群向少數區域進行集聚,向次熱區外進行集聚。于1 1:0 0,高熱區占比到達最高值,即人們在此時到達休閑場所呈現集聚。與工作日相比,休息日高熱區占比從1 1:0 0~2 1:0 0一直處于較高水平,與居民周日的生活軌跡基本一致。
城市高熱區作為城市中人口聚集程度較高的區域,這些區域是表征城市空間使用的重要節點區域。將百度熱力圖與地圖數據進行疊合,可以得出城市人口集聚或分布的空間特征。
2.2.1 工作日
將工作日整日的熱力平均值匯聚成圖6,大連市五區范圍內連續的高熱區共有1 0處,結合地圖數據對1 0處高熱區進行命名,并按照其熱度大小排序,依次為:西安路商業圈、中山廣場、青泥洼橋、友好廣場、大連火車站、華南廣場、和平廣場、東特購物廣場、人民廣場、馬欄廣場。將高熱區聚集區域進行進一步整理與整合,總結出高熱聚集區域的空間格局相關要素(表1)。由表中可得,高熱聚集區用地性質多為商業、商務、辦公用地,且與地鐵、公交等公共交通要素密切相關。
2.2.2 休息日
休息日大連五區內共有連續高熱區1 0個,結合地圖分別進行命名,按照高熱區面積大小進行排序,依次為:西安路商業圈、青泥洼商業街、華南廣場、大連火車站及勝利廣場、和平廣場、柏威年購物中心、大連市醫科大學附屬第一醫院、西崗區婦幼保健院、馬欄廣場、東特購物廣場。1 0個高熱區中有8個具有很強的商業休閑功能,其中:勝利廣場、青泥洼、西安路、華南廣場基本上是大連市的商業中心區,承載了市民大量的休閑娛樂購物的需求。說明休息日大連市五區內,主要人群集聚活動以購物休閑為目的,商業休閑區是使用強度最高的區域。除此之外,兩處高熱區是醫院,婦幼保健院和大醫一院(圖7)。
根據表2可知,休息日與工作日人口的聚集在空間上存在明顯差異,雖集聚區域仍然多以商業、商務用地為主,但是出現了兩處醫療用地,且大連火車站這一城市交通用地集聚程度休息日明顯高于工作日。該特征也與居民日常行為特征相符合,即休息日遠距離出行頻率大于工作日,休息日就醫頻率大于工作日。

圖4 工作日高熱區、次熱區折線對比圖

圖5 休息日高熱區、次熱區折線對比圖

圖6 工作日高熱區空間分布圖

表1 工作日五區人群活動分布與空間格局的關系表
大連市中心區工作日和休息日表現出來的共同集聚中心主要集中在百盛、麥凱樂、新瑪特等商場及車站、廣場等大型公共服務設施附近。主要中心人口過于集中,而次級中心與主要中心之間的銜接作用不明顯,建議下一步注重次級中心的設立,使中心區的人流密度得到有機疏散。
一方面,是市中心部分區域的過度集聚;另一方面,是工作日人口在工作時間分散。可以推斷出,人口在工作時段分散到了城市的不同區域,這樣的趨勢長此以往定會帶來城市空間的蔓延。所以,對于市區內的就業崗位應該進行合理的引導,例如,組織社區產業的發展,促進居民的社區就業,城市內應該注重就業密度,提升城市空間的使用效率,加快職住平衡工作,減緩城市的無效蔓延。
由于大連市特殊的“蜂腰”地形,城市南北之間的聯系必須通過“蜂腰”區域,這樣也就解釋了西安路商圈作為商業核心,又是南北聯系的交通要道,成為高熱區聚集的原因。即在后期的城市更新及交通網(尤其是地鐵線路)鋪開的過程中,應處理好城市用地與交通線路站點的協調,鼓勵公共出行,打造以地鐵站點為核心的步行生活圈,為市中心區減輕壓力。

圖7 休息日高熱區空間分布圖

表2 休息日五區人群活動分布與空間格局的關系表
利用大數據分析城市空間結構,為城市的更新發展提供依據,已經成為了當今規劃的熱點。本研究使用百度熱力圖作為數據來源,以大連市五區為研究對象,研究城市人群的聚集情況。介紹了百度熱力圖軟件的特點以及數據爬取軟件的使用方法,簡要說明了使用此數據進行研究需要的必要流程;以大連市五區為研究案例,使用Arc Map柵格計算工具將數據量化,分析了居民工作日與休息日的時間足跡,將熱力數據與地圖疊合,分析了居民集聚的空間特征;針對分析,提出大連市五區在城市空間結構、城市蔓延、土地使用、交通組織方面存在的問題,并進行了對策初探。本文僅是利用百度熱力圖進行了初步的城市人群聚集研究,在今后的城市發展中,大數據必將應用于更加廣泛的領域。