陳 偉,翟國方,張義杰
(1.南京郵電大學 地理與生物信息學院 江蘇 南京 210046;2.南京大學 建筑與城市規劃學院,江蘇 南京 210093; 3.南京財經大學 工商管理學院,江蘇 南京 210046)
城市人口分布是城市規劃、公共服務設施配置、各項政策制定等工作的重要依據,掌握精細尺度下的人口分布信息可為科學合理地決策提供詳細的量化基礎[1]。由于人口在城市中的分布具有范圍和時間上的雙重不確定性,這給準確分析其空間分布狀態帶來了較大困難[2]。在傳統的人口密度方法中,根據研究區域尺度和問題的不同,涉及的主要數據類型有人口普查數據[3]、土地利用數據[4]、遙感影像數據[5]、專項調查數據[6]等,數據不同程度地在時效性、誤差控制等方面存在不足。此外,評估結果多是靜態的,且空間統計單元較大,無法滿足細化的使用需求。大數據時代的到來給上述問題的解決帶來了契機,結合多源數據類型對人口分布和變化趨勢展開分析與模擬逐漸成為較可靠的方法[7-9]。
除傳統的密度法以外,當前城市人口分布研究的方法可總結為兩大類:首先是基于密度法的各種改進方法,由于大數據的獲取具有一定難度,研究中仍需要建立基本的人口密度柵格,然后通過構建模型方法對結果進行優化。戚偉等利用土地利用類型數據,通過“人口—晝夜—土地利用”關系模型和人口空間化模型,對格網單元的城市晝夜人口空間分布特征進行了分析[10];胡曾曾等基于公里網格人口分布數據,運用CA-Markov模型模擬了北京市2015—2030年4期公里網格的人口,并以街道尺度的人口數據驗證了模擬結果[11];康停軍等通過多智能體模擬實驗獲得了較高空間精度的城市人口分布,模擬的城市居住分異現象基本符合實際情況[12];凡宸等針對人口統計數據的空間單元較大的現實情況,采取一元與多元回歸方法在GIS平臺實現了人口密度的降尺度模擬,得到了200m柵格尺度人口數據[13]。第二類為結合大數據的人口分布分析方法,包括間接模擬和直接計算。前者代表為基于夜間燈光數據的人口模擬,原理與密度法相似,缺點是空間精度仍不足,可驗證性較差,但相較傳統方法已能定量反映出人口的實際空間集聚情況[14-16];后者代表為結合手機信令數據的人口分布評估。由于信令數據能較真實地表征城市人口的分布狀態,具有時效性強、覆蓋面廣等特征,被用于人口空間行為、人口流動、城市熱點片區識別等方面的研究,結果可信度較高[17-21]。里克西多等在研究中開發了一種用于收集和處理基于多個運營商網絡數據的方法框架,解決了利用移動電話數據來評估泛歐人口密度分布的問題[22];龍奮杰等以貴陽市觀山湖公園為例,結合手機信令數據對公園服務人數、服務時長等展開了評價,反映了城市公園的實際服務狀態,避免了傳統方法缺少數據檢驗的不足[23];黃建華等、鐘煒菁等分別利用信令數據對上海市人流時空分布與移動模式[24]、人口分布與空間活動的動態特征[25]進行了研究。
鑒于此,本文基于電信手機信令數據,以天津市小白樓CBD片區為例,運用Python語言處理數據并設計人員分析模型識別駐留與流動人員屬性,結合GIS對區域人員規??傮w變化趨勢、分地塊人數極值時空分布、駐留與流動人員時空分布進行了分析,以期為涉及人口分布的城市問題研究提供參考。
案例區域位于天津市中心城區,屬小白樓CBD組成部分,面積約13.47km2。區域內及附近的主要設施與重要功能片區有天津站、意式風情街區、海河文化廣場、和平路商業街、中心公園、靜園、五大道文化旅游區、天津總醫院、天津財經大學、天津外國語大學、天津醫科大學、天津大學等,有4條地鐵線從片區內部穿過,分別為1號線、2號線、3號線、津濱輕軌地鐵9號線,共有站點9處。據調查,片區內建筑較密集,傳統風情街區尤甚,低層建筑與高層建筑集中區的邊界區分明顯。(超)高層建筑主要分布于小白樓地區、海河沿岸兩側和營口道地鐵站附近??傮w上,研究區域是一處典型的高建筑密度、高人口密度的城市中心區。

圖1 按用戶ID去重(a)與按坐標計數(b)的結果(11月10日15∶00)
本文所使用的手機信令數據來源于中國電信,數據時間跨度為2016年11月1日—11月30日,共計51694631條數據,每一條數據都包含了用戶ID(手機號加密后)、坐標和活動時間信息。由于數據中涉及龐大的重復用戶ID及相同坐標用戶,需要對數據進行清洗、去除重復項、相同坐標用戶計數等預處理,以在不影響數據質量的前提下減小數據體量,便于在GIS中進行分析,提升運行速度。此外,為了掌握人口的高精度時空分布情況,將每一天數據以小時為單位進行分割,則30天內共計720份分時數據。以上數據預處理過程均通過Python語言編程實現。本文以11月10日15∶00的數據(包括分布于15∶00—15∶59區間的所有數據)為例,提取的原始數據見圖1a,去重后總計62989個點(人),同一個位置存在較多的用戶ID,且這種現象較普遍,不利于數據的快速處理分析。在點的位置保持不變的情況下按相同坐標進行計數,將數據導入GIS以發現,點的數量降至2936個,人數仍為62989人,即圖1b中的每個點都帶有人員數量屬性,初步呈現了人員活動的“熱點”區域。
在數據預處理中,尚未區分區域內的駐留人員與流動人員,而人員的駐留或流動屬性識別對掌握區域人員構成及其空間分布至關重要。本研究通過構建基于手機信令數據的人員分析模型進行分析,模型以Python語言編程實現,在Anaconda Navigator(Spyder)中進行運算。
根據本研究中手機信令數據的記錄規則與統計分析,若某個用戶的ID一天之內出現的次數大于6次,且在區域內停留的時間超過4h,則將其標記為駐留人員;若出現次數小于6次或在區域內停留的時間小于4h,則將其視為流動人員。若某個用戶的ID僅在7—19點之間出現,出現次數大于6次,且在區域內停留的時間超過4h,則將其標記為白天駐留人員;若僅在7點之前或19點之后出現,出現次數大于6次,且在區域內停留的時間超過4h,則將其視為夜間駐留人員。若某個用戶的ID僅在7—19點之間出現,出現次數小于6次,或在區域內停留的時間小于4h,則將其標記為白天流動人員;若僅在7點之前或19點之后出現,出現次數小于6次,或在區域內停留的時間小于4h,則將其視為夜間流動人員。某個用戶在區域內的最終坐標以該用戶ID出現次數最多的坐標來表示。
PN={PN1,PN2,…,PNn}為用戶ID的集合,其中N={1,2,…,n};Lj={Lj1,Lj2,…,Ljkj}為用戶PNj出現位置坐標集合,其中Kj={1,2,…,kj},j∈N(下同);Tj={Tj1,Tj2,…,Tjhj}為用戶PNj出現時間的集合,其中Hj={1,2,…,hj};Cji為用戶PNj的坐標Lji的出現次數,i∈Kj(下同),那么Cj={Cj1,Cj2,…,Cjkj}為用戶PNj不同坐標出現次數的集合;cj為用戶PNj的出現次數;tj為用戶PNj第一次出現到最后一次出現的時間間隔,以小時為單位;Aj為虛擬變量,表示用戶PNj的身份屬性,0表示流動人員,1表示駐留人員;Bj為虛擬變量,表示用戶PNj是否為白天駐留人員,0為是,1為否。
統計用戶PNj不同坐標的出現次數,由此可知該用戶出現次數為:
(1)
用戶PNj第一次出現到最后一次出現的時間間隔為:
tj=max(Tj)-min(Tj)
(2)
通過cj和tj的值判斷該用戶ID是否為駐留人員,即Aj的值為:
(3)
當Aj=1時:
(4)
某用戶的最終坐標以該用戶ID出現次數最多的坐標來表示,即當Cji=max(Cj)時,此時的坐標Lji便為用戶PNj的坐標。
本文對11月1日每個小時段的人員規模進行統計發現,一天內的區域總人口數量呈現出“平穩降低(0∶00—4∶00)—快速升高(5∶00—8∶00)—平穩升高(9∶00—17∶00)—快速降低(19∶00—23∶00)”的總體趨勢。
0∶00—4∶00時間段的區域內總人數平穩中有所減少,主要是流動人員活動強度逐漸降低的緣故。區域內的工作人員、路過的通勤人員和其他流動人員的增加,5∶00—8∶00時間段的總人數快速增多。而流動人員活動導致區域內人數在9∶00—17∶00時間段平穩增加,17∶00達到最大。18∶00之后,區域內總人數快速降低(圖2)。11月2日—11月30日的人員規模變化趨勢與11月1日相似。

圖2 11月1日分時間段區域總人員規模統計
從一周內相同時間段的平均人員規模變化趨勢看,周五全天的平均總人數較多,17∶00后的增勢尤為明顯,主要由通勤人員、休閑娛樂人員等在內的流動人員活動強度較大所致;周六、周日上午在7∶00—10∶00時間段的平均總人數均較周一至周五少,這是由其區域功能特性決定的;11∶00—14∶00時間段的人員數量基本與周一至周五同時段規模保持齊平,而隨著區域內下午和晚間休閑娛樂人員的快速增加,總人數規模增加明顯,尤其是周六的16∶00之后;周一至周四的區域人口變化情況較相似,其中周二18∶00之后的平均人員規模較其他3天少(圖3)。

圖3 周一至周日相同時間段平均人員規模變化趨勢
人數極值的時空分布分析可幫助了解人員活動的“熱點”與“冷點”地塊,我們對720個時間段的各個地塊人員數量最大值及其出現時間進行統計分析發現,總體上除0∶00、1∶00、6∶00、7∶00以外的所有時間段出現人數最大值地塊的人數低值均較小,同時段的地塊人數高值與人數低值差異較大,變動較劇烈;0∶00—7∶00時間段的人數最大值地塊數量與地塊總人數均較少,表明此時區域內沒有明顯的人員流入;8∶00—19∶00時間段的人數最大值地塊數量、地塊總人數和地塊平均人數均較多,反映出區域內白天的人員活動強度顯著高于夜間。此外,在8∶00和17∶00早晚高峰時段出現人數最大值地塊的人數高值均較鄰近時段大;20∶00—22∶00時間段的最大值地塊數量與地塊總人數不及8∶00—19∶00時間段多,但21∶00后的地塊平均人數有所回升,說明此時有部分地塊(如居住地塊)集聚了一定數量的人員(表1)。

表1 人數最大值地塊的出現時間及相關信息統計
從人數最大值地塊出現的時間段分布統計來看,0∶00—6∶00時間段的人數最大值地塊數量僅占總數的0.68%,而6∶00—18∶00時間段的占比達到了87.91%,18∶00—0∶00時間段的占比為11.41%(圖4)。

圖4 各時間段人數最大值地塊數量及占比
按照周一至周日的日期統計發現,周五出現的人數最大值地塊數量、地塊總人數及地塊平均人數均較多,周三、周二、周四分別次之,周一較少;周六、周日出現的人數最大值地塊數量為32個,但周六的地塊總人數、地塊平均人數較多??傮w上,地塊人數的高值與低值的變動較為劇烈(表2)。

表2 周一至周日人數最大值地塊信息統計
對人數最小值地塊的分析發現,在720個時間段內,最小值為0的地塊有217個,小于10人的地塊有249個,大于10人的地塊有49個;有44個地塊在超過1/2的時間段中最小人數為0,僅有80個地塊在全部時間段均顯示有人員活動。總體上,超過95%的地塊于晚間出現人數最小值,其中在1∶00出現的人數最小值地塊數量最多,為142個,占比達48%;22∶00、2∶00、4∶00、3∶00、0∶00時間段出現的地塊數量分別次之(圖5)。

圖5 人數最小值地塊的出現時間及地塊數量、占比
地塊最大人數分布及最大人數出現的時間見圖6。從圖6可見,天津站及其周邊地區、大王莊地鐵站、十一經路地鐵站至海河之間的區域、小白樓地區、和平路商業街、營口道地鐵站及其周邊地區等片區的地塊人數最大值均較高,屬于人員活動熱點區域(圖6a)。地塊人數最大值出現的時間見圖6,即出現數據極值的具體日期與時間段。
源數據既包含區域內的駐留人員,如工作人員、居住人員等,也有非區域內的通勤人員、休閑人員、旅客等流動人員,且流動人員較多。為掌握駐留、流動人員在區域內的變化趨勢與空間分布情況,運用前文構建的人員分析模型識別人員屬性,結果發現除了11月4日、19日的人員變化較為劇烈以外,駐留、流動人員數量的變化趨勢總體上呈現出以下特征:①不論是在白天還是夜間,駐留人員和流動人員各自的總規模略有變化但相對平緩;②全天的流動人員規模遠大于駐留人員規模;③白天的流動人員規模遠大于夜間流動人員規模;④夜間駐留人員規模大于白天駐留人員規模(圖7)。

圖6 地塊最大人數(a)及最大人數出現時間(b)

圖7 11月1日—11月30日大于/小于4h停留時間人數變化趨勢
本文將模型計算結果導入GIS以分析各個地塊的駐留、流動人員數量,具體包括白天駐留人員、夜間駐留人員、白天流動人員及夜間流動人員,以11月1日的地塊二為例,對應的人數分別為725人、1275人、1103人、545人,說明該地塊在白天的人員流動性較大,而夜間駐留人員數量多于白天,表明可能含有居住建筑。對11月2日—11月30日的數據繼續展開分析,各地塊停留時間大于或小于4h的30天平均人數見表3。

表3 各地塊大于/小于4h停留時間人數統計(30天平均)
在空間分布方面,夜間駐留人員的空間分布差異較白天駐留人員而言更為明顯,總人員規模也較大,多分布于天津站及周邊地區、大王莊地鐵站、十一經路地鐵站至海河之間的區域、營口道地鐵站及其周邊地區等;夜間流動人員的空間分布差異較白天明顯,但流動人員總規模遠不及白天。總體上,區域內全天的駐留人員與流動人員在空間分布上存在著一定的關聯特征,即駐留人員多的地方流動人員也較多,局部地區略有差異,但人員規模差距較大(流動人員多)。對熱點地塊來說,駐留人員與流動人員的規模均普遍較其他地塊大(圖8)。
由于使用電信服務的人員數量在研究區域內的占比未知,已分析的地塊人員規模并不能代表其全部人員數量。結合圖7的分析過程可知,基于電信手機信令數據分析得出的夜間平均駐留人數為24557人,而根據區域內帶戶數信息的小區、公寓、宿舍等居住建筑分布情況的POI數據,估算出夜間總居住人口約263539人。前者與后者的比值即近似為區域內電信服務的市場占比,約為9.32%,將所有日期的白天駐留人員、白天流動人員、夜間駐留人員、夜間流動人員分別按照此比例進行校正,即可得到各自的實際人員規模。

圖8 大于4h(a)與小于4h(b)停留時間人員的總體分布(30天平均)4 結論
基于手機信令數據,運用Python語言編程和GIS對天津市小白樓CBD片區的高精度人口時空分布特征進行了探索,主要結論為:①區域人口規模在研究時段內遵循“平穩降低(0∶00—4∶00)—快速升高(5∶00—8∶00)—平穩升高(9∶00—17∶00)—快速降低(19∶00—23∶00)”的總體變化趨勢。從一周內相同時間段的平均人員規模變化趨勢來看,周一至周四的人口變化情況較相似,其中周二18∶00之后的平均人員規模較其他3天少;周五全天的平均總人數最多,17∶00后的增勢尤為明顯;周六、周日上午在7∶00—10∶00時間段的平均總人數均較周一至周五少,11∶00—14∶00時間段的人員數量基本與周一至周五同時段規模保持一致,而下午和晚間總人數規模增加明顯,尤其是周六的16∶00之后。②在720個時間段內,于6∶00—18∶00時間段出現人數最大值地塊的數量占比達到了87.91%,空間上主要分布于天津站及其周邊地區、大王莊地鐵站、十一經路地鐵站至海河之間的區域、小白樓地區、和平路商業街、營口道地鐵站及其周邊地區等片區。同時,該時段的地塊平均人數較多,反映出區域內白天的人員活動強度明顯高于夜間。此外,在8∶00和17∶00早晚高峰時段出現人數最大值地塊的人數高值均較鄰近時段大??傮w上,周五出現的人數最大值地塊數量、地塊總人數及地塊平均人數均較多,周三、周二、周四分別次之。對人數最小值地塊的分析發現,有44個地塊在超過1/2的時間段中最小人數為0,僅有80個地塊在全部時間段均顯示有人員活動。在時間分布方面,超過95%的地塊于晚間出現人數最小值,其中在1∶00出現的人數最小值地塊數量最多。③駐留與流動人員數量的變化趨勢呈現出各自在白天和夜間的總規模略有變化但相對較為平緩,全天的流動人員規模遠大于駐留人員規模,白天的流動人員規模遠大于夜間流動人員規模,夜間駐留人員規模大于白天駐留人員規模等顯著特征。在空間分布方面,區域內全天的駐留人員與流動人員存在著一定的關聯特征,即駐留人員多的地方流動人員也較多,局部地區略有差異。夜間駐留人員多分布于天津站及其周邊地區、大王莊地鐵站、十一經路地鐵站至海河之間的區域、營口道地鐵站及其周邊地區等,空間分布差異較白天駐留人員而言更為明顯,人員規模也較大;夜間流動人員的空間分布差異也較白天明顯,但總規模遠不及白天。