段艷慧 郭 偉 趙學勝 張曉瑩 張冰瑞
(中國礦業大學(北京) 地球科學與測繪工程學院, 北京 100083)
人口數據是最為重要的基礎地理數據之一,對于國家和地區的相關情況調查、人口狀況、管理以及制定各項方針政策等都具有重要的意義,而精細化的人口分布是當前人口地理學研究的熱點和難點。人口分布分散,具有動態特征,不同的人口密度對自然資源和環境條件的影響也不同,因此,為了更好地應對我國城鎮化發展所面臨的各種環境與資源問題,有必要及時、快速地生成人口密度空間分布結果。傳統的人口密度計算方法是根據人口普查數據進行計算,但計算時間長、成本高、更新困難。此外,用于公共用途的人口普查數據難以準確、真實地反映人口在空間上的分布規律,中國的縣級人口普查數據對于城市規劃和管理等方面來說不夠細致,難以滿足城市規劃和發展的需要。
在過去的幾十年里,許多學者探究了利用不同的遙感和輔助數據估算人口的方法。這些研究多針對現有的土地利用數據,而并非所有土地利用類型均有人口分布,例如,水體、耕地、森林等。在土地利用數據中,不透水面(impervious surface area, ISA)是城市中人類活動的主要場所,研究表明,利用ISA可以進行人口估計。同時,利用Landsat影像可以準確地估計ISA。而由于縣級尺度的人口普查數據過于粗糙,需要像元尺度的更詳細的人口密度數據。但在小尺度上進行的研究很少,在小尺度上快速而準確地估計人口密度的過程尚不為人知。目前尚缺乏繪制人口密度分布圖的合適技術或方法。因此,本文試圖通過區(縣)尺度上的人口密度與遙感影像獲取的ISA數據之間的關系來繪制30 m像元尺度上的人口密度分布圖。
本文選取北京市為研究區,開展基于Landsat遙感影像的人口密度研究。北京(Beijing)位于中國華北平原北部,背靠燕山,毗鄰天津市和河北省,是中華人民共和國首都、直轄市、國家中心城市、超大城市,全國政治中心、文化中心、國際交往中心、科技創新中心。北京位于115.7 °~117.4 °E,39.4 °~41.6 °N。截至2020年,全市下轄16個區,總面積16 410.54 km,常住人口2 189.31萬人。北京市經濟發展水平較高,人口較為集中分布,路網分布密集,是城市化發展高水平的代表城市之一。
本研究采用美國陸地衛星計劃(Landsat)的第八顆衛星(Landsat8)、開源地圖(open street map,OSM)、可見光紅外成像輻射儀(visible infrared imaging radiometer,VIIRS)-日夜波段(day/night band,DNB)夜間燈光數據、第七次人口普查數據(含鄉鎮街道級別)、Worldpop數據以及行政邊界數據。由于使用的數據源不同,因此,首先要對所有的數據進行重投影以保持各數據之間的一致性。采用線性光譜混合分析法(linear spectral mixture analysis,LSMA)對Landsat8影像進行處理繪制北京市ISA分布。Worldpop數據作為已有人口密度數據用來對本文方法所作結果進行對比分析。
人口普查數據來自北京市第七次全國人口普查公報(第二號)(北京市統計局)。全市16個區中,常住人口在200萬人以上的區有4個,分別是朝陽區、海淀區、昌平區和豐臺區;在100萬人~200萬人之間的區有5個,分別是大興區、通州區、順義區、房山區和西城區;在100萬人以下的區有7個,分別是東城區、石景山區、密云區、平谷區、懷柔區、門頭溝區和延慶區。
利用Landsat8影像與北京市2020年人口普查數據繪制人口密度的基本流程如圖1所示。

注:①迭代自組織數據分析算法(iterative selforganizing data analysis,ISODATA)。圖1 基于Landsat8與普查數據的人口密度流程圖
為了使用LSMA方法有效地處理圖像,選擇合適的端元是至關重要的。由于影像3、4、5波段基本涵蓋所有的地類信息,所以在從Landsat多光譜波段提取3個組分的散點圖時,從中選擇3個具有代表性的端元高反照率目標、低反照率目標和植被。然后利用混合像元分解的方法將Landsat8多光譜圖像分解為三分體圖像。
由于ISA主要存在于高反照率目標和低反照率目標的圖像中,因此,去除該圖像中的非不透水面區域至關重要。以往的研究表明,歸一化水體指數(normalized difference water index, NDWI)在從其他土地覆蓋類型中分離出水體是有效的,因此,可以利用歸一化水體指數來去除水體。由于初步ISA結果可能與其他土地覆蓋類型相混淆,因此除水體外,需要進行圖像后處理來進一步去除圖像中的非不透水面區域。
利用谷歌地球的高空間分辨率圖像對提取的ISA進行精度驗證,采用隨機抽樣的方法選擇驗證樣本,共選取600個樣本,其中包含400個非ISA樣本和200個ISA樣本。采用誤差矩陣來評估ISA精度,從誤差矩陣中計算生產者精度、用戶精度和總體精度。
由于在城市的發展建設中,道路、廣場、停車場、機場等地越來越發達,此類設施屬于不透水面但并非居住區,因此,為了更加準確地對人口進行估計,需剔除不透水面中的非居民居住區域。OSM旨在為用戶提供免費且易于訪問的數字地圖資源,是現階段最受歡迎的自發地理信息數據,這類數據與傳統的地理空間數據相比,具有豐富、實時、更新速度快等優勢。因此,本文利用OSM數據對非居民區進行剔除。
R
)確定行政區尺度上人口密度估計的最佳估計模型。從2020年人口普查數據中可得北京市街道級別的人口數,北京市共有337個街道,隨機抽取200個街道進行驗證并繪制殘差圖像。
區尺度的人口密度分布只是行政單位的平均值,沒有考慮不同的土地利用/覆蓋類型;因此,這種分布不能準確地表示人口密度分布的空間格局。我們可以假設人口只分布在ISA存在的地方,而沒有人口出現在其他土地使用類型,如森林、農業用地和水體等。因此,像元大小處的人口密度可以表示為

(1)
其中,D
為像元處的人口密度;D
為行政區的人口密度;A
為行政區面積;f
為像元處的不透水面值;n
為該行政區內的ISA像元個數,非ISA的像元值為0。要建立基于ISA的人口密度估計模型,關鍵的一步是對ISA數據進行準確地提取。對ISA的精度評估結果如表1所示,北京市ISA精度的生產者精度和用戶精度分別為90.05%和86%,總體精度為92.17%。該研究進一步證實了基于LSMA的方法可以有效地從landsat8影像中提取ISA。

表1 ISA精度評定結果
北京市下轄16區,總面積為16 410.54 km,根據2020年全國第七次人口普查數據,北京市總人口為21 893 095人。北京市行政區劃人口密度為行政區總人數除以行政區面積,結果如圖2所示,可以看出北京市中心城區的人口密度大,圍繞中心呈發散狀,距離中心城區越遠,人口密度越小,西部和北部多為山區,人口密度最小。但由于該方法所得單位面積人口呈均勻分布,在山體、水體或森林等無人居住的地區也存在人口分布情況,因此,需要基于不透水面的像元尺度的人口密度圖來解決這一問題。

圖2 北京市行政區人口密度[審圖號:GS(2019)3333號]
3.3.1
30
m
像元的人口密度模型建立由于行政區人口密度并未考慮人口與ISA之間的關系,為了進行更小尺度的人口密度圖繪制,需要建立人口與ISA之間關系的模型。將人口密度與ISA密度之間進行線性和非線性回歸分析。圖3展示了人口密度與ISA密度的散點圖,表明它們之間的關系可以用指數式(2)表示。

(2)
其中,D
為人口密度;D
為ISA密度。決定系數R
=0.
941 4,表明在行政區尺度上人口密度估計效果較好。
圖3 人口密度與不透水面密度關系
利用模型反算行政區劃人口密度,并根據式(2)進行30 m像元大小的人口密度的計算,結果如圖4(b)所示,圖4(a)為基于原始ISA生成的人口密度,可以看出,剔除掉非居民區后的人口密度較之前的圖像降低了人口密度低估的問題,更加貼近實際情況。圖5為北京市Worldpop人口密度數據,放大后可以看出,其人口分布沿道路擴散,且道路上人口密度最大,而道路明顯不屬于居民地,圖6則為最終北京市30 m像元人口密度及局部放大圖,相比目前已有的Worldpop人口密度數據更加精確和細致。其中,核心城區(東、西城區)91%的人口分布在20人以上的像元中,最大可達每像元36人,而密云、懷柔、門頭溝和延慶地區每像元的人口均低于20人。該結果與行政區人口密度結果大體相似,依然顯示北京市中心城區人口密度大,西、北部山區地區人口密度小。但相比行政區尺度的人口密度圖,該圖可以顯示更多的空間細節,而且彌補了人口出現在無人居住區的不足,更加符合實際人口居住情況。

(a)原始ISA生成的人口密度

(b)居民區ISA生成的人口密度


圖5 北京市Worldpop人口密度數據


圖6 北京市30 m像元人口密度圖
3.3.2
30
m
像元的人口密度模型驗證建立人口密度與ISA密度之間的模型后,需驗證該模型是否可用。利用北京市第七次人口普查鄉鎮街道級數據對該模型進行驗證,得出估計人口與參考人口之間的關系如圖7所示,表明了良好的線性關系,說明所建立的人口密度與ISA密度之間的模型可用。估計人口殘差如圖8所示。

圖7 估計人口與參考人口關系

圖8 估計人口殘差
本研究基于北京市行政區人口密度與不透水面密度數據之間的關系,為30 m像元尺度上的人口密度分布圖提供了一種新的方法,首先,利用Landsat8遙感影像提取北京市不透水面并驗證其精度。其次,建立行政區人口密度與不透水面密度之間的關系。最后,假設人口只存在于不透水面地區,并用OSM數據剔除道路、停車場等非居民區,將人口數據反算到30 m像元尺度,實現人口密度空間化制圖。該方法為人口密度分布的空間格局提供了豐富的信息,具有利用遙感數據快速更新人口密度的潛力,對沒有普查數據的發展中國家尤其有價值。但在實際發展中,建筑高度是影響人口密度估算的一個重要因素,因此,需要進行更多的研究,將土地利用類型和建筑物高度納入遙感數據,以便建立更為完善的人口密度估計模型。