胡茂川,張龍海,劉丙軍,楊 輝,王寶華,楊 芳
(1. 水利部珠江河口治理與保護重點實驗室,廣州 510610;2. 中山大學 土木工程學院,廣州 510275;3. 廣州市水務規劃勘測設計研究院有限公司,廣州 510641;4.珠江水利科學研究院,廣州 510610)
當前全球氣候變暖問題不斷加劇,加上快速城市化導致下墊面和局部氣候的改變,極端天氣事件的發生頻次與強度呈現逐漸上升趨勢,使得中國內澇災害問題愈發嚴重[1-3]。廣州市作為粵港澳大灣區的城市之一,內澇頻發,且強度呈上升趨勢[4-5]。常態化的內澇問題對廣州市的正常運行以及公共安全造成了巨大影響,經濟發展也受到了威脅。如2020年5月22日,特大暴雨發生導致廣州市區內多處產生積水,道路橋梁、地鐵站等處受災嚴重,交通受到嚴重阻礙[6]。因此,深入了解廣州市近些年的內澇時空分布,對于廣州市防災減災管理具有重要意義。
城市內澇信息獲取方式眾多,如遙感監測、災后調查、社交媒體等[7-9]。其中,社交媒體數據由于來源廣泛、獲取成本低,近年來在災害防治中受到廣泛的關注。已有研究表明通過探索數據分析方法和空間單元,大規模的社交媒體數據在反映自然災害發生時間和地點上,取得了良好的進展和應用[10-12].李想[13]使用聚類法處理社交媒體數據中的災害信息,并將地址信息經緯度化,對現有的災情地點數據庫進行補充完善。Nikita等[14]對Twitter中的災害信息進行數據挖掘,利用話題標簽實現了快速分類聚集并估計了災害影響區域。
社交媒體種類豐富,其中新浪微博在國內具有最廣泛的用戶基礎。據統計,截止2021年第三季度,微博月活躍人數達到了5.73億,其中94%為移動端,日活躍人數達到了2.48億。微博中包含有發布時間、地理定位等記錄災害信息的各類數據[15]。王波等[16]基于微博簽到數據構建公眾感知指數和公眾情緒指數,從時間、空間兩個維度分析居民對暴雨洪澇響應的時空格局。肖楊[17]基于微博文本來判別暴雨內澇災情,并將機器學習算法應用于輿情分析中,為相關應急管理部門的災害預警提供了一定的參考。
當前,社交媒體數據在城市內澇災害中的應用尚不多見,且面向單次災害事件[18-20],針對同類災害的歷史發生規律分析的研究較為少見。伍智超等[21]利用微博數據統計分析了武漢市2015—2019年內澇時空分布特征。在內澇問題嚴重的粵港澳大灣區尚未有相關研究。本文在分析廣州市暴雨時空分布特征的基礎上,爬取2017—2021年的微博數據中廣州市內澇相關信息,從內澇的空間變化情況、時間變化情況以及在不同行政區的內澇情形差異等方面對廣州市近年的內澇形勢進行分析,并探討了其對暴雨的響應情況,為廣州市內澇防治工作提供參考。
降雨數據來源于廣東省水利廳汛情發布系統,包括2017—2021年廣州市245個站點的場次降雨數據。由于站點分布較均勻且流域內地形起伏變化不大,本文基于各站點的場次降雨數據,通過算術平均法得到廣州市行政區劃內各區的場次面雨量,分析廣州市各區的暴雨分布特征,并將24 h累計面雨量超過50 mm的雨量時間作為微博內澇相關信息爬取的時間邊界條件。
目前獲取微博數據的途徑主要有3種:① 微博API(Application Programming Interface);② 第三方爬蟲軟件;③ 網絡爬蟲技術。為使數據獲取流程具有更高的目的性和指向性,提高研究系統性和高效性,本研究開發了基于XPath路徑語言的python網絡爬蟲程序,該程序主要包括:① 登錄微博,獲取cookie;② Requests庫收集、解析微博頁面源代碼;③ 根據關鍵詞(見表1)與時間篩選出符合條件的微博文本和簽到數據。內澇關鍵詞的選取主要參考了王藎梓[22]的相關文獻,具體詳見表1。時間上設定為歷史場次暴雨發生的時間段。

表1 內澇關鍵詞
本研究收集了廣州市2017—2021年發生的場次暴雨對應的內澇簽到數據(包含文本信息、用戶打卡點、時間),由于微博爬取的數據較為復雜,對爬取的簽到數據進行了以下處理:
(1) 由于得到的數據包含了其他省份的簽到數據,故需要研究區以外的數據進行剔除,這一部分主要是通過Matlab編程進行識別篩選;
(2) 通過人工判讀去除文本內容與內澇無關對應的簽到數據,比如“選擇來這家公司,我真是腦子進水了。”“家里管道爆了,衛生間和客廳被水淹了”等。將處理后微博數據通過百度地圖API確定其空間位置。
2017—2021年廣州市發生了31場24 h雨量大于50 mm的暴雨事件,其中19場24 h雨量大于100 mm。暴雨發生最多的是2018年,共發生了9場暴雨事件,最大為281.2 mm(發生于2018年6月8日);2017年緊隨其后,發生了8場暴雨事件,相比于2018年,2017年的最大暴雨量均較小;2019和2021年的暴雨事件數量上較接近,有5場左右;2020年暴雨事件最少,只有3場。從場次暴雨對應的月份來看,廣州市暴雨事件多發于5、6月份,其次是7月和8月,最后才是9月。
2017—2021年廣州市各區發生的暴雨次數如圖1所示。白云區發生的暴雨次數最多(27次);其次是荔灣區,暴雨次數為26次;在其后的是從化區、花都區、海珠區、黃埔區和番禺區,均在5 a間發生了20場暴雨左右;相較而言,天河區、南沙區、增城區和越秀區發生暴雨的次數較少,均在15次左右。從發生次數在各區的分布來看,暴雨在廣州北部及中部兩側區域發生較多。

圖1 2017—2021年廣州市各區暴雨發生次數
各區的最大暴雨量分布如圖2所示。從化區在這5 a間的最大暴雨量是各區中最大的,達到281.2 mm。緊隨其后的是黃埔區與花都區,其最大暴雨量都達到了220 mm以上;其次是白云區和荔灣區,最大暴雨量為175 mm左右;增城區、越秀區、海珠區、天河區和番禺區最大場次暴雨量均比較接近,在155 mm左右;較其他區而言,南沙區的最大暴雨量最小,只有123.8 mm。總的來說,最大場次暴雨量的分布呈現從北向南遞減的態勢。

圖2 2017—2021年廣州市各區最大場次暴雨量
2017—2021年廣州市內澇數分布如圖3所示。2018年廣州市內澇最為嚴重(259次),其次是2019年(125次)、2020年(122次),最后是2021年(74次)和2017年(63次)。月尺度上,廣州市內澇主要發生于5月和6月(見圖4),其中,2018年6月內澇數接近150次,這主要與2018年臺風艾尼云在廣州引發的強降雨事件相關。

圖3 2017—2021年基于微博爬取的廣州市內澇數

圖4 2017—2021年各月基于微博爬取的廣州市內澇數
廣州市2017—2021年內澇點空間分布如圖5所示。近5 a廣州市內澇主要出現于白云區、越秀區、海珠區、天河區。緊鄰這些區域的番禺區、黃埔區、增城區、荔灣區也有一些澇點,其余各區在這五年間內澇發生數相對較少。廣州市內澇主要發生于主城區,內澇影響程度以其為中心四周擴散有所減弱的態勢。

圖5 2017—2021年廣州市內澇點分布情況
整體而言,廣州市轄區的內澇年際變化情況與廣州市整體變化情況不完全一致,廣州市內澇時空分布差異與各區降雨、下墊面、高程和排水系統等差異有關。2018年廣州內澇最為嚴重,但對于黃埔區、增城區和從化區而言,其內澇數并不是5 a中最多的。這與2018年廣州市的內澇主要成因是強臺風引發的風暴潮增水災害相關,從化和增城因地理位置關系,受風暴潮影響相對較小。2020年黃埔區、增城區內澇發生數是該區5 a中最多的。2020年“5·22”廣州特大暴雨,黃埔區降雨量達到了176.2 mm,增城區降雨量達到了155.4 mm,位于所有區中的前兩位,其中增城區也是該次暴雨事件的重災區。
從圖1和圖5可知,內澇空間分布與暴雨次數空間分布總體上一致,近5 a廣州市內澇發生次數年變化與暴雨次數的年分布也較為一致。2018年廣州市內澇發生次數最多,2018年廣州市暴雨次數和最大雨量也是近5 a中最多的。城市內澇發生最直接影響因素之一就是極端暴雨,通過微博獲取的內澇時空分布與暴雨時空分布總體一致,可以反映出微博內澇信息具有一定的精度和可行度。
從圖5可知,廣州市內澇多集中于越秀、海珠、天河及白云區左下部等主城區域。Zhang等[23]通過對來自廣州市水務局防汛抗旱中心的廣州歷史澇點數據分析也得出了類似結論。可見,基于微博獲取的內澇信息具有較高的可信度。王藎梓[22]對比基于微博獲取的內澇信息和上海市歷史澇情,證明微博內澇信息可覆蓋和補充官方觀測數據,具有較高的精度。本研究中由于缺少詳細的歷史澇點數據,微博內澇信息的精度仍需進一步的驗證。
雖然廣州市內澇時空分布總體上與暴雨時空分布一致,但兩者并不完全相同。部分市轄區如從化區和花都區近5 a內的暴雨次數和最大暴雨量都相對較大,但微博內澇簽到數并不多,而有些區如天河區的暴雨次數和最大暴雨量相對其他區較少但提取出的內澇相關微博簽到數卻很多。這一現象的產生與各區的城市化程度、排水管網以及人口分布均有關系。如天河區人口密度較大,微博活躍人數多,內澇發生時發博數可能會更多,并且由于城市化程度較高,不透水面積大加上排水管網失修損害等也會加劇內澇災害的發生,就算是暴雨量較小也可能會發生較嚴重的內澇,同時這個區域離珠江河口近,易受風暴潮和天文大潮影響;而花都區和從化區的人口密度和城市化程度較低,再加上地勢較高,雖然雨量很大,但內澇的發生數和相關微博簽到數可能較少。
本研究在利用廣州歷史降雨站點數據計算各行政區面降雨量的基礎上,分析了2017—2021年廣州市暴雨時空特征,之后利用python爬蟲程序從微博數據中爬取了廣州市2017—2021年的微博內澇簽到數據,經過去噪后,基于百度地圖API進行空間定位,分析近5 a廣州市內澇時空分布情況,形成結論如下:
(1) 微博簽到數據能較為直觀地展示廣州內澇分布情況,具有較高的可信度。
(2) 內澇主要出現于越秀區、荔灣區、海珠區和天河區,其次是白云區、番禺區、黃埔區。
(3) 2018年廣州市受內澇影響最大,其次為2020、2019年和2021年,而2017年相對受影響最小。
(4) 月尺度上,廣州內澇多發生于5月和6月。
(5) 廣州市轄區的內澇年際變化情況與廣州市整體變化情況不完全一致。
(6) 受城市化、排水能力、人口及潮位等因素影響,廣州市內澇時空分布總體上與暴雨時空分布一致,但不完全相同。
本研究還存在一些不足和改進之處,如:微博數據受人口密度影響較大,人口分布較少的區域信息相對較少;由于微博數據對于地名描述較為模糊,借用百度地圖API進行空間定位會產生一定的誤差,微博反爬限制也可能會導致部分內澇信息缺失等。本次研究主要是基于微博數據對內澇進行定性的分析,而定量(水位、水量)信息對于未來內澇的趨勢分析與評價更為重要,后續可通過文本信息提取來進行一些定量分析以提高可信度。