楊永崇,柳 瑩,李 梁
(1. 西安科技大學測繪科學與技術學院,陜西 西安 710054; 2. 西安市交通規劃設計研究院,陜西 西安 710082)
20世紀末中國城鎮每百戶自行車擁有量達180輛,之后的10多年中市民出行方式發生了翻天覆地的變化。軌道交通、公共汽車與私家車逐步代替自行車成為城市居民出行的主要交通方式,與此同時非機動車道規劃也逐漸跟不上飛速建設的城市路網。在“創新、協調、綠色、開放、共享”的發展理念下,一方面共享單車以驚人的速度在城市中崛起,補充了傳統城市交通方式,并在覆蓋公交盲區、強化軌道交通優勢、解決最后一千米及完善城市微循環中發揮了積極的作用[1];而另一方面運營公司對共享單車的飽和式投放、綠色出行的爆發式增長、市民騎行的離散式停靠與建設不周的城市道路格局發生矛盾,政府的規劃不足與企業的管理缺失等因素使共享單車的綠色出行存在各種隱患。
荷蘭是最早開始重視非機動車道路設施規劃的國家,1890年建設世界上第一條自行車專行道,之后不斷拓展完善,交通部對自行車專行道的修建制定了統一的標準,并鼓勵各種交通工具與自行車交通銜接[2]。1980年日本建設省以神奈川縣為試點開展共享單車業務,在神奈川縣平塚站與縣區設計了“車站—目的地—車站”軌跡方便人們出行,是世界上第一個基于共享單車的集約規劃解決方案[3]。2008年以后隨著有樁共享單車在全世界普及,越來越多的學者利用共享單車綁定GPS數據,分析數據蹤跡,研究城市居民單車出行的日常慣例、文化影響、交通汛期動態特征[4],以及站在運營管理角度提出合理分配意見[5-7]。盡管如此,針對居民出行時空行為特征角度的探討規劃與引導無樁共享單車的研究少之又少,因此本文利用共享單車大數據,彌補傳統研究方法中數據滯后和準確性不足的缺點,開展共享單車用戶騎行規律的研究,有利于在存量規劃的背景下,從動態發展的角度考慮城市綠色交通空間布局,基于需求的視角去更好地推進非機動車道路規劃的合理化與高級化。
西安地處關中平原中部,市區內地勢平坦,道路林蔭,文化古跡眾多。道路網繼承了唐代棋盤式的路網布局,是國內為數不多的騎行友好(bike-friendly)指數較高的城市之一。西安擁有眾多高校,以學生為代表的年輕力量驅使西安的共享單車推廣熱度位居前列。因此共享單車使用規范化迫在眉睫,已經成為主要的城市問題。在人本主義及后現代思潮影響下,城市問題的解決宗旨都離不開城市中“人”的社會行為特征分析[8]。隨著信息技術的發展,各種新的數據類型和來源也大大擴展了城市規劃的數據視野,我們能獲取大量具有位置信息的動態數據,使用新的處理模式洞察這些海量、高增長、多樣化的數據早已廣泛使用在各領域的研究管理中[9],為科學規劃提供了新的工具與方法,使用大數據進行城市道路規劃也是一次新的嘗試。
城市人口活動相關數據獲取的傳統方法是使用問卷調查、跟蹤調查或訪談等統計學的抽樣原理得到有限的隨機樣本,再使用隨機樣本的分析結果代表總體特征。但這種方法樣本的隨機性難以保證,也因此從根本上動搖了總體特征分析的合理性與可靠性;另外使用隨機樣本的方法也只是在不可能收集所有數據信息的情況下做出的一種現實選擇[10]。網絡數據挖掘技術的發展為騎行特征研究提供了新的思路,本文使用Python語言編寫循環語句,將瀏覽器頭部偽裝成手機瀏覽器,通過共享單車APP接口,抓取整個西安市的ofo單車位置數據;然后利用ignore語句對所有記錄去重、存儲、導出;最終得到全天候全天時、涵蓋了西安市三環以內大約23萬輛ofo共享單車的位置數據,可視化效果如圖1所示。這些數據基于市民自發的騎行行為,可以科學、客觀地反映城市騎行特征。
另外,大數據分析離不開公共基礎數據的支持,包括:①城市建筑物輪廓數據,來源于城市航拍的正射影像;②城市道路網數據、城市軌道交通數據,來源于剛更新的西安市交路矢量圖;③谷歌地圖網站下載的2.3 m分辨率的含有POI信息的城市混合遙感影像。

圖1 9月20日8時西安市ofo單車位置分布
首先,通過將CSV數據的坐標點依據經緯度導入ArsGIS分析平臺,與西安市行政區圖疊加,刪除三環以外的數據。然后,導出SHP數據并建立屬性字段name、lng、lat和Z字段,其中Z字段為個體值為“1”的短整型字段,其目的是方便后期的定量密度分析。最后,導入建筑物輪廓數據、影像數據及路網數據,并進行坐標糾正及整合。路網數據是在個人地理數據庫環境下構建網絡數據集,并使用網絡分析工具進行路網聯通性檢查。
在行為特征問題上比較常用的研究方法是密度分析法[11]、聚類分析法[12]、距離或可達性分析法[13-14]。本次研究使用大量的點數據,通過點密度準確衡量共享單車使用熱點,將不同等級熱點活躍范圍的值匹配進路網數據,最后使用貪心算法[15]即以熱點為中心、路網為載體,根據等級擴散提取騎行熱點路段。具體技術路線如圖2所示。
大數據空間分析的熱點分析或密度分析在可視化效果中常使用熱力圖、矩形(六邊形)格網專題圖來表示,而軌跡重建或OD分析一般用連線圖進行表達。因此在數據挖掘與規劃實現部分,ArsGIS平臺的空間分析與數據管理、數據轉換工具集是本試驗的操作關鍵。本試驗的創新點在于使用格網對用車密度進行統計獲取熱力圖,以及使用貪心算法改進路徑緩沖原理提取熱點路段。
將相鄰時刻的兩個數據相互擦除得到時間段內活躍單車分布,進行熱點分析。利用0—24:00的共享單車位置數據,對單日活動強度動態特征變化進行統計,如圖3所示。6:00—10:00為早高峰時段,12:00—13:00的午休時段有較小的漲幅,17:00以后逐漸進入晚高峰,受城市夜生活的影響,用車高峰從夜間22:00開始回落。整體來看,共享單車活動特征隨時間規律變化,具有明顯的早晚高峰,與城市人口的日常作息規律呈正相關。這說明,一方面傳統的作息規律仍然支配著居民的日常活動,時間與活動內容間的對應關系仍然存在;同時共享單車大數據與居民行為的對應關系,從而為后續研究提供依據。

圖2 技術路線

圖3 共享單車日活動強度動態特征變化折線
圖中1:00—2:00、4:00—5:00單車出發、到達數量存在明顯不一致,因此對1:00—2:00單車出發數據與單車到達數據依據單車編號進行屬性的配對工作,發現大量單車信息無法配對,因此推測在這一時段,ofo共享單車公司對共享單車進行故障自行車的收納與新車的投放調度工作,對這一猜想需要后期試驗進行OD線路提取模型來加以驗證。
熱力圖是一種基于密度換算的可視化表達,不同時段的單車活躍程度需通過密度分析運算結果。以9月20日7:00—8:00活躍單車數據為例,傳統的核密度分析工具得到的單車活躍熱力圖的表達值都是相對的、無定量的極大或極小值(如圖4所示),且不便于后續試驗的精確統計與再分析。因此,本次熱點提取利用柵格數據特殊的格網屬性,計算出不同地區的活躍單車密度。數據預處理時添加的Z字段代表每一個單車的值,使用點轉柵格工具,選取SUM像元分配類型,得到以格網為定量的單車活躍熱力圖(如圖5所示),正方形格網邊長為80 m,滿足城市規劃尺度。上述方法不僅能得到精確的結果,而且能對各時段的數據進行統計,以方便后續分析。

圖4 基于核密度算法單車熱力圖
利用上述方法對全天時內出發、到達的48組數據進行熱力分析,定義單位像元面積內活躍單車數大于100為高熱度區域。將其轉換為點數據并進行整合,提取出全天候單車活躍熱點分布圖。結合時間尺度可以看出,共享單車出發、到達的集中時間為凌晨、早晚高峰與午休時間。
熱點提取之后就可以基于OD線段的放射、吸收模型匹配進行分類與驗證。OD線段數據來源于單位時間段內同名出發、到達單車點的連線。考慮到單車可能被利用多次,但在短時間內仍然可以作為活動趨勢的判定。提取的OD連線數據量大、重疊度高,無法進行清晰直觀的觀察,就需要對海量線段進行基于熱點范圍的提取。通過將全天出發、到達熱點區域的出發、到達點數據與其時段內的OD連線進行匹配,提取全天熱點區域放射、吸收模型圖,有利于更科學地判斷騎行熱點的形成與特征。熱點地區放射吸收模型分為3種表現方式,行為聚集型、運輸位移型與內部流動型(如圖6所示),所有模型信息見表1。

圖6 不同類型的聚集模型

類型地區分類聚集/擴散規模運輸位移型京昆高速漢城服務區物流出發西安華晨物流有限公司物流出發/到達普洛斯物流中心物流出發/到達永松路公交站住宅出發/到達西大新村住宅出發/到達行為聚集型丈八北路地鐵站交通出發/到達西安文理學院北門學校/住宅出發電子正街中段住宅出發西安軟件園寫字樓出發高新九號寫字樓出發/到達龍首原地鐵站交通出發/到達魚化寨地鐵站交通到達西北工業大學研究生院北門學校到達吉祥村地鐵站交通到達大明宮西地鐵站交通到達高新六路中段寫字樓到達勞動路地鐵站交通出發/到達內部流動型西安交通大學思源閣食堂學校到達西北工業大學勇字樓學校到達西北工業大學西門學校到達
騎行時空特征是共享單車騎行特點的全面反映,也是非機動車道路設施規劃的重要依據。通過分析結果結合實際,不考慮ofo公司對共享單車的運輸行為及單位內部用車行為,對其他數據進行分析。6個用車熱點分布在地鐵站,地鐵站成為早晚高峰時段共享單車聚集點,這種現象在一定程度上反映了兩種交通方式的優化搭配原則,也是軌道站點的交通一體化規劃設計的重要依據。另外,永松路周邊的市政府小區、崇德坊社區等住宅聚集區、電子正街中段北山門住宅聚集區、西北大學新村成為共享單車調度運輸目的地、早高峰出發地,反映出綠色出行模式早已廣泛普及,共享單車成功地解決了居民出行的“最后一千米”問題。寫字樓、高校附近共享單車的聚集說明年輕群體是共享單車用戶的主力軍。此外,令人期待的西安城墻內部的市中心區域騎行的空間聚集效應無明顯特征,商業與住宅區域的錯綜復雜關系、老城區功能區聚類程度低等因素是解釋這一現象的重要依據。
通過對2017年9月20日每個時段的共享單車變化進行空間可視化分析,得到20個用車熱點,對這些熱點再分析后利用可視化模型進行分類。行為聚集型是市民自發的騎行行為在早晚高峰、午休等時段的聚集效應;運輸位移型是共享單車公司人為地對共享單車進行調度、運輸,這種類型的最大特點就是聚集點缺少OD線段的匹配;內部流動型是指在學校內,校內人員對共享單車具有規律性的使用情況,如午飯時間校內單車向食堂聚集,下課時間向校門口聚集取快遞的行為。城市非機動車用車熱點路段提取顯然需要依據行為聚集型模型進行分析,因此對騎行熱點路段的提取就要圍繞行為聚集型熱點展開[16]。
基于大數據研究全天候的OD線狀模型數據量大、重疊度高,無法進行分析與總結,在此利用核密度算法對OD線狀模型分布特征進行提取分析[17]。具體思想是借助一個移動窗口,計算并輸出每個柵格單元的OD線密度。設x1,x2,…,xn是從分布密度函數為f的總體中抽取的獨立分布樣本,估計f在某點x處的值f(x)[13]如下
式中,k( )為核函數;h>0,為帶寬;x-xi為估計點到樣本xi處的距離,完成的密度范圍在0~83 207.570 31之間。采用Jenks提出的自然間斷點分級法[18]將密度值分為7個等級后對結果進行重分類,并將結果轉換為矢量面數據與路網數據進行疊加求交集,這種方法可以將密度值轉為擴散強度(φ)定義在路網數據屬性內(見表2),進行貪心算法分析。參照其他城市共享單車騎行數據統計,從騎行距離來看,平均單次騎行距離約1.69 km,70%以上都在2 km以內[19]。因此,定義的φ值來源于共享單車的騎行平均距離與距離累計百分比大于70%的騎行距離范圍,即1.69~2 km之間,如圖7所示,并定義緊鄰熱點的一級范圍區域在150~300 m之內,作為規劃單車停放路段。

圖7 騎行距離分布
最后選取行為聚集型用車熱點放置網絡算法的目標點,進行貪心算法從而提取用車熱點路段。貪心算法又稱貪婪算法,在對問題求解時,總是做出在當前某種意義上的局部最優解,背包問題、Dijkstra算法都是貪心算法的經典案例。提取熱點路段的第一步是基于目標點的網絡緩沖分析,設道路網G=(V,E),它采用鄰接矩陣作為存儲結構,網結點i和j之間有直接邊,設其權值為Wij,并建立一個一維數組S,標記已經找到的最短路徑頂點。其中
S[i]=

表2 自然間斷點分級結果
計算定級因子最短路徑的距離時,權值Wij為網結點i和網結點j之間的直線距離,最短路徑的距離為其上各邊Wij的和。初始狀態時,S[0]=1,對于其余的網結點Vj(Vj=V0),有S[j]=0;設置另一個一維數組distance存放源網結點到其余源網結點的當前最短路徑長度,distance[i]=cost[orginal(V0),i][20]。利用上述過程重復執行n-1步就能得到按路徑長度遞增的順序求源網結點到其余各網結點的最短路徑。隨后依次連接網結點形成基于路徑緩沖的面數據。最后通過緩沖面數據提取熱點道路。依據不同φ值重復以上方法兩次,得到共享單車用車熱點一級、二級范圍,如圖8所示。

圖8 西安城區用車熱點路段提取
非機動車道路設施規劃的重點就是熱點區域單車的停放與市民騎行的體驗指數。本文利用大數據挖掘與利用、GIS分析方法提取了西安市用車熱點路段并且基于時間比例尺,最終合成西安城區用車熱點路段圖[21]。工作日用車熱點呈“三片一線”分布,以龍首原、大明宮西為直徑的圓形片區,以電子正街、含光路南口連線的橢圓片區,以科技路以南3 km帶狀片區,以及勞動路沿線為西安市工作日共享單車騎行熱點地段。熱點區域包含一、二級范圍,一級范圍主要針對共享單車停放容量進行控制,二級范圍旨在區域內劃分非機動車道,規范非機動車道路設施、標識,整治騎行交通規范。
當然,共享單車位置數據質量受數據抓取算法、數據清洗制約,研究維度受時間、統計算法制約,因此要想得到更為精準的用車熱點,必須提高數據質量、擴展樣本周期、完善算法分析,以保證分析結果的可靠性。