呂 鈴,彭雅麗,曾欣怡,楊雨鑫,黃明和
(江西師范大學軟件學院,江西 南昌 330022)
近年來,公共自行車已經成為人們生活中必不可少的一項基礎設施,在城市的發展中起著重要的作用。但是,隨著使用人數的增多,規模的擴大,其在實際運營中出現了一些管理運營方面的共性問題,如由于其網點布設不合理造成在高峰時段無車可借、低峰時段車輛使用率較低、車輛調度不合理、車輛損壞嚴重、無人維修等情況,嚴重制約著公共自行車的正常運轉和進一步發展。因此,對公共自行車系統布局的合理性和運營情況進行綜合評價,篩選出問題節點,及時進行管理控制,進而可以為公共自行車網點的布設、車輛投放力度提供科學合理的依據。
復雜網絡近年來吸引了廣大交通學者的目光,人們針對公交、地鐵、航空、鐵路等行業進行網絡建模和數據分析。高自友等人[1]利用復雜網絡、動力學分析等理論,探索了城市交通網絡的時空復雜性及演化機理。Borgnat等人[2]提出將自行車網點作為節點,自行車的共享交換為連邊,構建復雜網絡,研究人們出行的動力學統計特性在時空分布中的特點。鄭嘯等人[3]以北京市公交為例,對網絡的基本拓撲特性和關鍵節點進行分析,為城市交通規劃提供了參考意見。鄧羽等人[4]通過可達性與道路密度雙重指標的運用進行區域綜合分區,揭示了北京市城區內的空間可達性特征和道路基礎設施建設情況以及兩者在南北城區內的空間表征差異。劉志林、王茂軍[5]基于問卷數據,測度了北京城市124個街道的就業可達性,并將其作為職住空間錯位的標度指標,討論了職住空間錯位與居民通勤時間之間的關系。陳靖[6]提出了一種以時間符號遷移圖為建模語言,基于可達性分析的模型檢測算法。文獻[7]認為目前評價節點重要性的方法比較單一,進而提出了一種考慮了多種因素的節點重要性評價方法。尚焱等人[8]在篩選關鍵節點時將用戶系數和傳播系數作為微博傳播網絡的節點和邊的權重,形成雙向加權網絡,從而評估網絡中節點的重要程度。周漩等人[9]綜合考慮了節點效率、節點度值和相鄰節點的重要度,提出了一種利用重要度矩陣來評價網絡關鍵節點的方法。文獻[10]提出了一種基于TOPSIS(Technique for Order Preference by Similarity to Ideal Solution)的新復雜網絡節點重要性的評估方法。文獻[11]圍繞城市環境信號衰減、紅燈等停、固定和周期的公交運行模式,提出分層分區的通信模型,以解決城市交通問題。可見,通過構建復雜網絡能對交通網絡的整體拓撲進行精準的分析,對其網絡關鍵節點進行合理的篩選,為交通規劃提供理論依據。公共自行車因其交通功能的特殊銜接性,若能結合其中短距離出行和長距離出行進行不同的功能分析,必能得出更有意義的系統建設方案。
本文基于公共自行車基礎運營數據,通過分析復雜網絡拓撲特性,同時引入針對用戶出行目的和出行距離為基礎的分區可達性指標和網絡容量潛力分析模型,從技術因素方面分析網絡的內部結構和功能,篩選出網絡的關鍵節點。本文將該方法與傳統的基于度數和介數篩選關鍵節點的方法進行了比較分析,對現有公共自行車系統的運營情況進行了綜合評價,對網點的建設和車輛投放力度提供參考意見,以最大限度地發揮系統效益。
本文研究所使用的數據來自于某市公共自行車運營系統記錄的用戶出行數據,數據包括434個自行車租賃網點和2016年7月~2016年12月5個月的用戶出行數據。由于所獲取的數據是該市公共自行車系統的硬件設備上傳的數據,系統有時會發生設備斷電和斷網的情況,導致部分數據丟失;同時,由于有人工調度的干預,和人們日常使用檢查車輛的問題,有很多測試或無效數據,需要進行簡單的預處理。我們的預處理主要包括:
(1)將借還車間隔時間在1 min以內、大于1 440 min(24小時)的借還數據刪除。1 min內的借還數據,可推測為查車數據;而大于1 440 min的數據認為是自行車被盜、維修數據或非正常借還數據,因此,去除這兩類數據。
(2)對于出現故障的網點進行篩選,刪除故障網點。
根據以上系統記錄的用戶出行基礎數據,本文利用復雜網絡的基本理論進行數據建模。在模型中,以Δtk時段內的所有用戶產生的借還量為數據進行建模,借還涉及到的網點為網絡節點,記為V;單次借還數據關聯的兩個網點間建立連邊,記為E;連邊方向為借出網點流入歸還網點,每產生一條借還記錄該方向上的邊權加1。公共自行車網點既有流出量,又有流入量,因此該網絡是一個加權有向網絡。給每個節點id進行唯一編號i,其容量定義為ci,并定義由idi→idj的總流量為wij。由此可以產生一個由點集V和邊集E組成的圖G,可以表示為G=(V,E),圖的權重為總流量wij。節點vi的度ki指的是與其直接相連的邊的數量。在有向圖中,節點的度可以分為入度和出度,入度指的是流入該節點的邊的數量;出度指的是從該節點流出的邊的數量;度指的是與節點vi連接的邊的總數。
最終構建的復雜網絡模型有節點434個,邊19 472條,整個網絡的模型如圖1所示。圖中的點代表網絡的節點,點之間的連線代表網絡的邊。

Figure 1 A complex network model of public bicycles in a city圖1 某市公共自行車復雜網絡模型示意圖
王姣娥等人在文獻[12]中提出,當累積度分布為冪函數時,稱其結構具有“無標度”性質,同時提到具有小世界特性的網絡含有大的集聚系數和小的平均路徑長度。
我們計算入度累積度分布圖,在雙對數坐標下利用線性回歸得到方程y=0.6217-0.00007616x,回歸系數R2=0.7259,說明公共自行車復雜網絡入度累積度分布符合冪律分布,結果如圖2a所示。
計算出度累積度分布圖,在雙對數坐標下利用線性回歸得到方程y=0.6341-0.00007957x,回歸系數R2=0.7384,說明公共自行車復雜網絡出度累積度分布符合冪律分布,結果如圖2b所示。
計算平均聚類系數值為0.63,存在74.7%的網點聚類系數大于0.5,表現出了較強的聚集性,說明網絡中各節點與其鄰居之間的聯系緊密,這也比較符合公共自行車的實際運營模式。同時,計算得到網絡平均路徑長度為3.052,網絡直徑為6。綜合以上指標,表明該市公共自行車網絡具有小世界無標度特性,且符合“6度空間理論”。

Figure 2 Weighted cumulative distribution圖2 加權累積度分布圖
對于公共自行車復雜網絡上的任意節點,節點的入度表示該節點的直接流入量,即車輛的還入量;出度表示該節點的流出量,反映的是該節點的車輛借出量。根據半年的交易數據,計算網絡中節點的入度值和出度值,發現不同網點的使用次數存在著極大的差距。判定這種差異是否與節點的實際地理位置或其所處的功能區域等因素相關,還需根據其坐標、功能分區等做進一步分析。表1給出了公共自行車復雜網絡度值分布表。從表1中可以看出,僅有19.12%的節點日平均借出量和歸還量在20次以上,表明網絡中節點分布相對不均勻,僅有少部分節點的度值較高被頻繁使用,這部分節點是網絡的關鍵節點,與其它節點連通性好,處于人流量大的樞紐位置,在網絡中發揮著極其重要的位置,同時這部分網點最有可能出現失衡現象。所以,如何篩選出這部分關鍵節點,對其進行控制,對于優化整個網絡具有重要的意義。因此,本文提出了一種基于出行目的和出行距離的分區可達性指標來選取關鍵節點的方法。

Table 1 Degree distribution of thepublic bicycles complex network
公共自行車慢行交通的發展,一方面可以直接承載人們的短距離出行需求,另一方面能完成軌道+公交的“最后一公里”接駁,實現長距離出行的公共交通銜接。而要提高公共自行車在公共交通中的銜接作用,增強城市公共交通的競爭力最有效的措施就是通過各種辦法來改善其可達性。因此,準確、合理、全方位地分析城市公共自行車慢行交通的可達性,并針對不足之處進行改善,提高公共自行車的運行效率,對促進公共交通發展,緩解交通擁堵,減少環境污染具有重要意義。
因此,公共自行車系統評價,不僅需要挖掘復雜網絡的拓撲特征,還應分析公共自行車作為一種公共交通工具所承擔的交通可達性功能。首先將節點地域按照功能屬性進行劃分,緊扣公共自行車的公共交通特性,劃分為中短距離出行和長距離公共交通銜接區域,并通過可達性評價指標和潛力模型對整體網絡進行交通功能的綜合評估,具體如圖3所示。

Figure 3 Network division method圖3 網絡劃分方法
4.1.1 網絡劃分
公共自行車作為現有公共交通的合理補充,其主要功能是承載人們的中短距離出行需求并在長距離中實現和公共交通的銜接,緊扣這個公共交通核心功能,我們擬將節點數量龐大、出行復雜、功能繁多的公共自行車交通網絡,進行功能屬性的劃分,將各網絡節點所在的區域,及其在網絡中的地位、關系展現出來。具體的劃分算法分三步:
(1)節點功能區域劃分。
結合人們出行需求中的目的地功能,將所有的節點進行功能區域劃分,主要有公共交通區域、住宅區域、公共服務區域和商業娛樂區域。公共交通區域主要包括城市內主要的公交站點、地鐵站點;住宅區域主要包括人們的住宅小區;公共服務區域主要包括人們日常公共服務的場所,例如學校、銀行、醫院、行政服務點等;商業娛樂區域主要包括超市、購物中心、娛樂場所、景點休閑場所等。
(2)系統核心功能劃分。
為完成長距離公共交通銜接核心功能,公共自行車的每一個數據流都必然有一個屬于公共交通區域,因此,劃分為以公共交通為核心,與住宅、公共服務、商業娛樂三大分區的長距離公共交通銜接可達,這是一個公共交通銜接區域。
為完成中短距離出行,劃分住宅、公共服務、商業娛樂三大分區的中短距離出行區域,這類區域需將進一步劃分。
(3)中短距離出行區域劃分。
中短距離出行必須進一步根據距離和節點分布劃分成若干個中短距離范圍內的住宅區域、公共服務區域和商業娛樂區域,這樣一個完整的短距離范圍就是我們要尋找的中短距離區域。中短距離區域劃分算法:第一步,以人們的住宅小區為基點,所有該小區可達的節點都劃分進該區域內;第二步,若兩個相鄰的小區,與其他三個區域內的度相關性分布相似,則將兩個區域合并;循環進行度相關性判斷,直至所有區域劃分完成。
劃分完成后具有一個公共交通銜接區域和多個中短距離出行區域,我們主要研究區域內部節點之間的可達性,通過可達性評價指標判別節點屬性。
4.1.2 可達性指標
交通的本質是人們因為某種目的而發生的空間位移,是為了能夠便利地到達目的地,因此,國內外專家認為可達性是交通的根本目的。在已有的各種公共交通系統中,公路、鐵路、地鐵、公交都提出采用可達性分析作為評價交通系統的重要指標。因此,引入可達性指標作為公共自行車系統節點的一個重要屬性指標。
可達性的評價模型中,空間相互作用模型定義可達性為空間相互作用的潛力,認為可達性不僅與兩點間的空間阻隔有關,還與起點或終點活動規模的大小有關。Hansen提出的潛力模型就是空間相互作用模型的代表,其基本形式如下:
(1)
其中,Ai是節點i的可達性,即節點i與當前連接的所有其它節點相互作用過程中可能獲得的全部機會,dij是節點i和節點j之間的距離,a是反映距離阻抗影響程度的參數,Dj是節點j中的機會。
節點所劃分的區域中,如果該節點處于中短距離出行中的某個區域,則需計算生活小區網點到商業娛樂、公共服務類型的綜合可達性。若處于長距離公共交通銜接區,則在公共交通區域的該節點,需要計算交通樞紐類網點與生活小區、公共服務、商業娛樂的綜合可達性;節點的可達性指標值越高,說明該節點處于該功能區的中心,會承擔更多的用戶流量,是網絡中的關鍵節點。

Figure 4 Potential index and the reachability index of the node from the transport hub type network reach to the transport hub,public service,living area and commercial entertainment type network圖4 交通樞紐-交通樞紐、公共服務、生活小區、商業娛樂可達性指標與網絡容量潛力指標
4.1.3 容量潛力模型
一個網點的容量潛力用Ei表示,其基本形式如下:
Ei=Ai*Ci
(2)
其中,Ci為每個節點的容量,Ai為節點可達性指標。
相對潛力用Di表示,其基本形式如下:
(3)
將節點可達性指標與網點容量潛力相關聯,對分析網絡的潛力需求具有重要的指導意義。
長距離公共交通銜接區域到達各功能區域的可達性值可以通過計算其到達該類型內所有網點可達性值的和來表示。計算過程中反映距離阻抗影響程度的參數取1。圖4a和圖4b分別表示了該市公共自行車網絡中64個交通樞紐類網點到交通樞紐、生活小區、公共服務、商業娛樂類型網點的可達性值和網絡容量潛力指標。兩圖橫坐標均表示網點名稱,縱坐標分別表示每個網點每天每公里可達性指標和網點容量潛力。從圖4中可以看出,同一網點到達不同功能類型區域的可達性指標存在較大差異,這表明不同網點由于其所處的地理位置不同,會導致其銜接的功能區有所不同;并且從交通樞紐出發,到達生活小區和公共服務兩類網點比較便捷;且不管目的地是何種類型網點,長距離出行的銜接主要是通過少部分節點實現的,表明這少部分網點在交通樞紐功能區內處于核心,承擔著主要的出行流量,這部分網點可以被判定為網絡的關鍵節點。針對網點容量潛力的分析同樣可以看出,網絡中存在少部分節點網絡潛力相對較高,一個網點的容量潛力值越大,表明該網點所處的區域條件越好,越重要,到其它網點越便捷。對于網絡潛力較高的點,要和實際的流量進行分析比較,根據結果,若實際流量也是最高的,那可以增設網點,若實際流量不算高,說明該網點可能因為調度不及時或初始容量設置不高,導致其巨大的潛力未能展示出來,應重點調整調度方案和初始布設。
分析結果顯示,交通樞紐與生活小區、公共服務、商業娛樂銜接性的好壞可以通過網點容量的相互潛力來評價。計算結果顯示交通樞紐到生活小區、公共服務、交通樞紐、商業娛樂類型網點的相對網點容量潛力分別為0.20,0.52,0.15,0.12。這個結果表明從交通樞紐到公共服務和生活小區類型網點的相對發展潛力較好。針對這種情況,可依據實際流量值,著重關注交通樞紐與生活小區、生活服務交易的調度。
中短距離出行必須進一步根據距離和節點分布劃分成若干個中短距離范圍內的住宅區域、公共服務區域和商業娛樂區域,這樣一個完整的短距離范圍就是我們要尋找的中短距離區域。首先,我們篩選出所有生活小區類網點;然后計算出任意兩個節點之間的距離,繪制距離累積分布圖,如圖5所示,橫坐標表示生活小區距離分布圖,縱坐標表示累積分布。從圖5中可以看出,生活小區類網點的布設相差范圍在0~30 000 m,結合實際生活場景,我們暫時將距離5 000 m以內的生活小區類網點劃分至同一區域,已經被劃分的生活小區類網點將不再出現在另一個劃分區域中,循環進行,直至所有的生活小區類網點劃分完畢,并將可以到達該生活小區區域的網點劃分進該區域內,最終我們得到了5個區域。區域劃分結果如表2所示。

Figure 5 Distance accumulation distribution map of the living community圖5 生活小區距離累積分布圖

區域網點總數生活小區類型網點數目交通樞紐類型網點數目公共服務類型網點數目商業娛樂類型網點數目區域18836122812區域29510204916區域399157689區域416039335731區域5682492015
為了計算中短距離區域的交通可達性,針對5個區域的數據做如下處理:刪除網點功能屬性為交通樞紐類型的用戶出行數據。然后對5個區域分別計算生活小區-商業娛樂、生活小區-公共服務、生活小區-生活小區的可達性指標和網絡容量潛力。結果如圖6和圖7所示。
從對比圖形結果可以得出,在中短距離銜接的區域內,從生活小區出發到生活小區和商業娛樂的可達性值會出現特別高的網點,即在個別網點存在大量的用戶選擇公共自行車去商業中心和休閑娛樂場所,針對這部分網點,可以適當增設鎖車柱,增大車輛的投放力度或在其周邊也可以適當增設網點。對比長距離銜接和中短距離銜接區域的可達性,可以發現兩種方式流量的疏通主要都是通過少部分節點實現的,這部分節點即該網絡中的關鍵節點。中短距離銜接區域中生活小區類型網點到生活小區、商業娛樂和公共服務類型的相對容量潛力如表3所示。

Figure 6 Reachability index of the node from the living area type network to public service,living area,commercial entertainment type network圖6 生活小區-生活小區、商業娛樂、公共服務網點可達性指標

Figure 7 Potential index of the of the node from the living area type network to public service,living area and commercial entertainment type network圖7 生活小區-生活小區、公共服務、商業娛樂網點潛力容量分析圖

生活小區?公共服務/%生活小區?商業娛樂/%生活小區?生活小區/%區域131.7336.8031.47區域213.0031.5555.46區域328.6223.5347.85區域418.1211.8270.01區域530.1631.3638.48
前文在長距離出行分析得出交通樞紐-商業娛樂的相對可達性較低,容量潛力較小;而在以生活小區為核心的中短距離銜接區域中,到達各服務類型的網點相對潛力較均衡,生活小區到生活小區自身的相對潛力較大,表明在中短距離銜接中,人們出行的目的地很大可能會是生活小區。
本文設計了一種針對用戶出行目的和出行距離為基礎的分區可達性和網絡容量潛力模型篩選關鍵節點的優化分析方法,為了論證該方法的合理性和準確性,與傳統復雜網絡中經典的度值和介數方法進行比較分析,結果如圖8所示。

Figure 8 Screening evaluation comparison chart of key nodes圖8 關鍵節點篩選評價對比圖
從圖8中可見,利用經典的度值和介數法篩選出的關鍵節點,用此法大部分均可篩選出來,并且采用本方法能更加充分反映出各個網絡關鍵節點的特征,從而為關鍵節點的優化提供更準確的決策支持。復雜網絡分區可達性指標潛力評價模型算法明顯優于傳統的經典分析方法,能為關鍵節點的重要性指標給出評價原型,從而為其節點優化提供更準確的理論依據。該參數模型能作為一般性指標引入復雜網絡中進行關鍵節點的選取,具有較好的推廣性。
通過公共自行車運營數據進行復雜網絡分析,包括其整體的基本拓撲分析和分區模型下的可達性潛力指標分析,對現有公共自行車運營情況進行了整體分析和交通可達性分析,并提出網絡關鍵節點選取模型。文中所提出的復雜網絡分區可達性指標潛力評價模型,基于公共自行車的特殊交通特性,進行分區劃分,能較清晰地展示系統中重要的關鍵網點,并給出關鍵節點的交通特性,能為其進一步優化提供理論依據。
[1] Gao Zi-you,Zhao Xiao-mei,Huang Hai-jun,et al.Research on problems related to complex networks and urban traffic systems[J].Journal of Transportation Systems Engineering and Information Technology,2006,6(3):41-47.(in Chinese)
[2] Borgnat P,Abry P,Flandrin P,et al.Shared bicycles in a city:A signal processing and data analysis perspective [J].Advances in Complex Systems,2011,14(3):415-430.
[3] Zheng Xiao, Chen Jian-ping, Shao Jia-li,et al.Analysis on topological properties of Beijing urban public transit based on complex network theory[J].Acta Physica Sinica,2012,61(19):95-105.(in Chinese)
[4] Deng Yu,Cai Jian-ming,Yang Zhen-shan,et al.Measuring time accessibility with its spatial characteristics in urban areas of Beijing[J].Acta Geographica Sinica,2012,67(2):169-178.(in Chinese)
[5] Liu Zhi-lin,Wang Mao-jun.Job accessibility and its impacts on commuting time of urban residents in Beijing:From a spatial mismatch perspective[J].Acta Geographica Sinica,2011,66(4):457-467.(in Chinese)
[6] Chen Jing. Reachability analysis on real-time value-passing systems[J].Chinese Journal of Computers,2003,26(1):19-25.(in Chinese)
[7] Hu F, Liu Y, Jin J. Multi-index evaluation algorithm based on locally linear embedding for the node importance in complex networks[C]∥Proc of the 13th International Symposium on Distributed Computing and Applications to Business,Engineering & Science(DCABES 2015), 2015:138-142.
[8] Shang Yan,Fan Xin-wei,Yu Hong.A novel node influence measurement algorithm based on characteristics of users and propagation[J].Computer Engineering & Science,2015,37(11):2105-2111.(in Chinese)
[9] Zhou Xuan,Zhang Feng-ming,Li Ke-wu,et al.Finding vital node by node importance evaluation matrix in complex networks[J].Acta Physica Sinica,2012,61(5):1-7.(in Chinese)
[10] Du Y,Gao C,Hu Y,et al.A new method of identifying influential nodes in complex networks based on TOPSIS[J].Physica A Statistical Mechanics & Its Applications,2014,399(4):57-69.
[11] Peng Ya-li, Lü Ling,Xie Zhong-fu,et al.Research on layered-partition communication model on intelligent Urban VANET[J].Journal of Jiangxi Normal University (Natural Science),2016,40(6):627-634.
[12] Wang Jiao-e, Mo Hui-hui,Jin Feng-jun.Spatial structural characteristics of Chinese aviation network based on complex network theory[J].Acta Geographica Sinica,2009,64(8):899-910.(in Chinese)
附中文參考文獻:
[1] 高自友,趙小梅,黃海軍,等.復雜網絡理論與城市交通系統復雜性問題的相關研究[J].交通運輸系統工程與信息,2006,6(3):41-47.
[3] 鄭嘯,陳建平,邵佳麗,等.基于復雜網絡理論的北京公交網絡拓撲性質分析[J].物理學報,2012,61(19):95-105.
[4] 鄧羽,蔡建明,楊振山,等.北京城區交通時間可達性測度及其空間特征分析[J].地理學報,2012,67(2):169-178.
[5] 劉志林,王茂軍.北京市職住空間錯位對居民通勤行為的影響分析——基于就業可達性與通勤時間的討論[J].地理學報,2011,66(4):457-467.
[6] 陳靖.時間符號遷移圖上的可達性分析[J].計算機學報,2003,26(1):19-25.
[8] 尚焱,樊欣唯,于洪.考慮用戶和傳播屬性的節點影響力評估算法[J].計算機工程與科學,2015,37(11):2105-2111.
[9] 周漩,張鳳鳴,李克武,等.利用重要度評價矩陣確定復雜網絡關鍵節點[J].物理學報,2012,61(5):1-7.
[12] 王姣娥,莫輝輝,金鳳君.中國航空網絡空間結構的復雜性[J].地理學報,2009,64(8):899-910.