◆朱 雁 馬莊宣通訊作者 王詩語 溫宗良,2
?
基于BP神經網絡的共享單車優化調度問題
◆朱 雁1馬莊宣1通訊作者王詩語1溫宗良1,2
(1.徐州醫科大學 江蘇 221004;2.廣西中醫藥大學 廣西 530001)
本文根據中國優選法統籌法與經濟數學研究會為2017年第七屆MathorCup大學生數學建模挑戰賽提供的共享單車數據,使用BP神經網絡進行需求預測,從供需關系角度出發分析共享單車供需缺口。在此基礎上,基于動態規劃建立SSE動態時間序列模型,并通過Lingo軟件求解,得到了各區域共享單車最優的調度方案。
共享單車;調度;BP神經網絡;時間序列
共享單車是指企業在居民區、商業區等公共服務區提供的單車共享服務,是一種分時租賃模式[1]。共享單車較好地解決了“最后一公里”的騎行難題,且符合綠色出行理念,正受到越來越多的關注。共享單車一般都有GPS定位,可實時監測車輛位置、騎行分布等數據,利用這些數據可對單車進行全天候供需預測。我們通過分析共享單車的使用現狀,發現共享單車的供需關系并不均衡。共享單車調度是指共享單車供需不平衡時,通過相應數據的收集、整理和分析,對單車投放地址和投放數量進行調控,從而實現供需均衡。相對于國外對“有樁公共自行車”的研究,國內學者對于共享單車的研究已進入到了“無樁共享單車”的時代,但研究主要集中在發展建議、盈利模式、法律與監管等方面,對于共享單車優化調度的研究較少[2]。
我們采用中國優選法統籌法與經濟數學研究會為2017年第七屆MathorCup大學生數學建模挑戰賽提供的共享單車數據[1]建立時空分布模型,使用BP神經網絡進行需求預測,從供需關系角度出發分析共享單車供需缺口。在此基礎上,基于動態規劃建立SSE動態時間序列模型,并通過Lingo軟件求解得到了各地區共享單車的最小投放量。
1.1.1數據預處理及時空分布距離分析
首先,我們對數據進行預處理。先統計出單車從i地到j地所需要的時間,取其平均值作為從i地到j地所需要的時間路程(i,j=1,2,…,10)。在某一地到其他地的時間路程已知的前提下,建立以該地區為中心的空間分布模型。然后,定義區域間鄰近分布公式:若地區鄰近則記為1;反之則記為0。最終,我們得出各區域時空分布距離。
1.1.2 BP神經網絡模型預測分析
BP神經網絡[3]又稱誤差反向傳播神經網絡,是目前應用最廣泛的一種神經網絡。其工作過程主要分為兩個階段:第一階段,用一組樣本訓練網絡,其中每一個樣本都包含輸入和輸出。第二階段,以輸出值與樣本的期望輸出值進行比較。若誤差未滿足要求,則沿原連接通路逐層返回,并根據誤差按照一定規則調整各層節點的連接權值和閾值,以逐步減小誤差,直到滿足要求。人工神經網絡經充分訓練獲得了樣本的特征知識,并將這些知識以權值的形式分布存儲在網絡的連接上。由此構成了非線性映射模型。經訓練后的人工神經網絡具有泛化能力,不僅對學習過的樣本有效,而且對未經學習的樣本也可以較準確地預測。
調取某一天各時段不同區域共享單車流量,使用1.1.1中預處理的數據,利用BP神經網絡訓練樣本數據,然后預測一天中各時間段各區域共享單車流量,預測結果見表1所示。一天結束時,共享單車數量和為992(事先假設共享單車為1000輛),誤差率為0.8%;說明該預測結果合理。

表1 時間段各地區共享單車可使用次數
我們對于城市內各個區域對單車的需求數據進行整理統計,得出單車投放量同需求量之間的差值,并以此差值除以單車需求量得出了需求差率這一重要指標。將需求差率運用Matlab軟件進行作圖處理得出所示的需求差率空間分布圖(圖1)和平面分布圖(圖2)。

圖1 需求差率空間分布圖

圖2 需求差率平面分布圖
由圖1可知,圖面平整度差異大,紅色區域波峰較高,而某些區域波谷較低,說明整個地區共享單車分配策略存在不合理問題,選取0.2,0.4作為度量標準,大于0.2的區域對單車需求量較大,而分配量不足,說明該區域共享單車的滿足程度較低;大于0.4的區域對單車需求量很大,而分配量不足,說明該區域共享單車的滿足程度極低。
在圖2中,紅色代表滿意程度極低。我們采用賦值的方法對滿意度進行量化,按照空格內是否有紅色區域及紅色區域的數目,分別以0、1和2進行賦值來分析對單車的滿意度,得出滿意程度結果。10個區域中有2個得分為0,滿意度“差”,6個區域得分為1,滿意度“較低”,2個區域得分為2,滿意度“較高”。此結果表明絕大多數區域的居民對于單車的滿意程度存在較大意見,這也反映出共享單車供需關系之間的不平衡,存在較大的供給缺口,亟待優化調度。
受市場需求及單車本身性能消耗的影響,共享單車的數量處于變化之中。我們整理得到了各區域單車增減量。如表2前四行所示。

表2 單車數量變化及優化結果
利用指數平滑法[4]描述某個區域共享單車隨時間段的變化曲線,最終我們基于動態規劃建立SSE動態時間序列模型[5]。由于時間序列不能進行長期預測,因此在確定最優指數平滑曲線之后,將該曲線通過的點用集合表示,然后用多項式差值對集合中的點進行擬合,建立一次多項式。通過cftool函數工具箱的差值擬合對上述模型進行曲線擬合[6],得到其自變量系數及對應的次冪。以各區域單車投放量為決策變量,根據共享單車影響因子建立非線性規劃模型[7]。最后,通過lingo軟件對該模型進行求解,得到各地區共享單車最小投放量(見表2最后一行)。
隨著共享單車的風靡,其配置和調度問題成為大家關注的熱點。本文使用BP神經網絡進行需求預測,并基于動態規劃建立動態時間序列模型,得出了各區域共享單車最優的調度方案,以使系統運轉更加高效。需要指出的是,本文分析所采用的數據具有一定的局限性,利用共享單車實際應用中產生的數據可更準確地進行需求預測和分析,以更好地進行車輛投放、調度和運營維護。但本文的分析方法對于共享單車的優化調度具有一定的參考價值。
[1]2017年MathorCup大學生數學建模挑戰賽賽題[EB/OL].http://www.saikr.com/c/nd/5228,2017.
[2]楊證軻,董愷凌,張學梅.國內外共享單車研究綜述[J]. 成都大學學報(社會科學版),2018.
[3]Simon Haykin著;葉世偉,史忠植譯.神經網絡原理[M].機械工業出版社,2004.
[4]葉宗斌,周步祥,林楠,黎祚,程寅.基于等維新息指數平滑法模型的中長期負荷預測[J].電力系統保護與控制,2012.
[5]董言治,劉松濤,尉志蘋等.基于Matlab的時間序列分析和動態數據建模[J].計算機工程,2003.
[6]陳嵐峰,楊靜瑜,崔崧等.基于MATLAB的最小二乘曲線擬合仿真研究[J].沈陽師范大學學報(自然科學版),2014.
[7]Bonnans J F, Gilbert J C, Lemaréchal C, et al. Numerical optimization: theoretical and practical aspects[M]. Springer Science & Business Media,2006.
徐州醫科大學課題(D2016002),廣西自然科學基金項目(2018GXNSFAA138200),廣西哲學社會科學規劃研究課題(15FGL008),廣西中醫藥大學課題(QN14006)。