周學沛
(安徽省高速公路聯網運營有限公司,合肥 230000)
(1)構建數據信息中心。將結構化與非結構化數據匯集省中心用于分析,分析結果正確且有實際應用的價值,并能夠可控的被第三方應用展現和使用。
(2)基于大數據分析平臺技術對數據進行集中處理。數據處理的過程與結果能夠支撐當前和未來的使用,易于維護和管理,制定的流程和規范易于執行和推廣,逐步推進系統改造。
(3)制定全省高速公路大數據應用平臺的建設規范,為交通大數據的應用提供參考依據。
(4)提高全省高速公路聯網收費數據的使用效率,提升路網服務水平和質量。
我省擁有近260個收費站幾千條車道,每時每刻都不停的有車輛通過收費站,產生大量的數據。各種各樣的海量數據對高速公路經營管理構成了巨大挑戰。
目前高速公路產生的數據不僅信息量越來越多,而且數據結構也發生了很大改變,不僅有傳統的二維結構,還有很多非結構化的,如圖片、視頻、音頻、文檔/文本、報表等,并且所有數據是大量且增長迅速的。高速公路已進入“大數據”時代,如何充分利用這些數據,是需要亟待解決的,如對高速公路車輛進行合理的監控與疏導、控制和事件管理;時刻了解路網運行狀態,進行車輛調度與疏通;通過對數據的分析對交通發展、規劃、決策給予支持等。
大數據自被提出以來便出現了種種類型的平臺和解決方案,工業界針對大數據分析平臺,紛紛推出自己的大數據分析工具,主流的平臺和產品如下:Google的大數據分析產品、惠普的HAVEn、Teradata、IBM的InfoSphere等,這些平臺有各自的特點,對計算機及網絡有不同規格的要求,能做的分析和支持的服務也不相同。
根據交通路網的特點,其數據采集節點多且分布在不同物理位置,距離間隔較遠,數據傳輸不便,流數據多,因此適合采用分布式系統架構大數據平臺,其部署對硬件要求低廉,吞吐量高,可以以流的形式訪問文件系統。
主要考慮的是變極電機與不變極電機的差價。根據上海電機廠提供的參考價格,TL 1600—28/56同步電動機的價格約為150萬元/臺,而TL1600—28同步電動機的價格約為100萬元/臺,則每臺變極電機要多投資 50萬元,10臺電機共計500萬元;因電機體積增大而導致土建增加的經費約 60萬元,10臺合計600萬元;其余費用與同轉速發電相同。
(1)數據準備
數據是用來描述現實世界的信息資源。交通大數據描述交通工具、道路、流量、進出口狀況、天氣等,數據表示通過對信息資源的分類、編碼以及格式等內容進行分析規范,為了使計算機可以準確、高效的識別數據,匯集后的數據進而能夠為各種應用提供服務。
(2)數據類型
高速公路聯網收費軟件數據:全省有幾百各收費站,幾千條收費車道,每天產生大量的收費數據,日積月累了海量的數據信息。
應用系統數據:高速公路收費監控系統、呼叫系統、各個路段運行的收費、票據、稽查、通行卡等管理軟件也累積了大量數據。
傳感器數據:遍布在高速公路上路感線圈、標識站等,不斷的對過往車輛進行感知,持續生成數據。
視頻監控系統的數據:收費車道、收費廣場、道路干線及隧道都布設了大量的攝像機,時刻產生大量的視頻數據。
(3)數據采集及存儲
高速公路路段下設的收費站很多,管理處與收費站又都部署有多套系統,時刻不停的產出各種類型的數據,若不建立良好的規范,不加以控制,勢必增加數據處理難度;所以數據采集的規范是針對各類系統的,對所有系統都有制約性,需要總體規范和各類系統的詳細規范,并對采集的數據做好歸類工作。
大數據由于數據量大,價值密度低的特點數據一般不宜久存,需要將存儲按成本高低,容量大小,速度快慢進行分層,未經過徹底分析或需要反復分析的數據存放在價格高、容量小、速度快的存儲上,待數據價值被充分提取并逐步壓縮后放入成本低,容量大,速度慢的存儲上,直到最后被歸檔。
(1)車流軌跡分析。基于公路網收費站OD數據,在一個較長時期內,識別、預測大多數車輛在固定道路上的運行軌跡(如貨車、客車和部分私家車),對于出行軌跡不固定的車輛,采用隨機分配方法分配,形成用戶出行軌跡數據特征分析模型。通過給定某時段某入口車流量,可以預測其分別以多大概率分別流向其他出口。可以幫助發現某方向或區段是否超負荷運轉,可為車流分流、路徑調整提供幫助。如制作節假日遷移圖譜,并對未來節假日高峰流量做出預警。
(2)路網交通狀態預測。依據收費站點OD數據,分析一個較長時間段的交通流量,綜合考慮路況、天氣、時間節點等因素。統計某時段不同入口車流,分析這些車流匯入主干道的概率,基于沖擊波理論分析主干道的車流。分別統計并分析入口與出口的車流密度-時間曲線,分析兩類曲線及其相關關系,進而研究干道車流沖擊波的衰減與增強規律,構建干道車流短期、中期和長期預測模型。進而反演路網在某時段內各路段上的通行速度與通行量分配,從而構建模擬實際的道路運行模型,能夠為交通建設決策、交通政策變更、環境工程、經濟發展提供建議。
(3)基于大數據的收費站收費預測。高速公路的年通行費與國家、地方宏觀經濟發展水平高度相關,僅僅依據交通量預測未來收費準確性低,普適性也差。因此,研究國家經濟發展關鍵指標數據與道路收費數據的相關關系,進而構建基于這兩類大數據的年收費預測模型,可以提高收費站收費預測的精度。
(4)高速公路網風險評估。當前交通安全形勢嚴峻,分析高速公路網安全性的表征方法及其發展變化規律,對道路管理者主動防控風險意義重大。基于交通大數據,從“人-車-路-環境-管理”五方面分析高速公路交通安全影響因素,綜合考慮交通量、天氣、時間段、季節、地點、路網結構、車道數量、事故形態、事故責任人交通方式等數據,建立路網狀態預測仿真模型和風險評估模型。
(5)勞動強度與收費員疲勞關系分析。由于交通流量在高速路網分布的不均衡性,導致不同時間段、不同收費站的收費員勞動強度差異較大。對于流量較大的時段或收費站,收費員連續勞動的強度大,容易導致收費員工作效率下降,工作態度失準,從而降低高速公路收費水平;而對于流量較小的時段或收費站,則會造成收費員工作無效率,編制冗余,機構臃腫,造成人力資源浪費。通過高速公路收費數據對出入口收費員勞動強度進行統計分析,以曲線、表格的形式為管理決策者提供直觀參考,可以輔助管理者合理決策,調整編制,提高工作效率,改善工作態度和質量。
(6)收費稽查分析。針對不同類型的逃費行為,根據OD數據將其在樣本空間上聚類,構建不同逃費類型的特征識別模型。基于歷史數據,篩選不逃費車輛樣本,將其在特征空間進行聚類,構建不逃費車輛特征識別模型,進而得到疑似逃費車輛樣本;結合歷史數據篩選出過往逃費嫌疑大的車輛,通過比對分析確定逃費車輛信息。
近年來,在經濟發展的推動下,我省高速公路的建設步伐高歌猛進,營運里程突飛猛漲,截至目前已突破4600公里,隨之也帶來了收費數據呈而幾何級增長。因此,高速公路大數據平臺的構建勢在必行,通過對高速公路大數據的分析處理,不斷增強數據的價值,為高速公路運營管理提供有效的決策支持。