林 馳,徐 博,薛昕惟,于 成
(大連理工大學 軟件學院,遼寧 大連 116621)
智能交通大數據隱私保護實驗平臺
林 馳,徐 博,薛昕惟,于 成
(大連理工大學 軟件學院,遼寧 大連 116621)

智能交通系統是未來交通系統的發展方向,它集成了多方面技術的管理系統,具有實時、準確、高效等特點。隨著系統的數據量越來越大,對交通大數據隱私的保護則顯得格外重要。大數據隱私保護仿真平臺提供兩種方式建立路網,一種是使用路網生成工具,通過自主編寫道路文件生成自定義的路網;另一種是使用路網轉換工具,轉換不同格式的路網。研究歸納了現階段智能交通大數據隱私保護面臨的挑戰與不足,介紹了智能交通大數據實驗平臺的構成和原理,描述了系統框架的設置和隱私保護方法。結果表明:該平臺能夠有效智能交通大數據安全隱私,具有較好的教學與科研價值。
智能交通; 大數據; 隱私保護; 路徑追蹤
車輛自組織網絡(Vehicular Ad-hoc NETwork,VANET)[1-4]以無線通信的方式將部署在車輛上的通信設備建立多跳、容遲網絡,實現車輛與車輛間、車輛與基礎設施間的無線通信,具有通信方式靈活、信息傳播迅速等特點[5-6],是智能交通系統(Intelligent Traffic System,ITS)的重要組成部分[7]。ITS作為“互聯網+”的核心應用,將為智能社區、智能城市等應用提供基礎架構,已經被列為我國十三五規劃,具有廣泛的應用前景和重大的研究意義。
ITS數據規模龐大[8],對海量數據管理的完整性、可靠性、精確性、高并發性等具有較高的要求[9-11]。近年來,ITS作為VANET的應用載體,日益受到交通運輸、導航、物流等研究領域的廣泛關注[12-14]。目前針對ITS海量數據的管理已經提出了許多基于Hadoop的大數據管理方案,并且已在我國部分城市得到應用,但尚有很多問題沒有得到深入揭示和妥善解決,具體包括(但不限于):①ITS大數據的存取與維護效率低下[15-16]。針對ITS大數據而言,現有數據維護方法缺乏有效的數據壓縮與還原方法,未能充分挖掘ITS大數據在時間空間上的關聯特性,導致存儲量巨大,存取效率低下,難以實施有效的維護。②運用眾包(Crowdsourcing)機制實現ITS安全隱私保護更具挑戰[17-18]。ITS中車輛運行于開放環境中,車輛的位置信息屬于敏感信息,極易被捕獲;除此之外,在特定的應用環境下,還需要對特定的用戶進行實時追蹤(如刑偵追蹤,實時車輛監控等)[19]。眾包作為一種新型群體智能模式,依托個體能力,實現群體智能決策。考慮到ITS系統中拓撲具有動態性、不確定性、個體車輛知識能力的有限性等特點,與眾包機制的應用場景相契合,因此運用眾包機制實現與維護ITS大數據的采集與安全維護更加具有可行性[20]。③ITS大數據的移動應用具有多樣化需求。ITS大數據在未來的應用需求包括精確導航,實時定位追蹤,交通堵塞實時預測,快速車流疏導等方面的應用,因此需要在高效的大數據維護的基礎上開發多樣化實時移動應用(安卓和IOS平臺應用),為旅游、汽車、環境等產業的發展提供便利[8]。
綜上所述,為了應對ITS大數據帶來的新挑戰,及時開展面向ITS大數據關鍵技術的研究,建立適用于ITS特殊需求的大數據安全維護系統架構,提高系統安全性和隱私性是非常必要的,本文實驗基于以上背景,對ITS大數據關鍵技術進行研究。
圖1闡述了本實驗研究內容間的邏輯關系,本系統自下而上分為5個層次。本實驗主要研究內容位于ITS數據采樣層、數據處理層和數據應用層3個層次。具體來說,主要研究內容包括:
(1) ITS海量數據維護,最小化RSU(Road Side Unit)數量分布理論。本實驗運用RSU對車輛位置信息進行采樣,由于車輛位置信息具有時空關聯性的特點,進而采用矩陣恢復的方法恢復每個車輛的完整時空位置信息。ITS中RSU的數量直接影響網絡信息分發的QoS、延遲、能耗等性質。運用網絡覆蓋理論,結合矩陣恢復技術,提出ITS中RSU分布理論,實現RSU數量最小化,同時確保海量數據的采集與完整恢復。考慮到使用矩陣恢復的方法得到的ITS大數據存在一定的誤差,為了提高數據的精確性,采用卡爾曼濾波(Kalman Filter),減小位置數據的誤差。除此之外,研究基于眾包機制的ITS大數據維護,運用矩陣恢復、卡爾曼濾波相結合的方式,設置車載系統間通信協議,進一步減少RSU數量,提高能效性。

圖1 智能交通系統安全大數據應用框架
(2) ITS安全模型。與網絡安全領域類似,ITS中也會存在防御者和攻擊者,防御者負責確保網絡安全,攻擊者對于特定用戶進行攻擊,或多攻擊者串通,向網絡中注入虛假位置信息數據。防御者采用Truth Discovery的方式,甄別大數據中的虛假數據或誤差數據,進而確保ITS海量數據的安全性與精確性。
(3) ITS海量數據安全模型應用。在高效精確維護ITS海量數據的同時,設計基于ITS海量實時大數據應用,包括實時車流預測,交通擁塞分析與避免,車載精確導航等安卓和IOS應用。
SUMO仿真平臺提供兩種方式建立路網:① 使用Netgen路網生成工具,通過自主編寫道路文件生成自定義的路網;② 使用Netconvert路網轉換工具,轉換不同格式的路網。本實驗中采用了Netconvert方法,導入開放地圖數據庫(OpenStreetMap)中的數據,生成與實際城市道路相符的路網模型。
OpenStreetMap是一個可以自由編輯的世界地圖,通過OpenStreetMap可以實現獲取真實世界地圖的路網信息,并以.osm格式的文件存儲。在SUMO仿真平臺中,能夠直接利用Netconvert轉換工具將該文件轉換成.net.xml格式的路網文件并顯示。
如圖2所示,使用OpenStreetMap工具導出時可以根據地圖調節導出區域,或者手動輸入坐標范圍設定導出區域。實驗中,通過OpenStreetMap工具導出了3個不同城市的地圖:成都、杭州和北京,并生成了相應的.osm文件(見圖3)。下一步便需要在無人行駛的道路文件中添加車輛模型。

圖2 OpenStreetMap路網導出

圖3 路網生成(成都)
2.1添加車輛模型
SUMO提供了很多不同的方法來添加車輛模型,例如旅程定義、交通流定義、使用隨機路徑等。實驗中,采用了旅程定義的方式為路網添加車輛信息。
在.rou.xml配置文件中,每個車輛的旅程信息如上定義,定義信息包括一個車輛ID、出發時間、所經道路ID、停靠車道ID以及再次出發時間。通過這種方式,本文實驗成功定義出成都、杭州以及北京3座城市的車輛模型。
2.2數據提取
通過生成路網文件和車輛旅程文件,SUMO軟件便能生成一個運動的仿真模型。通過對輸出文件的解析及重要信息的重新處理和提取,得到如下所示格式的所有車輛在所有仿真時刻的車輛信息,包括車輛ID、監測時間、地圖方位坐標以及分解后的速度信息,這些信息將被用來實現之后的算法設計。
運用眾包機制,使用矩陣恢復、卡爾曼濾波恢復路徑。圖4所示對用戶數量為5用戶的路徑進行精確恢復,對比實驗結果可得誤差可控制在2 m以內,且采樣頻率越高,算法收斂越快(見圖5)。此外,實驗表明,僅保留30%的車載數據便可實現對所有車輛位置信息的精確追蹤,極大降低了ITS大數據的存儲量。

圖4 5用戶路徑恢復

圖5 10用戶路徑恢復
根據ITS大數據中車輛的位置信息,最優化智能交通系統中RSU的位置分布情況如圖6所示。圖中紅點表示最優化RSU分布位置。

(b) 成都

(c) 杭州
建立了智能交通大數據安全保護框架,運用仿真的手段創建智能交通系統仿真環境進而模擬出車輛的交通,安全隱私保護方法保護了系統中用戶的安全性。
[1] Lin Xiaodong,Lu Rongxing,Liang Xiaohui,etal.STAP: A social-tier-assisted packet forwarding protocol for achieving receiver-location privacy preservation in vanets [C]//Proc INFOCOM,2011 Proceedings IEEE,IEEE,2011: 2147-2155.
[2] Liu Nianbo,Liu Ming,Lou Wei,etal.PVA in VANETs: Stopped cars are not silent [C]//Proc INFOCOM,2011 Proceedings IEEE,IEEE,2011: 431-435.
[3] Lu Rongxing,Lin Xiaodong,Luan T H,etal.Pseudonym changing at social spots: An effective strategy for location privacy in vanets [J].IEEE Transactions on Vehicular Technology,2012,61(1): 86-96.
[4] Lu Rongxing,Lin Xiaodong,Zhu Haojin,etal.SPARK: a new VANET-based smart parking scheme for large parking lots[C]//Proc INFOCOM 2009,IEEE,2009: 1413-1421.
[5] Sommer Christoph,German Reinhard,Dressler Falko.Bidirectionally coupled network and road traffic simulation for improved IVC analysis [J].IEEE Transactions on Mobile Computing,2011,20(1): 3-15.
[6] Taleb Tarik,Sakhaee Ehssan,Jamalipour Abbas.A stable routing protocol to support ITS services in VANET networks [J].IEEE Transactions on Vehicular Technology,2007,56(6): 3337-3347.
[7] Nguyen Tien V,Baccelli Francois,Zhu Kai,etal.A performance analysis of csma based broadcast protocol in vanets [C]// Proc INFOCOM,2013 Proceedings IEEE,IEEE,2013: 2805-2813.
[8] Fang Hua,Zhang Zhaoyang,Wang Chanpaul Jin,etal.A survey of big data research [J].IEEE Network,2015,29(5): 6-9.
[9] Rawat Danda B,Popescu Dimitrie C,Yan Gongjun.Enhancing VANET performance by joint adaptation of transmission power and contention window size [J].IEEE Transactions on Parallel and Distributed Systems,2011,22(9): 1528-1535.
[10] Ren Dandan,Du Suguo,Zhu Haojin.A novel attack tree based risk assessment approach for location privacy preservation in the VANETs [C]//Proc 2011 IEEE International Conference on Communications (ICC),IEEE,2011: 1-5.
[11] Shea Christine,Hassanabadi Behnam,Valaee Shahrokh.Mobility-based clustering in VANETs using affinity propagation [C]// Proc Global Telecommunications Conference,2009.GLOBECOM 2009,IEEE,2009: 1-6.
[12] Tao Jun,Zhu Limin,Wang Xiaoxiao,etal.RSU deployment scheme with power control for highway message propagation in VANETs [C]//Proc Global Communications Conference (GLOBECOM),IEEE,2014: 169-174.
[13] Zhang Yang,Cao Guohong.V-pada: Vehicle-platoon-aware data access in vanets [J].IEEE Transactions on Vehicular Technology,2011,60(5): 2326-2339.
[14] Zhu Hongzi,Fu Luoyi,Xue Guangtao,etal.Recognizing exponential inter-contact time in VANETs [C]// Proc INFOCOM,2010 Proceedings IEEE,IEEE,2010: 1-5.
[15] Piorkowski M,Raya M,Lugo A.L,etal.TraNS: realistic joint traffic and network simulator for VANETs [J].ACM SIGMOBILE Mobile Computing and Communications Review,2008,12(1): 31-33.
[16] Lee Uichin,Magistretti Eugenio,Gerla Mario,etal.Dissemination and harvesting of urban data using vehicular sensing platforms [J].IEEE Transactions on Vehicular Technology,2009,58(2): 882-901.
[17] Wu Di,Zhang Yuan,Bao Lichun,etal.Location-based crowdsourcing for vehicular communication in hybrid networks [J].IEEE Transactions on Intelligent Transportation Systems,2013,14(2): 837-846.
[18] Wang Yan,Jiang Jianmin,Mu Tingting.Context-aware and energy-driven route optimization for fully electric vehicles via crowdsourcing [J].IEEE Transactions on Intelligent Transportation Systems,2013,14(3): 1331-1345.
[19] Sampigethaya Krishna,Li Mingyan,Huang Leping,etal.AMOEBA: Robust location privacy scheme for VANET [J].IEEE Journal on Selected Areas in Communications,2007,25(8): 1569-1589.
[20] Gibaud Alain,Thomin Philippe.Message forwarding based on vehicle trajectory history in Fully Distributed Traffic Information Systems [J].Computer Communications,2015,60(1): 40-52.
Big Data Privacy Protection Platform for Intelligent Transportation System
LINChi,XUBo,XUEXinwei,YUCheng
(School of Software,Dalian University of Technology,Dalian 116621,Liaoning,China)
Intelligent transportation systems (ITSs) become the mainstream direction of the future transportation system.An Intelligent transportation system integrates many kinds of technologies,and has the characteristics of real-time,accuracy and high efficiency.With the increasing amount of data,it is very important to protect the privacy of traffic data.Big data privacy protection simulation platform provides two methods to establish the system.One is to use the network generation tool and another is to use network conversion tool.The drawbacks and challenge of privacy protection for big data in intelligent transportation systems are summarized.The principle and organization of the experimental platform for ITSs are introduced.The architecture and the approaches of privacy preservation are also presented.Experimental results demonstrate that the proposed methods can effectively protect the privacy for big data and has a certain value in the actual teaching and scientific research.
intelligent transportation; big data; privacy protection; trajectory tracking
2016-11-10
國家自然科學基金(61402072,61402078);2016年遼寧省本科教改立項一般項目;大連理工大學2016年教育教學改革重大項目(ZZD2016001)
林 馳(1984-),男,遼寧大連人,博士,講師,研究方向為物聯網。E-mail: c.lin@dlut.edu.cn
薛昕惟(1984-),女,遼寧大連人,博士,講師,研究方向為圖像處理。E-mail: xuexinwei@dlut.edu.cn
TP 393
:A
:1006-7167(2017)07-0039-04