李翔敏,戴 帥
(公安部道路交通安全研究中心,北京100062)
自大數據(Big Data或Mega Data)的概念提出以來,西風東漸,英國人維克托·邁爾-舍恩伯格(Viktor Mayor-Sch?nberger)和肯尼斯·庫克耶(Kenneth Cukier)所著《大數據時代》(Big Data)[1]在中國出版后,更是一時間引發熱議。與信息技術和網絡技術相伴而生的大數據處理技術則是被當作解決各種疑難雜癥的靈丹妙藥,各種研究和應用不斷涌現,各行各業爭相追捧,道路交通管理行業也不例外。
近年來在智能交通不斷發展的背景下,大數據作為很多智能交通解決方案的基礎,獲得了前所未有的關注。道路交通管理部門以及相關企事業單位都開始大規模投入,在規劃設計、軟硬件配置、軟件研發、數據采集處理、系統運營維護等方面進行大量探索和嘗試,形成了頗多成果,也不乏相對成功的實際應用案例[2-4]。在成功案例的激勵和各種絢麗的圖形化表現形式的吸引下,越來越多的道路交通管理部門和相關企事業單位對大數據概念表現狂熱,加緊上馬各種項目。與此同時,業界產生了針對大數據應用實際效果的質疑[5]。
學術領域有關道路交通管理行業大數據的研究頗為活躍,從中國知網的相關文獻檢索結果來看(以交通和大數據作為關鍵詞進行檢索),相關論文數量逐年上升,研究角度逐步多樣化,涵蓋規劃設計、平臺搭建、系統架構、技術應用等方面。但是,相關研究成果主要集中在理論研究和系統設計層面,實證研究和案例研究較少,重理論、輕實踐的現象突出。
從業界一些示范性的大數據應用項目來看,依然是新瓶裝舊酒,用的還是傳統的數理統計分析和商業智能(Business Intelligence,BI)的方法,只是冠以大數據的帽子而已。因此,在中國交通管理領域大數據狂熱的背后,存在諸多的潛在問題與風險,應適時對基于大數據的道路交通管理熱潮進行冷思考,確保大數據在道路交通管理領域中的恰當運用,消除盲目追捧,回歸交通信息化管理的初衷,真正提高交通信息化管理水平。
為了應對道路交通信息化管理面臨的新形勢,本文在針對基于大數據的道路交通管理進行反思的基礎上,指出道路交通管理信息化的發展路徑應該遵循既要發展大數據,又要善用“小數據”的原則。在追逐大數據技術潮流的同時,也要強調小即是美的理念,充分利用手頭已有的“小數據”和技術,努力夯實科學交通管理的基礎。
美國著名的信息技術研究和分析公司高德納(Gartner)將大數據定義為“需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產”。美國國際商業機器公司(International Business Machines Corporation,IBM)則歸納出大數據的4V特點:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)。雖然不同學者或機構對大數據的具體定義有所不同,但是基本上提及了上述4項特點。大數據為科學研究和技術應用帶來了思維方式的改變,即使用全樣本數據而非抽樣樣本數據、關注效率而非精確度、關注事物的相關性而非因果關系[1]。大數據技術不僅能夠分析結構化的數據,更傾向于對由視頻攝像頭、傳感器、RFID、GPS等采集的非結構化的海量多樣數據進行更好的分析。
大數據技術因其強大的預測能力以及借助商業智能手段而展現出絢麗的圖形化表現形式,常常被人神化和敬畏。其實,大數據只是信息技術和網絡技術發展到一個新階段的產物,并非高大上,所用到的數學原理和統計學知識也并不復雜,只是在數據的處理量和處理方法上有新的改變。道路交通管理領域的大數據應用,也只是基于海量的交通數據,根據交通工程學、運籌學、數學、統計學等學科的知識,并配合新的海量數據處理方法來解決道路交通管理領域的實際問題。
道路交通領域存在各種類型的多源海量交通數據,涵蓋交通流特征參數數據、“車駕管”數據、交通基礎設施數據、交通管理設施設備數據等,既有靜態數據又有實時數據。交通大數據的意義并非在于收集和存儲海量的數據信息,而是在于對這些隱含交通意義的數據進行專業化處理、分析和挖掘,將海量數據潛在的價值挖掘出來,提高數據的附加值,用以輔助交通管理,減少因交通擁堵和交通事故帶來的損失。大數據技術固然是先進的、符合時代技術潮流的、能夠提高交通管理水平的有效手段,但是大數據也帶來了許多新的挑戰,特別是對于那些缺乏分析技術、信息技術投入和與大數據相適應的管理文化的機構和部門[6]。因此,在引進和運用大數據技術的過程中,需要科學理性,在看到大數據優勢的同時,既不能夸大其作用,也應該看到它的劣勢[7]。
與其他技術一樣,大數據技術顯然也不是萬能的。海量數據所具有的價值只是潛在且不確定的,業界經驗認為海量數據庫中僅有約10%~20%的數據才是真正有價值的。大數據技術的成功運用,受制于數據基礎、算法、軟硬件等各種因素。例如,數據信息采集技術的限制、采集方法的缺陷以及樣本量過小等因素,都會極大影響后期分析處理,使得大數據技術成為無本之源。
中國道路交通管理信息化進程的起步相比發達國家較晚,在基礎數據的規劃設計、采集處理、管理應用等方面存在嚴重不足。具體表現在:1)各類交通信息采集設備缺乏科學統一的選型、安裝和運營維護,致使設備無法返回有效、高質量的數據;2)大量交通信息采集設備功能沒有發揮,例如大量視頻攝像頭沒有安裝流量檢測軟件導致無法采集相應的數字信息,只能用作視頻監控,造成資源浪費;3)數據碎片化,沒有形成統一、相互關聯的數據庫;4)軟硬件技術水平和專業人員配備落后,數據蘊含的價值無法被挖掘,造成數據資源的閑置和浪費。
鑒于中國道路交通管理領域信息化建設尚處于早期發展階段,積累的數據量有限,數據質量相對不高,很多道路交通管理部門在應用大數據技術時面臨諸多挑戰。因此,需要道路交通管理部門在大數據的熱潮中,冷靜思考大數據技術的限制和應用前提,特別是在自身底子薄、零基礎的情況下,需要慎之又慎,切忌為了政績和相關利益企業的游說而盲目上馬大數據項目。
與其他眾多消費品一樣,大數據的采集、存儲和處理是有成本的。除了一些人工的數據采集方法,大數據的采集主要依賴于技術和資本密集型的交通檢測器,而大數據的多樣性又依賴于安裝在不同位置、不同類型的交通檢測器,這些交通檢測器的購置和運營維護成本較高。此外,交通大數據一般無法用單臺普通計算機存儲和處理,需要依賴分布式處理、分布式數據庫和云存儲、虛擬化技術,而這些技術的開發應用也需要大量資源。
因此,在追趕大數據潮流、上馬交通大數據項目時,道路交通管理部門需要首先衡量自身的人力和物力基礎,在成本效益分析的基礎上進行考慮。在資金不足或效益遠低于成本的情況下要果斷放棄,首先做好基本的交通管理工作。在資金充裕和效益大于成本的情況下,要避免不差錢的想法,認真考慮自身專業人員配備是否到位、是否具有系統運營維護能力等問題,避免交通大數據系統建設成為爛尾工程,或建設完畢后因使用不當而成為擺設,造成資源閑置和浪費。
交通是人類的基本需求之一,人們的日常出行必然會產生一系列與個人相關的交通數據。在移動互聯網、衛星定位導航、車輛識別技術快速發展的今天,出行所產生的交通信息數據更容易被采集和存儲,而交通大數據技術的發展也正是順應這一潮流而生。在法制化逐步深入和公民個人意識覺醒的今天,公眾對于個人隱私問題較為關切,交通大數據特別是與個人隱私相關的交通大數據問題顯得頗為重要。
目前,中國尚未出臺專門的法律法規界定和規范信息時代下的個人隱私,一些涉嫌侵犯個人隱私的案件多采用其他相關法律法規來裁判。因此,現階段中國交通大數據發展過程中還未對個人隱私及數據安全給予足夠重視。例如,成熟的車輛號牌視頻識別技術已經被交通管理部門和相關企業廣泛運用,車主的號牌信息及出行信息在未被告知的情況下被記錄和存儲,個別交通管理部門和企業在數據的管理和使用過程中不對車主的號牌信息進行相應隔離,一旦泄露或者被違法買賣,風險極大。相比之下,在中國香港地區,由于法律限制,交通管理部門或相關企業在未經車主允許的情況下,不能夠采集車輛的車牌信息,以確保個人隱私。在這種情況下,以車輛號牌視頻識別技術為基礎的大數據應用就受到限制。在此情況下,如果仍然想要跟蹤車輛的行駛軌跡而不涉及隱私問題,就需要對車輛視頻識別技術進行改進,由根據號牌識別車輛改為根據外觀特征識別車輛,以確保車主的個人隱私不被侵犯。
因此,交通管理部門及相關企業在收集可能涉及個人隱私的交通大數據的過程中,要有前瞻性,提前做好準備,依法依規地采集、處理、存儲、應用和傳播數據。雖然交通管理部門的交通信息數據有的較為敏感,有的涉及公共安全和公民隱私,但是并不代表交通信息數據不能公開。交通管理部門要在保障公共安全和公民隱私的前提下,有勇氣推進信息公開,對涉密信息進行脫敏處理,積極穩健地逐步開放和共享數據,提供給更有能力的個人和機構進行分析并加以利用,以便最大限度挖掘交通數據信息的潛在價值,助力交通管理。例如,2014年,貴州省與阿里巴巴集團共同宣布面向全球啟動“智慧交通算法大挑戰”。貴陽市向參賽者開放了海量的脫敏交通數據,包括公共汽車GPS數據、出租汽車GPS數據、高德導航數據,逐步啟動大數據商業開發,為交通數據信息開放起到了很好的示范作用[3]。
國外發達國家的道路交通信息化管理走過了一條漫長而堅實的道路,憑借先進的管理體制、完善的交通管理設施、發展相對較早的信息技術和網絡技術,在過去的交通管理工作中逐步積累了大量交通數據。在此基礎上,國外同行開發了各種交通模型、應用和系統,并將它們成功應用于實踐中,持續且有步驟地推進交通管理信息化建設。近年來,由于大數據技術的發展,原本積累的很難有效處理的海量交通數據被充分挖掘和利用起來。
與國外發達國家相比,中國交通管理領域的信息化建設則呈現跳躍式發展特征。中國的交通信息化管理起步較晚,科技、設施、人才、經濟基礎相對較差,以往積累的信息數據種類和數量有限,數據質量不高,利用率較低。在這樣的基礎上,面對大數據浪潮的襲來,業界反應不一,有的在現有基礎上適當發展大數據應用迎頭趕上,有的沒有基礎也要強行上馬大數據項目;有的積極完善數據采集,研發各種交通模型充分利用大數據技術,有的則在追逐大數據的同時卻做不好基本的交叉口配時應用。
因此,發展大數據技術不能操之過急,須首先判斷自身的科技、設施、人才、經濟、數據的積累,做好科學系統的規劃后再逐步引進和應用大數據技術。此外,在應用大數據技術的同時,不能只關注成功案例,還要多關注失敗案例,從中汲取教訓。
基于大數據的交通管理本質上是交通信息化管理的一種途徑或者應用。目前,中國的道路交通管理面臨新形勢,對交通信息化管理提出了新的挑戰和更高的要求。在新型城鎮化的背景下,中國的機動化、城鎮化進程加速,交通供需矛盾進一步加劇,運用信息化技術手段緩解交通擁堵成為必由之路。此外,在中國經濟增長呈現新常態、國家預算法出臺、地方政府債務管理體制變革的背景下,大大減少了道路交通管理部門投入的隨意性,規范了投入的力度,以及提高了科學性。
為了應對道路交通信息化管理面臨的新形勢,在反思基于大數據的道路交通管理的基礎上,交通信息化管理的發展路徑應該遵循既要發展大數據,又要善用“小數據”的原則。這里的“小數據”指相對大數據而言數據量較小、種類較少的樣本數據,主要根據傳統的數理統計學原理抽樣得來。基于“小數據”的交通管理,即是運用有限樣本量的抽樣數據,在充分研究事物因果關系的基礎上,開發、標定、運用各種交通模型以輔助科學交通管理。在大數據采集和處理技術出現之前,基于交通流參數的交通科學化、精細化管理都是依賴于對交通“小數據”進行分析和運用。例如,美國道路通行能力手冊(HCM)中,大量的交通工程學模型都是通過充分運用“小數據”進行標定和不斷完善。這些基于“小數據”而建立起來的交通工程學模型,在實踐中被廣泛應用,極大地推動了交通科學研究和工程實踐的發展進步,從這個意義上來說,小即是美。
由于中國交通信息化管理起步較晚,各方面基礎相對薄弱,因此,站在大數據時代的門口回望,依然會發現中國基于“小數據”的交通管理水平還有很大的提升空間。因此,最重要的是首先盤活存量,善用手頭已有的“小數據”,努力夯實科學交通管理的基礎。
1)充分利用“小數據”并促進現有交通管理技術的科學運用。
要重視對現有交通數據的充分利用和挖掘,加強專業人才和配套資金的投入。例如,目前很多交叉口的信號配時仍然不合理,很多是由于缺乏科學的交叉口流量調查基礎、缺乏規范動態的配時調整機制、缺乏專業技術人才以及對配時軟件和模型的不正確使用或降低難度的簡單使用。在缺乏科學合理的交叉口信號配時的情況下,即使引進先進的大數據技術,交通管理的效果也難以顯著提升。道路交通管理部門只有科學地進行交叉口流量調查,充分利用好“小數據”,科學深入地應用信號配時技術,才能真正夯實科學交通管理的基礎。
2)切勿盲目追求技術的升級改造。
大數據潮流的背后更多的是投資人、技術與服務供應商、咨詢公司以及新聞媒體的熱炒,但實際上真正運用大數據的政府管理部門和企業卻頗為迷惑。業界很快發現,很多所謂大數據技術解決方案其實是新瓶裝舊酒,并未給之前的交通信息化管理帶來革命性變化。傳統的數據庫技術和算法模型已經能夠基本滿足需要,并非一定需要運用諸如MapReduce、Hadoop等大數據技術。此外,在很多交通管理部門缺乏基礎交通數據和專業人員的情況下,即使上馬大數據項目,也很難充分發揮作用。因此,與其投入大量的資源引入不實用的大數據技術,倒不如踏踏實實地用好已有資源,切勿盲目追求技術的升級改造。
3)循序漸進提升交通信息化管理水平。
海量的非結構化大數據中確實蘊含巨大的潛在價值,不斷更新的大數據相關技術也是進行數據挖掘、輔助交通管理決策的利器,但這并不意味著就要從基礎弱、底子薄的狀態一下躍變到追逐技術潮流的巔峰。交通管理技術的變革是一個漸進的過程,應當穩健推行,認真研究交通參與者的切實需求,充分運用已有交通管理技術和方法,切勿急功近利。在交通信息化管理的基礎和條件仍然不夠完善的情況下,需要先用好手頭的“小數據”,在充分運用好傳統交通信息化管理技術手段的基礎上,循序漸進,逐漸引入大數據技術。無論大數據概念如何火爆,交通信息化管理的發展都應該回歸理性,以解決問題的有效性和高效性為出發點,恰當運用各種技術。
大數據技術的發展確實能夠提升道路交通管理的科學性和有效性,且進一步提高道路交通管理的信息化水平。得益于大數據技術,過去很難進行處理的海量的非結構化、半結構化多源交通數據變得易于處理,而且處理能力和速度得到極大提升,可以實現很多以前無法實現的功能,蘊藏在海量交通數據中的潛在價值得以被更好發掘。但是,技術的發展和應用是一個需要堅實基礎和循序漸進的過程,在大數據熱潮下,需要回歸理性,正確認識大數據,穩健推進交通信息化管理的發展。
正確認識大數據,即是要科學、理性、全面地了解大數據的局限、成本、風險和應用基礎,而非人云亦云、貪大求全地跟風盲目上馬大數據項目。在自身尚未完全準備好全面擁抱大數據時代時,首先要做好的是秉承小即是美的理念,善用“小數據”,即重視當下,加強對現有交通數據信息的充分利用和價值挖掘,改進和加強科學技術對交通
管理工作的輔助作用。
[1]維克托·邁爾-舍恩伯格,肯尼思·庫克耶.大數據時代:生活、工作與思維的大變革[M].盛楊燕,周濤,譯.杭州:浙江人民出版社,2013.Viktor Mayor-Schonberger,Kenneth Cukier.Big Data:A Revolution that Will Transform How We Live,Work and Think[M].Sheng Yangyan,Zhoutao,translated.Hangzhou:Zhejiang People's Publishing House,2013.
[2]徐煒.交通管理已進入大數據時代[J].道路交通管理,2013(11):36-37.
[3]李佳師.貴州用大數據解決交通擁堵[N].貴州日報,2015-01-06(11).
[4]Yu Huijun,Wang Zhigang,Liu Xiaoyan,et al.A Big Data Application in Intelligent Transport Systems[J].Applied Mechanics and Materials,2015,734:365-368.
[5]馬繼華.解決交通擁堵,大數據應用靠譜嗎?[N].人民郵電,2014-05-05(4).
[6]Buckley Stephen,Lightman Deborah.Ready or Not,Big Data is Coming to a City[C]//Transportation Research Board.TRB 94th Annual Meeting Compendium of Papers,Washington DC:Transportation Research Board,2015.
[7]劉濤.大數據不是萬能的[N].中國國防報,2014-10-29(4).