李川鵬 王秀旭 王耀福


摘 要:本文基于共享出行模式,首先提出了一套出行數據采集、通信、存儲、分析的方法論;其次通過具體實踐,構建了較為完善的全景出行大數據體系;最后從智能研發、智能應用、智慧交通三個方面重點闡釋了出行大數據的具體應用。
關鍵詞:共享模式 大數據 智慧交通
Research on the Construction and Application of Big Data System for Travel Based on Sharing Mode
Li Chuanpeng Wang Xiuxu Wang Yaofu
Abstract:Based on the shared travel model, this article first proposes a set of methodology for travel data collection, communication, storage, and analysis; secondly, through specific practices, the article builds a relatively complete panoramic travel big data system; finally, from the three aspects of transportation: intelligent R&D, intelligent application, and wisdom, the article focuses on the specific application of travel big data.
Key words:Keywords: Sharing Mode, Big Data, intelligent transportation
1 引言
在未來城市出行供給不能依賴汽車保有量的粗放增長,出租車和公共交通的運力提升亦遭遇瓶頸以及城市道路資源緊缺的情況下,汽車共享出行成為一種短期有效的解決方案[1]。同時伴隨著新一輪的科技革命和產業變革,數字經濟和共享經濟在逐步取代傳統的商業模式[2],進一步使得汽車產業、出行服務乃至交通運輸系統的形態及價值鏈發生了顛覆性改變,催化共享出行模式發生著深刻的變化[3]。針對這一現實情境,共享出行作為人、車和服務的鏈接,有助于推進汽車行業全產業鏈的生態布局。而整個汽車全產業鏈匯集著海量數據,基于共享模式如何捕捉汽車產業上下游價值鏈動態并開發潛力,有效變現數據成為重中之重[4]。鑒于此,本文基于共享出行模式,首先提出了一套出行數據采集、通信、存儲、分析的方法論;其次通過具體實踐,構建了較為完善的全景出行大數據體系;最后結合汽車專業細分領域的研究,對運營大數據進行即時分析,從智能研發、智能應用、智慧交通三個方面重點闡釋出行大數據的具體應用。
2 出行大數據體系的構建
隨著共享出行車輛持續運營,采集到實際情況下的運營數據已達TB級,目前已形成一整套較為完備的數據采集方案,但本文旨在數據采集標準化和數據采集、傳輸、存儲和處理的體系化方面實現重點突破。因此,本文構建了出行大數據采集、傳輸、存儲、處理的全生命周期的數據體系。
2.1 數據的采集
在數據采集標準化方面,首先確認數據采集的范圍,確認采集人、車、環境三大類構建運營數據體系,采集頻率方面將數據分為周期性采集、觸發性采集兩類,其中為保證數據分析價值,單數據周期性采集最快頻率為100Hz,硬件到數采的接口以及數據處理的平臺標準。具體如表1所示。
數據采集通過T-BOX、V-BOX、記錄儀、傳感器和攝像頭等多種方式融合的方法來實現。通過T-BOX、車身CAN總線、GPS/BM、加速度傳感器等來采集車的數據和人的部分數據(如駕駛行為等數據),通過CAN 解碼數據處理與主控MCU融合,實現數據精準讀取、支持實時數據獲取;通過攝像頭、記錄儀和V-BOX實現人的部分數據和環境數據的采集。
2.2 數據的傳輸
在數據傳輸方面,通過在T-BOX硬件中內置的8G內存卡和高靈敏度蜂窩網絡天線,將車的數據和人的部分數據以時間戳的形式打包實現異步傳輸,最終通過4G網絡以FTP文件形式傳輸到服務器后進行解析;而人的數據和環境的數據基于V-BOX通過4G網絡傳輸到服務器,同時選擇高規格的服務器來保證每條遷移同步鏈路都能擁有良好的傳輸性。
2.3 數據的存儲
在數據存儲方面,對不同類型的數據建立相應的數據庫進行存儲。首先對于人的數據、車的數據和環境的數據中屬于結構化類型的數據,通過建立關系型數據庫來完成存儲;對于如道路狀況等屬于非結構化類型的數據,通過非結構化WEB數據庫進行存儲。
2.4 數據的處理
在數據處理方面,不同類型需求采取的處理方式不同。通常,實時性需求用EMC的GreenPlum、Oracle的Exadata,以及基于MySQL的列式存儲Infobright進行處理;一些批處理,或者基于半結構化數據的需求使用Hadoop進行處理。在此基礎上,可以利用機器學習中的聚類算法建立標簽體系,利用SVM、NaiveBayes等算法建立模型體系。
2.5 數據可視化
綜上,本文構建了出行大數據采集、傳輸、存儲、處理全生命周期的數據體系。但是該體系本身既龐大又復雜,為了后續標簽體系建立和模型體系的建立,我們需要將借助圖形化的手段將出行大數據進行可視化處理。
3 出行大數據的應用探索
每一臺車不僅僅是出行的工具,而且是互聯網、數字化屬性的載體,面對海量數據如何提取出重要信息并進行分析,以及如何變現成為關鍵的問題。因此,本文需要通過TBOX、VBOX、GPS、RFID、傳感器和攝像頭圖像處理器等裝置設備采集人的數據、車的數據和環境的數據,構建以駕駛行為、生理特征等多維度的數據集。基于采集的數據,結合汽車產業鏈細分領域的研究,對運營大數據進行即時分析。通過算法優化,實現對各類數據信息的讀取和控制,構建各類數據應用模型,深度挖掘數據價值。本文擬與主機廠一起探索一個全景數據運營的鏈條。首先,從底層為主機廠做基礎的數據咨詢規劃,并搭建專屬的數據平臺;其次,基于采集數據建立針對車和用戶的標簽體系和模型體系,從而為用戶提供精準的個性化的服務;最后,基于標簽體系和應用需求,進一步把模型和相關應用場景、產品形態相結合,建立反映硬件損耗關聯度、甚至反映預測用戶價值需求的模型體系,進行產品和服務的專屬設計,并形成一種商業化的運營模式。
在具體的數據應用環節,本文擬從智能研發、智能應用、智能交通三個方面構建大數據應用體系。
3.1 智能研發
在智能研發方面,通過對TBOX、GPS、RFID、傳感器、攝像頭圖像處理器等裝置設備采集到的車況監測信息和環境信息進行整合處理,首先全面準確地分析出研發階段的零部件、整車性能評估、試驗車的DTC問題預警、管理優化、生產線等問題;其次通過GPS、VBOX、攝像頭和傳感器等處理裝置采集到的人的信息和環境的信息,分析出在不同環境下消費者比較中意的車型、最為關注的產品性能等其他方面的偏好,針對消費者的產品需求偏好來對產品進行改進創新,設計生產出大眾消費者心中理想的汽車款型,并根據售后的消費反饋數據,持續地改進調整產品。
3.2 智能應用
圍繞汽車產業鏈,以數據為基礎,用人工智能做出明智的判斷與決定,形成汽車的“數智大腦”。同時基于數據,探索四大數據智能應用方向:智+服務、智+營銷、智+保險和智+調度。本文具體從智+營銷和智+保險談智能應用方向。
智+營銷主要是基于用戶行為構建用戶畫像,提供精準的個性化服務。基于出行大數據體系,用機器學習中的K-means算法建立用戶畫像,準確把握用戶的區域分布、性別分布、年齡分布、興趣愛好、消費偏好等重要信息,從而進行精準的線上產品信息推送和廣告投放;而智+保險主要實現UBI保險創新及共享出行保險機制創新。基于出行大數據體系,到的車的數據、人的數據和環境的數據,建立UBI定價模型對人、車和環境的各個維度數據進行精細化的分析,從而制定出服務不同用戶的差異化的車險定價,以滿足不同用戶不同場景下的需求。
3.3 智慧交通
基于大數據的智慧交通存在多種可能,交通的智能化是根本的趨勢,利用大數據技術和智能分析技術,整合城市管理的其他數據,將真正推動智慧交通建設,為交通管理奠定良好的基礎。基于共享模式建立的出行大數據體系,在獲得人的數據、車的數據和環境的數據的情況下,一方面,交通部門實時掌握了道路上共享汽車流量、客流量信息以及各種道路環境信息,從而科學合理的制定出疏散和管制措施預案,提前預警和疏導交通;另一方面,用戶通過其車載終端或數據采集系統提供的實時數據,幾乎掌握全部主要道路的交通路況,進而科學合理的制定自己的行車路線。同時基于出行大數據體系,結合天津南站項目的具體實踐,將出行大數據與南站數據平臺有機銜接,數據進行實時共享,構建暢達、高效、安全、綠色的南站交通服務系統,提供客運交通網絡實時狀態感知、汽車車輛運行智能監控與調度、多模式運營服務協調、全出行鏈客運信息服務等。
參考文獻:
[1]羅蘭貝格.2018年中國汽車共享出行市場分析預測報告[R].德國:羅蘭貝格,2018.
[2]謝雅玲.新常態下的共享經濟效應[J].現代經濟信息,2017(15):32.