李昊原
以前用“掃馬路”的方式,開著車去記錄地圖數據和現實世界的地理信息變化,通常要3~10個月才能呈現到在線地圖上。隨著車聯網、自動駕駛技術的發展,行業對地圖更新速度的要求越來越高,這種方式已經捉襟見肘。大數據等技術為地圖信息采集與更新提供了新的手段。現在,每天行駛在道路上的車會產生大量的軌跡數據,理論上平均只要五分鐘,就可以“跑”出一張北京的公路網。
時下,地圖導航已經不再是出行導航的專屬,而是已延伸到包括物流、電商、保險以及政務等多個領域,越來越成為工作生活中不可或缺的部分。當下,地圖數據也成為BAT等巨頭們激烈角逐的角斗場。對于地圖廠商來說,首要任務是挖掘地圖數據中的商業價值及社會價值。
大數據的產品很美好,但從采集到應用的困難也很“大”。四維圖新集團旗下大數據公司世紀高通產品經理熊繼林介紹,世紀高通的位置大數據平臺MineData目前的數據總量高達4PB,日采集量達到了2.9TB,處理的數據種類高達114種。

這個平臺是將不同部門的數據本身存在交叉使用的場景匯集到同一個大數據平臺上。在這個平臺之上,有三種數據處理系統:數據蜂巢系統DataHIVE、數據可視化的MineMap和算法分析實驗室MineLab。
不同類型和來源的數據,首先通過探針匯集到數據蜂巢之中。“探針往簡單理解,就是在不影響正常運行的情況下傳輸數據,比如汽車中的芯片探針,可以獲取汽車狀態和行駛的數據,在服務器里的探針,可以不影響集群傳遞企業的數據。”熊繼林介紹,探針獲取數據之后,傳輸到蜂巢中進行處理與分類,然后再分揀和提煉到不同的數據沙盒中去。“數據沙盒,你可以理解為數據應用的最小單元。”
在數據可視化和數據分析時,只需根據需求,選配相應的數據沙盒即可。比如在物流行業的數據應用,會用到公路交通網絡、車輛的實時信息和軌跡以及加油站的位置等。這樣從數據收集到處理與應用,可以實時快速地通過數據蜂巢系統完成。“人類最初的地圖是畫在羊皮上、畫在紙上,即使成了電子地圖之后,一開始也是柵格的地圖,說白了是圖片,但我們不能拿圖片去進行數據分析。為什么2C端App上的地圖不適合企業用?因為和具體業務沒有聯系,沒辦法基于需求進行定制,而當數據在數據蜂巢中被打散和處理后,放入到一個個沙盒中,就可以在后臺選配調用,通過MineMap做展示或是通過MineLab進行分析。”
“直接用2C的地圖去做2B的業務,效率很低。”對日常應用來說,市面上主流的互聯網地圖,甚至常見的紙質地圖,區別似乎不大。但對企業來說,應用于自身業務的地圖,則有著完全不同的要求。在熊繼林看來,對于想要應用位置信息服務平臺的企業來說,面臨的最大問題,就是如何將業務數據放到地圖上。

四維圖新旗下世紀高通大數據平臺部經理熊繼林
“一千個人眼中有一千個哈姆雷特”,同一個世界,基于不同的用途需要“看到”的信息是不同的。就像古代記錄土地歸屬的魚鱗圖冊,和地鐵一卡通背后的地鐵路線圖,“神似”要比“形似”更為重要。熊繼林舉例,對于物流行業來說,公路網、加油站等要素是關注重點,而軍事機構則需要全部地形要素。
熊繼林和團隊曾經給物流企業做過車輛監控解決方案,通過技術服務實現對物流車輛的實時監控整合車輛的出發點、路線、到達位置,以及當時的路況、是否擁堵等數據,為物流行業計算出合理的路線規劃,極大節省了物流行業的運營成本。類似的技術還用于交警行業,大城市早晚高峰擁堵幾乎是常態,以往是憑交警的經驗,指揮調節車道方向,經常出現同一條主干道上,一個方向交通嚴重擁堵,另一個方向的車輛卻很稀疏。為此,四維圖新為交警系統研發的交警平臺上,通過潮汐模型,用道路和車流量的數據來分配“潮汐車道”,讓交警快速而全面地找到這些需要開設潮汐車道的地方。此外,交警平臺還研發了很多道路交通運行改善的模型,比如擁堵研判,堵點分析,路況預測,紅綠燈配時優化等,通過和西安交警的合作,讓西安市的擁堵情況排名下降了13位。
從最初做圖商,到后來業務的不斷拓展,一方面四維圖新在被自動駕駛、車聯網、新能源等趨勢所推動,另一方面,又利用技術成為了推動者。楊賴土是世紀高通的產品總監,主要負責產品線戰略的制定以及公司產品的規劃、設計驗收和發布。他在同企業客戶交流中發現,國內企業對地理信息系統的需求越來越多,隨著對業務理解和溝通的深入,位置大數據又挖掘出了全新的價值點。
平安保險的車險在北京有400名稽查員,每天的任務就是去處理街上發生的事故,而事故平均每天發生兩三千起,稽查員根本跑不過來。世紀高通的團隊通過大數據,將場景分解,他們分析了北京的事故高發地,提前讓稽查員知道哪里是事故高發地;其次,預測了稽查員在5到10分鐘之內以自我為中心能跑多遠,并以此提供老司機推薦路徑,按起點和終點匹配,更合理更省時間。“這是位置大數據分析結果解決具體問題的案例,我們叫做急速勘察解決方案。

楊賴土,四維圖新旗下世紀高通產品總監
很多在之前看來不好解決的問題,現在通過大數據有了方案,就像一個窗戶紙被捅破。楊賴土介紹,目前MineData可以提供公有云、私有云和混合云的大數據解決方案,并在不斷開拓新的行業客戶。
一直以來,四維圖新都和車廠有著緊密的聯系,對未來公司的定位也是做智能駕駛的大腦,而大數據平臺被視為整個四維圖新數據的出入口。談到大數據平臺的建設程度,熊繼林覺得,還只是達到了階段性的目標。“我們還有許多數據沒有接入進來,比如說車聯網。”而智能駕駛的車輛本身就會產生海量的數據,不僅是車輛的,還有駕駛員和人車交互的數據,未來可能一輛車一天就可以產生4個TB的數據。不久前,四維圖新收購了芯片廠商杰發科,“因為車上的數據都是由芯片收集和處理的,所以未來芯片肯定會占據智能駕駛重要的基礎位置”,目前諸如駕駛員駕駛狀態、緊急剎車情況等重要數據還難以收集,而有了底層的芯片能力,也能夠為大數據平臺提供更全面的數據來源。“我們希望越來越多的數據掌握在自己手里”,楊賴土說,目前大數據平臺與芯片數據的對接剛剛開始,今年他們將和車廠一起推進汽車傳感器數據的采集和接入,未來平臺還將迎來數據量的大爆發。