陳宗娟 孫二鑫 李晉津
(中汽數(shù)據(jù)(天津)有限公司,天津 300300)
在大數(shù)據(jù)時(shí)代的浪潮下,大數(shù)據(jù)逐漸成為企業(yè)的核心競(jìng)爭(zhēng)資源[1]。汽車行業(yè)作為國(guó)民重要支柱性產(chǎn)業(yè)之一,其產(chǎn)業(yè)鏈長(zhǎng)、關(guān)聯(lián)度高、消費(fèi)群體廣泛、數(shù)據(jù)來(lái)源多樣,大數(shù)據(jù)在汽車行業(yè)的應(yīng)用必將發(fā)揮巨大的價(jià)值[2-3]。運(yùn)用GIS地圖表達(dá)結(jié)合空間數(shù)據(jù)挖掘等方式對(duì)汽車產(chǎn)業(yè)大數(shù)據(jù)進(jìn)行分析展示,從空間維度揭示大數(shù)據(jù)的規(guī)律,實(shí)現(xiàn)車輛智能管控和調(diào)度、市場(chǎng)需求精準(zhǔn)預(yù)測(cè)、安全駕駛水平提升、合理進(jìn)行業(yè)務(wù)布局、汽車產(chǎn)品質(zhì)量提升等都具有重要的現(xiàn)實(shí)意義[4-6]。本文通過(guò)構(gòu)建汽車產(chǎn)業(yè)大數(shù)據(jù)GIS地圖表達(dá)技術(shù)架構(gòu),對(duì)汽車產(chǎn)業(yè)大數(shù)據(jù)的來(lái)源、分類、存儲(chǔ)、管理、分析以及GIS地圖表達(dá)進(jìn)行了系統(tǒng)的總結(jié)和研究,并研究了GIS地圖表達(dá)在汽車行業(yè)大數(shù)據(jù)中的典型應(yīng)用,為汽車行業(yè)大數(shù)據(jù)信息挖掘和展現(xiàn)方式的研究工作提供參考。

圖1 汽車產(chǎn)業(yè)大數(shù)據(jù)GIS 地圖表達(dá)技術(shù)架構(gòu)圖
GIS地圖表達(dá)充分利用了地理信息技術(shù)提供的空間數(shù)據(jù)可視化能力,將汽車產(chǎn)業(yè)數(shù)據(jù)通過(guò)處理整合成地理空間數(shù)據(jù),用地圖的方式進(jìn)行數(shù)據(jù)表達(dá),在空間維度上實(shí)現(xiàn)了大數(shù)據(jù)的分析。本文通過(guò)構(gòu)建技術(shù)架構(gòu)見(jiàn)圖1所示,描述汽車產(chǎn)業(yè)大數(shù)據(jù)GIS地圖表達(dá)的流程體系。
汽車產(chǎn)業(yè)大數(shù)據(jù)具有數(shù)據(jù)類型繁多、數(shù)據(jù)量巨大、碎片化傳播的特點(diǎn),其來(lái)源較為廣泛,包括汽車產(chǎn)業(yè)鏈數(shù)據(jù)、互聯(lián)網(wǎng)數(shù)據(jù)、運(yùn)行數(shù)據(jù)、人為數(shù)據(jù)等。汽車產(chǎn)業(yè)鏈數(shù)據(jù)涵蓋汽車設(shè)計(jì)、研發(fā)、生產(chǎn)、制造、銷售、回收等全產(chǎn)業(yè)鏈環(huán)節(jié),又可進(jìn)一步細(xì)化為整車/零部件企業(yè)、新能源車、油車、電商服務(wù)、4S店、汽車保險(xiǎn)、汽車金融、二手車、停車、加油、洗車服務(wù)等;隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,汽車產(chǎn)業(yè)大數(shù)據(jù)呈現(xiàn)爆發(fā)式的增長(zhǎng),互聯(lián)網(wǎng)數(shù)據(jù)來(lái)源包括車聯(lián)網(wǎng)數(shù)據(jù)、移動(dòng)通信數(shù)據(jù)、線上交易數(shù)據(jù)、消費(fèi)者數(shù)據(jù)、開(kāi)放數(shù)據(jù)、平臺(tái)數(shù)據(jù)等;汽車運(yùn)行過(guò)程中傳感器傳輸數(shù)據(jù)、終端采集數(shù)據(jù)、駕駛員和乘客數(shù)據(jù)等,形成一系列實(shí)時(shí)、連續(xù)的數(shù)據(jù);另外,人們通過(guò)社交媒體等產(chǎn)生的數(shù)據(jù),也構(gòu)成龐大的汽車產(chǎn)業(yè)大數(shù)據(jù)。
汽車產(chǎn)業(yè)大數(shù)據(jù)按照對(duì)象分類可分為車、人、環(huán)境三個(gè)方面的數(shù)據(jù)。其中,與車相關(guān)的數(shù)據(jù)包括汽車產(chǎn)品大數(shù)據(jù)、汽車運(yùn)行大數(shù)據(jù)、汽車流通大數(shù)據(jù)以及汽車后市場(chǎng)大數(shù)據(jù)等;與人相關(guān)的數(shù)據(jù)有基本信息大數(shù)據(jù)、消費(fèi)大數(shù)據(jù)、用車大數(shù)據(jù)等;與環(huán)境相關(guān)的大數(shù)據(jù)有天氣大數(shù)據(jù)、道路大數(shù)據(jù)、駕駛場(chǎng)景大數(shù)據(jù)等,每個(gè)大數(shù)據(jù)類別具有廣泛的外沿。按照數(shù)據(jù)格式分類可分為:文本、圖片、文件、視頻、音頻等結(jié)構(gòu)化、非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),其中,和地理位置有關(guān)的數(shù)據(jù)都稱為空間大數(shù)據(jù),也是GIS地圖表達(dá)的基礎(chǔ)數(shù)據(jù)。
豐富的業(yè)務(wù)數(shù)據(jù)需要強(qiáng)大的存儲(chǔ)、管理和運(yùn)算能力。以數(shù)據(jù)中心的方式構(gòu)建數(shù)據(jù)倉(cāng)庫(kù),為基礎(chǔ)的管控與決策支持提供強(qiáng)大的前提保障,實(shí)現(xiàn)業(yè)務(wù)數(shù)據(jù)的集中管理和共享。以關(guān)系型數(shù)據(jù)庫(kù)、非關(guān)系型數(shù)據(jù)庫(kù)結(jié)合分布式存儲(chǔ)的結(jié)構(gòu)模式進(jìn)行數(shù)據(jù)的存儲(chǔ)工作,存儲(chǔ)結(jié)構(gòu)采用集群化的方式進(jìn)行存儲(chǔ),保證數(shù)據(jù)的安全性、穩(wěn)定性、易擴(kuò)展性、高性能和靈活性。通過(guò)數(shù)據(jù)的清洗、解析、判讀和建模進(jìn)行數(shù)據(jù)的有效管理,利用算法、模型、并行計(jì)算等形成高效的計(jì)算架構(gòu)。應(yīng)用算法建模、模型評(píng)估、機(jī)器學(xué)習(xí)、數(shù)據(jù)重構(gòu)等挖掘數(shù)據(jù)價(jià)值,以接口的方式提供給展示端應(yīng)用。
GIS地圖表達(dá)用地圖的方式將龐大、復(fù)雜的空間地理信息數(shù)據(jù)進(jìn)行分類、表達(dá)和直觀呈現(xiàn),不僅可以對(duì)經(jīng)典的矢量、柵格等基礎(chǔ)空間數(shù)據(jù)進(jìn)行分析展示,還可以實(shí)現(xiàn)對(duì)實(shí)時(shí)傳輸數(shù)據(jù)的可視化,有助于管理人員進(jìn)行快速輔助決策,挖掘大數(shù)據(jù)的隱藏價(jià)值。可使用單值圖、熱力圖、聚合圖、氣泡圖、類別圖、時(shí)態(tài)圖等方法對(duì)數(shù)據(jù)進(jìn)行渲染[7],揭示空間大數(shù)據(jù)在地理位置上的分布規(guī)律,另外,GIS與柱圖、餅圖、折線圖等統(tǒng)計(jì)圖表的結(jié)合將有效補(bǔ)充非空間信息的統(tǒng)計(jì)規(guī)律。常用的支持GIS空間大數(shù)據(jù)可視化分析的工具有:Echarts、Openlayers、Leaflet、ArcGIS API for javascript、PolyMaps等,可根據(jù)開(kāi)發(fā)需求、數(shù)據(jù)類別、展示效果等進(jìn)行選用或組合使用。

圖2 車輛和V2X 設(shè)備分布圖
分布圖以符號(hào)化的形式表示數(shù)據(jù)的空間位置分布,比較簡(jiǎn)單、直觀,是GIS中最常用的一種地圖表達(dá)方式。根據(jù)數(shù)據(jù)傳輸類別的不同,除了可以展示一些靜態(tài)數(shù)據(jù)之外,還可以展示一些實(shí)時(shí)動(dòng)態(tài)數(shù)據(jù),結(jié)合點(diǎn)位屬性可查詢點(diǎn)位的相關(guān)信息。分布圖在汽車產(chǎn)業(yè)中應(yīng)用較為廣泛,公交、汽車等車輛實(shí)時(shí)監(jiān)控、整車廠/零部件企業(yè)分布、加油站分布、交通事故分布等均可以分布圖的形式展示,不同的數(shù)據(jù)類型可以圖層的方式疊加顯示,揭示數(shù)據(jù)在空間位置上的規(guī)律,輔助進(jìn)行精準(zhǔn)決策。車輛和V2X設(shè)備分布圖2所示。
熱力圖對(duì)特定區(qū)域的數(shù)據(jù)點(diǎn)進(jìn)行疊加計(jì)算,通過(guò)顏色的漸變來(lái)反應(yīng)點(diǎn)的密度、數(shù)值大小,顏色越深則點(diǎn)的密度越大、數(shù)值越高。熱力圖可以分區(qū)域進(jìn)行渲染、也可以對(duì)某一數(shù)據(jù)進(jìn)行統(tǒng)一渲染、也可對(duì)路線進(jìn)行渲染。熱力圖在汽車產(chǎn)業(yè)中的應(yīng)用場(chǎng)景很多,經(jīng)典的應(yīng)用是通過(guò)4S店、充電樁的集中分布情況進(jìn)行店面或充電樁的智慧化選址,通過(guò)車流量熱力分布情況分析車輛擁堵信息,從而合理進(jìn)行路徑規(guī)劃,通過(guò)客戶的常見(jiàn)瀏覽路徑設(shè)計(jì)更好的門(mén)店路線和輔助設(shè)施(桌椅等),通過(guò)不同門(mén)店的客戶偏好提供更好的消費(fèi)體驗(yàn)。
流向圖是地圖與流程圖的結(jié)合體,表示對(duì)象從一個(gè)地方運(yùn)動(dòng)到另一個(gè)地方,一段路徑通過(guò)一對(duì)起點(diǎn)、終點(diǎn)來(lái)確定流向。以線符號(hào)來(lái)表示,用線的寬度來(lái)表示每個(gè)流的數(shù)量大小。如某整車廠生產(chǎn)的某個(gè)車型的流向情況、整車廠生產(chǎn)一款車型所需要的零部件來(lái)源,汽車產(chǎn)品材料流向圖直觀揭示了汽車產(chǎn)品材料生產(chǎn)廠商所生產(chǎn)的材料在各地的流向情況。
統(tǒng)計(jì)地圖包括氣泡圖、柱狀地圖、餅狀地圖等,也可以將地圖與統(tǒng)計(jì)圖表進(jìn)行組合使用。氣泡圖根據(jù)某個(gè)屬性,以及值的大小進(jìn)行渲染,數(shù)值越大,氣泡圓圈越大,如中國(guó)各省汽車數(shù)量分布圖;柱狀地圖對(duì)一個(gè)或多個(gè)區(qū)域內(nèi)的一個(gè)或多個(gè)屬性進(jìn)行統(tǒng)計(jì)顯示,柱子越高表示數(shù)值越大;餅狀地圖也是對(duì)一個(gè)或多個(gè)區(qū)域內(nèi)的一個(gè)或多個(gè)屬性進(jìn)行統(tǒng)計(jì)顯示,強(qiáng)調(diào)數(shù)據(jù)與整體之間的相對(duì)關(guān)系,餅狀區(qū)域越大表示屬性占比越高。
3D地圖的視覺(jué)效果更為豐富和酷炫,可以做出更多效果,適配更多場(chǎng)景,為用戶帶來(lái)更加真實(shí)的場(chǎng)景體驗(yàn)。3D地圖多用于加強(qiáng)車輛的可視化運(yùn)營(yíng)管理,可對(duì)道路使用情況、車輛運(yùn)行狀態(tài)進(jìn)行實(shí)時(shí)監(jiān)控和分析,為車場(chǎng)和試驗(yàn)場(chǎng)提供輔助決策。另外,3D地圖在仿真培訓(xùn)、教學(xué)中也有廣泛的應(yīng)用。
總之,在全球制造業(yè)深刻變革和全面重構(gòu)的背景下,汽車產(chǎn)業(yè)大數(shù)據(jù),包括產(chǎn)業(yè)數(shù)據(jù)、運(yùn)營(yíng)數(shù)據(jù)、消費(fèi)數(shù)據(jù)等,都將成為未來(lái)競(jìng)爭(zhēng)的核心突破口[8]。GIS地圖表達(dá)為大數(shù)據(jù)的挖掘提供了新的視角,從空間位置關(guān)系和時(shí)空變遷的角度挖掘大數(shù)據(jù)中的規(guī)律和趨勢(shì),目前GIS技術(shù)在汽車領(lǐng)域有一定的應(yīng)用[9-10],但是應(yīng)用的還不夠深入,還有很多待挖掘的信息。將GIS數(shù)據(jù)表達(dá)廣泛應(yīng)用于汽車產(chǎn)業(yè)數(shù)據(jù)挖掘,結(jié)合其他數(shù)據(jù)挖掘技術(shù)進(jìn)行深度數(shù)據(jù)挖掘和分析,以搶占市場(chǎng)先機(jī),助力汽車產(chǎn)業(yè)智能化轉(zhuǎn)型升級(jí)。