蔡映雪,胡松,胡輝,陳伽,尹輝,蔡昭權
(惠州學院,惠州516007)
一種面向北斗衛(wèi)星定位技術的結(jié)構(gòu)化數(shù)據(jù)挖掘模式
蔡映雪,胡松,胡輝,陳伽,尹輝,蔡昭權
(惠州學院,惠州516007)
作為我國獨立自主研發(fā)的空間定位技術,北斗衛(wèi)星定位技術已憑借這高精度高可靠的定位、導航、授時服務在地理測繪、水利漁業(yè)、交通運輸?shù)阮I域做出顯著的貢獻。由于北斗衛(wèi)星導航系統(tǒng)的使用尚未全面鋪開,市場規(guī)模較小,更多領域的應用服務有待深入開發(fā),北斗衛(wèi)星導航系統(tǒng)的市場前景以及發(fā)展?jié)摿θ匀痪薮蟆5跀?shù)量龐大的衛(wèi)星數(shù)據(jù)的數(shù)據(jù)挖掘技術還相對落后,一定程度上制約北斗衛(wèi)星導航系統(tǒng)的進一步發(fā)展。提出一種面向北斗衛(wèi)星定位技術的結(jié)構(gòu)化數(shù)據(jù)挖掘思路,解決過去針對衛(wèi)星數(shù)據(jù)使用方式過于單一、片面的問題。
北斗衛(wèi)星導航系統(tǒng)是基于北斗衛(wèi)星定位技術開發(fā)的一套國際一流的集空間定位、導航、授時等功能于一體的衛(wèi)星導航系統(tǒng)[1]。從2000年到2012年,我國已經(jīng)陸續(xù)發(fā)射了20多顆北斗衛(wèi)星并設立了32個地面站,北斗衛(wèi)星導航系統(tǒng)也正式面向亞太地區(qū)提供服務。目前,我國正加快北斗衛(wèi)星組網(wǎng)的速度,今年我國計劃發(fā)射6-8顆北斗衛(wèi)星,2018年前后將顆完成對“一帶一路”沿線國家提供服務,預計到2020年,北斗衛(wèi)星導航系統(tǒng)將可面向全球提供服務。屆時,北斗衛(wèi)星導航系統(tǒng)的用戶數(shù)量將會達到二十億以上,由此產(chǎn)生的龐大的衛(wèi)星數(shù)據(jù)將是無價之寶。然而目前空間信息領域的數(shù)據(jù)挖掘技術相對落后的現(xiàn)狀無疑是對其的極大浪費。如何將龐大而復雜的衛(wèi)星數(shù)據(jù)轉(zhuǎn)化為商業(yè)價值促使相關行業(yè)發(fā)展起來反哺用戶群體是目前研究學者最為關心的問題[2]。
數(shù)據(jù)挖掘技術是近年來較為熱門的技術話題。數(shù)據(jù)挖掘指的是針對現(xiàn)今互聯(lián)網(wǎng)蓬勃發(fā)展帶來的海量數(shù)據(jù)進行分析,利用數(shù)據(jù)模型和分析算法將隱藏在海量數(shù)據(jù)中有價值的信息提取出來,使得人們能夠更為貼切的理解生活中的客觀規(guī)律,并由此發(fā)掘更適合人類使用的新思想、新技術。數(shù)據(jù)挖掘通常會借鑒統(tǒng)計學的抽樣方法或計算機技術領域的人工智能、模式識別、機器學習等分析和學習的方法[3]。這些方法往往又依賴信號的接收處理、大規(guī)模的信息檢索、算法的最優(yōu)化或競爭進化。因而數(shù)據(jù)挖掘是一個專門而深入的學科,以海量數(shù)據(jù)為基礎的分析、學習和進化。
自20世紀70年代美國成功研制GPS衛(wèi)星定位系統(tǒng)以來,基于GPS衛(wèi)星數(shù)據(jù)的開發(fā)就從未停止過[4]。日本從上世紀90年代開始籌建GPS連續(xù)觀測網(wǎng),并于次年檢測到北海道東部近海8.1級超強地震。同樣的,衛(wèi)星監(jiān)測在地質(zhì)調(diào)查、礦山遙感等方面的應用也毫不落后。1992年,美國開始研制“智能車輛高速公路系統(tǒng)”,以求實現(xiàn)車輛的動態(tài)管理、路線導航、安全檢查、意外救護等任務。2000年前后,國外的大型農(nóng)機制造企業(yè)成功研發(fā)了基于GPS的精細農(nóng)業(yè)系統(tǒng),實現(xiàn)了農(nóng)業(yè)領域的精細化管理。在軍事方面,GPS本身即為軍事目的的專門定制產(chǎn)品,可提供軍隊各指揮系統(tǒng)各艦隊甚至各個飛行管理的靈活管理,是美國軍隊強大的根本所在[5]。而娛樂方面,基于地圖的周邊景點和酒店等目標的導航更是為GPS的發(fā)展提供了強大的助力,并愈發(fā)深入和細化。
在我國,北斗衛(wèi)星導航系統(tǒng)正處在起步階段,近年來正處于逐步升級完善的階段,對衛(wèi)星數(shù)據(jù)的使用還處于跟蹤學習狀態(tài),然而不可否認的是,我國業(yè)界對于北斗衛(wèi)星導航系統(tǒng)的價值挖掘從未停止[6]。無論是2008年汶川地震還是還是北京奧運會,無論是氣象預報還是交通管理,都無處不有北斗衛(wèi)星導航系統(tǒng)的身影。出色的空間定位技術將會越來越多的被應用到各行各業(yè)中去,此為北斗衛(wèi)星定位技術在未來的大趨勢[7]。
以車輛為例,車載接收器能夠通過北斗衛(wèi)星從車輛的日常運行過程中獲得大量的狀態(tài)數(shù)據(jù),如偽距、多普勒觀測值、北斗時等。這些數(shù)據(jù)是動態(tài)且實時更新的,反映了車輛實時的運行狀態(tài),數(shù)據(jù)項越多則對車輛狀態(tài)的描述越為準確。這些狀態(tài)數(shù)據(jù)為道路交通狀況的智能分析提供了基礎。由于數(shù)據(jù)的多樣性及零散性,且數(shù)據(jù)均為狀態(tài)值,并非我們對于描述物體運動狀態(tài)所需要的數(shù)據(jù)值,我們難以從海量的復雜數(shù)據(jù)中快速且概括性的了解物體本身的運動狀態(tài),因而需要在前期對采集到的數(shù)據(jù)進行數(shù)據(jù)的結(jié)構(gòu)化提取。
從衛(wèi)星回傳的數(shù)據(jù)中,包含了衛(wèi)星檢測到物體運動狀態(tài)的所有觀測值,然而當我們需要從某一方面描述物體的狀態(tài)是,是不需要將所有觀測到的狀態(tài)值全部用上的,所以挑選必要的數(shù)據(jù)項就顯得尤為重要。舉個例子,當需要測算車輛的速度時,就必須知道車輛在規(guī)定時間內(nèi)移動的距離,這就需要獲取車輛在這段規(guī)定時間內(nèi)一系列延續(xù)性的坐標變化,進而計算出路程,最后利用速度公式計算出車輛的速度。

而當需要得到的數(shù)據(jù)約為抽象時,結(jié)構(gòu)化數(shù)據(jù)提取的步驟及層次將會更多。如需要檢測車流量的時候,設同一路段每小時車流量為M,平均數(shù)為G,計算Mn與G的增量比Vn,則有:

其中車流量M、平均數(shù)G均為多維度計算后得到的結(jié)果。
結(jié)構(gòu)化數(shù)據(jù)的提取只是對零散而基礎的數(shù)據(jù)進行初步的聚合或統(tǒng)計,并非深入挖掘不同數(shù)據(jù)項之間的關聯(lián)性,難以在提升數(shù)據(jù)價值方面取得較為顯著的效果,因此還需要在具有一定擬合的數(shù)據(jù)基礎上利用更具有學習能力、更能提取數(shù)據(jù)特征的算法來完成數(shù)據(jù)價值的挖掘。
數(shù)據(jù)挖掘應該是一個不斷提升數(shù)據(jù)價值的過程,而不是一門單一的技術或手段。數(shù)據(jù)挖掘的過程中會不斷的產(chǎn)生新的高維度數(shù)據(jù)及其集合,這個過程一旦開始就將不斷的利用機器學習的原理,不斷地由基礎數(shù)據(jù)形成可描述的數(shù)據(jù)集合,然后利用一些規(guī)定的條件對數(shù)據(jù)集合進行提取或清洗,去除冗余無效的數(shù)據(jù),然后根據(jù)數(shù)據(jù)之間展示出來的規(guī)律性或關聯(lián)性進行數(shù)據(jù)聚合,形成一定的數(shù)據(jù)模型,結(jié)合分類思想,得到一批新的數(shù)據(jù),并在此基礎上再次提取或清洗。在這一反復循環(huán)的過程中,會出現(xiàn)反復的衍生或歸并,產(chǎn)生不同維度的新數(shù)據(jù),直到數(shù)據(jù)被認可為有價值為止。
根據(jù)上述思路,可以形成一種面向結(jié)構(gòu)化數(shù)據(jù)的數(shù)據(jù)挖掘模式,其中包含以下步驟:
(1)數(shù)據(jù)收集。在該步驟中,需要收集一切有效數(shù)據(jù),并根據(jù)結(jié)構(gòu)性進行調(diào)整和歸類,使得數(shù)據(jù)看起來顯得更為科學和合理。
(2)數(shù)據(jù)提取和清洗。在該步驟中,對收集到的有效數(shù)據(jù)進行高維度的提取,形成一批新的高維度數(shù)據(jù)作為下一輪數(shù)據(jù)的聚合和分類提供原材料。
(3)數(shù)據(jù)聚合和分類。當新的高維度數(shù)據(jù)形成的時候,不同數(shù)據(jù)之間必然會存在一定的規(guī)則關聯(lián)性或趨向性,是下一輪數(shù)據(jù)挖掘的前提,根據(jù)不同的關聯(lián)性或趨向性對本次產(chǎn)生的高維度數(shù)據(jù)進行分類,有助于數(shù)據(jù)的進一步挖掘。
(4)挖掘結(jié)果分支的回溯。數(shù)據(jù)并非維度越高,代表性越強,反而容易因為算法的缺陷使得某些有用數(shù)據(jù)被排斥掉,因而需要對原始數(shù)據(jù)的挖掘操作進行回溯,使得相同的原始數(shù)據(jù)在不同數(shù)據(jù)挖掘算法的計算下得到不同的結(jié)果集,形成更多的結(jié)果分支,這樣有利于增加訓練集,同時也能讓數(shù)據(jù)挖掘算法自身能夠通過機器學習的方式進行自我完善。
結(jié)構(gòu)化數(shù)據(jù)挖掘模式如圖1所示。

圖1 結(jié)構(gòu)化數(shù)據(jù)挖掘模式示意圖
日益完善的北斗衛(wèi)星導航系統(tǒng)具有廣闊的市場前景,然而與之匹配的數(shù)據(jù)挖掘方式效果不盡人意,使得衛(wèi)星數(shù)據(jù)資源造成了巨大的浪費。本文結(jié)合機器學習的思路,提出了一種面向北斗衛(wèi)星定位技術的結(jié)構(gòu)化數(shù)據(jù)挖掘思路,解決了過去針對衛(wèi)星數(shù)據(jù)使用方式過于單一、片面的問題。
[1]仙桃蒸三元.北斗衛(wèi)星導航系統(tǒng)[J].黑龍江科技信息,2012(12).
[2]張勝茂,程田飛,王曉璇,等.基于北斗衛(wèi)星船位數(shù)據(jù)提取拖網(wǎng)航次方法研究[J].上海海洋大學學報,2016,25(1):135-141.
[3]JiaweiHan,MichelineKamber,JianPei,等.數(shù)據(jù)挖掘:概念與技術[M].機械工業(yè)出版社,2012.
[4]張治宇.GPS應用與發(fā)展[J].新絲路,2016(14):144-144.
[5]張勇,陳正陽.GPS在軍事后勤保障中的應用[J].北京測繪,2008(4):56-59.
[6]陳建成.北斗導航系統(tǒng)應用在我國社會經(jīng)濟發(fā)展中的作用[J].中國電子商情:通信市場,2007(Z1):47-48.
[7]閆忠文.中國衛(wèi)星北斗導航應用產(chǎn)業(yè)發(fā)展思路[J].衛(wèi)星應用,2014(4):7-10.
A Structured Data Mining Model For Beidou Satellite Location Technology
CAI Ying-xue,HU Song,HU Hui,CHEN Jia,YIN Hui,CAI Zhao-quan
(Huizhou University,Huizhou 516007)
As China's independent research and development of space positioning technology,Beidou satellite positioning technology has been relying on this high-precision and reliable positioning,navigation,timing services in the geographical surveying,water conservancy and fisheries,transportation and other fields to make a significant contribution.As the use of Beidou satellite navigation system has not yet fully rolled out,the market size is small,more areas of application services to be in-depth development,Beidou satellite navigation system market pros?pects and development potential is still huge.But based on a large number of satellite data mining technology is still relatively backward,to some extent,constrained the further development of the Beidou satellite navigation system.Presents a structured data mining idea for Bei?dou satellite positioning technology,which solves the problem that the satellite data is used in the past is too single and one-sided.
1007-1423(2017)27-0033-04
10.3969/j.issn.1007-1423.2017.27.008
北斗衛(wèi)星定位技術;結(jié)構(gòu)化;數(shù)據(jù)挖掘;商業(yè)價值
惠州市科技計劃項目(No.2014B020004023、No.2015B010002002)、廣東省普通高校青年創(chuàng)新人才類項目(No.2015 B010002002)
蔡映雪(1983-),女,廣東汕尾人,本科,研究方向為計算機軟件
胡松(1985-),女,河北秦皇島人,碩士,講師,研究方向為信息系統(tǒng)和信息管理
胡輝(1979-),女,江蘇鹽城人,碩士,講師,研究方向為計算機軟件
陳伽(1979-),男,廣東惠東人,碩士,研究方向為計算機軟件和計算機網(wǎng)絡
尹輝(1983-),男,廣西桂林人,碩士,研究方向為3S應用
蔡昭權(1970-),男,廣東陸豐人,碩士,教授,研究方向為計算機網(wǎng)絡、智能計算、數(shù)據(jù)庫
2017-07-11
2017-09-10
Beidou Satellite Positioning Technology;Structured;Data Mining;Commercial Value