田科
摘要:數(shù)據(jù)挖掘技術(shù)的推廣應(yīng)用為高速公路運營的管理和服務(wù)水平提升帶來了便利。近年來,隨著我國經(jīng)濟的不斷發(fā)展,高速公路的通車里程不斷增加,車輛通行量逐年攀升,傳感設(shè)施的建設(shè)也越來越多,使得在高速公路運營管理的各種系統(tǒng)中存儲的數(shù)據(jù)資源越來越多。文章對數(shù)據(jù)挖掘在高速公路運營管理中的應(yīng)用進行了探討。
關(guān)鍵詞:數(shù)據(jù)挖掘;數(shù)據(jù)分析;高速公路;運營管理;數(shù)據(jù)資源 文獻標識碼:A
中圖分類號:TP311 文章編號:1009-2374(2016)12-0049-02 DOI:10.13535/j.cnki.11-4406/n.2016.12.023
隨著我國高速公路的通車里程不斷增加,方便了司乘人員的同時也對管理者提出了新課題。高速公路運營管理過程中產(chǎn)生了大量的數(shù)據(jù),占用了存儲資源,卻不能進行有效的融合分析,如何對這些海量的信息進行處理并對提升決策水平提供依據(jù),是目前高速公路管理者需要解決的問題。通過數(shù)據(jù)挖掘技術(shù),可以有效地解決這些問題,利用這些數(shù)據(jù)進行融合分析,為高速公路安全暢通提供了決策支持。
1 背景探析
從高速公路信息化數(shù)據(jù)量來看,我國高速公路具備大規(guī)模數(shù)據(jù)應(yīng)用的基礎(chǔ)。截至2015年,全國高速公路總里程達120000萬公里;就河南省而言,高速公路通車里程約為6300公里,從2004年開始運營的高速公路聯(lián)網(wǎng)收費系統(tǒng)至今已過去12年,累積的流水數(shù)據(jù)已達數(shù)百億條,而且還以每天數(shù)萬條流水的速度在增長,這些數(shù)據(jù)就像一片待開發(fā)且肥沃的土地一樣,充滿無限的可能和生機。
2 數(shù)據(jù)挖掘及其應(yīng)用
數(shù)據(jù)挖掘可從大量亂序的、隨機的、不確定的數(shù)據(jù)中根據(jù)需求,提取出隱藏較深并且有利用價值的信息。數(shù)據(jù)挖掘是一種涉及范圍較廣的學(xué)科,它不僅包含數(shù)據(jù)統(tǒng)計、模式發(fā)現(xiàn)、神經(jīng)網(wǎng)絡(luò)等內(nèi)容,而且囊括了可視化、知識庫系統(tǒng)等其他領(lǐng)域。現(xiàn)階段,數(shù)據(jù)挖掘技術(shù)隨著科技的不斷進步逐漸完善,已經(jīng)被普遍應(yīng)用于各個行業(yè):
2.1 在體育競技方面的應(yīng)用
美國一家科技公司研發(fā)的大數(shù)據(jù)挖掘軟件曾被美國的多個籃球教練所使用,數(shù)據(jù)挖掘技術(shù)能夠通過對籃球隊中隊員的排列情況進行分析得出有效的隊形和戰(zhàn)術(shù)。
2.2 在商業(yè)銀行中的應(yīng)用
數(shù)據(jù)挖掘在金融領(lǐng)域的應(yīng)用越來越普遍、廣泛,金融行業(yè)可利用數(shù)據(jù)挖掘系數(shù)對客戶的信息進行分析和篩選,同時也進行一定的金融風(fēng)險評估,通過數(shù)據(jù)挖掘軟件不僅能夠制定吸引客戶的營銷戰(zhàn)略,而且對客戶、信用卡以及投資產(chǎn)品等項目進行分類,以便為客戶提供最適宜的金融項目。
2.3 在電信行業(yè)中的應(yīng)用
電信行業(yè)會將數(shù)據(jù)挖掘軟件應(yīng)用于客戶在年齡、入網(wǎng)時間、注冊產(chǎn)品等數(shù)據(jù)的統(tǒng)計中,比如對客戶是否使用了電信公司提供的某種產(chǎn)品進行統(tǒng)計,可以清楚地得出該產(chǎn)品是否被廣大用戶所接受,借此進行下一步產(chǎn)品營銷的規(guī)劃。
3 數(shù)據(jù)預(yù)處理方法
數(shù)據(jù)挖掘首先要對數(shù)據(jù)進行預(yù)處理,包含了多種功能和處理方法,下面針對高速公路數(shù)據(jù)特點對數(shù)據(jù)處理方法進行探討:
3.1 數(shù)據(jù)清理
因為高速公路管理和系統(tǒng)設(shè)計等問題,數(shù)據(jù)庫中往往存儲了大量雜亂的信息內(nèi)容,并不是所有的信息都有利用價值,如果數(shù)據(jù)中存在很多冗余數(shù)據(jù),就會增加大數(shù)據(jù)挖掘的難度,影響分析結(jié)果,所以要進行數(shù)據(jù)清理工作,按照一定規(guī)則將錯誤的、有沖突的、不完整的數(shù)據(jù)進行清理。例如,高速公路中聯(lián)網(wǎng)收費數(shù)據(jù)整理時,就會發(fā)現(xiàn)很多車牌識別錯誤、計重明顯有偏差、車型判斷錯誤等“臟數(shù)據(jù)”,可設(shè)計預(yù)處理功能將這些沒有利用價值的信息進行清理,從而提升大數(shù)據(jù)挖掘的效率和準確率。不同的數(shù)據(jù)要采用不同的清理方式,在處理一些缺失的數(shù)據(jù)時,比如巡邏日志的登記有很多缺失的字段,要結(jié)合業(yè)務(wù)特點將可能丟失的數(shù)據(jù)進行填充,對于重復(fù)數(shù)據(jù)的清理則應(yīng)根據(jù)實際情況進行清理后核對。
3.2 數(shù)據(jù)集成
根據(jù)數(shù)據(jù)挖掘的任務(wù)與目標,需要將不同來源、格式、性質(zhì)的數(shù)據(jù)進行集中,為用戶提供數(shù)據(jù)綜合分析和共享,強化信息的使用效率并可以在不同角度提供決策支持。比如對高速公路的數(shù)據(jù)分析中,需要將分散的巡查日志、超限信息、施工信息、監(jiān)控信息等數(shù)據(jù)進行匯總,為下一步的數(shù)據(jù)挖掘工作提供數(shù)據(jù)支持,這種集成能夠?qū)⑾嚓P(guān)數(shù)據(jù)進行綜合處理和分析。
3.3 數(shù)據(jù)轉(zhuǎn)換
數(shù)據(jù)挖掘中需要進行數(shù)據(jù)格式轉(zhuǎn)換,因為各個系統(tǒng)設(shè)計的時間較早,沒有按照統(tǒng)一的格式和發(fā)展規(guī)劃進行建設(shè),造成數(shù)據(jù)的結(jié)構(gòu)相差很大,部分模擬信號還沒有進行數(shù)字化分析存儲,為提升數(shù)據(jù)挖掘的效率,需要將數(shù)據(jù)進行統(tǒng)一處理,例如高速公路監(jiān)控和各種車感器信息是非常好的信息來源,其中往往蘊含著各種事故信息、危險路段、惡劣天氣等的規(guī)律,可為應(yīng)急指揮提供決策支持,面對這些信息我們可以利用數(shù)據(jù)提取算法,提取其中的有價值信息,按照統(tǒng)一的格式進行數(shù)字化存儲,為數(shù)據(jù)挖掘提供資源,對于其他較為復(fù)雜的信息來說,同樣需要結(jié)合業(yè)務(wù)要求和規(guī)律進行分析和提取工作。
3.4 數(shù)據(jù)歸約
將數(shù)據(jù)集成和轉(zhuǎn)換存儲后會形成海量的數(shù)據(jù),除了設(shè)計建設(shè)高效的大數(shù)據(jù)分析平臺外,對數(shù)據(jù)的規(guī)約也是精簡數(shù)據(jù)量的有效方法,利用特征歸約、樣本歸約、特征值歸約等方法,可以將數(shù)據(jù)集上的分析挖掘更有效,且不影響分析結(jié)果。同時可利用信息可視化技術(shù),建立可視化的信息分析模型,使得信息的分析結(jié)果形成抽象程度高、規(guī)律性特征清晰、展現(xiàn)能力強的可視化形式,為輔助決策提供多元化參考。
4 數(shù)據(jù)挖掘在高速公路管理中的應(yīng)用
隨著智能交通的發(fā)展,高速公路信息化建設(shè)和應(yīng)用已經(jīng)非常廣泛,我國在該領(lǐng)域中投入了大量的人力和財力,數(shù)據(jù)挖掘的應(yīng)用規(guī)模也在短期內(nèi)增長迅速。
4.1 高速公路通行信息的數(shù)據(jù)應(yīng)用
第一,通過對省內(nèi)各高速公路收費站車輛來往信息,能夠根據(jù)進出站、行駛路段、行駛時間等因素對車流量的情況進行分析,得出車流的分布特點,為高速公路收費系統(tǒng)的優(yōu)化,提高通行效率提供數(shù)據(jù)依據(jù);第二,通過對省內(nèi)高速公路的收費數(shù)據(jù)進行歸納和篩選,與當?shù)馗黜椊?jīng)濟指標進行對比,建立預(yù)測模型,能夠?qū)ξ磥硪欢螘r間內(nèi)的聯(lián)網(wǎng)收費情況進行預(yù)測;第三,通過對省內(nèi)高速公路指定區(qū)域內(nèi)的車流量數(shù)據(jù)信息,得出該區(qū)域路段的車輛密度,預(yù)測道路養(yǎng)護費用,降低運營單位成本投入;第四,通過對交通量等歷史數(shù)據(jù)的分析并結(jié)合高速公路網(wǎng)模型,能夠分析出各時段車輛分布圖,遇到突發(fā)情況,可進行高效的指揮調(diào)度;第五,通過對車輛通行信息、氣象信息、道路路況信息等融合分析,能夠制定出安全駕駛的相關(guān)提示,最大限度地減少交通事故的發(fā)生;第六,通過對省內(nèi)高速公路車輛通行記錄和收費情況等數(shù)據(jù)的分析,能夠提供高速公路未來規(guī)劃依據(jù)。
4.2 對高速公路人員及管理的數(shù)據(jù)應(yīng)用
通過對高速公路聯(lián)網(wǎng)收費系統(tǒng)中收費人員的日常操作信息進行分析,比對通行車輛的統(tǒng)計數(shù)據(jù),能夠預(yù)防收費員出現(xiàn)違規(guī)收費的現(xiàn)象,同時還可通過工作人員的操作日志,如在崗時間、操作的具體步驟、操作流程、設(shè)備使用情況等數(shù)據(jù)進行分析,從而為升級現(xiàn)有系統(tǒng)提供參考依據(jù),避免工作人員的操作失誤,提升工作效率。
4.3 對高速公路司乘人員的數(shù)據(jù)分析
全省每天在高速公路上行駛的車輛數(shù)萬計,通過對這些車輛通行信息的分析,統(tǒng)計不同種類車輛的分布和行駛規(guī)律等,調(diào)整服務(wù)區(qū)的設(shè)置和功能,為司乘人員提供個性化的服務(wù),尤其是我國正處于全面發(fā)展高速公路電子不停車收費的今天,我們要努力提高管理效率,增強服務(wù)意識,發(fā)掘潛在用戶,推動高速公路智能化的健康發(fā)展。
5 結(jié)語
綜上所述,隨著計算機技術(shù)的飛速發(fā)展,全國各地的高速公路都逐漸從信息化向智能化的發(fā)展方向,基礎(chǔ)硬件設(shè)施投入不斷加大,我們更應(yīng)該在高速公路智能化管理上下功夫,利用數(shù)據(jù)挖掘技術(shù)結(jié)合行業(yè)特點能有效地為提升高速公路服務(wù)質(zhì)量做出貢獻,因此,我們需要投入更多的精力在數(shù)據(jù)挖掘的研究和推廣中,全面地推動我國高速公路的智能化建設(shè)。
參考文獻
[1] 郭劉恒.基于聯(lián)網(wǎng)收費數(shù)據(jù)的實時滑動、動態(tài)校核的高速公路交通量預(yù)測方法研究[J].公路,2014,(12).
[2] 武兆偉.高速公路聯(lián)網(wǎng)收費數(shù)據(jù)在路網(wǎng)監(jiān)控中的應(yīng)用研究[J].科技信息,2014,(14).
[3] 余豐茹.基于全車牌識別的高速公路聯(lián)網(wǎng)收費數(shù)據(jù)挖掘系統(tǒng)框架研究[J].公路與汽運,2014,(4).
[4] 李猛.基于RFID技術(shù)多義性路徑識別系統(tǒng)在高速公路聯(lián)網(wǎng)收費中的應(yīng)用[J].廣東科技,2013,(16).
[5] 孫軼軒.基于數(shù)據(jù)挖掘的道路交通事故分析研究[D].北京交通大學(xué),2014.
[6] 申寧.高速公路收費數(shù)據(jù)處理技術(shù)分析[J].中小企業(yè)管理與科技(上旬刊),2013,(2).
(責(zé)任編輯:蔣建華)