李 莉
(內蒙古烏蘭察布市運輸管理處)
公路汽運是一個國家的基礎性和服務性產業。在2013年6月20日,我國交通運輸部總規劃師戴東昌在新聞發布會上表示,我國公路交通承擔78.2%的貨運量和93.5%的客運量。與改革開放初期相比,我國汽車客運量和貨運量都增長了百倍之多,但我國公路汽運依然存在著基礎設施差、路網密度低、運輸車輛不合理以及各地區發展不均衡等問題。
通過應用數據挖掘技術,我們通過分析可以為管理者們提供一個科學的管理方法,這對公路汽運是相當重要的,這就可以在同等條件下把公路汽運的安全性、快速性等提高一個水平。
數據挖掘技術指的是從統計過的大量相關數據中搜索出隱藏的有用信息,它通常和計算機技術、統計學、在線分析處理技術、情報檢索以及專家系統相結合來實現目標。
整個工作可分為三個階段:1.數據準備;2.數據挖掘;3.結果表達和解釋(下圖1 為數據挖掘結構圖)。

圖1 典型的數據挖掘系統結構圖
目前我們賦予數據挖掘的任務包括:關聯分析、聚類分析、分類分析、特異群組分析和演變分析等。這項技術已經被廣泛應用于商務管理、生產控制、市場分析以及科學探索等領域。下面的這個例子為我們生動的詮釋了數據挖掘技術的獨到之處。
在美國一家沃爾瑪連鎖超市中,貨架員將尿布和啤酒擺在一起出售,雖然讓人不可思議,但結果卻是尿布和啤酒銷量都增加了。究其原因,主要是數據處理技術的功勞。原來,沃爾瑪擁有龐大的數據倉庫系統,為了能夠準確了解顧客的購買習慣,沃爾瑪對每個顧客的購物籃進行了分析,結果發現跟尿布一起購買最多的商品竟然是啤酒。分析師最終找到了出現這種奇怪現象的原因:原來美國的很多年輕父親下班后經常要去超市給自己的孩子買尿布,順帶著把喜歡的啤酒也買了。超市將尿布和啤酒擺在距離不遠的貨架后,成功將那些對啤酒需求欲望不是太高的顧客俘獲。
從上述事例中我們可以看出數據挖掘系統可將人們不會想到的事情聯系到一起,所取得的效果也是出乎意料的。
此前的數據挖掘技術已經在交通管理中得到了廣泛的應用,并且挖掘出了很多因素潛在的關聯性和規則性。公路汽運作為交通中的主要組成,相應的數據挖掘技術建立也會較為簡單,而且很多數據還可以和交通管理實現數據共享。此項技術必將能夠帶動我國公路汽運的安全性、合理性更進一步的發展。
公路汽運線路優化可充分利用現有的時間、財務和資源,以最佳的運輸方式、運輸線路、最低的運輸成本、最高的質量和最快的速度來完成最終的運輸目的。目前,我國公路汽運中存在很多不合理之處。
(1)對流運輸:指同類或相互代替的貨物相向運輸,它是最為突出和普遍的一種不合理的運輸形式。其實質是出現了額外的車輛行走里程,增加了不必要的運費。
(2)迂回運輸:由于路徑選擇不當導致沒走最短的路徑。
(3)重復運輸:將可以直線運輸的貨物經不必要的中轉,這種現象浪費裝卸勞力,增加作業負擔,而且增加了運送時間和出入手續,這些都增加了運輸成本。這種不合理的運輸形式在當前快遞中最為常見。
(4)回程為空車:運輸目的達到后回程時空車行駛。這種也會浪費很多運力。
下面我們說一下公路汽運線路方案中數據挖掘技術應用的大致流程。
①相關數據的采集。
首先,要進行數據的采集工作,主要包括:汽車運輸的成本、耗時、耗油量、行程量、貨運量(客運量)、行車環境、貨物種類等。在采集數據時應符合幾個原則:a 直觀性。即所有的參數應易于理解,記錄時也按照一定順序進行;b 便利性。數據的采集工作應該在動員人數、設備最少的條件下進行,最好是在常規交通數據采集下就可完成的;c 經濟性。數據的采集量是很大的,其費用開銷也不能過大;d 可靠性。數據采集時應避免在特殊天氣或背景下進行,保證數據的普遍性、可靠性。
②數據的挖掘和分析。
通過應用數據挖掘技術,我們可以挖掘出汽車運輸的成本、耗時、耗油量等因素之間的關系,繪制出它們的擬合曲線,找出各個量之間的關系。
③結果的表達
通過進行數據挖掘,可以更加全面直觀的了解各個因素之間的相互影響關系,為決策者提供有效的技術支持,這樣就可以有效減少公路汽運中線路安排不合理現象的存在。
交通安全始終是人們和各級政府時刻關注的話題,根據權威部門統計:多年以來我國每年的交通事故死亡人數均超過10 萬人,造成的財產損失超過400 億,高居世界第一。安全性也事關公路汽運產業的興亡,而通過使用數據挖掘技術,決策者調整相關政策,可以使公路汽運安全性有所提高。
(1)數據采集。
影響公路汽運安全的因素包括很多,其中各個因素中又包含很多小的因素,例如:人為因素(人為因素又包括年齡、性別、學歷等)、車輛因素(包括車齡、車型、電氣設備情況等)和環境因素(包括道路等級、天氣影響、地形地貌等)等等。在數據采集時應注意分類清楚,便于以后的處理。
(2)數據挖掘。
在對公路汽運安全性因素上進行數據挖掘時,我們采用的是關聯法則中的經典算法—Aprior 算法,其核心思想是基于兩階段頻繁集思想的遞推算法。Aprior 算法將發現關聯規則分兩步進行:①通過迭代,檢索出數據庫中的所有頻繁項集(不包括用戶為選擇的范圍);②利用檢索出的頻繁項集構造出用戶最小信任度的規則。其步驟可簡化為:創建數據庫→頻繁項集表→交通事故關聯規則→關聯規則結果。
(3)結果的表達。
通過數據挖掘,我們可以找出影響公路汽運安全性的最大因素,以及這些因素之間的關聯,其結果很可能是意想不到的,例如:我們的主觀意念都是覺得駕齡越少,其事故率越高,然而交通管理部門對事故數據庫經過進行數據挖掘,發現駕齡在6 ~10年的老司機才是名副其實的“馬路殺手”。所以,得到分析結果后相關領導應及時采取改進措施。
汽運站點的合理與否將會大大影響客運量情況,更加人性化的站點布局也會使“提倡綠色出行,發展公共交通”的政策實施起來更加容易。在平時我們布局公路汽運站點時,一般是等距離平分這段線路,這就存在很多不合理的地方,例如:在居民較為稠密的地方沒站點,還得步行一段距離,這必然導致很多人選擇其他的交通方式;而有的站點周圍根本沒有對汽車需求很強烈的群體。這樣公路汽運的作用就會大打折扣,所以對此問題應用數據挖掘技術較為緊迫。
對公路汽運的站點布置應該由乘客的實際需求度決定。我們可以對乘客(包括身份、年齡、性別等)、周邊居民區和公共場所(學校、醫院等)等相關數據進行采集,建立數據庫。然后建立相關算法,對數據庫進行數據挖掘。
目前,我國各大城市對公交站點、汽車站的位置進行了適當調整,很多城市實現了交通工具之間的“無縫對接”以及“百米距離內換乘”。只有站點布局更為合理了,才可以使得公路汽運在國家提倡“節能減排”的時候大顯身手。
隨著我國經濟的不斷發展和人們生活品質的不斷提高,公路汽運必將會越來越貼近我們的日常生活。八零后、九零后的網購習慣、旅游愛好等無一不是和公路汽運密切相關的,而隨著更多的年輕人消費能力的提升,公路汽運的發展前景也會越來越廣闊。數據挖掘技術能夠幫助公路汽運公司的領導者做出更為明智、正確的決策,完全可以作為一種保障企業科學管理的有效手段。我們應積極接受這門先進的管理方法,還要相應的引進這方面的人才,為公路汽運事業的順利發展保駕護航。
[1]張小利,陳莉.數據挖掘在智能交通系統中的應用(自然科學版)[J].西北大學學報,2005,(11):26-28.
[2]黃解軍,潘和平,萬幼川.數據挖掘技術的應用研究[J].計算機工程與應用,2003,(2):45-48.
[3]鄒力鵑,王麗珍.空間數據挖掘發展研究[J].計算機工程與應用,2003,(11):186-188.
[4]黃曉霞,蕭蘊詩.數據挖掘集成技術研究[J].計算機應用研究,2003,(4):37-39.