牛慧杰
摘要:伴隨著我國社會經濟發展進程持續加快,我國各行各業都獲得了迅猛發展,基于此背景下的新的信息化技術也層出不窮。就現階段而言,大數據理念的廣泛應用對鐵路運輸發展意義重大。
關鍵詞:“大數據”背景;鐵路運輸;發展策略
當今社會是個信息量爆棚的時代,鐵路行業面臨海量的工作信息,要想在短時間對其進行有效整合和管理,需要及時采集海量的信息數據,通過系統的篩查于分析,為鐵路運輸組織管理人員及時應對、精準決策提供有效的參考信息,這不僅服務于管理層,同時還對基層從業者的工作能力提升具有重要的促進性作用。
一、大數據概述
大數據迄今并沒有公認的定義。但是同傳統數據相比,大數據具有如下5v特征:即體量大、速度快、模態多、難辨識和價值大密度低。相對而言,大數據并不只是在數量上的龐大,更多的是數據類型上的復雜。大數據是一種思想,是一種挖掘思想,淘金思想,核心并不是擁有數據,而是用數據去做什么,大數據有什么不重要,怎么用才重要。大數據的核心價值是預測,本質是基于預測所做出的正確判斷。以往的數據分析是基于精確數據的深度挖掘,大數據則更多是利用已有數據對分析得出某種趨勢。
二、“大數據”背景下鐵路運輸發展策略
1.大數據在鐵路運輸行業數據收集中的運用
隨著近些年來我國鐵路改革的不斷推進,鐵路運行形式和管理方法也發生了翻天覆地的變化,鐵路網絡化售票和實名售票逐漸推行開來,電子商務模式在貨運組織中的應用程度不斷加深,國家出臺一系列政策向鐵路運量傾斜,這些都造成了鐵路運輸數據的進一步增加。結合鐵路企業實際發展情況來看,還需要不斷規劃統籌建設大數據結構,促進鐵路運輸進入大數據時代,全面合理地選擇大數據收集點,為海量信息數據的收集奠定堅實的基礎。鐵路企業相關部門需要重視起大數據采集工作,結合鐵路運輸需求和運輸現狀,引入專業的大數據收集和分析人才,將所有可能涉及鐵路交通物流的數據整合到一起,并加強與各個電子運營商之間的交流與溝通,融合各方面的資源構建一個物流大數據資源庫,以促進物流數字化管理工作的推進。結合云平臺技術建立大數據平臺,以大規模計算的云平臺作為物理支撐,不斷擴大數據平臺的空間以及容量,使得數據能夠進行大規模的運算和分析。然后,將客貨調度分配、車站綜合管理、運輸路徑選擇等運輸關鍵信息系統全部接入大數據平臺,加強各個系統之間的交流與溝通,避免信息孤島的存在,為大數據平臺提供高價值高水平的信息與數據。
2.以對外合作為載體,實現對市場需求的挖掘
加大對對外合作的重視力度,這樣不僅可以實現對外合作范圍的拓寬,而且也能夠更好地把握當前社會發展過程中的市場需求。未來我國高速鐵路網的建立與通車是釋放鐵路客貨運輸能力的重要措施。伴隨著我國經濟的平穩發展,未來客貨運輸市場將會向“買方市場”所發展,市場競爭較現在相比也會更加激烈,在此背景下,注重對市場需求的挖掘己成為鐵路運輸業未來競爭過程中的關鍵與重點。以鐵路運輸企業角度來講,雖然其掌握著海量數據信息,但基本以自身運營數據為主,包含的外部市場需求數據信息相對較少,這也體現了當前數據挖掘工作依然未展開的客觀事實。而受到市場需求信息零散且遍布互聯網這一特點的影響,因此想要保證市場信息挖掘的順利開展就需要從外部借力來進行。例如可以搜索當前較為知名的搜索引擎公司,與當前較為專業的搜索引擎公司如Google、百度等進行合作,以其提供的海量互聯網信息檢索數據為輔助,實現對現階段運輸市場需求和未來發展形勢的準確挖掘,并剖析出不同經濟發展階段下運輸市場需求的演變規律。
3.加強數據的結合工作,完善內部機制
對內部運輸機制的完善不僅是對相關的數據進行整合,而是在以大數據的分析工作、統計工作為基礎,開辟一條新的調度指揮通道,將數據作為介質,使其在最大程度滿足市場需求的基礎上,在運輸方向、故障分析方向、安全與配套設備保障方向、效能分析等方向發揮最大的價值。與此同時,建立一套合理的鐵路調度管理體系尤為重要,該體系的職能是以完整數據的分析作為基礎,對市場變化的信息、客戶目標信息等指標進行有效的控制。例如鐵路運輸業的貨物運輸領域,為最大程度幫助貨運客戶節省運輸的時間、運輸的成本等,可以對客戶的行業、發貨的時間、需要的車型、運輸的規模、真實的產能等屬性信息進行一定的收集,以大數據中數據的挖掘技術作為基本技術支持,快速選擇出符合貨運客戶實際需求,滿意度較高的運輸產品。該步驟可以提升鐵路運輸部門的信譽度,加強貨運部門與鐵路部門的溝通,形成共同發展、共同促進的共贏局面。
4.數據處理
鐵路車流數據處理包括四個模塊:采集、分析與挖掘、預測、應用。數據分析可以滿足一般的分析需求,主要利用分布式數據庫或者分布式計算集群對其中保存的超量數據進行分類和匯總。數據挖掘即是從大量數據中通過各種技術找到其中隱藏的有用信息,是本項目的關鍵點也是一大難點。該項目擬采用技術有:神經網絡、Logistic回歸方法、SEMMA方法、預測模型、改進K-means聚類算法等。K-means聚類算法基本思想是首先隨機選取幾個初始聚類中心,其他對象根據與每個中心的距離分別分配,形成聚類。計算每個聚類均值作為新的聚類中心,重復分配對象,直至函數收斂。
三、結論
綜上所述,隨著計算機技術的不斷發展,大數據在鐵路運輸組織工作中的應用價值越來越高,在鐵路運輸系統中應用大數據可以幫助領導人更好地進行決策,提高鐵路運輸生產的安全性和可靠性,保證鐵路運輸企業的經濟效益。