張會廣
(鄭州宇通客車股份有限公司,河南 鄭州 450000)
在具體的發展過程中,相關企業應該根據當前企業的具體發展情況,建立一個全面且高效的數據系統。并且提出公交車輛維修保養數據挖掘模型,根據當前的具體發展情況對數據挖掘模型進行不斷優化和完善。從而不斷提高公交車輛維修保養的質量。同時還能有效降低企業的投入成本。這在一定程度上能夠促進我國交通行業得到更好的發展,人們的日常出行也能得到有效的保證。
序列模式,最早是由國外的相關技術人員提出的,所謂序列模式是指在一組有序的序列組成的數據集中經常出現的一些數據組合構成模式。序列模式與關聯規則挖掘有著本質上的區別,序列模式挖掘的對象以及結果都是有序排列的,因此數據具有極強的有序性,每個序列的條目無論是在時間上還是空間上都是有序進行排列的,輸出結果也十分有序,序列模式挖掘的出現在一定程度上改變了相關行業的發展。最初采用序列挖掘模式的動機是對帶有事件發生時間屬性的事物數據庫進行更加高效的管理,最開始序列模式挖掘被廣泛的應用在商品購買中,商家可以采用具有針對性的促銷方式來增加顧客購買商品的數量,這樣能夠給商場帶來更多的經濟收入。當前序列挖掘模式已經成為數據挖掘的一個重要組成部分,序列模式挖掘的算法和研究應用在不斷擴大,從當前的具體發展情況來看,序列模式挖掘已經被廣泛的應用在醫學交通以及多個領域。相關研究人員在提出了序列模式挖掘的相關理念后也提出了三種不同的序列模式挖掘算法,這三種不同的算法為序列模式挖掘的發展奠定了良好的基礎。
apriori 算法是數據挖掘中序列模式挖掘中最為簡單且直觀的一個算法。該種算法具有十分明顯的特效,采用apriori 算法的基本思想可以概括為,在前期要對相應的數據進行采集,并且找出所有的頻集,對于出現的一些頻集進行相應的技術處理,在處理過后,頻集必須要滿足最小支持度和最小可信度兩個要求,這樣才能更加科學有效的開展后續的工作。每一條規則的右部只有一項,在采用定義的過程中都是采用中規則的定義,規則在具體的計算過程中一旦生成,只有大于用戶給定的最小可信度的規則才能夠被有效的保留下來,因此這也可以算是apriori 算法的一個缺點,因此在具體的操作過程中,可以根據實際情況進行選擇。
apriori2 算法是在apriori 算法中演變而來的,從本質上來說它仍然具備apriori 算法的主要思想,但是apriori2 算法融入了大量先進的思想元素,先進思想元素的運用,能夠使頻率的高低進行有效的排序,使用頻次高的會排在前面,而使用頻次低的將會排在后面,在使用有序規則的過程中,將大大降低挖掘數據集的數據量。從而有效減少相應工作的復雜性。
除了以上涉及到的2 種算法以外,gsp 也是十分有效的一種算法,gsp 算法早在1996 年就被提出,該算法雖然與apriori 算法不同,但是性質卻與apriori 的性質極為相似,在引進條約約束的過程中,gsp 算法有著固有的特征,可以分層次的對不同時間間隔的約束條件進行有效引入,可以有效減少候選序列模式的數量,并且加快整個工作的執行效率。該優勢是前2 種算法所不具備的優勢。因此當前gsp 算法是被應用最為廣泛的一種算法。但是gsp 算法也存在一定的缺點,gsp 算法并不適用于數據量比較大的數據挖掘類型,因為數據量比較大的數據挖掘類型在運行的過程中會產生大量的候選序列模型,此時就需要對原始庫的數據進行多次反復的掃描,這樣就會增加產生長序列的情況,而gsp 算法對于長序列無法進行有效的計算。因此gsp 算法并不適用于數據量較大的數據挖掘類型。在選擇具體算法的過程中,相關技術人員可以根據當前的具體發展情況進行選擇,選擇最為科學有效的算法才能為后續的工作奠定良好的基礎。
公交車輛的日常維修和保養,對于公交車輛的正常運行顯得十分重要,日常的維修和保養可以分為常規保養和突發性的維修,這對于公交車輛的正常行駛有著極為重要的作用,如果相關企業沒有建立科學有效的常規保養和維修管理制度,將會導致公交車輛在運行過程中突發一些安全事故,這會對人們的生命和財產造成極為嚴重的影響。在具體的發展過程中,常規保養是車輛行駛一段時間以后,在一定里程內要進行強制性的常規檢查,而突發性的維修則是指車輛在運行過程中出現了一些故障而進行臨時性的維修。當前在一些大型的車輛維修企業中,從車輛發生故障到故障被排除需要經過多個環節的處理,每一個處理環節都十分重要,任何一個環節出現問題,都會影響最終的問題處理效率,而且在每個處理環節過程中都會產生大量的數據信息,相關技術人員需要對這些信息進行有效的保存,將數據保存到數據庫中,這樣才能為后續的維修和檢查提供有力的數據支持。公交車輛在維修保養的過程中會產生大量的數據,這些數據包括常規的保養數據以及車輛進行維修的數據,在維修和保養的過程中,車輛可能會存在一系列的問題,需要對這些問題進行科學有效的歸納,對于更換的配件以及保養的材料都需要進行數據記錄。
根據當前的具體發展情況來看,公交車輛維修保養數據包括車輛報修的內容,車輛維修內容以及車輛保修材料3種主要的數據類型共同組成。其中車輛的維修質量以及維修效率都可以通過相應的數據進行計算。在一般情況下公交車輛從開始投入使用以后,就會開始計算相應的里程數和運營時間,在相應的里程數內需要進行多次的常規檢查,如果在運行過程中發生一些突發性的障礙也需要對該種情況進行相應的數據保存,公交車輛維修保養數據適合序列模式數據挖掘的兩個基本特征,因此在維修和保養的過程中,可以充分利用序列模式挖掘的模式,這樣能夠有效提高維修和保養的效率。
雖然在當前的發展過程中,相關部門十分重視公交車輛維修數據挖掘模型的建立,但是在建立模型的過程中仍然存在一些問題,如何提高車輛維修的質量,并且節省維修時所用的材料成本是相關維修企業應該重點研究的問題。在維修和保養的過程中,要根據當前車輛的具體情況選擇不同的維修和保養方式,這樣才能有效提高車輛維修和保養的效率。最大程度的發揮出車輛的使用價值,同時還能有效節約車輛的維修成本。在建立模型的過程中,應該結合公交車輛維修保養的歷史數據。對于可能會出現故障的部件,進行及時的保養和更換,從而防止一些突發性安全事故的出現。
在建立公交車輛維修數據挖掘模型的過程中,要充分考慮到公交車輛維修保養數據挖掘的需求,結合當前維修的具體數據構成來建立模型。公交車輛維修保養數據挖掘模型的建立應該分為3 個不同的層次,分別為數據儲存層、數據挖掘層以及用戶交互層。在具體的建立過程中,只有保證這3個層次的科學和理性才能構建一個完整的數據挖掘模型。數據挖掘層是整個模型的核心,因此相關部門應該重點對數據挖掘層進行科學有效的建立,數據挖掘層在建立的過程中涉及到多方面的內容。其中包括待挖掘的數據庫和數據挖掘引擎以及核心挖掘算法等等,這些內容都對整個模型的構建有著十分重要的影響。整個數據模型的挖掘數據庫主要是對數據集進行科學有效的處理,數據挖掘引擎是根據數據集的特點進行建立的,在實現核心功能的過程中,需要采用數據挖掘算法。
綜上所述,隨著時代的不斷發展,當前公交車已經成為人們日常生活中必不可少的交通工具,如何才能更好的對公交車進行維修和保養,成為了當前相關企業應該重點研究的問題。在對公交車進行維修和保養的過程中,應該充分運用序列模式挖掘的方式,建立科學有效的數據模型。這樣不僅能夠有效提高維修和保養效率,同時還能降低在維修和保養過程中投入的成本,使得公交企業在激烈的市場競爭下能夠脫穎而出。將數據挖掘技術及其算法與城市公交車輛的維修和保養進行充分的融合,開創了一個全新的領域。雖然當前技術還不是十分成熟,在建設模型的過程中也存在一些問題,但是發展前景十分良好,相關部門應該對此進行深入的分析和研究。