占善華++徐金成
摘 要:文章結合筆者單位實際情況,深入分析了當前司法行政系統內警用車輛的維修數據,并結合其他系統車輛維修所面臨的問題,提出了基于序列模式挖掘的警用車輛維修數據分析模型,使其在警用車輛維修數據中可以得到運用。對促進機關事業單位車改以及警用車輛維修管理的決策有重要的現實意義。
關鍵詞:序列模式;數據挖掘;警用車輛;模型分析
車輛維修是一個特殊的行業,有其特殊性,任何一輛車在進行了某個部件的維修后,鑒于廠家或者維修部門的保障期限,在保障期或者某一短時間內是無需進行相同部件的同樣的維修服務。不過如果是警用車輛的維修,由于車輛的出勤率,勢必會導致其特殊的維修次數和周期,常年累月的的維修管理數據可能揭示出潛在較嚴重的問題,如有一些車輛維修費用高;有些車輛維修次數多;短期內部分車輛存在多次維修同種問題的情況等。鑒于警用車輛維修管理數據的特殊性,應該有一個分析模型去分析,從而得出潛在的問題,做到未雨綢繆。
1 序列模式挖掘步驟
序列模式挖掘的步驟如圖1所示,我們可以看到,總體上分為三個不相同的步驟。它們依次順序為:數據預處理→知識庫形成→可視化。
2 基于序列模式挖掘的警用車輛維修數據分析模型結構介紹
通過數據采集模塊警用車輛維護數據挖掘模型的序列模式,數據預處理模塊,挖掘序列模式挖掘模塊,該模塊包括以下幾個部分。警用車輛維修數據采集模塊用于采集數據進行分析;數據預處理將采集的數據為標準,統一的數據格式;序列模式挖掘的模型和算法的核心部分,挖掘的完整規范的預處理,統一的數據格式與相關的序列模式挖掘和序列模式評估模塊;分析顯示在圖形和表格形式的挖掘挖掘結果評估結果。
模型的體系結構如圖2所示。
3 模型組件介紹
3.1 數據提取
警用車輛維修系統是一個非常復雜和龐大的信息管理系統,包含復雜的業務邏輯和數據庫連接存在十分復雜的數據庫表。然而,使用已經運行,所以在這個極其復雜的巨系統數據庫中積累了大量的業務數據,但這些數據庫中的數據不是數據挖掘的警用車輛使用數據,我們需要提取相應的數據提取操作相關的數據。
警用車輛維修系統,維修車的應用需要上傳維修報價,包含報價信息,車牌號碼,車輛識別代碼,汽車維修零件清單,以及相應的價格和其他相關信息。此信息存儲在相應的數據庫中的表,需要提取。
3.2 數據預處理
由于各種主觀和客觀的或不可抗拒的原因,數據提取過程中得到的數據往往是不一致的,多余的,不完整的現象,直接的數據序列模式挖掘幾乎是不可能的。數據清洗的需要,數據采集,通過操作上收集到的數據預處理數據的一系列操作,能滿足要求的序列模式挖掘。數據質量是數據預處理的改進,當然,也可能會丟失數據的一部分,但有助于提高準確度和后期的序列模式挖掘性能。
警察的車輛維修制度,車輛保養的記錄到數據挖掘算法的屬性數據,可以處理的數據格式,例如價格序列數據庫中的值為離散的區間值數據庫的維護將使用中國維修配件消耗屬性表示,可以轉換成該算法直接操作字符或字符代碼,等等。經過數據情況好或不好,會影響精度的數據預處理,提取相關規則非常到位下推導和結果的有效性。
3.3 序列模式挖掘
序列模式挖掘算法模塊采用改進的序列模式挖掘,一個處理好進一步挖掘數據的步驟。期待的消耗部件之間的關系提出找警察車輛維修事件,和資金賬單每個警察車輛修理在特征提取的事件之間的相關性,比如和維修時間的相關性。
3.4 挖掘結果評估
對序列模式挖掘算法挖掘出來的結果進行評估,評估應用于該模型的改進的序列模式挖掘算法的優勢與特征。
觀察序列模式挖掘的警用車輛維修相關屬性的關聯性是否有效,以及算法是否更優秀。
4 結語
主要工作在于提出了警用車輛維修數據的序列模式挖掘模型,并介紹了該模型中所具有的組件:即數據收集模塊、數據預處理模塊、序列模式挖掘模塊、挖掘結果評估模塊在整個模型中所做的工作。提出了基于序列模式挖掘的警用車輛維修數據分析模型,但還未實際應用于實踐中,后續工作將用于提高挖掘效率并應用于實踐。
[參考文獻]
[1]周斌,吳泉源.序列模式挖掘的一種漸進式算法[J].計算機學報,1999,22(10):882-887.
[2]李云,劉學誠,朱峰.數據挖掘技術在入侵檢測中的應用[J].計算機應用與軟件,2011,28(5):117-119.
[3]馬進,金茂菁,楊永麗,等.基于序列模式挖掘的隱私保護多步攻擊關聯算法[J].清華大學學報,2012,52(10):1427-1434.
[4]HANJW,KamberM,PeiJ.數據挖掘概念與技術[M].北京:機械工業出版社,2012:278-284.
[5]蔣盛益,李霞,鄭琪.數據挖掘原理與實踐[M].北京:電子工業出版社,2011:166-169.