徐耀宗,邱 彬,程 明,張文靜
(中國汽車技術研究中心,北京 100070)
基于機動車合格證大數據的行業運行異動監控研究
徐耀宗,邱彬,程明,張文靜
(中國汽車技術研究中心,北京 100070)
隨著國家簡政放權、強化事中事后監管等改革工作的推進,運用機動車合格證大數據實施行業監管將成為政府主管部門的重要抓手。文章通過對機動車合格證歷史數據的深度分析,結合市場預測數學方法,提出一套合理可行的行業運行異動監控信息化解決方案,為政府主管部門找出違規“嫌疑人”提供決策參考。
機動車;合格證;異動監控
機動車整車出廠合格證(以下簡稱“合格證”)是車輛生產企業在車輛制造完畢、檢驗合格后隨車配發的機動車出廠合格證明,是辦理國產機動車注冊登記必須提交的法定證明之一。自2005年合格證管理制度建立以來,合格證先后經歷了由紙質到電子,由單一向多元的發展歷程。到目前,合格證系統中管理的企業數量已超過1 600家,數據記錄總量超過4億條,可以說合格證在產品出廠銷售環節、機動車注冊上牌及車輛購置稅征繳等環節已得到廣泛使用,為政府有關部門在開展行業監管、提升服務效率和質量、打擊非法違規等方面發揮了不可替代的作用。
首先,有利于政府主管部門加強監管、提高效率。黨的十八屆三中全會提出了“簡化事前準入,加強事中事后監管”的總體要求。2015年6月,國務院辦公廳發布的《關于運用大數據加強對市場主體服務和監督、監管的若干意見》(國辦發[2015]51號),提出要充分運用大數據的先進理念、技術和資源,加強對市場主體的服務和監管,推動簡政放權和政府職能轉變,強化事中事后監管,提高政府治理能力。因此,充分運用機動車合格證大數據實施汽車行業管理必能事半功倍。
其次,有利于監控行業運行動態,規范生產秩序。進入新世紀以來,我國汽車產業發展迎來井噴期,企業數量、機動車產量逐年增加,其中汽車產銷量自2009年已連續7年位居世界第一,成為汽車大國。由于企業數量巨大,魚目混珠,給行業管理帶來不少難題。因此,加強機動車合格證管理體系建設,通過合格證信息及時掌握企業生產狀態,及早發現異常情況,有利于進一步規范行業秩序,促進行業健康發展。依據《關于建立汽車行業退出機制的通知》(工信部產業[2012]349號文),工業和信息化部通過調取企業合格證上傳數量,篩選出僵尸企業和不能維持正常生產經營的企業名單,分別于2013年和2015年向社會公示了第一批48家和第二批92家特別公示車輛生產企業名單實現了車輛生產企業有進有出的動態管理。在近年來,合格證數據在政府主管部門對罐式車、危險品車、校車、新能源車輛等專項核查中,作為重要的生產信息,為核查工作發揮了重要的支撐作用。
再次,有利于輔助有關政策規定落地實施。根據我國《道路交通安全法》及其實施條例等有關法律法規,機動車出廠合格證明作為機動車注冊登記環節的法定憑證,對于防范被盜搶、走私和非法拼裝車輛上路,保障道路交通安全發揮著舉足輕重的作用。隨著合格證電子信息不斷完善和應用,它為行業主管部門實施汽車行業退出機制、《公告》管理、生產一致性核查等方面提供了有力支撐。同時,機動車出廠合格證作為國家稅務總局開展車購稅征繳的有效憑證,也是減免車購稅政策執行中車型判定的重要參考依據。
2015年以來,隨著我國經濟發展新常態的出現,汽車產業面臨新的機遇和挑戰。產業結構調整幅度逐步加大,市場競爭壓力持續增加,不乏個別機動車生產企業在合格證上面動起“歪腦筋”,未產先傳、產后不傳、上傳數量暴增暴減、非法倒賣合格證、大幅超過核準產能等現象時有發生。因此,為了切實掌握國內機動車企業生產動態,借助合格證數據開展行業運行異動監控工作,實現在大數據環境中自動識別違法違規 “嫌疑人”。
機動車合格證運行異動監控系統總體設計思路是,通過對各機動車生產企業歷史上傳數據的深度分析,按照汽車、摩托車、三輪汽車和低速貨車等不同車輛類別,制定科學的運行異動判定規則,運用數學預測方法,按月度測算合格證上傳預警閾值,再將企業實際合格證上傳量與預警閾值進行比較,確定異動企業名單,并通過系統要求異動企業進行書面備案說明。該異動監控系統的建立,提升政府主管部門對行業事中事后監管的水平,將有力配合政府主管部門做好新形勢下的行業管理工作。對政府主管部門而言,異動監控工作有利于實時了解行業動態,抑制非法行為,提高政府管理效率和監管質量;對行業而言,有力于企業之間互相監督,讓非法行為難以藏身,構建良好行業管理秩序。
3.1合格證歷史數據迭代與企業分類
由于汽車、摩托車、三輪汽車與低速貨車企業數量眾多,產量差異巨大。因此,只有對不同類別、不同數量級的生產企業設定不同的異動監控參數,才能確保模型的科學合理性。本研究中基于K-均值聚類方法原理,開發設計了一款工具軟件,輸入是汽車、摩托車、三輪汽車與低速貨車三種類別企業連續12個月月度合格證上傳量平均值,獲得產量近似的企業自動歸類結果。K-均值聚類工具軟件見圖1。

圖1 K-均值聚類工具軟件
使用K-均值聚類工具軟件,將汽車、摩托車、三輪汽車及低速貨車企業依次進行區間分段。將企業每月合格證上傳量作為離散的點陣,根據聚合的算法,劃分成區間。若聚合的區間內企業數量過于密集,再將密集區間再次聚合運算。經過多輪迭代,結合行業管理經驗,調整上傳量區間范圍,形成三類企業的上傳數量特征區間,其中汽車(含整車、改裝車)企業分為9個區間,摩托車企業分為6個區間,低速貨車和三輪汽車企業分為5個區間。不同類型企業異動監控區間劃分見表1。

表1 不同類型企業異動監控區間劃分 單位:輛
3.2不同類型企業運行異動規則
本研究中,將重點對兩類非正常運行企業行為進行監控,第一類是合格證數據上傳數量運行異動的企業;第二類是連續六個自然月合格證上傳數量為0的企業。其中,第一類企業監控需要運用科學計算分析方法進行測算,總體思路是通過對不同類別企業合格證歷史數據的分析挖掘,運用“平穩時間序列ARMA預測”科學算法并結合行業實際情況確定各企業月度預警閾值,進而實現與各企業實際月度上傳合格證數量的比對。若企業實際上傳量超過預警閾值,則判定該企業為運行異動。
根據本研究特點,選取平穩時間序列ARMA(2,2)模型進行單月預測預測值計算,算得不同企業預測值后,試算時賦予2.5倍的預警值空間,超出預警值意味著超出常量范圍,上傳數據量異常。由于企業規模不同,用途不同的車輛生產規律不同,使用同一預警閾值會使統計結果產生差距,需要根據區間內數據的不同特征調整預警閾值范圍。設定兩個預警閾值調節參數:k為增長空間參數,b為底數參數。
計算公式為:T月預警閾值=當期預測值×容許度(k)+修正值(b)
k值:為限定預測值的倍數上限。上傳數量較小區間的企業每月數值波動大,設定為較大倍數。上傳數量較大區間的企業每月數值波動小,設定為較小倍數。
b值:每類區間的最低安全值。給予一定數量范圍的容差值,消除算法中的不確定性。
T:代表月份,為1~12整數。
經過多次數據試算,得到合理k、b參數值。當T月實際上傳量>T月預警閾值,則判定該企業T月合格證數據運行異動。
3.3數據驗證與分析
本文選取2015年T月1100余家汽車生產企業作為數據驗證對象,根據以上異動判定規則進行計算,共有15家企業可判定為異動,與行業管理現狀基本相符。按照超過預警值數量大小排序前五的企業異動情況如表2所示。

表2 2015年T月某五家汽車企業合格證異動運行監控情況
以上五家企業T月之前12個月的合格證運行折線圖如圖2所示。
從圖2中亦可看出,這五家企業合格證數據在第T月波動比較大。因此,可以認為該異動規則算法與實際情況較為接近。

圖2 五家企業連續12個月合格證運行情況
4.1系統框架
構建異動監控系統是實現以上行業監控功能的核心工具,它不僅需要實現歷史數據實時提取,同時也要完成多個步驟的計算。系統基于Windows 10開發,開發環境為Microsoft Visual Studio 12.0,客戶端應用程序適用于IE瀏覽器及其他瀏覽器。后臺計算模塊根據企業前12個月合格證上傳數量,運用“ARMA(2,2)時間序列預測”科學算法并結合行業實際情況確定各企業月度預警閾值,導入數據庫。客戶端企業反饋模塊根據企業輸入的信息獲取企業當月預警值和上月預警值以及上月實際上傳量,當實際上傳量大于預警值時則提示需要企業反饋情況說明,其他情況則顯示企業運行正常,不需反饋情況說明。
系統構架如圖3所示。

圖3 機動車合格證運行異動監控系統構架圖
4.2數據倉庫構建
本研究核心在隨著合格證數據的動態變化,底層數據倉庫需要實時更新,同時再加上歷史數據的初始化,才能保障將來的異動監控系統的高度自動化運行。通常情況下,建立一個數據倉庫需要經過以下幾個處理過程:數據倉庫設計;數據抽取;數據管理。數據倉庫的實現主要以關系數據庫(RDB)技術為基礎,目前關系數據庫的數據存儲和管理技術較為成熟,成本和復雜性較低,但由于關系數據庫系統并不能滿足數據倉庫的數據存儲要求,因此需要通過使用一些技術,如動態分區、位圖索引、優化查詢等,使關系數據庫管理系統在數據倉庫應用環境中的性能得到大幅度的提高。
4.3系統主要功能
系統基于數據倉庫,將異動監控規則和定義轉化為計算機語言,為此主要設計了四大功能模塊:①數據處理模塊,主要進行歷史數據的挖掘、清洗與導入。②數據計算模塊,通過人機交互界面,實現數據儀表板顯示、數據更新、分析計算、結果導出等功能;③智能輔助模塊,主要實現按企業、按車型、按異動類別等不同需求自動生成月度異動監控報告,并實現在線打印、下載等功能;④企業反饋模塊,主要通過高級接口實現與機動車合格證管理系統對接,向異動企業發出預警,并為企業提供情況說明反饋通道。
合格證運行異動監控系統的構建,為政府主管部門實施行業管理提供了良好的數據支撐。對于合格證運行異動監控工作,后期主要有兩大延伸:一是通過對企業反饋異動原因的系統分析,結合企業異動數據,提出行業事中事后監管政策建議。二是基于異動監控分析結果納入汽車行業信用管理平臺,將合格證運行異動作為企業失信行為判定的重要依據。從長遠來看,機動車合格證運行異動監控工作,對于國家在汽車行業實施供給側改革,淘汰落后產能,推進產業結構調整等方面將會發揮重要作用。
主要參考文獻
[1]周新民,張軍,薛峰.環境自動監控系統異動數據的應用探討[J].壞境保護,2013,41(16):61-62.
[2]周世兵,徐振源,唐旭清.新的K-均值算法最佳聚類數確定方法[J].計算機工程與應用,2010,46(16):27-31.
[3]陳光金.ARMA模型在我國汽車產量預測中的應用[J].全國商情:經濟理論研究,2007(5):27-28.
[4]郭順生,王磊,黃琨.基于時間序列模型預測汽車銷量研究[J].機械工程師,2003(5):8-10.
[5]劉霄龍,謝宇,林僚,張超婧.基于大數據的全業務監控預警模型研究[J].廣西通信技術,2015(1):18-23.
[6]虞杲,宋廣衛.利用數據挖掘技術建立客戶異動監控模型[J].通信企業管理,2010(8):82-83.
10.3969/j.issn.1673-0194.2016.19.114
D631.5
A
1673-0194(2016)19-0196-05
2016-06-17