楊忱,劉淋磊
(陜西汽車集團有限責任公司,陜西 西安 710021)
汽車行駛工況又稱車輛測試循環,是描述典型車輛行駛的速度-時間曲線,用于確定車輛污染物排放量、燃油消耗量、新車型技術開發和評估以及測定交通控制的風險等,是汽車工業一項共性的核心技術[1]。目前行業的工況構建主要是針對城市工況,且采用的是從起步到停車作為一個工況片段進行整個行駛工況的構建,該方法比較適用于城市工況,針對重型卡車該方法構建的工況往往有所偏差,進行車輛燃油經濟性模擬仿真與真實燃油消耗偏差較大。在數據處理中往往采用K-Means 聚類,該方法對初始聚類中心較為敏感,無法保證聚類結果的穩定性。
為此,本文采用了300 輛重卡典型工況區域內運行數據作為研究對象,按速度區間、加減速工況劃分工況片段,針對初始聚類中心進行優化,并結合馬爾可夫原理進行工況構建,能夠更加客觀的表征區域工況。
數據是采用車載GPS 行車記錄儀采集,選取典型銷售區域的300 輛車進行一個月的不間斷的后臺數據采集,路線運行如圖1 所示,主要采集的是河南的日用工業品市場車輛的運行數據。數據采集的頻率為1Hz,能夠采集發動機的轉速、扭矩、油門開度、進氣壓力等參數,通過電信網絡將數據傳輸至信息平臺,只要車輛行駛就會有數據傳輸,能夠保證采集數據的真實性和連續性。

圖1 車輛行駛路線
采集的數據中存在因路面激勵導致的車輛顛簸,會出現瞬時的加速度大于5m/s2的情況,不能真實的反應實際的工況特點,因此將加速度大于5m/s2的數據進行剔除,能夠有效的保證工況構建的合理性和準確性。
K-Means 聚類方法能夠快速的實現數據的分析,但其缺點也很明顯,初始聚類中心選取的隨機性,會導致聚類結果偏差很大,聚類結果收斂性無法保障。本次針對該方法進行優化,以保證更為真實的聚類結果。
針對所有樣本數據進行分類,形成不同的數據集合,來表示數據的關系和結構,這是K-Means聚類方法的最終目的。最初的中心點的選取是在數據庫中隨機抽選的,可能出現所選取的中心點偏離數據集合的高密度區。初始聚類中心的選取由隨機抽取變更為由基礎算法來選定,從數據集中隨機抽取K 個數據對象組成一個集合,重復隨機抽樣M 次,得到M 個點集:(x11,x12,…,x1n),(x21, x22,…,x2n),…,(xm1,xm2,…,xmn),然后進行歐式距離計算并根據圖2 改進后的方法進行,最終選取聚類中心。
根據運行工況集合X=(x1,x2,…,xm),從中的任意兩個不同的工況片段,計算兩工況xi與xj之間的歐氏距離:

同理,兩個聚類中心點ci=(ci1,,ci2,…,cin)和cj=(cj1,cj2,…,cjn)之間的歐氏距離為:

式中i=1,2,3,…,k-1;j=i+1,i+2,…,k
分別求出 M 組中的 k 個工況集的最小歐式距離min1(d(xi,xj)), min1(d(xi,xj)), …,min1(d(xi,xj)),以該組數據中與其他點距離最遠的數據作為該組數據集的中心點,進而得到M 個不同工況的聚類中心,然后根據以下流程得到K 個不同的工況數據中心,按照此方法進行工況數據的K-Means聚類,以保證聚類結果的可靠性和收斂性。

圖2 改進K—Means 聚類算法中心點選取
我國目前多參照歐洲的工況進行適應性改進[2],并且我國學者針對不同的城市建立了本地的工況[3~5],針對所采集的所有數據,進行匯總分析,按速度區間進行劃分,重卡車輛較乘用車工況更加復雜,是國道和高速的綜合運行。車速比較分散,不僅僅與道路性質有關,也和車流量有關。

圖3 車速分布占比
汽車行駛狀態定義[6]:怠速為發動機正在工作但車速為0 的運行狀態;加速為汽車加速度大于0.1 m/s2的連續過程;勻速為汽車加速度的絕對值小于0.1 m/s2,同時并不是駐車狀態的連續運行過程;減速為汽車加速度絕對值大于0.1 m/s2的運行過程。
從0Km/h 到100Km/h 對加速、減速等過程進行劃分運動學片段,不同行駛狀態形成數據集合,S1={1,2,3,…},本次選取最大加速度amax,最小加速度amin,平均加速度aaverage,平均車速vaverage來表征不同的數據片段。0Km/h 到100Km/h的數據片段共計n 個,就可以得到一個特征向量矩陣Xn×4。


圖4 0-10Km/h 部分加速工況片段
根據改進后的聚類方法進行不同速度區間段的運動片段分類,最終將0Km/h 到100Km/h 的加速行駛狀態,劃分為4類,其累計貢獻度超過85%,雖然有一定的信息損失,但對最終的結果影響較小[7]。

表1 聚類中心
馬爾可夫過程是一個隨機過程,那么不同的數據段組成一系列的事件,Ri,i=1,2,3…T 及相應的狀態空間S={1,2,3,…},S 中每一項都只與前一項相關[7]。用聚類中心所代表的運動學片段來替換整個工況中該類所有運動學片段,這樣就能形成一個有時間順序的不同的運動學片段集合,對所有的運動學片段進行編號,然后就形成了一個數據集合。根據貝葉斯公式能夠計算出一個有順序的概率集合,從而能夠計算出不同的運動學片段所能夠轉移成為其它工況片段的概率。
以0Km/h 到10Km/h 的加速過程為例,其工況片段聚類結果為4 類,分別記為M11、M12、M13、M14,或者為10Km/h到20Km/h 的加速過程M2j,根據馬爾可夫原理就能夠計算出兩個加速過程的轉移概率。
M11事件轉移為M2j事件的概率P 可以表示為:


表2 M11后續工況片段出現的概率
則運動學片段M11后面的工況最可能的是M22,以此類推完成M22運動學片段后續的工況片段,進而完成整個行駛工況的構建。起始工況片段選取整個工況數據集中出現概率最高的片段,按照上述方法進行合成,直到達到合理的長度為止。

表3 起始工況片段出現的概率
與原行駛工況相比,最大誤差為3.1%,可靠性較強,能夠有助于簡化計算流程,并能夠針對我國區域跨度大的特點,針對物流運輸熱點路線進行工況合成,有助于產品的精準研發。

圖5 組合行駛工況

表4 主要參數對比
與原行駛工況相比,最大誤差為3.1%,與實際行駛工況進行比對,百公里燃油誤差為1%,有助于更加真實的反應車輛的實際運行行駛工況。
基于企業數據平臺大數據,分速度區間進行運動學片段劃分,采用運動學片段來表征不同的行駛狀態,并結合馬爾可夫原理完成轉移概率的計算,最終以特征工況完成典型工況的構建。并通過實例驗證了構建工況的準確性,也驗證了該方法的可行性和精準性。