999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于BO-FCM和PSO-XGBoost的城市快速路交通狀態(tài)識別

2023-09-27 09:47:42孫經(jīng)偉谷遠利
交通運輸研究 2023年4期
關(guān)鍵詞:優(yōu)化模型

孫經(jīng)偉,谷遠利

(北京交通大學 綜合交通運輸大數(shù)據(jù)應用技術(shù)交通運輸行業(yè)重點實驗室,北京 100044)

0 引言

交通狀態(tài)識別是智能交通管理和控制中的重要一環(huán),通過實時、準確的交通狀態(tài)識別可獲得道路狀態(tài)信息,據(jù)此誘導和控制交通,有助于緩解城市交通擁堵。因此,交通狀態(tài)識別成為智能交通系統(tǒng)中重要的研究方向。

目前,交通狀態(tài)識別方法主要有聚類算法和有監(jiān)督的機器學習兩種。聚類算法具有良好的分類效果,能對交通流數(shù)據(jù)進行有效分類,同時對交通狀態(tài)識別的模糊性有較好的適應性。部分學者通過對聚類算法優(yōu)化或結(jié)合其他算法對交通狀態(tài)進行識別,如結(jié)合最優(yōu)自編碼器和K 均值(Kmeans)聚類算法[1]、加權(quán)指數(shù)的模糊C均值(Fuzzy C-Means,FCM)算法[2]、投影尋蹤動態(tài)聚類[3]、高斯混合模型聚類算法[4]等,從而實現(xiàn)對交通狀態(tài)實時有效的判別。不過,聚類算法結(jié)果易受初始聚類中心隨機選擇的影響而陷入局部最優(yōu)問題,從而導致交通狀態(tài)識別結(jié)果的準確性和穩(wěn)定性不高。有監(jiān)督的機器學習算法具有良好的學習能力,可通過訓練數(shù)據(jù)樣本獲得較高的分類精度,目前已經(jīng)在交通狀態(tài)識別領(lǐng)域得到廣泛應用。如一些學者嘗試使用BP 神經(jīng)網(wǎng)絡(Back Propagation Neural Network,BPNN)[5]、隨機森林算法[6]、融合多個機器學習模型[7]、遺傳算法優(yōu)化SVM[8]、K-近鄰規(guī)則(K-Nearest Neighbor,KNN)[9]、貝葉斯算法[10]等來構(gòu)造交通狀態(tài)識別模型,并得到較好的識別結(jié)果。不過許多研究對機器學習算法的超參數(shù)取值會影響模型訓練結(jié)果和擬合程度的問題考慮不足,使得模型識別結(jié)果未達到最優(yōu)。

近年來,將聚類算法和監(jiān)督學習算法相結(jié)合的模型越來越多,如商強等[11]提出譜聚類算法和KNN 算法相結(jié)合的交通狀態(tài)判別模型;常麗君等[12]提出優(yōu)化后的FCM 算法結(jié)合概率神經(jīng)網(wǎng)絡的交通狀態(tài)識別方法。可以看出,聚類算法和監(jiān)督學習算法相結(jié)合的效果較好,聚類算法為監(jiān)督學習提供了先驗數(shù)據(jù),監(jiān)督學習算法則利用先驗數(shù)據(jù)進行訓練和測試,保證了交通狀態(tài)識別結(jié)果的實時性。目前集成學習已經(jīng)成為機器學習的重要組成部分,其通過結(jié)合多個學習器來獲得優(yōu)越的泛化能力,在分類問題上展現(xiàn)出明顯優(yōu)勢[13]。極度梯度提升樹(eXtreme Gradient Boosting,XGBoost)算法是集成學習中的重要算法,其收斂速度快,準確率高且不易過擬合,但XGBoost 算法參數(shù)過多且對參數(shù)較為敏感,使得其應用較為復雜。

為提高城市快速路交通狀態(tài)識別的準確性,本文將利用貝葉斯優(yōu)化算法快速確定FCM 算法的最優(yōu)初始聚類中心,并利用粒子群算法確定XGBoost算法的最優(yōu)參數(shù),結(jié)合交通狀態(tài)識別的變化性,構(gòu)建基于貝葉斯優(yōu)化改進的FCM 聚類算法與粒子群優(yōu)化改進的XGBoost 算法相結(jié)合的交通狀態(tài)識別模型,并使用聚類分析后的交通數(shù)據(jù)對監(jiān)督學習算法進行訓練,提升交通狀態(tài)識別的效率和穩(wěn)定性,最后采用北京市三環(huán)快速路的交通數(shù)據(jù)對模型進行實例驗證,并與其他方法進行性能對比分析。

1 模型構(gòu)建

本文主要通過對某一時刻的交通數(shù)據(jù)進行識別,來判斷其所處的交通狀態(tài)。首先對歷史交通數(shù)據(jù)進行聚類分析并劃分出不同的交通狀態(tài),得到先驗信息,然后利用先驗信息訓練PSO-XGBoost 模型,在模型中對待識別交通數(shù)據(jù)進行測試,得到該交通數(shù)據(jù)所處的交通狀態(tài)。

1.1 聚類分析

模糊C 均值算法是一種經(jīng)典的聚類算法,因其能提供靈活的聚類結(jié)果且適用于不同的數(shù)據(jù)類型而在眾多模糊算法中應用最為廣泛。本文利用FCM 算法對交通流量、速度和道路占有率進行聚類分析,得到每個交通數(shù)據(jù)的狀態(tài)標簽,目的是實現(xiàn)被劃分為同一聚類的樣本數(shù)據(jù)對象間的最大相似性和不同聚類的樣本數(shù)據(jù)對象間的最小相似性。通過對目標函數(shù)進行優(yōu)化,獲取每個樣本對所有類中心的相似程度,即隸屬度,進而對樣本進行自動分類。

目標函數(shù)[14]為:

式(1)中:J是目標函數(shù);n是樣本數(shù);c是聚類中心個數(shù);m是任何大于1 的實數(shù);xi是第i個樣本點;uij是第i個樣本點的第j個類中心的隸屬度;cj是第j個類中心。

FCM 算法初始聚類中心的隨機性對聚類的結(jié)果影響很大,容易使算法陷入局部最優(yōu),造成聚類結(jié)果的準確度不高且運行時間較長,故需要優(yōu)化FCM 算法以解決算法局部收斂的問題。貝葉斯算法是一種運行速度快、穩(wěn)定性良好的全局優(yōu)化算法,其利用已搜索過的點的信息來提升搜索效率,減少迭代次數(shù),進而快速獲得最優(yōu)解,可有效解決FCM算法問題。

貝葉斯優(yōu)化FCM 算法(Bayesian Optimization,BO-FCM)的流程如下:

1)初始化高斯回歸模型(Gaussian Process Regression,GPR),采集函數(shù)UCB(Upper Confidence Bound),確定最大迭代次數(shù),定義目標函數(shù)Jm=f(C)和聚類中心的參數(shù)空間。

2)隨機選取聚類中心點作為BO 算法的初始值。

3)擬合高斯回歸模型,通過采集函數(shù)UCB來計算優(yōu)化結(jié)果,執(zhí)行貝葉斯優(yōu)化算法后得到聚類中心Ci,計算目標函數(shù)值Jm=f(Ci)。

4)不斷迭代直至達到最大迭代次數(shù),輸出歷史最佳參數(shù)即聚類中心。

5)將貝葉斯優(yōu)化算法的結(jié)果代入FCM 算法得到樣本數(shù)據(jù)的聚類結(jié)果,完成交通狀態(tài)劃分。

1.2 PSO-XGBoost算法

XGBoost 算法[15]屬于Boost 算法,其目標函數(shù)為:

式(2)~式(3)中:L(φ)為目標函數(shù);l為單個樣本的損失;yi為標簽值;為預測輸出;Ω(fk)為正則化項;fk為樹模型;k為樹的數(shù)量;γ為葉子樹懲罰正則項;T為樹葉子節(jié)點數(shù);w為葉子權(quán)重值;λ為葉子權(quán)重懲罰正則項。

XGBoost 算法主要是在損失函數(shù)的基礎(chǔ)上加入了正則化和采用縮減辦法來防止過擬合,同時對目標函數(shù)進行泰勒展開,利用推導得到的表達式作為分裂準則來構(gòu)建每一棵樹。該算法能在避免過擬合的前提下對目標函數(shù)進行擬合,提升識別精度,具有較強的泛化能力,同時支持并行化處理,運行速度得以提高。XGBoost 算法的缺點是參數(shù)過多,對參數(shù)敏感,因此算法的應用較為復雜。為了合理有效地選擇算法的超參數(shù),提高算法識別精度,使用收斂速度快、可調(diào)整參數(shù)少、尋優(yōu)能力強的粒子群優(yōu)化算法(Particle Swarm Optimization,PSO)對XGBoost 的參數(shù)進行優(yōu)化。

粒子群優(yōu)化算法通過在一組無質(zhì)量的粒子中對鳥類進行建模,所有粒子根據(jù)所尋求的個體極值和當前全局最優(yōu)解來調(diào)整位置和速度,進而找到粒子群的全局最優(yōu)解。PSO算法實現(xiàn)較為簡單,不涉及復雜的神經(jīng)網(wǎng)絡模型且收斂速度較快。PSO-XGBoost算法流程如圖1所示。

圖1 PSO-XGBoost算法流程圖

根據(jù)圖1,PSO-XGBoost算法的具體流程如下:

1)定義PSO 算法的參數(shù),包括粒子群規(guī)模N、粒子維度D、迭代次數(shù)K、慣性權(quán)重ω,確定需要優(yōu)化的超參數(shù),同時設置每個參數(shù)的調(diào)節(jié)范圍。

2)隨機初始化粒子群,通過評估粒子的適應度值來對粒子和群體的全局最優(yōu)位置進行比較,不斷更新速度和位置,當達到最大迭代次數(shù)后結(jié)束粒子群算法流程,得到最優(yōu)參數(shù)。

3)將歷史交通流數(shù)據(jù)的聚類結(jié)果分為訓練集和測試集,對參數(shù)優(yōu)化后的XGBoost 模型進行訓練和測試,實現(xiàn)交通狀態(tài)識別。

1.3 交通狀態(tài)識別模型

本文利用貝葉斯優(yōu)化后的FCM 算法對歷史交通流數(shù)據(jù)進行狀態(tài)劃分,將聚類結(jié)果分為訓練集和測試集,對PSO-XGBoost 算法進行訓練和測試驗證,從而實現(xiàn)交通狀態(tài)識別。完整的交通狀態(tài)識別步驟如下:

1)以交通流量、速度和道路占有率作為特征參數(shù),進行交通狀態(tài)劃分。

2)根據(jù)文獻[12],將城市交通狀態(tài)劃分為暢通、平穩(wěn)、擁擠和擁堵4 個等級,對應的標簽編號為0,1,2,3。使用BO-FCM 模型對交通流數(shù)據(jù)進行聚類分析并獲得實驗數(shù)據(jù)的交通狀態(tài)標簽。

3)將已經(jīng)劃分交通狀態(tài)的特征變量數(shù)據(jù)按4∶1 分為訓練數(shù)據(jù)和測試數(shù)據(jù),其中訓練集的輸入為所選取的3 個特征參數(shù),輸出為相應的交通狀態(tài)。

4)使用訓練集數(shù)據(jù)對PSO-XGBoost 模型進行訓練,然后利用測試數(shù)據(jù)對訓練后的模型進行驗證測試,對模型性能進行評價。

2 實例驗證

2.1 數(shù)據(jù)處理

采用北京市西三環(huán)快速路的交通流數(shù)據(jù)進行交通狀態(tài)識別實驗和模型測試。選取西三環(huán)航天橋南—紫竹橋北作為實驗路段,檢測器分布如圖2 所 示。采 集2014 年1 月6 日—2014 年1 月10 日全天流量、速度和道路占有率數(shù)據(jù),以2 min 為時間間隔,日交通數(shù)據(jù)序列個數(shù)為720 個,數(shù)據(jù)缺失率不高于5%,數(shù)據(jù)總量為17 897 條,能較好地展現(xiàn)交通流變化和交通流特性。在實驗開始前,先對原始數(shù)據(jù)進行篩選,剔除缺失數(shù)據(jù)和異常數(shù)據(jù),如北京市三環(huán)快速路的限速為80 km/h,因此刪除速度為80 km/h 以上的數(shù)據(jù)點,然后使用Z-score 標準化方法將數(shù)據(jù)轉(zhuǎn)換為正態(tài)分布,同時將Z-score 值的絕對值小于3 的數(shù)據(jù)點視為異常點,予以刪除。將所有數(shù)據(jù)點繪制成箱線圖,如圖3 所示,可以看出3 項交通流參數(shù)屬性正常,異常點已剔除。以1 月6 日—1 月9 日的數(shù)據(jù)為訓練數(shù)據(jù),1 月10 日的數(shù)據(jù)為測試數(shù)據(jù),在Python平臺進行模型實驗。

圖2 檢測器分布圖

圖3 樣本數(shù)據(jù)箱線圖

2.2 基于BO-FCM的交通狀態(tài)劃分

根據(jù)交通流中的速度、交通流量及道路占有率,將樣本數(shù)據(jù)所處的交通狀態(tài)劃分為4 類,分別是順暢、平穩(wěn)、擁擠、擁堵。確定聚類數(shù)目為4,通過貝葉斯優(yōu)化算法不斷迭代300次得到FCM算法的初始聚類中心矩陣為:

基于以上初始聚類中心進行聚類,得到聚類結(jié)果如圖4 所示。每類交通狀態(tài)下的交通流量、速度和道路占有率的均值如表1 所示。從表中可以看出,每種交通狀態(tài)下的交通流量、速度和道路占有率都有較大差異,且4 種交通狀態(tài)都有較明顯的規(guī)律。處于第0類交通狀態(tài)下的速度較大,但交通流量和道路占有率都很低,對應于順暢的交通狀態(tài);第1 類交通狀態(tài)的速度較第0 類下降,但交通流量和道路占有率有所提高,此時處于平穩(wěn)狀態(tài);第2 類和第3 類的交通狀態(tài)變化情況相同,對應于擁擠和擁堵狀態(tài)。從順暢到擁堵的交通狀態(tài)變化過程中,可以看出速度在不斷降低,而交通流量和道路占有率不斷提高,算法優(yōu)化后所得結(jié)果與實際交通流變化規(guī)律相同。

表1 交通流參數(shù)均值

圖4 聚類結(jié)果

為驗證聚類結(jié)果的準確性,以點位3 063 的數(shù)據(jù)聚類結(jié)果為例,其2014 年1 月6 日—1 月9 日的交通狀態(tài)變化情況如圖5 所示。可以看出,0:00—6:00,交通流處于順暢狀態(tài);6:00之后車流量不斷加大,出現(xiàn)早高峰,交通流狀態(tài)從順暢轉(zhuǎn)為擁堵;隨后交通流狀態(tài)不斷波動,晚高峰出現(xiàn)在15:00—18:00,此時交通狀態(tài)又轉(zhuǎn)變?yōu)閾矶拢笾饾u趨于平穩(wěn)狀態(tài)。模型得到的聚類結(jié)果和實際道路交通變化情況較為接近,BO-FCM 模型能有效劃分交通狀態(tài)。

圖5 1月6日—1月9日交通狀態(tài)變化

2.3 PSO-XGBoost模型交通狀態(tài)識別

實驗中,選取6 個對模型結(jié)果影響較大的參數(shù)對XGBoost 算法進行優(yōu)化,分別為影響模型穩(wěn)定性的學習率,控制模型擬合程度的樹的最大深度,最小葉子節(jié)點樣本權(quán)重,隨機采樣比例,控制隨機采樣列數(shù)占比的使用的特征占比,影響模型損失函數(shù)值的節(jié)點分裂所需的最小損失函數(shù)下降值。設置各參數(shù)的變化范圍,使用PSO 算法進行尋優(yōu)得到最佳模型參數(shù),如表2 所示。將優(yōu)化得到的模型參數(shù)代入XGBoost中進行訓練和測試,使用1 月6 日—1 月9 日的數(shù)據(jù)作為訓練數(shù)據(jù),1 月10日的數(shù)據(jù)作為測試數(shù)據(jù)。

表2 最優(yōu)參數(shù)值

2.4 模型性能整體評價

為了明確本文模型的準確率和穩(wěn)定性,將其與支持向量機(Support Vector Machine,SVM)模型、隨機森林(Random Forest,RF)算法、K 最近鄰算法進行對比分析。依據(jù)文獻[8],先將SVM模型中的RBF 核函數(shù)設置為21,懲罰系數(shù)設置為0.5,隨機森林算法和K 最近鄰算法的參數(shù)值采用默認值,然后采用Python 中的sklearn 庫建立和運行SVM,RF,KNN 模型。本文模型和其他模型的交通狀態(tài)識別混淆矩陣如圖6 所示,圖中各行是實際交通狀態(tài),每列是預測交通狀態(tài),對角方格中的數(shù)表示每個交通狀態(tài)識別正確的數(shù)量,如第1 行第1 列表示能正確識別為順暢狀態(tài)的數(shù)據(jù)有853 個。由該圖可知,本文算法在全部3 487 個測試數(shù)據(jù)中,識別錯誤的數(shù)據(jù)只有2 個,其識別出的狀態(tài)和實際狀態(tài)只相差1 個交通狀態(tài)類型,分別是將實際的平穩(wěn)狀態(tài)識別為順暢狀態(tài)和擁擠狀態(tài),模型的總體準確率達99.94%,識別精度較高,其他模型則多次出現(xiàn)識別狀態(tài)和實際狀態(tài)相差2個類型的情況,這表明本文算法穩(wěn)定性較好。本文算法與另外3 種算法的識別結(jié)果如表3 所示。從該表可知,本文模型的識別準確率比SVM,RF,KNN等常見模型分別提高了1.23%,1.06%,1.57%。

表3 不同方法的識別結(jié)果比較

圖6 不同模型識別結(jié)果的混淆矩陣

圖6 (續(xù))

3 結(jié)束語

交通狀態(tài)識別是城市智能交通的重要基礎(chǔ),為提高交通狀態(tài)識別的準確率,本文結(jié)合聚類算法和監(jiān)督學習算法的優(yōu)勢,提出一種基于貝葉斯優(yōu)化的FCM 算法和PSO-XGBoost 算法相結(jié)合的快速路交通狀態(tài)識別模型,針對FCM 算法易陷入局部最優(yōu)和XGBoost 算法參數(shù)復雜敏感的問題,對FCM 算法的初始聚類中心和XGBoost 算法的重要超參數(shù)兩個方面進行優(yōu)化,最后利用歷史交通流數(shù)據(jù)對模型性能進行了測試和比較分析。結(jié)果表明,本文方法實現(xiàn)了對交通狀態(tài)的精準識別,對比其他常見算法,不僅對交通狀態(tài)識別的準確率更高,錯判率更低,而且穩(wěn)定性好,表明所建立的模型性能更優(yōu)越,可為準確獲取交通出行信息和改善交通擁堵提供方法支撐。本文在交通狀態(tài)識別過程中未考慮聚類中心數(shù)量對識別結(jié)果的影響,在未來研究中將對不同聚類中心數(shù)量下不同道路的交通數(shù)據(jù)進行測試和模型性能分析。

猜你喜歡
優(yōu)化模型
一半模型
超限高層建筑結(jié)構(gòu)設計與優(yōu)化思考
民用建筑防煙排煙設計優(yōu)化探討
關(guān)于優(yōu)化消防安全告知承諾的一些思考
一道優(yōu)化題的幾何解法
由“形”啟“數(shù)”優(yōu)化運算——以2021年解析幾何高考題為例
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
主站蜘蛛池模板: 黑人巨大精品欧美一区二区区| 国产美女无遮挡免费视频网站| 精品少妇人妻无码久久| 无码粉嫩虎白一线天在线观看| 午夜福利亚洲精品| 久操线在视频在线观看| 国产最爽的乱婬视频国语对白| 蜜桃视频一区二区| 2021国产精品自产拍在线观看| 久久精品无码专区免费| 在线中文字幕网| 日本高清有码人妻| 成人亚洲国产| 九色免费视频| 蜜臀AV在线播放| 国产欧美性爱网| 精品三级网站| 91视频99| 人人爽人人爽人人片| 伊在人亚洲香蕉精品播放 | 日韩国产综合精选| 国产免费高清无需播放器| 亚洲小视频网站| 四虎精品免费久久| 亚洲天堂视频在线观看免费| 国产亚洲精品自在久久不卡 | 18禁影院亚洲专区| 免费毛片视频| 尤物精品视频一区二区三区| 日韩欧美网址| 热思思久久免费视频| 日本手机在线视频| 欧美午夜视频在线| 人妻91无码色偷偷色噜噜噜| 亚洲天堂网2014| 亚洲不卡影院| 无码中文AⅤ在线观看| 99热国产在线精品99| 国产人人射| 久久综合AV免费观看| 欧美亚洲综合免费精品高清在线观看 | 又黄又爽视频好爽视频| 亚洲精品麻豆| 亚洲中文字幕久久精品无码一区 | 国产青青操| 国产成人久视频免费| 亚洲人成色在线观看| 理论片一区| 素人激情视频福利| 亚洲国产精品日韩欧美一区| 伦精品一区二区三区视频| 亚洲欧洲天堂色AV| 亚洲人成在线精品| 99久久精品免费视频| 无码专区国产精品一区| 午夜综合网| 亚洲女同欧美在线| a色毛片免费视频| 色综合日本| 在线国产欧美| 这里只有精品在线播放| 国产在线欧美| 日韩精品无码免费专网站| 午夜啪啪网| 欧美亚洲香蕉| 亚洲午夜福利在线| 欧美成人区| 精品久久久久成人码免费动漫| 欧美成人a∨视频免费观看| 日韩视频福利| 波多野结衣的av一区二区三区| 欧美国产日韩在线| 啪啪免费视频一区二区| 国产玖玖视频| 国产福利在线免费观看| 91精品久久久无码中文字幕vr| 好吊妞欧美视频免费| 97青青青国产在线播放| 欧美成人一级| 亚洲人成人伊人成综合网无码| 国产无遮挡猛进猛出免费软件| 青青青国产视频手机|