李慧穎,武亞鵬,許熳靈,李 婷
(中南勘察設(shè)計(jì)院集團(tuán)有限公司 武漢市 430073)
經(jīng)過(guò)四十余年的建設(shè)發(fā)展,截至2020年末,我國(guó)高速公路里程已經(jīng)突破16萬(wàn)公里,超過(guò)5000km的省份(市、自治區(qū))達(dá)到了18個(gè),在全國(guó)范圍內(nèi)構(gòu)建起了快捷、高效的運(yùn)輸體系,支撐國(guó)民經(jīng)濟(jì)的高質(zhì)量發(fā)展。同時(shí),“十四五”時(shí)期我國(guó)高速公路里程仍舊持續(xù)增長(zhǎng),預(yù)計(jì)至2026年達(dá)到20km,面對(duì)規(guī)模如此巨大的高速公路網(wǎng)絡(luò),如何做好運(yùn)行特征研究,優(yōu)化運(yùn)營(yíng)管理成為高速公路“提質(zhì)增效”的關(guān)鍵命題。
關(guān)于高速公路運(yùn)行特征的相關(guān)研究可分為兩類,下面進(jìn)行分別介紹。第一類是利用高速公路收費(fèi)數(shù)據(jù)、視頻監(jiān)測(cè)數(shù)據(jù)等基礎(chǔ)數(shù)據(jù),運(yùn)用統(tǒng)計(jì)分析方法對(duì)高速公路時(shí)間運(yùn)行特征、空間運(yùn)行特征進(jìn)行定量或定性的描述,如劉國(guó)盼等[1]對(duì)貴州省高速公路在節(jié)假日期間車輛出行目的進(jìn)行了相關(guān)闡述,并以此分析交通擁堵原因;桑美英等[2],利用高速公路運(yùn)行大數(shù)據(jù),對(duì)全國(guó)高速公路貨運(yùn)車輛比例、月平均車流量、分時(shí)段客貨車流量、節(jié)假日車流量以及運(yùn)距等相關(guān)指標(biāo)進(jìn)行了統(tǒng)計(jì);李若靈[3]則重點(diǎn)對(duì)上海市2012年至2018年高速公路節(jié)假日車流量數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,研究高速公路擁堵原因,并提出相關(guān)建議;楊朗等[4]以高速公路卡口數(shù)據(jù)、貨車GPS定位數(shù)據(jù)等為基礎(chǔ)數(shù)據(jù),對(duì)廣州機(jī)場(chǎng)高速公路高峰小時(shí)交通量、飽和度、客貨車比例等時(shí)間特征進(jìn)行了統(tǒng)計(jì)。
第二類則是構(gòu)建數(shù)學(xué)模型對(duì)基礎(chǔ)數(shù)據(jù)進(jìn)行挖掘,分析高速公路運(yùn)行特征產(chǎn)生機(jī)理,如戢曉峰等[5]采用線性回歸的方法,分析研究惡劣天氣對(duì)高速公路交通流影響;趙珍珍等[6]利用聚類分析的方法,對(duì)經(jīng)濟(jì)發(fā)展水平與交通量之間的相關(guān)性進(jìn)行了分析;王林等人以高速公路聯(lián)網(wǎng)收費(fèi)數(shù)據(jù)為基礎(chǔ),采用線性回歸分析的方法,研究交通量與地區(qū)生產(chǎn)總值之間的相關(guān)性。楊中岳[7]利用手機(jī)信令數(shù)據(jù),基于神經(jīng)網(wǎng)絡(luò)模型建立了高速公路運(yùn)行狀態(tài)預(yù)測(cè)方法;李桃迎等[8]則是以高速公路車流量數(shù)據(jù)及天氣數(shù)據(jù)為基礎(chǔ)數(shù)據(jù),建立交通量短時(shí)預(yù)測(cè)模型;龍科軍等[9]對(duì)高速公路線圈監(jiān)測(cè)數(shù)據(jù)展開(kāi)研究,并建立了交通流評(píng)判模型。
綜上所述,采用數(shù)學(xué)模型進(jìn)行數(shù)據(jù)挖掘的方法能夠進(jìn)一步揭示高速公路運(yùn)行特征影響機(jī)理,在基礎(chǔ)數(shù)據(jù)充裕的情況下更具研究意義,其挖掘方式主要包括分類、估計(jì)、預(yù)測(cè)、聚類、相關(guān)性分析等多種類型。因此,以湖北省某高速公路收費(fèi)站所數(shù)據(jù)為基礎(chǔ),采用聚類、線性回歸等方法對(duì)其運(yùn)行特征展開(kāi)研究。
選取湖北省某條高速公路作為研究對(duì)象,并統(tǒng)計(jì)了其2018年至2020年分月份斷面交通量數(shù)據(jù)、收費(fèi)站所分日交通量及收費(fèi)站一天中分時(shí)段交通量,由于卡口僅記錄出站口車輛數(shù)據(jù),因此該數(shù)據(jù)不含進(jìn)站口車輛數(shù)據(jù),見(jiàn)圖1。

圖1 高速公路月平均日交通量統(tǒng)計(jì)
以月為單位分析可知,該高速公路2018年與2019年月平均日交通量分布趨勢(shì)基本一致(注:2020年由于疫情的影響,暫不分析其交通量變化趨勢(shì)),均是在1月份至2月份交通量達(dá)到峰值,之后開(kāi)始下降,至5月份開(kāi)始回升,10月份出現(xiàn)高峰,12月份出現(xiàn)低谷。
重點(diǎn)選取1月份、4月份、5月份、10月份的日交通量進(jìn)行統(tǒng)計(jì)分析,結(jié)果顯示,高速公路交通量受節(jié)假日影響較為明顯,其中春節(jié)返鄉(xiāng)前期,12號(hào)收費(fèi)站所最高日交通量達(dá)到12000vel,是正常情況下6倍之多;清明節(jié)、五一勞動(dòng)節(jié)、國(guó)慶節(jié)也均出現(xiàn)了較大波動(dòng)。究其原因,主要是受節(jié)假日返鄉(xiāng)、出游、復(fù)工等交通集中出行以及高速免費(fèi)政策的影響,導(dǎo)致高速公路交通量短時(shí)間內(nèi)激增,見(jiàn)圖2。


圖2 高速公路12號(hào)收費(fèi)站所2019年1月份、4月份、5月份、10月份日交通量統(tǒng)計(jì)
以小時(shí)為單位分析可知,12號(hào)收費(fèi)站所一天中存在明顯的早高峰和晚高峰時(shí)段,分別集中在9時(shí)至10時(shí)和18時(shí)至19時(shí),高峰小時(shí)系數(shù)為0.08左右,凌晨1時(shí)至6時(shí)交通量者處于較低水平,其中3時(shí)至5時(shí)交通量趨近于0,見(jiàn)圖3。

圖3 高速公路12號(hào)收費(fèi)站所小時(shí)交通量分布統(tǒng)計(jì)
為深入探究前章節(jié)中高速公路所呈現(xiàn)出的交通量時(shí)間分布特征形成原因及影響因素,針對(duì)14個(gè)收費(fèi)站所進(jìn)行聚類分析,之后對(duì)同類收費(fèi)站所共同特征進(jìn)行因素相關(guān)分析,尋找影響機(jī)理。
聚類分析簡(jiǎn)稱為聚類,是把一個(gè)數(shù)據(jù)集分為多個(gè)數(shù)據(jù)集的過(guò)程,且每個(gè)子集所含對(duì)象具有高度相似性,而相對(duì)于其它子集對(duì)象則不相似[10]。聚類的方法有很多,基本類型主要包括:劃分方法、層次聚類法、基于密度的方法和基于網(wǎng)格的方法[11]。其中,劃分方法較為常用,其分為K-mediods法和K-means法兩種,K-mediods法是由K-means法改進(jìn)而來(lái),是用來(lái)解決k-means法中離群點(diǎn)干擾問(wèn)題,在小型數(shù)據(jù)集上運(yùn)行良好。本文共14個(gè)研究對(duì)象,數(shù)據(jù)量不大,故選用K-mediods法進(jìn)行聚類分析。
K-mediods法計(jì)算步驟:
(1)確定聚類簇?cái)?shù)K值。
(2)隨機(jī)選取K個(gè)樣本作為簇中心。
(3)計(jì)算剩余樣本至中心點(diǎn)距離(選取歐式距離)。
(4)將簇內(nèi)每個(gè)樣本點(diǎn)作為簇中心計(jì)算一遍距離,并將距離之和最小的點(diǎn)作為新的簇中心。
(5)重復(fù)步驟3與4,直至簇中心不再變化,目標(biāo)函數(shù)值最小。
目標(biāo)函數(shù)計(jì)算公式如下:
(1)
其中,E表示數(shù)據(jù)集中所有對(duì)象p與Ci的代表對(duì)象Oj的絕對(duì)誤差之和。
由于K值為自行選取,因此需要構(gòu)建聚類結(jié)果評(píng)價(jià)指標(biāo)來(lái)評(píng)判K值的合理性,通過(guò)組內(nèi)平方誤差(Sum of Squared Error-SSE)來(lái)評(píng)判,具體如下:
(2)
其中,d是兩個(gè)點(diǎn)的歐氏距離;k是簇的個(gè)數(shù);x是數(shù)據(jù)點(diǎn);ci是第i個(gè)簇的中心;si表示第i個(gè)簇中數(shù)據(jù)點(diǎn)的集合。
隨著聚類數(shù)目增多,每一個(gè)類別中數(shù)量減少,距離變短,SSE減小。當(dāng)某一K值,SSE的減小明顯變緩,即將該聚類數(shù)目取為K值。
聚類分析之初需要對(duì)收費(fèi)站所原始交通量數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,以消除數(shù)量級(jí)差異對(duì)聚類結(jié)果的影響。選用z-score法(正規(guī)化方法)對(duì)交通量數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,計(jì)算公式如下:
(3)
其中,yi表示第i小時(shí)標(biāo)準(zhǔn)化后的交通量數(shù)據(jù);vi表示第i小時(shí)原始交通量數(shù)據(jù);n表示交通量數(shù)據(jù)個(gè)數(shù),n=24。
選取K=2、3、4、5、6、7、8等值進(jìn)行試算,并計(jì)算組內(nèi)平方誤差(SSE),具體結(jié)果見(jiàn)圖4。

圖4 組內(nèi)平方誤差(SSE)計(jì)算結(jié)果
從圖4可以看出,當(dāng)K=4時(shí),SSE減小趨勢(shì)明顯變緩,因此選取聚類簇?cái)?shù)為4,并選取各類收費(fèi)站所中部分樣本進(jìn)行小時(shí)交通量分布統(tǒng)計(jì),具體結(jié)果分析如圖5和表1所示。


圖5 四種類型收費(fèi)站所小時(shí)交通量分布統(tǒng)計(jì)

表1 四種類型收費(fèi)站所小時(shí)交通量分布統(tǒng)計(jì)
進(jìn)行交通量時(shí)間分布影響因素分析時(shí),采用了多元線性回歸的方法,即將收費(fèi)站所是否包含在某一類別中作為被解釋變量,是取值為“1”,否則取值為“0”,將收費(fèi)站所5km范圍內(nèi)工業(yè)園區(qū)、景區(qū)、學(xué)校、公司(工廠)、賓館、娛樂(lè)場(chǎng)所、醫(yī)院、小區(qū)、村莊等POI(興趣點(diǎn))數(shù)量作為解釋變量,具體計(jì)算公式如下:
z=ε+β0+β1q1+β2q2+…+βnqn
(4)
其中,z為被解釋變量,q為解釋變量,β為回歸系數(shù),ε為隨機(jī)誤差。
回歸結(jié)果顯示:一類收費(fèi)站所周邊以工廠用地為主,由于上班通勤交通流的影響,導(dǎo)致出站口形成早高峰,小時(shí)交通量分布為單峰型;二類收費(fèi)站所周邊以工業(yè)、辦公及居住用地為主,由于上班、下班通勤交通流的影響,分別導(dǎo)致出站口形成早高峰與晚高峰,小時(shí)交通量分布為雙峰型;三類收費(fèi)站靠近或處于城區(qū),周邊用地屬性種類較多,通勤、貨運(yùn)、業(yè)務(wù)、生活等各類交通流交織,導(dǎo)致通勤交通流帶來(lái)的高峰被稀釋,呈現(xiàn)全峰型;四類僅包含14號(hào)收費(fèi)站所,難以利用線性回歸進(jìn)行定量分析,通過(guò)定性分析可知,14號(hào)收費(fèi)站所是某城市向東對(duì)外出行的唯一入口,同時(shí)也是溝通機(jī)場(chǎng)與城市的重要通道,因此其小時(shí)交通量分布綜合了二類與三類的特征,全天交通量水平較高且呈現(xiàn)多個(gè)峰值。

表2 POI(興趣點(diǎn))數(shù)量與聚類結(jié)果擬合結(jié)果
通過(guò)以月、日為單位分析可知,在無(wú)特殊事件發(fā)生的情況下(自然災(zāi)害、疫情等)高速公路交通量波動(dòng),主要受節(jié)假日返鄉(xiāng)、出游、復(fù)工等交通出行及高速公路免費(fèi)政策的影響,交通量短時(shí)內(nèi)激增,容易發(fā)生交通擁堵以及安全事故,需要相關(guān)部門制定合理的措施。對(duì)站所聚類分析,將14個(gè)收費(fèi)站所分為四類,其小時(shí)分布正特征分別呈現(xiàn)單峰型、雙峰型、全峰型以及多峰型,并通過(guò)回歸分析得出,高速公路小時(shí)分布特征主要受周邊用地屬性的影響,其中工廠、辦公等用地屬性引發(fā)出站早高峰,居住用地引發(fā)出站晚高峰。本文結(jié)論對(duì)高速公路新建或改擴(kuò)建過(guò)程中互通位置布設(shè)、樣式設(shè)計(jì)等相關(guān)內(nèi)容,具有重要指導(dǎo)意義。同時(shí),由于基礎(chǔ)數(shù)據(jù)的影響,并未對(duì)高速路公路交通量空間分布進(jìn)行分析,后續(xù)將考慮運(yùn)用OD反推等手段進(jìn)行研究分析。