










摘要: "自主式交通系統 (autonomous transportation system, ATS) 是為應對主動式智慧交通發展趨勢而提出的新一代交通系統。為科學合理地構建ATS功能架構,提出了一種面向多屬性文本的優化密度峰值聚類算法 (density peaks clustering, DPC)。該算法結合交通系統功能架構的基本特征,通過改進的詞頻-逆向文檔頻率算法與文本向量空間模型,將多屬性文本轉化成空間維度坐標。再利用高斯函數和決策值優化DPC算法進行聚類,并結合輪廓系數對聚類結果進行評價。為了檢驗算法的合理性,在ATS道路自動駕駛場景下,基于道路載運工具運行服務域、交通基礎設施管理服務域和交通安全管理服務域的功能數據集進行了算例分析,依據聚類結果繪制功能架構圖。架構圖由自主感知-自主學習-自主決策-自主響應4層構成,驗證了ATS應用場景中功能架構優化算法的可行性和合理性。算例結果表明:該算法的構建具有魯棒性,算例輪廓系數整體均值為0.84,與原算法相比解決了聚類過程中聚類中心難以劃定的問題;與原智能交通系統中的各架構設計相比,該功能架構更具有層次性和邏輯性。該優化算法能夠促進新一代交通系統功能架構的構建,推動自主式交通系統理論體系的發展。
關鍵詞: 自主式交通系統;密度峰值聚類;功能架構;道路自動駕駛場景;多屬性文本
中圖分類號: U491 文獻標志碼:A文章編號:1002-4026(2023)02-0093-10
開放科學(資源服務)標志碼(OSID):
Optimized density peaks clustering algorithm for functional architecture of
an autonomous transportation system
LI Chuanyao, CHEN Yiting
(School of Traffic and Transportation, Central South University,Changsha 410075, China)
Abstract∶ Autonomous transportation system (ATS) is a new generation of transportation system proposed in response to the new development trend of active intelligent transportation. To scientifically and reasonably construct the functional architecture of the ATS, an optimized Density Peak Clustering (DPC) algorithm for multiattribute text is proposed in this paper. Combined with the basic characteristics of the functional architecture of a traffic system, the algorithm converts multiattribute text into spatial dimension coordinates through improved term frequency-inverse document frequency algorithm and text vector space model. Gaussian function and decision value were used to optimize the DPC algorithm for clustering, and the clustering result was evaluated using a contour coefficient. To test the rationality of the algorithm, this paper uses the functional datasets of road-carrier operation service domain, traffic infrastructure management service domain, and traffic-safety management service domain in ATS to perform an analysis as an example and draws functional architecture diagrams according to the clustering results. The architecture diagram comprises four layers of autonomous perception, autonomous learning, autonomous decision, and autonomous response, thus forming a scientific analysis method for functional architecture in ATS application scenarios. The results of the example show that the proposed algorithm is robust and the average value of the contour coefficient of the example is 0.84. Compared with the original algorithm, the problem of difficulty in defining the clustering center in the process of clustering is solved. Compared with other architecture designs in the intelligent transportation system, the functional architecture is more hierarchical and logical. This optimization algorithm can promote the construction of the functional architecture of the new generation of transportation system and the development of the theoretical system of the ATS.
Key words∶ autonomous traffic system; density peak clustering; functional architecture; road self-driving scenarios; multiattribute text
目前,已有交通系統體系框架很難適應新興技術下交通從“被動智能”向“主動智慧”的發展,亟需構建適應新一代交通發展的交通系統。國家科技部提出構建自主式交通系統(autonomous transportation system,ATS)的要求,以改進當前智能交通系統對新興技術的適用性問題,更科學地指導我國的交通運輸發展。
《中國智能運輸系統體系框架》[1]奠定了中國智能交通系統架構基礎,研究了智能交通系統 (intelligent transportation system, ITS) 的邏輯框架與物理框架,并在兩個框架下對部分功能進行描述,但沒有對功能框架進行獨立的分析與構建。此外,其邏輯框架與物理框架也多以文字、表格、數據流圖形式展示,沒有直觀的可視化展示。2020年美國交通運輸部出版了The Architecture Reference for Cooperative and Intelligent Transportation[2],為規劃、定義和集成ITS提供了一個通用框架。但是該版架構沒有提出針對具體應用場景的詳細框架,缺乏對道路實際服務需求的描述,所提出框架也缺少一定的理論依據。
為此,本文擬采用機器學習方法來構建ATS功能架構。機器學習中的聚類算法是通過在無類別標記數據上建立聚類,進而學習數據內部相似關系以獲取數據分類的一種無監督學習方法。K-均值、核密度聚類、密度峰值聚類[3]等經典聚類算法廣泛應用于各領域的聚類分析研究,引起廣泛關注。不少學者針對聚類算法展開優化并結合多種聚類算法在交通領域開展深入研究,如Aguiar等[4]針對網絡流量分類優化問題,改進了核密度聚類算法。曹崇閣等[5]應用系統聚類算法對市域軌道交通車站進行快慢車停站方案規劃,使其滿足各類客流出行需求。余慶等[6]基于改進的模糊C均值聚類算法實現高速公路交通狀態的有效識別,達到了提高路網服務水平的目標。孫悅朋等[7]基于密度聚類方法預防公共場所的行人安全事故,進而優化人群安全管理。但是,目前仍缺少針對交通領域中的文本聚類研究,尤其缺乏針對多屬性文本轉化數據的聚類方法。一方面,交通中許多數據來源于實際生活,有些并不是由數字直接構成,通過算法使文本準確、可靠地轉化成可用數據,可以有效解決問題分析中缺少數據的問題。另一方面,通過文本聚類分析可將數據分組,降低研究對象的復雜性以便進行科學分析,同時能夠提高精度,尤其有助于新一代交通體系下各架構的研究。
基于下一代交通系統功能架構的研究需要,本文以密度峰值聚類算法作為算法主體,結合詞頻-逆向文檔頻率 (term frequency-inverse document frequency, TF-IDF) 算法、文本向量空間模型、輪廓系數構建一套針對多屬性文本聚類問題的優化算法,根據ATS道路自動駕駛場景下的功能數據集進行實例分析,完成該場景下功能架構的搭建工作和可視化工作,為面向未來的系統功能架構的搭建提供參考。
1算法構建
本文設計了面向多屬性文本的優化密度峰值聚類 (density peaks clustering, DPC)算法,算法構建如圖1所示,其能夠解決文本向數據轉化和科學聚類的問題,提高算法的準確率,解決人工選取聚類中心偏差大的問題。
1.1基于TF-IDF算法進行文本預處理
文本指書面語言的表現形式,可分為短文本與長文本。本研究主要針對短文本展開,將交通系統所需的功能作為基礎文本,基于功能的多個屬性進行算法構建。
TF-IDF算法是在文本領域中使用最廣泛的數值權重計算方法,算法主要采用統計的方法,其原理是[8]根據香農信息學原理,某特征在某文檔中出現的次數越多其越重要,文檔集中含有該特征的文檔數量越多其越不重要,即若某詞的詞語頻率值很高、逆向文檔頻率值很低,則該詞具有很好的類別能力。該算法也在研究中被不斷改進優化[9],其精度和準確率得到了提高。
1.1.1詞語頻率
若某詞語t在文檔Dn n=1,2,…,N 中出現ft,Dn次,則詞頻f t,Dn =ft,Dn,考慮到每個文檔的長度不同,根據文檔長度調整得到該詞語的詞頻為[10]
f t,Dn = ft,Dn SDn ,(1)
其中,N表示文檔總數,SDn表示Dn中的詞語總數。
考慮到本模型是為多屬性文本聚類服務,每個詞語有較多的屬性,現依據詞語屬性對其進行聚類分析,為優化聚類分析結果,對詞語頻率計算公式進行改進如下:
f(s,Wn)= fs,Wn SWn ,(2)
其中,s表示某文本的屬性,Wn n=1,2,…,N 表示由文本屬性組成的屬性庫,SWn表示Wn中的屬性總數。
1.1.2逆向文檔頻率
逆向文檔頻率可用來度量某詞語的普遍重要性,使用文檔的總數除以詞語庫中出現詞語的文檔數的對數表示,計算公式為
f(t,D)=lg "N nt +l ,(3)
其中,t表示某詞語,D表示語料庫整體,nt表示語料庫整體中出現t的文本頻數,l的取值根據實驗來確定,一般取0.01。
根據文本屬性轉換的需要,假定詞語在屬性庫中必定出現,采用平滑的逆文檔頻率對計算公式重新定義如下:
f(s,W)=lg "SW Ss+1 ",(4)
其中,SW表示屬性庫中屬性總數,Ss表示包含s的屬性總數。
1.1.3詞語頻率-逆向文檔頻率
詞語頻率-逆向文檔頻率被定義為詞語頻率與逆向文檔頻率的乘積,即計算公式為
f(s,Wn,W)=f(s,Wn)·f(s,W)。(5)
當乘積越大時表明該詞語更能代表該文檔,即在本研究中乘積值越大表明該屬性越能夠代表該文本。由此根據每個文本的屬性特征由公式(2)、(4)、(5)計算得到文本轉化成的數據值,從而為將多屬性文本轉化成數據提供科學依據。
1.2基于文本向量空間模型得到文本空間維度坐標
根據TF-IDF算法得到了不同屬性文本的數值權重,為了采用密度峰值聚類算法進行空間聚類分析,需要將文本的屬性權重轉化成空間維度坐標,遂采用文本向量空間模型。
文本向量空間模型最早由Joachims[11]引入文本分類系統,開創了文本分類的先河。這一模型能將給定的文本轉換成一定維數的向量,其以特征項作為文本表示的基本單位,向量的各維對應文本中的一個特征項,而每一維本身則表示了其對應的特征項在該文本中的權值。權值代表了特征項對于所在文本的重要程度。模型的定義為:在給定的文檔中 D=D s1,w1;s2,w2;…;sn,wn , D符合以下兩條約定:各個特征項sk 1≤k≤n 互異;各個特征項sk無先后順序關系,構造空間向量。即由TF-IDF算法得到文本的屬性權重f(s,Wn,W)后,根據文本向量空間模型將文本的多個屬性轉化成文本的空間維度坐標。
1.3面向文本屬性的密度峰值聚類優化算法
通過由前面兩小節得到的文本空間維度坐標對文本進行聚類分析。在聚類算法中,一般可以基于密度、基于劃分等對聚類算法進行分類,以K-均值算法為代表的劃分聚類和以DBSCAN (density-based spatial clustering of applications with noise)算法為代表的密度聚類原理簡單、實現容易[12]。但是,K-均值算法受初始聚類數目影響大,只能處理凸形或球形邊界聚類;DBSCAN的I\\O消耗大,當樣本密度不均勻時會出現聚類質量低的情況。綜合考慮文本的屬性特征,選用僅以數據點之間的距離為基礎、適用于任意形狀的數據集、能夠快速找到正確簇數的空間聚類方法——密度峰值聚類算法。
1.3.1密度峰值聚類算法
密度峰值聚類算法是一種基于密度的空間聚類算法,算法的原則是聚類中心的局部密度較大,聚類中心與高于其局部密度的其他點距離較遠[3]。該算法較好地彌補了K-均值算法、DBSCAN算法的不足,尤其是克服了DBSCAN中不同類的密度差別大、領域范圍難以設定的問題,魯棒性強,具有較強適用性。本文將在此研究基礎上進行一定的優化,使此算法更加適應多屬性文本的聚類研究。該算法的步驟如下:
(1)設定截斷距離dc,根據統計學經驗dc=0.02或dc=0.04 [13]。
(2)對于給定的數據矩陣 XN·M=[x1,x2,…,xi,…,xN]T,其中 xi= x i1,xi2,…,xiM],N為樣本個數,M為樣本維數。樣本xi的局部密度表示為ρi,計算公式如下:
ρi=∑ i≠j χ dij-dc ,χ x = "1, if xlt;00, if otherwise ",(6)
其中,dij為樣本xi和xj之間的距離,使用歐式距離計算距離,將與xi的距離小于dc的點的數量直接作為第i點密度。歐式距離計算公式如下:
d= "∑(xiα-xjα)2 ,(i,j=1,2,…,n,i≠j,α=1,2,…,M),(7)
其中,xiα表示第i點的第α維坐標。
(3)計算局部密度距離。計算每個點到高于自身局部密度值點的最小距離ξi,計算公式如下:
ξi=max j:pjgt;pi "dij 。(8)
對于密度最大的樣本,ξi定義為
ξi=max j "dij ,(9)
(4)根據密度與距離估計中心點。對每一個待聚類點,繪制出局部密度與高于局部密度點距離的散點圖,密度峰值通常是局部密度較高且相對距離較大的樣本。
(5)劃分剩余待聚類點。將每個數據點歸類到比其密度更大的最相近的類中心所屬的類別中。
1.3.2密度峰值聚類算法優化
基于以上DPC算法思想,根據文本聚類的需要對算法進行科學優化。首先,對局部密度的計算進行優化。將前文所述的局部密度截斷核計算方式優化為高斯核計算方式,能夠顯著提高密度計算的精細度,從而更好地優化聚類效果。高斯核計算方式將計算歐式距離和高斯函數值,將所有點值的和作為密度。高斯函數值定義樣本局部密度計算公式為:
ρi=∑ n j=1 exp - dij dc "2。(10)
其次,由于密度峰值聚類算法最初是依據局部密度與高局部密度點距離的散點圖人工選取聚類中心,由人工進行聚類中心的選取易出現較大的偏差,因此對聚類中心點的選取進行優化。采用決策值的方法進行優化:選擇決策值γi較大的樣本作為密度峰值聚類中心,即局部密度與局部密度距離乘積較大的點,γi的計算公式如下:
γi=ρi·ξi。(11)
通過對DPC算法進行優化,能夠更加精準地找到符合條件的聚類中心,將剩余待聚類點進行聚類,提高聚類性能。
1.4輪廓系數檢驗聚類性能
聚類性能評價指標能夠很好地評價當前聚類模型的聚類效果,目前已有的聚類模型的內部評價指標有蘭德系數 (adjusted rand index)、輪廓系數 (silhouette coefficient)等[14],其中輪廓系數常用于評估無所屬類別數據的聚類結果,故本研究選用輪廓系數。輪廓系數兼顧了聚類的凝聚度和分離度,其取值范圍為[-1, 1]。輪廓系數越大,表示聚類的效果越好。通過輪廓系數這一評價指標對文本的聚類進行性能評價,當輪廓系數較低時,考慮重新對對象進行聚類分析,找到更加適合的聚類中心,提高聚類性能,使聚類結果更加科學、合理。
2實例分析
前文已經建立了一套針對多屬性文本聚類的算法模型,下面選取自主式交通系統中的道路自動駕駛場景下的功能數據集進行實例分析,以驗證算法的性能。
2.1自主式交通系統
借助人工智能、大數據、5G通信等新興技術構建的自主式交通系統,以自組織運行和自主化服務的方式完成人與物的運輸,推動交通系統合理、系統地從“被動式”向“自主式”轉變[15],達到減少交通系統人為干預的目的,提升交通系統的自主能力。
2.2道路自動駕駛場景下服務域與功能
自動駕駛能實現道路交通部分或完全自動化運行,我國也鼓勵創新、加強自動駕駛技術研發,健全適應自動駕駛的支撐體系。因此,本文選定道路自動駕駛場景展開研究,以補充、豐富自主式交通系統的研究。
2.2.1場景描述
整體場景定義如下:在城市道路行駛過程中,車輛通過單車感知與信號通信,精確掌握車輛位置、速度、交通標志標線及周圍環境,通過車載系統或云端系統集成并學習相關環境信息,主動實現路線規劃、超車換道、跟車運行、交叉口響應和泊車等功能。
2.2.2場景下服務域與功能
在構建下一代自主式交通復雜系統體系時,需從用戶的實際需求出發,解析實現ATS服務所需的系統功能,通過功能支撐ATS服務的實現。已有規范與研究資料中,《中國智能運輸系統體系框架》[1]將ITS用戶分為8大服務域、34項服務、138個子服務,《基于車路協同的智能交通系統體系框架》[16]將ITS用戶分成9大服務域。ATS結合以上兩類體系框架和最新出版的美國The Architecture Reference for Cooperative and Intelligent Transportation[2],共分成9大服務域。根據道路自動駕駛場景搭建的需要,研究場景下的道路載運工具運行服務域共有3項服務、10項子服務;交通基礎設施管理服務域共有1項服務,2項子服務;交通安全管理服務域共有2項服務、3項子服務,如圖2所示。
三個服務域中的每項子服務中均包含多種功能,為便于進行聚類,首先對功能的屬性進行如下定義并建立屬性庫。提供者:決定組分實體、關聯技術組合和關聯需求組合,對屬性提供者建立庫,用ai(i=1,2,…,10)表示;過程對象:功能實現所利用或處理的對象,對屬性過程對象建立庫,用bi(i=1,2,…,25)表示;服務對象:能夠直接使用功能或利用功能的輸出結果的對象,對屬性服務對象建立庫,用ci(i=1,2,…,10)表示。提供者庫、過程對象庫、服務對象庫如表1所示。
在表1中,部分提供者與服務對象的名稱相同,這是考慮到功能分層搭建時會將功能由上一層的服務對象傳遞給下一層的提供者,以體現架構邏輯的閉環性。結合屬性庫研究每個功能的屬性,對道路自動駕駛場景下子服務各個功能采用屬性組合形式表示,部分功能和屬性如表2所示,全表見OSID科學數據與內容附表1。
根據子服務的需求科學確定其所需功能如下:自動泊車={A1;A2;A3;A4;A5;A6;A7;A8;A9};自適應巡航= {A1;A10;A11;A12;A13;A5;A14;A15;A7;A16;A17;A18};自動換道= {A2;A4;A10;A19;A14;A7; A16;A20;A21};碰撞管理={A10;A1;A19;A16;A16;A22;A23;A24};車輛編隊駕駛服務={A1;A2;A10;A25; A7;A16;A26;A27;A28;A29};車輛與信號燈協同駕駛服務={A30;A13;A31;A15;A32;A33;A34};無信號燈路口通行服={A10;A35;A36;A16;A36;A37;A38;A39;A40;A41};車輛年檢={A42;A43;A44;A45;A46;A47};無人車整車性能測試={A48;A42;A44;A45;A49;A50};無人車情景測試={A48;A42;A51;A44;A45; A52;A49;A50};通信技術協同設施管理={A53;A54;A55;A56;A57};人工智能信息支撐設施管理={A58;A59;A60;A61;A62};車載監控與預警={A63;A48;A45;A44;A64;A65;A66};緊急事件檢測與自動識別={A67;A68;A69;A70;A71;A72;A73;A74};緊急車輛調度={A75;A60;A72;A76;A77;A78}。
2.3算法應用與分析
采用TF-IDF算法將每個服務下功能的屬性轉化為數據,并依據文本向量空間模型轉化成空間維度坐標,共得到78個空間維度坐標。由于部分不同名稱的功能具有相同的屬性,故將78個數據刪去重復值后共計37個空間維度坐標數據,再采用優化的DPC算法,其中dc取0.02。計算出每個功能點的密度和局部密度距離,采用決策值法計算每個功能點的數據密度和局部密度距離乘積,按照降序排列,前五位決策值分別是0.863、0.282、0.169、0.140、0.130,從第六位開始數據的決策值低于0.1,故說明待聚類點以這5個點為聚類中心較合適。接著,依據DPC算法原理,繼續對數據進行聚類分析,得到如圖3所示的聚類結果圖。
從圖3中可以看到,功能依據屬性的不同被聚類成5簇,每一簇均有一個聚類中心。然后,采用輪廓系數法對各功能點進行聚類結果評價,得到輪廓系數整體均值為0.84,聚類效果較好,但其中有三個數據點的輪廓系數低于0.6。為此,再次對這三個數據點所在的簇1、簇4進行聚類分析,以提高聚類結果性能。重新對簇1和簇4進行聚類分析后,整理得到如表3所示為4簇聚類結果。
2.4算法結果應用與對比分析
2.4.1算法結果應用
在自主式交通系統中期望通過提供功能實現自主感知、自主學習、自主決策、自主響應,從而實現自主服務。所以,最終依據聚類結果將所有功能聚類成4簇,從“感學決響”4個方面確定支撐每個服務所需的系統功能。依據聚類結果,將簇1命名為自主感知層,該層獲取實體世界的信息;簇2命名為自主學習層,該層處理感知數據、獲取知識;簇3命名為自主決策層,該層通過充分評估,形成最優控制方案;簇4命名為自主響應層,該層是最終執行階段。參考Behere等[17]研究的自動駕駛在電氣、電子方面架構,自主式交通系統的功能架構圖主要體現“通過功能實現服務,功能支撐服務”的思想。每一份架構圖代表場景下的一個子服務,架構圖共有四層。從感知層開始搭建架構,功能的屬性提供者將過程對象傳遞給服務對象,感知層將服務對象傳遞到學習層的功能屬性提供者,以此類推,最后由決策層向響應層發出指令,實現最終服務。以道路載運工具運行服務域中的自動車輛駕駛服務下的碰撞管理子服務為例,繪制功能架構圖如圖4所示。
類似地,該算法也可應用于道路自動駕駛場景下其他14個子服務功能架構圖的繪制。實例主要是通過三個服務域的部分子服務進行驗證。由于ATS各子領域和子模塊之間存在協同發展的特性,其他6個服務域中的功能也可提煉出提供者、過程對象、服務對象三個屬性,故也可參考上述算法對子服務的功能進行聚類分析,參考聚類結果進行功能架構的搭建,進而支撐子服務的實現。同時,本文研究的算法在一定程度上可以為面向未來的系統功能架構搭建提供理論指導,在已有系統的基礎上對系統的功能特性進行提煉、總結,而后通過算法的應用科學搭建功能架構,為后續系統的仿真提供參考。
2.4.2算法結果對比分析
若采用K-均值方法對上述的功能數據集進行分析,首先需要確定劃分的簇數,當劃定不同的簇數時得到不同的聚類結果,導致聚類結果依賴于聚類中心的初始化。若采用無改進DPC算法進行聚類分析,在選定聚類中心時存在人工選定的問題,使得聚類效果失真。相對的,優化后的DPC聚類算法有較高的精度,整個聚類結果不易受模型中存在的數據擾動、噪聲及離群點的影響,具有魯棒性[18]。
與《中國智能運輸系統體系框架》[1]中的緊急事件管理服務下的事件管理子服務相比,我們的碰撞管理子服務是針對自動駕駛車輛提出,在感知層、學習層、決策層和響應層有不同的提供者和服務對象,并且對傳遞的過程對象進行了詳細說明。而事件管理子服務的用戶主體是道路使用者、交通管理部門等,服務主體只有交通管理中心,用戶主體和服務主體過于寬泛,缺少具體的指向性,而且在書中單以表格形式說明,缺少理論支持和可視化展示。
Behere等[17]研究的功能架構組件被劃分為感知、決策、控制和車輛平臺操縱三類,總體架構由車輛平臺層和感知智能駕駛層構成,設計體現了影響自動駕駛的各種因素。但是,本文所提出的功能架構更多考慮中國自動駕駛發展的實際情況,針對每個具體的子服務研究其功能架構,層與層之間形成一一映射關系,科學嚴謹,能夠輔助后續ATS邏輯架構和物理架構研究。邏輯架構將在功能架構的基礎上進行細化,分析服務運作形成的邏輯數據流。物理架構將著重研究提供者、過程對象、服務對象間的相互操作關系和交互信息流,并通過功能架構、邏輯架構、物理架構研究ATS各代際之間的演化關系,共同服務于系統的仿真搭建。
3結語
本文針對多屬性文本聚類算法進行優化,并依托ATS道路自動駕駛場景下的功能與功能屬性進行了實例研究。在文本聚類算法的優化方面,對DPC算法的密度計算方式、尋找聚類中心算法做出了改進;在應用方面,針對聚類結果搭建功能架構,在功能架構設計方面取得了很好的成效。本文也存在一定的不足之處,在TF-IDF算法中,計算詞頻時沒有考慮當文檔過長時導致詞語頻率出現偏差的影響,在之后的改進中可以考慮使用帶偏置的詞語頻率計算方式。在實例應用的文本收集時,只是針對交通領域中的道路自動駕駛場景,存在收集文本主觀化等問題,將在后續的研究中進行拓展。本研究希望促進下一代交通系統的構建,科學詮釋ATS運作機制,未來形成一套完備且可拓展的ATS架構設計標準,促進ATS的普適化建設。
參考文獻:
[1] 《中國智能運輸系統體系框架》專題組. 中國智能運輸系統體系框架[M]. 北京: 人民交通出版社, 2003.
[2]United States Department of Transportation.The Architecture Reference for Cooperative and Intelligent Transportation [EB/OL]. [2022-03-06]. https://www.arc-it.net/index.html.
[3]RODRIGUEZ A, LAIO A. Clustering by fast search and find of densitypeaks[J]. Science, 2014, 344(6191): 1492-1496. DOI:10.1126/science.1242072.
[4]AGUIAR C, LEITE D. Unsupervised fuzzy eIX: Evolving internal-external fuzzy clustering[C]//2020 IEEE Conference on Evolving and Adaptive Intelligent Systems (EAIS). Bari,Italy:IEEE,2020:1-8.DOI:10.1109/EAIS48028.2020.9122774.
[5]曹崇閣, 徐行方, 鄭翔. 基于系統聚類的市域軌道交通快慢車停站方案[J]. 交通與運輸, 2021, 37(3): 41-44. DOI:10.3969/j.issn.1671-3400.2021.03.010.
[6]余慶, 胡堯. 基于改進FCM聚類算法的高速公路交通狀態識別[J]. 交通運輸研究, 2021, 7 (2): 47-54. DOI: 10.16503/j.cnki.2095-9931.2021.02.006.
[7]孫悅朋, 郭仁擁, 于濤. 基于密度聚類的多向行人流群集區域分布比較[J]. 山東科學, 2021, 34 (5): 64-74. DOI:10.3976/j.issn.1002-4026.2021.05.009.
[8]YU C M, XUE H D, JIANG Y F, et al.A simple and efficient text matching model based on deep interaction[J]. Information Processing amp; Management, 2021, 58(6): 102738. DOI:10.1016/j.ipm.2021.102738.
[9]石琳, 徐瑞龍. 基于Word2Vec和改進TF-IDF算法的深度學習模型研究[J]. 計算機與數字工程, 2021, 49(5): 966-970. DOI:10.3969/j.issn.1672-9722.2021.05.020.
[10]PAN L. An Improved TF-IDF method for calculating text feature weight[J]. International Core Journal of Engineering, 2021, 7(9): 244-248. DOI: 10.6919/ICJE.202109_7(9).0036.
[11]JOACHIMS T. Text categorization with Support Vector Machines: Learning with many relevant features[J]. Machine Learning: ECML-98, 1998, 1398: 137-142. DOI:10.1007/BFb0026683.
[12]陳新泉, 周靈晶, 劉耀中. 聚類算法研究綜述[J]. 集成技術, 2017, 6 (3): 41-49. DOI: 10.3969/j.issn.2095-3135.2017.03.004.
[13]丁世飛, 徐曉, 王艷茹. 基于不相似性度量優化的密度峰值聚類算法[J]. 軟件學報, 2020, 31 (11): 3321-3333. DOI:10.13328/j.cnki.jos.005813.
[14]馬鑫, 段剛龍, 王建仁, 等. 基于改進輪廓系數法的航空公司客戶分群研究[J]. 運籌與管理, 2021, 30 (1): 140-146. DOI:10.12005/orms.2021.0020.
[15]徐光明, 劉昕怡, 鐘林環, 等. 自主式交通系統邏輯架構可靠性分析與評價[J]. 鐵道科學與工程學報, 2022, 4 (12): 1-9. DOI:10.19713/j.cnki.43-1423/u.T20211327.
[16]張毅, 姚丹亞. 基于車路協同的智能交通系統體系框架[M]. 北京: 電子工業出版社, 2015.
[17]BEHERE S, TRNGREN M. A functional reference architecture for autonomousdriving[J]. Information and Software Technology, 2016, 73: 136-150. DOI:10.1016/j.infsof.2015.12.008.
[18]GARCA-ESCUDERO L A, GORDALIZA A, MATRN C, et al. A review of robust clusteringmethods[J]. Advances in Data Analysis and Classification, 2010, 4(2/3): 89-109. DOI:10.1007/s11634-010-0064-5.