基于空間分塊的CGF注意力感知方法

2023-04-24 11:26:54俞棋睿歐陽偉俊矯媛媛

指揮與控制學報 2023年1期

俞棋睿歐陽偉俊秦龍矯媛媛胡越

1.國防科技大學系統工程學院湖南長沙 410073

陸軍分隊戰術級作戰仿真系統中CGF 的戰場行為與地理環境和實體活動緊密相關. 實現高效且精確的態勢感知和實例價值排序[1],在增強CGF 行為擬人性、提高仿真系統運行效率等維度上都有重要意義. 空間認知技術在環境知識的獲取、表示、管理等任務中應用愈發廣泛[2],而實現對虛擬戰場環境感知過程的建模,能夠有效實現針對戰場態勢中目標對象的感知、管理與查詢功能. 這對于提高CGF 模型空間感知行為的可信度和感知行為模型計算效率,具有現實意義.

在對軍事人員態勢感知過程方面,本文采用了價值排序的思想,價值排序指在虛擬環境中,感知主體結合多感官感知注意力機制和感知主體實例偏好等,對感知對象進行價值評價及排序的過程. 考慮到CGF 動作行為的可編程性,重點考慮視覺和聽覺兩種感知方式,并充分研究各實例類感知習慣、能力等現有資料,提出各影響因子線性加權后的價值評價算法,從而生成CGF 態勢感知下感知目標的有序輸出. 感知對象價值排序結果的準確與否,對CGF 后續分析決策的合理性、虛擬戰場仿真推演的逼真性都存在一定影響. 如何合理量化影響因子的作用權重,是衡量注意力感知方法可信度的關鍵所在[3].

本文對如何提升感知模型計算效率進行了研究.目前,制約感知效率提升的一大性能瓶頸是感知主體查詢及動態管理感知對象的時間復雜度. 其中,傳統的簡單遍歷法準確率高但查詢效率較為低下；KD樹管理CGF 實體的方法,雖大大提高了查詢效率,但KD 樹的頻繁重構同樣造成大量的時間浪費.

針對上述問題,本文基于空間分塊的實踐實現了對戰場空間的高效感知及動態管理. 結合多感官感知注意力機制（視、聽）及感知主體實例偏好,應用價值排序建立了基于感知注意力機制的價值模型,并與傳統感知方法橫向對比. 結合空間分塊和價值模型搭建了分隊戰術級態勢感知仿真平臺. 基于空間分塊的CGF 注意力感知方法,在不損失感知精度的前提下能夠有效提高感知效率,具有其可行性和有效性,可為戰場態勢感知實踐提供參考.

1 多感官感知注意力機制

1.1 視覺感知作用機理

視覺模型使用錐形感知模型[4],以視點為圓錐頂點,視線所在直線為圓錐中線. 感知夾角構建視錐,如圖1 所示,視錐盡頭最外圍為視圈,中心處為心點.若CGF 實體落在錐體內,則認為其處于可感知范圍之中,納入感知對象行列[5].

圖1 視覺模型錐形感知示意圖Fig.1 Schematic diagram of cone perception of visual model

在二維平面上,如圖2 所示,采用視覺模型扇面感知. 以觀察點為圓心,最大觀察距離為半徑,視野跨度為扇形的角弧度,從而確定視覺觀察范圍[6].

圖2 視覺模型扇面感知示意圖Fig.2 Schematic diagram of sector perception of visual model

1.2 聽覺感知作用機理

聽覺模型[7]使用球形感知模型,如圖3 所示,以聽覺中心為球心,設定聽覺半徑及聽覺閾值,根據各聲源分貝數與聽覺閾值的比對,聲源地理坐標與感知球形區域的匹配確定CGF 實體的可感知性.

圖3 聽覺模型球形感知示意圖Fig.3 Schematic diagram of spherical perception of auditory model

在二維平面上,如圖4 所示,采用聽覺模型圓形感知. 以觀察點為圓心,最大聽覺距離為半徑,繪制聽覺感知圓,從而確定聽覺感知范圍.

圖4 聽覺模型圓形感知示意圖Fig.4 Schematic diagram of circular perception of auditory model

2 空間分塊的對象感知方法

2.1 空間分塊的實施

空間分塊,即按照固定長寬分割特定地理空間為若干等大地塊,如圖5 所示,sTile 即為地圖sMap中的等大地塊.

圖5 作戰區域空間分塊思想可視化呈現Fig.5 Visualization presentation of spatial block concept in combat geographical area

此外,于各地塊內部維護一系列存儲某一特定類型及陣營實體的鏈表,即以vector 容器存儲某一地塊內各類型-陣營對包含的全部CGF 實體集合；同時構建CGF 實體與所屬地塊間的二維映射哈希表,以STL 的關聯容器map 建立CGF 實體ID 與所屬地塊間的鍵值對應關系. 其中,鏈表實現了對單個地塊內部感知對象的定位索引,為軸對齊包圍盒（axisaligned bounding box,AABB）涉及地塊的感知提供支撐；而哈希表則存儲了整個仿真區域內所有感知對象的信息,以便根據感知對象ID 查找其相關信息. 鏈表和映射哈希表的引入,實現了地塊與CGF 實體的雙向鏈接,從不同層面滿足了用戶的快速查詢需求.

映射哈希表建立了CGF 實體與所屬地塊的索引關系,有利于快速定位實例所屬空間分塊,大大降低了對象查詢和管理的時間復雜度.

1）時間復雜度優化.鏈接CGF 實體與空間地塊,在快速定位的同時實現了戰場感知范圍的塊幅壓縮,即克服了遍歷較大地理空間范圍造成的高時間復雜度.

在具體實施時,先根據觀察者初始位置及其類型屬性,繪制其視覺觀察扇面和聽覺感知圓,并拓展為各自的AABB. AABB 即為包含該對象,且各邊平行于坐標軸的最小矩體,在二維平面上體現為最小矩形. 通過包圍盒在地理空間所處位置和覆蓋面積,確定各自觀察范圍的相關所屬空間地塊. 并通過CGF實體和空間地塊的映射關系,遍歷相關地塊全部實體,分別與視覺觀察扇面或聽覺感知圓相匹配. 空間分塊思想的應用,大大降低了戰場空間遍歷的時間復雜度,優化了全域遍歷的低成效、高耗時等弊端.

如圖6 所示,觀察扇面的AABB 覆蓋了從A-I的全部地塊,需遍歷9 個地塊中全部對象；而聽覺感知圓的AABB 僅覆蓋了塊A、塊B、塊D、塊E、塊G、塊H,只需遍歷上述6 個地塊中的對象[5].

圖6 觀察扇面和聽覺感知圓的AABBFig.6 AABB of the observing sector and auditory perception circle

2）對象感知方法. 確定感知主體Agent 的位置及觀察方向,進一步確定其視覺感知扇面及聽覺感知圓. 在此基礎上分別繪制觀察扇面及感知圓的AABB,依此確定完全或部分重疊的相關地塊,即觀察遍歷的范圍. 進而利用地塊與CGF 實體間的鏈表實現對相關CGF 實體的快速定位及其與感知范圍的匹配,以最終確定感知對象列表.

2.2 空間分塊的比較優勢

相較于傳統鏈表的遍歷查詢和KD 樹的高頻重構,空間分塊思想在對象管理和查詢方面,有其顯著的比較優勢.

一方面,相比于傳統鏈表的順序遍歷法,空間分塊的對象感知方法實現了實體的定位初篩,將感知范圍限制在與視覺扇面及聽覺感知圓的AABB 完全重疊或部分重疊的空間分塊內,大大壓縮了遍歷范圍,避免了對不在感知范圍內目標的比對檢查.

另一方面,KD 樹的對象管理方式包含KD 樹的構建與查詢. 感知對象在戰場空間內頻繁遷移的過程中,其相對位置不斷變化,故KD 樹的頻繁重構無法避免. 相比于KD 樹通過犧牲重構時間成本換取較高查詢效率的弊端,空間分塊的對象感知方法充分利用了一定時間跨度內CGF 實體基本停留于所屬初始空間分塊內的特點,大大降低了信息頻繁存取造成的時間損耗,且極少數感知對象跨地塊遷移對應于空間分塊算法僅涉及相關鏈表及映射哈希表的刪改,其時間成本同樣遠低于KD 樹重構.

3 基于感知注意力機制的價值模型

計算機生成兵力綜合了包括聽覺、視覺在內的多種感官,從虛擬戰場環境中進行態勢感知. 感知注意力機制既包括由感知能力、習慣等要素導致的信息捕捉差異,又包含CGF 實體基于個體類型、屬性的個性化偏好. 構建感知注意力機制的價值模型,即對以上兩種注意力機制的作用機理實行量化建模.從選擇與反饋兩個角度入手,通過感知信息的初篩,并將信息傳回智能體形成反饋,依據價值排序生成基于價值得分的感知對象優先度降序實例列表.

3.1 價值指標體系構成

真實戰場環境中,感知主體感知戰場態勢會結合客觀目標威脅度及主體實例偏好,對感知目標價值進行綜合考量,通過建立價值指標體系,確定價值指標參數及影響權重,求出價值得分并進行降序排序.

模型建立層面,分別建立視覺注意力模型[8-9]和聽覺注意力模型.

構建視覺注意力模型時,主要考慮指標為目標與感知主體間距離[10]、角度偏移量[11]及感知目標移動性[3]三要素為價值評價排序依據. 對聽覺注意力模型[12],主要考慮指標為聲音分貝數,如圖7 所示. 鑒于Agent 主體根據其不同的屬性特點對感知對象存在的特定實例偏好,本文進一步將主體實例偏好納入價值指標體系.

圖7 注意力機制價值指標構成示意圖Fig.7 Schematic diagram of composition of value indicators of attention mechanism

3.2 感知注意力的價值評價算法

感知注意力的價值評價算法: 輸入: CGF 主體可感知目標對象全集R；輸出: 價值優先度排序后的感知對象降序實例列表.

對于任意目標i∈R: 1）以目標與感知主體之間的距離從大到小進行排序,得到目標距離序號Rdis；2）以目標與視覺中軸線的角度偏移量從大到小進行排序,得到目標偏移量序號Rangle；3）以目標當前移動速度從小到大進行排序,得到目標移動性序號Rmobility；4）以目標分貝數從小到大進行排序,得到目標分貝數序號RDecibel；5）基于目標類型進行從低價值到高價值的偏好排序,得到偏好排名序號Rpref；6）將以上5 個參數分別賦權進行線性加合[13-14],并降序排序,得到根據價值得分降序排序后的有序目標集R′. 因各要素在價值評價體系中的重要度衡量存在實際偏好,故本實驗平臺暫采取直接相加并求取算術平均的方式定義價值得分.

4 實驗驗證

4.1 分隊戰術級態勢感知仿真平臺框架

分隊戰術級作戰仿真系統旨在通過仿真推演還原真實戰斗場景實況[15]. 考慮到多兵種一體化聯合作戰已然成為未來戰爭的基本作戰形式,為充分還原虛擬戰場環境,優化CGF態勢感知,搭建仿真戰場環境應設置不同陣營及多種類型的CGF 模型（含坦克、裝甲車、單兵、集群等）,并使之按照想定規則隨機散落于地理空間各處. 鑒于CGF 實體生命周期的局限性和真實人類的注意力有偏性,在定義CGF 對象時也應引入注意力機制并定義生命周期屬性,以初篩無效感知,凸顯主要信息,實現多兵種及多陣營下的CGF 感知注意力控制,如圖8 所示.

圖8 分隊戰術級態勢感知仿真平臺框架Fig.8 Simulation platform framework of element tactical-leveled situational awareness

4.2 分隊戰術級態勢感知仿真平臺實現

本文聚焦于虛擬戰場環境下感知主體對地圖內各實例對象的感知效應. 在考慮到真實戰場環境影響的基礎上,綜合視覺和聽覺兩個感知維度,和感知主體實例偏好的主觀維度,提出了基于感知注意力機制的價值模型,依此對主體態勢感知的注意力機制進行仿真模擬. 同時,結合實際軍事分析需求,實現了二維空間下仿真推演的簡單可視化并進一步將其封裝為動態鏈接庫,完成針對基于感知注意力機制的價值模型的驗證. 同時,搭建的戰場態勢感知仿真實驗平臺,也能更加方便用戶及時通過仿真結果進行分析,在短時間內迅速作出調整決策.

態勢感知仿真平臺實現的具體功能如下: 1）該平臺使用戶能夠在地圖場景內或隨機或于指定位置放置感知對象[16]；2）即時改變視覺觀察扇面朝向,按用戶需求調整感知方向（觀察扇面中心線方向）[17]；3）實現感知對象在地圖范圍內的隨機游走；4）實現了Agent 主體對CGF 實體的實時探測、價值排序及可視化輸出；5）即時按用戶需求改變Agent 主體所處坐標位置；6）實現AABB 的可視化呈現.

如圖9 所示,本文模擬的區域規格為100*100,單個地塊規格為10*10,故將整個區域劃分為了10*10 的方格區. 設地塊數量為M,CGF 實體數量為N,故區域內總的變量個數為地塊數量與CGF 實體數量的累加,即M+N. 在遍歷查詢、KD 樹查詢和分塊查詢3 種查詢方式下,感知對象篩選過濾計算任務的時間復雜度分別如下：遍歷查詢因涉及模擬區域內全部CGF 實體,故算法時間復雜度為O（N）；KD樹查詢算法在計算篩選過濾環節的時間復雜度時,并不考慮KD 樹構建算法的時間耗費,因此,當CGF實體對象均勻分布于地圖中時,KD 樹的近鄰搜索時間復雜度趨近于O（log2N）,只有在CGF 實體呈現集中部署的情況下搜索時間復雜度才退化為O（N）. 然而在本文研究所涵蓋的應用場景中,由于CGF 實體位置的動態變化,將頻繁引發KD 樹的全局重構,這將帶來額外的時間開銷；而對于本文所給出的空間分塊算法,考慮最壞情況為智能體的感知區域覆蓋了全部地塊,即感知區域的AABB 覆蓋了所有的地塊,此時算法時間復雜度為O（M）+O（N）,但實際應用中,感知主體的感知區域面積遠遠小于整個地圖的面積,且作為感知對象的CGF 實體一般呈均勻分布的態勢,因此,其實際的搜索地塊數量M′＜＜M,其時間復雜度將得到大幅壓縮,且個別CGF 實體由于運動發生的位置改變只需要相鄰地塊之間的鏈表刪除和插入操作,因此,更適合用于維護動態場景中的目標信息,故實際時間復雜度應遠小于O（M）+O（N）.

圖9 戰場態勢感知仿真實驗平臺可視化Fig.9 Visualization of battlefield situation awareness simulation experiment platform

本仿真實驗平臺采用windows10 操作系統,CPU信息為Intel（R）Core（TM）i7-9750H CPU@2.60 GHz 2.59 GHz. 該仿真平臺中,在戰場空間內初始投入200 個CGF 實體,令其按照想定規則隨機分布于地圖各分塊內. 青藍色扇形和紫色圓形分別為視覺觀察扇面和聽覺感知圓的可視化呈現,玫紅色矩形則為其AABB 標示.

地圖內各CGF 實體依據其特定類型和陣營,由不同半徑及顏色的空心圓標出,并被賦予特定行進速度. 地圖右側欄內由上至下分別顯示當前時刻仿真時鐘、仿真速度、探測距離、觀測數量、查詢方式及排序依據,CGF 實體列表內容則為感知對象的有序輸出[18]. 隨仿真時鐘不斷推進,地圖內各實例對象以特定行進速度沿隨機方向不斷游走[3],隨著感知對象不斷變化,右側欄輸出也隨時間推進實時更新.

圖10 所示為3 種感知方式耗時對比（仿真平臺運行100 次）,橫向比較空間分塊的對象感知方法、簡單遍歷法以及基于KD 樹的對象管理方法,可以發現,空間分塊的對象感知方法在態勢感知的時間效率上具有極大優勢. 相比之下,簡單遍歷法因篩選范圍存在較大冗余耗時更多,而KD 樹因頻繁重構造成大量時間損耗. 觀察感知結果（如圖11）可知,三者在感知對象的數量和內容上完全一致,僅僅只是價值排序的結果有所不同. 即空間分塊法本身不會造成感知精度上的明顯損失.

圖10 3 種感知方式耗時對比Fig.10 Time consuming comparison of three kinds of perception modes

圖11 3 種感知方式下結果的對比呈現Fig.11 Comparative presentation of results under three kinds of perception modes

在具體的仿真實驗實施中,簡單遍歷法及基于KD 樹的對象管理方法以感知主體與CGF 實體間的坐標距離為依據降序排序；而空間分塊的對象感知方法則應用本文所提出的基于感知注意力機制的價值模型,依據價值得分降序排序. 觀察排序結果可知,依據坐標距離的排序方法,存在較近單兵實體的價值優先度略高于稍遠的裝甲目標的情形,不符合主觀認知. 而價值模型的構成則充分考慮感知習慣及主觀認知,更符合戰場實際.

綜上所述,基于空間分塊的CGF 注意力感知方法在不損失感知精度的前提下,能夠有效提高感知效率,優化價值優先度排序[19-21],具有一定可行性,可為戰場態勢感知實踐提供參考.

5 結論

本文實現了視聽兩種感官和感知主體實例偏好共同作用下的虛擬戰場態勢感知以及針對感知對象的價值排序,進一步基于離散事件調度框架,對虛擬戰場態勢感知仿真實驗平臺設計了完整的可視化動態鏈接庫. 基于當下研究成果對下步工作作出如下展望: 1）拓寬感知維度；2）實現工程化；3）權重偏好訓練；4）優化系統構建. 在后續工作中,需要進一步拓寬感知維度,以進一步貼近實戰,提高仿真實驗之于現代化戰爭的借鑒意義.

致謝

感謝本文的共同第一作者歐陽偉俊先生對態勢感知仿真實驗平臺可視化實現、感知注意力價值評價算法設計等工作作出的重要貢獻.