楊闖,劉建業(yè),2,3,*,熊智,2,3,賴際舟,2,3,熊駿
1. 南京航空航天大學(xué) 自動化學(xué)院 導(dǎo)航研究中心,南京 211106 2. 先進飛行器導(dǎo)航、控制與健康管理工業(yè)和信息化部重點實驗室,南京 211106 3. 衛(wèi)星通信與導(dǎo)航江蘇高校協(xié)同創(chuàng)新中心,南京 210016
動物具有優(yōu)秀的(群體)導(dǎo)航能力,可實現(xiàn)由原始感知信息的輸入到準(zhǔn)確、可靠、靈活的導(dǎo)航動作的直接輸出,這種端到端的智能行為,一直是人工智能(AI)研究領(lǐng)域持續(xù)關(guān)注的焦點之一。近年來,隨著腦與神經(jīng)科學(xué)的不斷發(fā)展,研究者逐漸揭示了昆蟲和哺乳動物及其群體大腦導(dǎo)航機理[1-3],受這些機理啟發(fā),以及AI所依賴的智能算法、計算能力和數(shù)據(jù)的發(fā)展,一種新型仿生導(dǎo)航技術(shù)“類腦導(dǎo)航”得到了較大發(fā)展,展現(xiàn)出了自主環(huán)境感知、空間認(rèn)知、面向目標(biāo)導(dǎo)航(路徑規(guī)劃與動作決策)一體化智能計算能力,在自主智能無人系統(tǒng)中具有較大的應(yīng)用潛力。
無人機密集集群作為無人系統(tǒng)的主要形式之一,是由成百上千甚至更多無人機個體通過某種特定集群機制所形成的一類高度可重構(gòu)、按需設(shè)計、分布式自主智能的密集網(wǎng)絡(luò)化無人系統(tǒng),在充分發(fā)揮數(shù)量優(yōu)勢的情況下,可以提供顯著增強的任務(wù)執(zhí)行能力、靈活性和魯棒性,在偵察、搜救、飛行表演、測繪測量等軍民用領(lǐng)域具有廣闊的應(yīng)用前景[4]。但同時無人機密集集群龐大的網(wǎng)絡(luò)化群體結(jié)構(gòu)和復(fù)雜飛行環(huán)境也對集群導(dǎo)航技術(shù)提出了特殊要求:能適應(yīng)衛(wèi)星不可信、電子干擾、夜間等復(fù)雜飛行環(huán)境(魯棒性);能在配備低成本導(dǎo)航設(shè)備前提下實現(xiàn)準(zhǔn)確的導(dǎo)航精度(準(zhǔn)確性);感知與導(dǎo)航信息能及時生成動作決策而快速響應(yīng)復(fù)雜外部環(huán)境及密集集群環(huán)境(實時響應(yīng)動作);應(yīng)有較高的自主智能性(智能性);通過少量無人機個體的導(dǎo)航信息交互即能實現(xiàn)整個集群導(dǎo)航的能力(計算效率)。現(xiàn)有無人機集群導(dǎo)航算法難以較好或同時滿足上述需求[5-7],亟需發(fā)展能適應(yīng)無人機密集集群復(fù)雜飛行環(huán)境的魯棒性強、準(zhǔn)確、實時響應(yīng)動作、智能性強以及計算量小的新型集群導(dǎo)航方法。
類腦導(dǎo)航技術(shù)具有解決上述無人機密集集群導(dǎo)航難題的潛力。其中,基于昆蟲導(dǎo)航機理的多模態(tài)仿生傳感器和哺乳動物導(dǎo)航機理的類腦傳感信息處理機制的類腦環(huán)境感知技術(shù)具有低成本、多模態(tài)測量優(yōu)勢,可以在復(fù)雜作業(yè)環(huán)境下提供準(zhǔn)確的環(huán)境及個體運動信息;哺乳動物導(dǎo)航機理啟發(fā)的導(dǎo)航細(xì)胞自組織神經(jīng)計算機制的類腦空間認(rèn)知技術(shù),不依賴高精度傳感器和準(zhǔn)確導(dǎo)航模型,可以提供較為準(zhǔn)確可靠的導(dǎo)航參考;哺乳動物導(dǎo)航機理啟發(fā)的端到端面向目標(biāo)類腦導(dǎo)航技術(shù),無需導(dǎo)航參數(shù)解算,可實時耦合原始感知、認(rèn)知與動作決策;類腦導(dǎo)航技術(shù)架構(gòu)具有較好開放性,可以擴展更多類腦智能行為;昆蟲個體以及哺乳動物導(dǎo)航細(xì)胞自組織行為啟發(fā)的類腦群體導(dǎo)航技術(shù),僅通過與局部群內(nèi)或與環(huán)境的相互信息交互既可在整個群體層面涌現(xiàn)有序的協(xié)同行為。
類腦導(dǎo)航技術(shù)的上述特點與無人機密集集群系統(tǒng)對集群導(dǎo)航魯棒性、準(zhǔn)確性、實時響應(yīng)動作、智能性以及計算效率的要求有著緊密的契合之處,是實現(xiàn)無人機密集集群導(dǎo)航魯棒性強、準(zhǔn)確、實時響應(yīng)動作、智能性強以及計算量小等要求的一條新思路和途徑。本文基于作者團隊申請并主持的國家自然科學(xué)基金項目“類腦感知定位機理的無人機密集集群編隊協(xié)同導(dǎo)航方法(61873125)”研究進展,對呈現(xiàn)上述特點的類腦導(dǎo)航技術(shù)研究現(xiàn)狀、研究新趨勢以及存在的問題和挑戰(zhàn)進行了詳細(xì)論述。
本文作者團隊曾綜述分析并發(fā)表了無人機集群類腦導(dǎo)航系統(tǒng)[8]一文,但本文與前文論述的主題和方法不同,前文著重分析了一類僅計算輸出導(dǎo)航與相對導(dǎo)航參數(shù)(姿態(tài)/速度/位置)的腦啟發(fā)導(dǎo)航模型;而本文闡述了類腦導(dǎo)航技術(shù)最新研究進展,研究了另一類直接輸出動作決策的感知/認(rèn)知/路徑規(guī)劃/動作決策一體化類腦導(dǎo)航智能體,本類方法在實時響應(yīng)外界環(huán)境并自主生成動作決策方面有潛在的優(yōu)勢。
認(rèn)知地圖是動物進行空間認(rèn)知和導(dǎo)航的基礎(chǔ)。昆蟲將與其他個體以及環(huán)境交互過程中形成的認(rèn)知地圖存放于外部環(huán)境中,如螞蟻通過在環(huán)境中釋放的信息素的鋪設(shè)和跟蹤來建立正常交通的路線和網(wǎng)絡(luò),這些路線和網(wǎng)絡(luò)構(gòu)成了螞蟻的認(rèn)知地圖[9];而哺乳動物的認(rèn)知地圖則位于大腦的海馬區(qū)中,該腦區(qū)中多種導(dǎo)航細(xì)胞實現(xiàn)對環(huán)境信息的編碼和記憶,形成表征空間的內(nèi)部認(rèn)知地圖。昆蟲/哺乳動物形成認(rèn)知地圖或基于認(rèn)知地圖進行導(dǎo)航的機理如圖1所示。

圖1 動物大腦端到端導(dǎo)航機理Fig.1 Mechanism of end-to-end navigation of animal brain
1) 昆蟲大腦導(dǎo)航機理
昆蟲同時采用非自我中心和自我中心2類信息組合定向[1]。非自我中心主要有:復(fù)眼感知太陽方位/光線強度與光譜梯度;復(fù)眼高度專化的小眼感知天空偏振光進行定向;觸角感受氣味/風(fēng)向等信息進行相對定位,并敏感地球磁場定向。自我中心信息為內(nèi)部體感的角速度。昆蟲大多利用光流進行測速,積分獲得距離信息,而步行螞蟻等昆蟲使用步進積分器來估計行進距離。然后對方位和行進距離路徑積分定位。昆蟲通過復(fù)眼觀測全景視圖、觸角感受氣味等信標(biāo)進行信標(biāo)定位。使用復(fù)眼視覺快照(Snapshot)等信標(biāo),通過最大化當(dāng)前和記憶信標(biāo)之間的匹配,沿著圖像差異最小的信標(biāo)方向進行路線跟隨[1]。
中樞復(fù)合體(Central Complex)被認(rèn)為是昆蟲導(dǎo)航與控制的關(guān)鍵腦區(qū),主要由扇形體、橢球體、前腦橋和一對小結(jié)構(gòu)成[1]。當(dāng)前主要揭示了中樞復(fù)合體的路徑積分導(dǎo)航神經(jīng)機制,如圖1(a)所示。橢球體神經(jīng)元實現(xiàn)對非自我中心和自我中心方位傳感信息的融合,融合后的方位信號投射到前腦橋中,激活編碼某一方位的特定神經(jīng)元,以此表征昆蟲方位。小結(jié)接收光流速度信息并投射到扇形體中循環(huán)連接的神經(jīng)元,循環(huán)神經(jīng)元結(jié)合前腦橋編碼的方位信息在這里完成路徑積分。當(dāng)前時刻的定位定向信息不斷與小結(jié)記憶中的目標(biāo)方位位置進行比對,比對結(jié)果產(chǎn)生誤差信號驅(qū)動特定動作神經(jīng)元產(chǎn)生動作指令。
2) 哺乳動物大腦導(dǎo)航機理
哺乳動物導(dǎo)航能力以大腦內(nèi)嗅皮層——海馬體(海馬區(qū))中的大量導(dǎo)航細(xì)胞集群放電活動為基礎(chǔ),通過大量導(dǎo)航細(xì)胞(神經(jīng)元)形成的神經(jīng)回路進行導(dǎo)航和定位計算,是大腦神經(jīng)網(wǎng)絡(luò)多層級信息編碼和表征的結(jié)果。海馬區(qū)中的3種關(guān)鍵導(dǎo)航細(xì)胞為頭朝向細(xì)胞、網(wǎng)格細(xì)胞、位置細(xì)胞,如圖1(b)所示。哺乳動物經(jīng)過長期導(dǎo)航行為學(xué)習(xí)和發(fā)育,形成上述3種導(dǎo)航細(xì)胞特定的突觸連接結(jié)構(gòu),進而構(gòu)成大腦導(dǎo)航神經(jīng)網(wǎng)絡(luò)計算回路呈現(xiàn)出:在大腦前庭系統(tǒng)角速度輸入或視覺信息轉(zhuǎn)化的角速度輸入下,特定的頭朝向細(xì)胞會放電激活,以此表征方位信息;網(wǎng)格細(xì)胞對自運動信息(頭朝向細(xì)胞提供的方位輸入和速度細(xì)胞提供的動物前向速度輸入)進行路徑積分,并在動物到達環(huán)境中六邊形網(wǎng)格狀區(qū)域頂點時激活放電,對局部空間進行不同分辨率和方向的度量,形成高效緊湊的空間度量地圖,被用來為空間中任意位置提供矢量導(dǎo)航[10];多尺度網(wǎng)格細(xì)胞路徑積分的結(jié)果融合產(chǎn)生位置細(xì)胞特定的放電活動[11],動物到達環(huán)境某個區(qū)域時,特定的位置細(xì)胞會激活放電,以此指示動物所處位置及周邊空間信息,大量位置細(xì)胞聯(lián)合編碼所處整個環(huán)境,形成表征環(huán)境的內(nèi)容認(rèn)知地圖,但由于路徑積分存在累積誤差,上述生成的認(rèn)知地圖不準(zhǔn)確;此外,圖像、聲音、氣味等外部環(huán)境信息也會激發(fā)特定位置細(xì)胞放電,形成對特定環(huán)境區(qū)域的記憶,通過大量位置細(xì)胞的聯(lián)合記憶也能生成認(rèn)知地圖,但此時的認(rèn)知地圖是離散的片段式;最終,位置細(xì)胞通過融合外部信息和路徑積分信息生成準(zhǔn)確連續(xù)可靠的認(rèn)知地圖[12]。頭朝向細(xì)胞、網(wǎng)格細(xì)胞以及位置細(xì)胞神經(jīng)計算回路中還存在其他多種導(dǎo)航細(xì)胞,完成對導(dǎo)航信息不同層級的神經(jīng)計算[13]。
大腦中的海馬體和內(nèi)側(cè)前額葉皮質(zhì)被普遍認(rèn)為是處理動物面向目標(biāo)導(dǎo)航的2個關(guān)鍵腦區(qū)[14],如圖1(b)所示,伏隔核一方面接收海馬體產(chǎn)生的空間認(rèn)知信息,另一方面從腹側(cè)被蓋區(qū)接收由多巴胺神經(jīng)元產(chǎn)生的獎勵預(yù)測誤差信息(即當(dāng)前與目標(biāo)位置間的誤差),然后融合此二種信息并通過伏隔核中的動作細(xì)胞產(chǎn)生一系列動作指令,內(nèi)側(cè)前額葉皮質(zhì)接收動作指令指導(dǎo)動物的運動行為,最終完成面向目標(biāo)的導(dǎo)航過程。
上述昆蟲和哺乳動物大腦導(dǎo)航機理表明:二者都是通過大腦內(nèi)部多種大量導(dǎo)航細(xì)胞(神經(jīng)元)自組織集群特異性放電活動對自運動以及視覺/聽覺/嗅覺等外源性輸入信息進行端到端導(dǎo)航神經(jīng)計算的,均包括3個過程:路徑積分、信標(biāo)校正以及面向目標(biāo)導(dǎo)航;二者導(dǎo)航過程均可以抽象為3個階段:環(huán)境感知、空間認(rèn)知、面向目標(biāo)導(dǎo)航;此外,昆蟲通過大量昆蟲個體的自組織集群形成群體智能,而哺乳動物通過導(dǎo)航細(xì)胞的自組織集群形成產(chǎn)生空間智能的海馬區(qū)和內(nèi)側(cè)前額葉皮質(zhì)結(jié)構(gòu),具有互補對稱性[9]。
類腦導(dǎo)航是一種動物大腦端到端導(dǎo)航機理啟發(fā)的新型仿生導(dǎo)航技術(shù),如圖2所示,以自運動等內(nèi)源性、視覺等外源性信息為輸入,借鑒動物感知、認(rèn)知和導(dǎo)航腦區(qū)結(jié)構(gòu)和信息處理機制,利用AI技術(shù)實現(xiàn)從原始感知信息輸入到導(dǎo)航行為決策的直接輸出,形成具有自主環(huán)境感知、空間認(rèn)知、路徑規(guī)劃與動作決策一體化能力的智能體。類腦導(dǎo)航不僅隱含了導(dǎo)航參數(shù)解算,更實現(xiàn)對環(huán)境信息的學(xué)習(xí)、推理、探索、記憶等認(rèn)知過程以及綜合任務(wù)目標(biāo)做出的路徑規(guī)劃與決策。

圖2 類腦導(dǎo)航工作流程Fig.2 Workflow of brain-inspired navigation
類腦導(dǎo)航包括類腦環(huán)境感知、類腦空間認(rèn)知以及面向目標(biāo)類腦導(dǎo)航3個過程。類腦環(huán)境感知借鑒動物感知環(huán)境方式和處理多感官信息的選擇性注意、逐級抽象等神經(jīng)機制,采用卷積神經(jīng)網(wǎng)絡(luò)等AI技術(shù)實現(xiàn)對多模態(tài)傳感信息的多維度特征提取并解析自運動信息及環(huán)境信息;類腦空間認(rèn)知借鑒大腦導(dǎo)航細(xì)胞自組織集群放電機制,采用吸引子神經(jīng)網(wǎng)絡(luò)等AI技術(shù)構(gòu)建空間認(rèn)知模型,將自運動信息和環(huán)境信息轉(zhuǎn)化為表征自身導(dǎo)航信息及環(huán)境特征事物關(guān)系特征的導(dǎo)航細(xì)胞特異性放電活動,構(gòu)建認(rèn)知地圖;面向目標(biāo)類腦導(dǎo)航借鑒動物面向任務(wù)目標(biāo)位置導(dǎo)航行進時認(rèn)知地圖特定導(dǎo)航細(xì)胞與動作細(xì)胞連接激活神經(jīng)機制,采用強化學(xué)習(xí)等AI技術(shù)實現(xiàn)面向目標(biāo)位置的路徑規(guī)劃與動作決策過程。
動物具有多種精致巧妙的感覺器官以及感官信息處理機制,這些是動物實現(xiàn)準(zhǔn)確、高效感知自身運動、同伴以及周圍環(huán)境信息的關(guān)鍵。類腦環(huán)境感知主要研究借鑒動物豐富的視覺、觸覺、嗅覺、聽覺等多種感覺器官生物結(jié)構(gòu)及其多模態(tài)感官信息處理機制,實現(xiàn)對載體自身導(dǎo)航信息以及周圍環(huán)境多維度特征提取。其中基于昆蟲感覺器官的仿生傳感器以及基于哺乳動物大腦感官信息處理機制的選擇性注意、逐級抽象等類腦環(huán)境感知神經(jīng)計算方法得到了大量研究。
2.1.1 多模態(tài)仿生導(dǎo)航傳感器
當(dāng)前研究使用較多的仿生類導(dǎo)航傳感器主要有光學(xué)類、電磁學(xué)類、力學(xué)類。
1) 光學(xué)類。基于昆蟲復(fù)眼結(jié)構(gòu)的復(fù)眼傳感器可以實現(xiàn)高分辨率大視場成像;利用復(fù)眼結(jié)構(gòu)中眾多子眼形成的視差及方位感知能力,實現(xiàn)目標(biāo)三維定位;還可以感知天空偏振矢量場信息獲得導(dǎo)航能力。基于昆蟲視網(wǎng)膜感受像素強度視域變化的機制的光流傳感器不僅包含了運動信息,還包含有關(guān)景物三維結(jié)構(gòu)的豐富信息。同樣基于動物視網(wǎng)膜感光機制啟發(fā)的事件相機通過異步方式測量每個像素亮度變化實現(xiàn)對時間/位置和符號進行編碼,相比傳統(tǒng)以固定速率捕獲圖像視覺傳感器具有高動態(tài)范圍、高時間分辨率、低功耗、不受運動模糊影響等優(yōu)勢[15]。
2) 電磁學(xué)類。蝙蝠通過發(fā)出超聲波不僅可以探測物體距離、方向和運動速率,還可以判斷其大小、形狀和結(jié)構(gòu)[3],基于該原理的超聲波傳感器/雷達計在導(dǎo)航、避障等方面得到了大量應(yīng)用。
3) 力學(xué)類。基于昆蟲平衡棒(Haltere)感知角運動機理的仿生陀螺儀具有抗震性強、受溫度影響小等優(yōu)勢。基于動物觸覺感知物體材質(zhì)、空間屬性機理的仿生觸覺傳感器可以進行物體空間、物體感知,彌補視覺傳感不足,實現(xiàn)對環(huán)境的精細(xì)感知,如加州大學(xué)伯克利分校[16]開發(fā)了基于深度學(xué)習(xí)/觸覺傳感器的“深度觸覺模型”,實現(xiàn)機器人通過觸覺信息精確定位物體,進一步融合視覺/觸覺,實現(xiàn)視覺粗略感知、觸覺精細(xì)感知;此外,也可以以自我中心和非自我中心為參考系感知自身或物體空間位置[17],如普渡大學(xué)[18]制造了仿生蜂鳥飛行機器人,采用類腦導(dǎo)航算法僅依靠觸覺傳感信息實現(xiàn)在黑暗條件下像蜂鳥一樣自行飛行與避障。
此外,融合使用上述多模態(tài)傳感器,可以感知獲得更加豐富的不同尺度層級的環(huán)境及自運動信息。加州大學(xué)伯克利分校[19]為美國國防高級研究計劃局(DARPA)研究設(shè)計了仿昆蟲輕量微型無人機硬件平臺,同時集成了仿生復(fù)眼、昆蟲平衡棒仿生陀螺儀、仿生光流傳感器、U型仿生磁強計等多模態(tài)仿生傳感器,具有環(huán)境感知信息豐富、動態(tài)飛行環(huán)境適應(yīng)性強、測量準(zhǔn)、節(jié)能等多種優(yōu)勢。基于蜜蜂視覺機理和導(dǎo)航方法的光流計算模型[20],通過感知測量圖像多維度運動和光流場進行導(dǎo)航,相比傳統(tǒng)視覺法具有簡單、魯棒性強等優(yōu)勢,已用于多種自動導(dǎo)航系統(tǒng)研制,如基于光流導(dǎo)航與復(fù)眼結(jié)構(gòu)結(jié)合的仿生微型室內(nèi)飛行器[21]。此外,也能進一步融合聲音[22]、氣味[23]等其他模態(tài)仿生傳感信息用于感知環(huán)境和自身運動信息。
2.1.2 類腦傳感信息處理
面對海量傳感信息,借鑒動物感官信息處理機制,快速準(zhǔn)確實現(xiàn)對場景感知、目標(biāo)識別與特征提取是類腦環(huán)境感知需解決的另一重要問題。
動物是以全景信息為基礎(chǔ)進行視覺信息處理。動物在處理視覺信息時,首先對原始全景圖像進行壓縮,壓縮后的低分辨率圖像信息仍包含豐富的導(dǎo)航信息,用于視覺匹配、運動狀態(tài)檢測等,這種視覺處理方式相比視覺特征點提取具有更強的魯棒性[24]。此外“快照模型”提供了有效的根據(jù)當(dāng)前經(jīng)歷的信標(biāo)視圖信息和記憶視圖之間的匹配度進行視覺導(dǎo)航指引的方法[25]。
動物以選擇注意機制、逐級抽象機制處理海量感官信息。作為降低圖像數(shù)據(jù)處理復(fù)雜度的重要預(yù)處理步驟,基于視覺注意機制的圖像視覺顯著性區(qū)域檢測技術(shù)發(fā)展迅速,有效解決了傳統(tǒng)對圖像數(shù)據(jù)所有區(qū)域不設(shè)優(yōu)先級的處理方法造成了大量的計算浪費問題[26]。受Hubel和Wiesel[27]關(guān)于初級視覺皮層定向選擇性的研究以及近幾年逐漸發(fā)展的深度學(xué)習(xí)的啟發(fā),基于生物視覺神經(jīng)元局部感受野機制的擅長處理連續(xù)輸入信號的卷積神經(jīng)網(wǎng)絡(luò)(CNN)被提出,在環(huán)境快速感知和目標(biāo)識別領(lǐng)域得到了大量應(yīng)用。用CNN來研究從大量感覺輸入中快速分層提取有用特征并逐級抽象,在單目視覺深度估計任務(wù)中得到了成功應(yīng)用[28],谷歌DeepMind提出了一種抽象視覺定位方式,省去以點云或像素的形式構(gòu)造顯式地圖,而是在更高、更抽象的級別(如對象級別)學(xué)習(xí)環(huán)境的隱式表示[29]。蘇黎世聯(lián)邦理工學(xué)院[30]結(jié)合CNN和路徑規(guī)劃控制系統(tǒng),將無人機實時感知的原始圖像抽象映射為路點和期望速度形式的魯棒表示,實時耦合無人機感知與動作。此外,還有如基于拓?fù)渲X理論的前饋式層級識別模型[31]等其他大腦視皮層生物啟發(fā)的視覺信息處理方法。
類腦空間認(rèn)知通過大腦導(dǎo)航細(xì)胞的自組織集群放電活動實現(xiàn)對類腦環(huán)境感知過程提取的自運動信息(方位/速度)以及解析的環(huán)境信標(biāo)信息的導(dǎo)航解算,并將導(dǎo)航信息轉(zhuǎn)化為大腦內(nèi)部特定的導(dǎo)航細(xì)胞放電活動,同時將解算的位置信息與信標(biāo)信息通過位置細(xì)胞關(guān)聯(lián)記憶和存儲,完成認(rèn)知地圖的構(gòu)建。其中導(dǎo)航細(xì)胞自組織集群放電活動的神經(jīng)計算是類腦空間認(rèn)知的基礎(chǔ),其神經(jīng)實現(xiàn)和計算機制一直是一個開放性問題,當(dāng)前模型主要有:連續(xù)吸引子神經(jīng)網(wǎng)絡(luò)(CANN)、深度學(xué)習(xí)模型、脈沖神經(jīng)網(wǎng)絡(luò)模型。上述模型,均是基于神經(jīng)網(wǎng)絡(luò)中大量導(dǎo)航細(xì)胞的集群放電活動涌現(xiàn)的;另一類是基于單個導(dǎo)航細(xì)胞模型,如振蕩相干模型[32]、貝葉斯大腦模型[33],此類模型認(rèn)為空間認(rèn)知信息的計算在單個導(dǎo)航細(xì)胞計算實現(xiàn),然后通過干涉或加權(quán)融合得到全局統(tǒng)一的導(dǎo)航信息進一步形成認(rèn)知地圖。本文重點對基于導(dǎo)航細(xì)胞集群放電機制的連續(xù)吸引子神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)模型、脈沖神經(jīng)網(wǎng)絡(luò)模型進行分析。
2.2.1 連續(xù)吸引子神經(jīng)網(wǎng)絡(luò)模型
CANN是一種具有特殊網(wǎng)絡(luò)連接結(jié)構(gòu)的循環(huán)神經(jīng)網(wǎng)絡(luò),認(rèn)知神經(jīng)科學(xué)研究表明CANN刻畫了大腦信息處理機制的本質(zhì)特征,是神經(jīng)信息表達的典型計算模型,其內(nèi)部神經(jīng)元集群放電活動具有高效、穩(wěn)定、平滑的參數(shù)化記憶編碼信息的能力。CANN的上述特性與哺乳動物大腦導(dǎo)航細(xì)胞集群放電表征動物導(dǎo)航參數(shù)尤為切合,已成功應(yīng)用于建模頭朝向細(xì)胞、網(wǎng)格細(xì)胞以及位置細(xì)胞神經(jīng)計算模型,具有很強的生物意義和工程應(yīng)用前景。代表性的研究如Burak和Fiete提出的CANN網(wǎng)格細(xì)胞精確路徑積分模型,接近神經(jīng)生理學(xué)觀察的大鼠網(wǎng)格細(xì)胞路徑積分保持精度[34]。Milford團隊基于鼠腦頭朝向細(xì)胞和位置細(xì)胞神經(jīng)計算機理的RatSLAM系列視覺仿生即時定位與建圖(SLAM)算法[35],如圖3所示,可以從較弱的視覺輸入信息構(gòu)建大型和復(fù)雜區(qū)域認(rèn)知地圖,并基于低成本視覺傳感器進行了66 km郊區(qū)建圖、連續(xù)運行2周的室內(nèi)機器人建圖。基于CANN的類腦空間認(rèn)知方法得到了大量研究和應(yīng)用,詳細(xì)內(nèi)容可查閱文獻[13]。
圖3 RatSLAM算法Fig.3 RatSLAM algorithm
2.2.2 深度學(xué)習(xí)模型
采用遞歸CANN描述位置細(xì)胞、網(wǎng)格細(xì)胞等導(dǎo)航細(xì)胞作用機理時,表現(xiàn)出較好的模型適用性[34]。然而,這些模型通常依賴于合適的突觸權(quán)值,同時這些權(quán)值需要呈現(xiàn)出一種特定不對稱連接形式,以便根據(jù)自運動信息來移動吸引子狀態(tài)。這些特殊的連接形式是否真實存在于動物大腦中目前尚不清晰。此外,CANN主要考慮了少數(shù)幾種導(dǎo)航細(xì)胞作用機制,而未包含可能存在的其他類導(dǎo)航細(xì)胞。為全面地模擬海馬-內(nèi)嗅皮層導(dǎo)航機理,需要建立一個完備的模型以能夠同時包含其他導(dǎo)航細(xì)胞以及神經(jīng)生理學(xué)機制。而近年來功能不斷發(fā)展的深度循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)在上下文相關(guān)或時序相關(guān)的自然語言、語音等數(shù)據(jù)處理中得到了廣泛研究與應(yīng)用,具有較好地融合當(dāng)前輸入與過去歷史的特性以及類腦處理復(fù)雜空間認(rèn)知導(dǎo)航問題的潛能[36],是減小CANN模型不完備性的一條途徑。圖4為哥倫比亞大學(xué)[37]利用RNN訓(xùn)練速度和航向輸入完成了模擬二維導(dǎo)航任務(wù),在對訓(xùn)練好的RNN網(wǎng)絡(luò)節(jié)點進行可視化操作時,呈現(xiàn)出了與神經(jīng)生理學(xué)觀察一致的網(wǎng)格細(xì)胞、邊界細(xì)胞和條紋細(xì)胞等導(dǎo)航細(xì)胞放電表示樣式。同時,谷歌DeepMind團隊[38]在用RNN中的長短期記憶網(wǎng)絡(luò)(LSTM)訓(xùn)練速度和航向信息時也呈現(xiàn)出了網(wǎng)格細(xì)胞放電樣式,此外,還證明了網(wǎng)格細(xì)胞等導(dǎo)航細(xì)胞支持矢量導(dǎo)航的觀點。上述兩項最新發(fā)現(xiàn),證明了把RNN用于空間的定位和導(dǎo)航時,隱節(jié)點的物理意義類似于大腦位置細(xì)胞、網(wǎng)格細(xì)胞、邊界細(xì)胞等導(dǎo)航細(xì)胞。

圖4 循環(huán)神經(jīng)網(wǎng)絡(luò)訓(xùn)練類腦導(dǎo)航[37]Fig.4 Brain-inspired navigation trained by RNN[37]
2.2.3 脈沖神經(jīng)網(wǎng)絡(luò)模型
基于腦啟發(fā)的脈沖神經(jīng)網(wǎng)絡(luò)(SNN)模型相比基于數(shù)學(xué)理論推導(dǎo)的CANN、深度學(xué)習(xí)等人工神經(jīng)網(wǎng)絡(luò)模型更加接近實際生物結(jié)構(gòu),其神經(jīng)元的輸出具有時間維度編碼的脈沖序列,多個神經(jīng)元可以實現(xiàn)時-空二維空間的表達能力。基于SNN的類腦空間認(rèn)知模型大部分連接由大腦結(jié)構(gòu)預(yù)先定義,只需較少的參數(shù)學(xué)習(xí)就能較好建模位置細(xì)胞、網(wǎng)格細(xì)胞、頭朝向細(xì)胞等大腦導(dǎo)航細(xì)胞集群編碼導(dǎo)航信息,實現(xiàn)映射環(huán)境[39]。此外,把大腦模仿成神經(jīng)處理的層級結(jié)構(gòu),初始階段不建立神經(jīng)元全連接,通過將識別的環(huán)境成分映射到有限數(shù)量的神經(jīng)表征中,從而學(xué)習(xí)認(rèn)知未知環(huán)境區(qū)域,同時使學(xué)習(xí)需求最小化[40]。但SNN主要采用依賴神經(jīng)元脈沖時序而定的可塑性進行網(wǎng)絡(luò)參數(shù)學(xué)習(xí),是一種局部訓(xùn)練的非監(jiān)督非反向傳播算法,但不能保證一定能訓(xùn)練出性能優(yōu)異的網(wǎng)絡(luò),另外,SNN網(wǎng)絡(luò)訓(xùn)練比較困難,因此基于SNN的類腦認(rèn)知模型還處于初級研究階段。
面向目標(biāo)類腦導(dǎo)航通過無監(jiān)督學(xué)習(xí)建立認(rèn)知地圖中表征方位、位置、障礙物等多種導(dǎo)航信息的頭朝向細(xì)胞、位置細(xì)胞、邊界細(xì)胞等多種導(dǎo)航細(xì)胞與表征多種動作行為的多種動作細(xì)胞之間的智能神經(jīng)連接,完成由原始環(huán)境感知信息輸入到動作決策的直接輸出過程,實現(xiàn)接近動物端到端面向目標(biāo)導(dǎo)航的智能行為,如圖5所示。無監(jiān)督學(xué)習(xí)通過讓機器人自主探索面向目標(biāo)導(dǎo)航任務(wù),自主加強特定導(dǎo)航細(xì)胞與特定動作細(xì)胞的突觸連接強度,最終形成一種穩(wěn)定的連接模式,在這種連接模式下,導(dǎo)航細(xì)胞的每種放電狀態(tài)都對應(yīng)一種特定的最優(yōu)的動作細(xì)胞,實現(xiàn)面向目標(biāo)的導(dǎo)航過程。代表性的研究如用赫布學(xué)習(xí)建立頭朝向細(xì)胞/位置細(xì)胞與動作細(xì)胞的智能連接,實現(xiàn)機器人自主面向目標(biāo)行進導(dǎo)航[41];采用網(wǎng)格細(xì)胞對當(dāng)前和目標(biāo)位置分別進行多尺度空間編碼,通過競爭學(xué)習(xí)建立當(dāng)前和目標(biāo)差異與運動神經(jīng)元的特定連接,實現(xiàn)了機器人緊湊的面向目標(biāo)導(dǎo)航過程[42];在矢量導(dǎo)航框架下,通過獎勵機制和關(guān)聯(lián)學(xué)習(xí)實現(xiàn)機器人面向目標(biāo)導(dǎo)航路徑自主優(yōu)化決策,以動物抄近路方式到達目標(biāo)[43]。無監(jiān)督學(xué)習(xí)類面向目標(biāo)類腦導(dǎo)航具有自主學(xué)習(xí)導(dǎo)航行為決策的優(yōu)勢,靈活性較強,缺點是學(xué)習(xí)效率較低,效果有限。

圖5 基于無監(jiān)督學(xué)習(xí)的面向目標(biāo)導(dǎo)航Fig.5 Unsupervised learning-based goal-directed navigation
CNN為從大量感覺輸入中快速分層提取有用特征提供了一種可行的方式;深度學(xué)習(xí)的發(fā)展,為強化學(xué)習(xí)在大規(guī)模決策問題中的應(yīng)用提供了可能。這些研究促進了另一類面向目標(biāo)導(dǎo)航“深度強化學(xué)習(xí)導(dǎo)航”的發(fā)展。深度強化學(xué)習(xí)導(dǎo)航將深度學(xué)習(xí)的感知能力和強化學(xué)習(xí)的決策能力相結(jié)合,并能夠通過端到端的學(xué)習(xí)方式快速實現(xiàn)從原始圖像輸入到導(dǎo)航行為決策的直接輸出,建立起感知與行為決策之間的智能連接,在最大化策略函數(shù)的過程中實現(xiàn)了智能體的導(dǎo)航過程,是一種更接近動物思維方式的端到端的面向目標(biāo)導(dǎo)航方法。深度強化學(xué)習(xí)導(dǎo)航在3D游戲[44]、迷宮[45]、室內(nèi)[46]等場景仿真中取得了較好效果,甚至表現(xiàn)出了超越人類的能力。
深度強化學(xué)習(xí)導(dǎo)航對于游戲等這種復(fù)雜的、每步行為之間存在較強相關(guān)性的、通過短期的獎勵即可得到最優(yōu)的策略的環(huán)境有很好的效果,但是對于獎勵稀少,需經(jīng)過長期獎勵才能獲得最優(yōu)策略的導(dǎo)航場景,很難快速學(xué)習(xí)出最優(yōu)策略,可通過引入多源感知信息構(gòu)造獎勵數(shù)量[45]、對記憶場景的復(fù)用[47]增加獎勵數(shù)量等手段緩解因獎勵過少而引起的尋優(yōu)過慢及習(xí)得策略不優(yōu)等問題。深度強化學(xué)習(xí)導(dǎo)航應(yīng)用前需進行大量試錯式迭代訓(xùn)練,大多載體在應(yīng)用時一般很難承受如此多的試錯,也很難在實際場景中進行訓(xùn)練。解決訓(xùn)練難題一方面可通過充分利用已有經(jīng)驗加快和加強新任務(wù)的學(xué)習(xí),如在線元學(xué)習(xí)[48],基于類似場景下可控載體采集的數(shù)據(jù)進行技能訓(xùn)練[49];另一方面通過開發(fā)環(huán)境模擬器,在虛擬場景中進行訓(xùn)練[50],但仿真場景和真實場景存在較大差別,訓(xùn)練出來的模型不能很好地泛化到真實場景中。此外,還可以引入遷移學(xué)習(xí)機制,提高模型通用性,如谷歌DeepMind團隊[51]構(gòu)建的雙路徑深度強化學(xué)習(xí)導(dǎo)航架構(gòu),用兩路RNN來分別記憶不同環(huán)境下通用的導(dǎo)航尋路策略內(nèi)核和不同環(huán)境下位置的重新表征,進一步通過CNN實時提取視覺輸入,實現(xiàn)了在沒有地圖庫參考、僅給出幾個地標(biāo)點(任務(wù)獎勵)情況下,成功在離線街景中到達目的地。該深度強化學(xué)習(xí)導(dǎo)航的主體“導(dǎo)航尋路策略”還具有在不同城市間的遷移能力。
當(dāng)前,國內(nèi)外研究者從類腦環(huán)境感知、類腦空間認(rèn)知以及面向目標(biāo)類腦導(dǎo)航等3個方面開展了類腦導(dǎo)航研究,初步形成了機理分析、建模、仿真與實驗驗證一體化的研究體系,表現(xiàn)了一定類似動物的自主智能特性,但還存在著智能水平欠佳、模型不完整、實時性差等問題,尚處于探索和完善階段。當(dāng)前,研究人員通過擴展類腦導(dǎo)航與更多類腦智能行為的耦合,嘗試實現(xiàn)類腦導(dǎo)航神經(jīng)形態(tài)軟硬件一體化設(shè)計,通過集群機制促進類腦導(dǎo)航向類腦群體導(dǎo)航發(fā)展,進一步提高類腦導(dǎo)航自主智能性。
動物進行空間認(rèn)知和導(dǎo)航時利用了包括感官信息激發(fā)位置細(xì)胞放電、空間記憶和推理在內(nèi)的多種并行機制[52]。現(xiàn)有類腦導(dǎo)航研究主要從自運動信息和視覺2個信息源模擬動物大腦導(dǎo)航過程,忽略了記憶、推理等其他機制的作用,無法從系統(tǒng)層面模擬大腦導(dǎo)航機制。事實上,海馬-內(nèi)嗅皮層中的位置細(xì)胞-網(wǎng)格細(xì)胞回路在編碼地理位置信息的同時,還進行編碼記憶聲音頻率,物體形狀及其他抽象的任務(wù)特征空間[53],位置細(xì)胞-網(wǎng)格細(xì)胞的功能可能比在地理環(huán)境中進行定位要更加廣泛,如圖6[52]所示。人和動物進入新環(huán)境時,仍表現(xiàn)出高效準(zhǔn)確的認(rèn)知導(dǎo)航能力,與大腦基于記憶的推理能力息息相關(guān)[54],如基于網(wǎng)格細(xì)胞的視覺識別、記憶和推理模型[55]。因此,如何共用位置細(xì)胞-網(wǎng)格細(xì)胞神經(jīng)回路,將類腦導(dǎo)航與記憶、推理、知識空間或語義空間等更多智能行為耦合,產(chǎn)生更強大的類腦導(dǎo)航能力,是未來研究熱點,如基于類腦導(dǎo)航機制和情節(jié)記憶的服務(wù)機器人[56]。
當(dāng)前,國內(nèi)外主要從軟件算法層面開展了類腦導(dǎo)航技術(shù)研究,具有一定的自主智能及魯棒性。但由于當(dāng)前類腦導(dǎo)航算法實現(xiàn)過程主要還是基于CPU平臺的馮·諾依曼計算體系結(jié)構(gòu),存在模型復(fù)雜、計算量大、實時性差、功耗高等弊端[11]。實際上,動物大腦高效、準(zhǔn)確、實時的導(dǎo)航能力還與神經(jīng)生理結(jié)構(gòu)密切相關(guān),類腦導(dǎo)航研究還需考慮硬件智能的設(shè)計。如何借助基于脈沖神經(jīng)網(wǎng)絡(luò)的神經(jīng)形態(tài)技術(shù),將軟件智能與硬件智能二者優(yōu)勢有機融合,從結(jié)構(gòu)層次模仿腦、器件層次逼近腦智能層次超越腦,建立更強大的類腦導(dǎo)航系統(tǒng),實現(xiàn)類腦導(dǎo)航軟硬件一體化,是實現(xiàn)更深層次模擬動物導(dǎo)航面臨的關(guān)鍵問題和挑戰(zhàn),也是未來應(yīng)用于無人載體研究的重點。美國諾貝爾生理醫(yī)學(xué)獎獲得者Edelman團隊提出了類腦導(dǎo)航系統(tǒng)軟硬件一體化設(shè)計架構(gòu)“BBD”(Brain-based Device)[57],如圖7所示,包含了從傳感信息輸入、類腦認(rèn)知地圖構(gòu)建、行為決策、行進導(dǎo)航以及運動控制全過程,為類腦神經(jīng)形態(tài)導(dǎo)航系統(tǒng)的設(shè)計提供了較好的范例。

圖6 類腦導(dǎo)航與記憶的耦合[52]Fig.6 Coupling of brain-inspired navigation and memory[52]
謝菲爾德大學(xué)[58]“Brain on Board”項目基于昆蟲復(fù)眼視覺開發(fā)了類蜜蜂腦軟硬件架構(gòu)四旋翼無人機平臺BeeBotV2,具有體積小、能耗低等優(yōu)勢。加州大學(xué)歐文分校[59]首次采用SNN架構(gòu)類腦芯片TrueNorth實現(xiàn)了基于CNN的無人駕駛小車野外自主導(dǎo)航、決策與控制一體化測試,具有硬件體積小、功耗低、并行計算等優(yōu)勢;曼徹斯特大學(xué)采用其SNN架構(gòu)類腦芯片SpiNNaker實時解析視覺信息實現(xiàn)了機器人全自主導(dǎo)航與行駛。蘇黎世聯(lián)邦理工學(xué)院Yulia團隊[60]設(shè)計了基于SNN的SLAM算法,并在混合模擬/數(shù)字神經(jīng)形態(tài)硬件平臺進行了測試實現(xiàn)了較好的時間復(fù)雜性和節(jié)能;蘇黎世聯(lián)邦理工學(xué)院[61]開發(fā)了微型無人機計算平臺用簡化CNN類腦視覺環(huán)境感知與飛行動作決策一體化算法,并基于ASIC超低功耗AI芯片Gap8設(shè)計了類腦導(dǎo)航計算機,實現(xiàn)了27 g微小無人機全自主智能飛行。近期,清華大學(xué)設(shè)計開發(fā)了基于“天機”混合異構(gòu)類腦芯片的軟硬件一體化計算平臺[62]。通過共用樹突回路,融合了基于精確多位值處理計算信息機制的人工神經(jīng)網(wǎng)絡(luò)硬件計算回路和基于二進制脈沖序列的神經(jīng)形態(tài)硬件計算回路;采用神經(jīng)狀態(tài)機算法融合了基于視覺、語音、IMU傳感信息的CNN、SNN、CANN等多模態(tài)神經(jīng)計算回路,實現(xiàn)了無人駕駛自行車自平衡、動態(tài)感知、目標(biāo)探測、跟蹤、自動避障、語音理解、自主決策等功能。上述研究為發(fā)展自主環(huán)境感知、空間認(rèn)知、路徑規(guī)劃與動作決策一體化能力的類腦神經(jīng)形態(tài)導(dǎo)航系統(tǒng)及其工程應(yīng)用奠定了基礎(chǔ)。

圖7 基于BBD的類腦導(dǎo)航系統(tǒng)架構(gòu)[57]Fig.7 Brain-inspired navigation system based on BBD[57]
自組織行為是自然界中常見的現(xiàn)象,如協(xié)同工作的蟻群和蜂群、編隊飛行的鳥群和蝙蝠群、結(jié)隊巡游的魚群等。這些現(xiàn)象的共同特點是一定數(shù)量的自主個體通過局部群內(nèi)以及與環(huán)境的相互交互和通信,在整個群體層面上呈現(xiàn)有序的協(xié)同樣式和行為。上述自組織機制為實現(xiàn)類腦導(dǎo)航從個體智能導(dǎo)航到群體智能導(dǎo)航產(chǎn)生提供了一個很好的生物模型。當(dāng)前研究人員主要借鑒昆蟲以及蝙蝠等哺乳動物個體自組織機制以及哺乳動物個體大腦導(dǎo)航機理啟發(fā)的導(dǎo)航細(xì)胞自組織機制開展了部分集群類腦導(dǎo)航研究。
1) 生物個體自組織機制
昆蟲通過與環(huán)境以及其他昆蟲個體的自組織信息交互完成群體導(dǎo)航過程。其中昆蟲通過向環(huán)境釋放某種吸引或排斥物質(zhì)來建立正常交通的路線和網(wǎng)絡(luò),這些路線和網(wǎng)絡(luò)構(gòu)成了昆蟲的認(rèn)知地圖,代表性的研究如Jimenez等[63]基于螞蟻正反饋和負(fù)反饋信息素集群認(rèn)知地圖構(gòu)建機制,采用SNN在Netlogo多智能體仿真驗證平臺實現(xiàn)了機器人集群認(rèn)知地圖的高效準(zhǔn)確構(gòu)建和自組織機制的機器人群體智能導(dǎo)航。Bonnet等[64]研究了蜂群和魚群通過視覺信號(如不同的形狀、顏色和條紋)和行為信號(如加速度、振動和尾巴運動)進行個體導(dǎo)航信息傳遞交互機制,通過機器人協(xié)助實現(xiàn)魚群和蜂群跨物種協(xié)同集群飛行。
哺乳動物同樣通過與環(huán)境以及其他個體的自組織信息交互完成群體導(dǎo)航過程。近兩年來,認(rèn)知神經(jīng)學(xué)家開始探索以蝙蝠群體為代表的哺乳動物群體導(dǎo)航機理[65],如圖8所示。當(dāng)前被證實的蝙蝠群體導(dǎo)航神經(jīng)元[66-67]:敏感空間位置的三維位置細(xì)胞,敏感空間角度的三維方向細(xì)胞,敏感行進距離的三維網(wǎng)格細(xì)胞,以及追蹤臨近事物運動軌跡和感應(yīng)同伴位置的社交位置細(xì)胞等三維導(dǎo)航細(xì)胞[2],這些細(xì)胞協(xié)同工作來繪制蝙蝠(群體)的三維空間認(rèn)知地圖。此外,近年來,群體智能決策“深度多智能體強化學(xué)習(xí)”技術(shù)[68]的出現(xiàn)和發(fā)展,為研究群體在與環(huán)境交互中習(xí)得智能決策提供了便捷計算架構(gòu)。結(jié)合構(gòu)建的類腦三維空間認(rèn)知地圖以及深度多智能體強化學(xué)習(xí),開發(fā)三維群體環(huán)境感知、空間認(rèn)知、面向目標(biāo)導(dǎo)航一體化的端到端計算架構(gòu),即“三維集群類腦導(dǎo)航”,將是未來群體智能研究的熱點。

圖8 三維類腦群體導(dǎo)航神經(jīng)機理[65]Fig.8 Neural basis of 3D brain-inspired swarm navigation[65]
2) 導(dǎo)航細(xì)胞自組織機制
澳大利亞國防科技集團Vladimir等[69]將哺乳動物海馬體導(dǎo)航細(xì)胞自組織路徑積分與導(dǎo)航機制融入哈密頓動力學(xué)集群控制模型融合的大規(guī)模無人機-無人車聯(lián)合集群元認(rèn)知監(jiān)督導(dǎo)航/路徑規(guī)劃/動作決策一體化模型,此外,美國約翰霍金斯大學(xué)開展了基于大腦海馬區(qū)導(dǎo)航細(xì)胞自組織機制的無人機集群感知/認(rèn)知/路徑規(guī)劃與動作決策一體化探索研究。
如前文所述,昆蟲個體自組織集群機制與哺乳動物大腦導(dǎo)航細(xì)胞自組織集群機制具有較好的互補對稱性[9]。昆蟲自組織集群感知、空間認(rèn)知與導(dǎo)航模型具有較高的群體智能;導(dǎo)航細(xì)胞自組織集群導(dǎo)航神經(jīng)計算機制得到了大量研究,具有穩(wěn)定可靠的導(dǎo)航結(jié)果。因此,如何有效融合此二類自組織機制,發(fā)展“昆蟲/導(dǎo)航細(xì)胞”自組織集群環(huán)境感知、空間認(rèn)知與面向目標(biāo)導(dǎo)航神經(jīng)計算機制,是提升無人機密集集群導(dǎo)航性能的另一途徑,也是作者團隊重點研究的領(lǐng)域之一[70]。
如前所述,類腦導(dǎo)航是一種大腦導(dǎo)航機理啟發(fā)下的端到端推理學(xué)習(xí)型導(dǎo)航方法,借鑒動物大腦導(dǎo)航細(xì)胞自組織集群神經(jīng)計算機制,利用AI技術(shù)實現(xiàn)從原始傳感信息輸入到導(dǎo)航行為決策的直接輸出,形成具有自主環(huán)境感知、空間認(rèn)知、路徑規(guī)劃與動作決策一體化能力的類腦導(dǎo)航模型。從當(dāng)前類腦導(dǎo)航技術(shù)研究來看,應(yīng)用于無人機密集集群系統(tǒng)主要存在類腦導(dǎo)航模型適用性、可解釋性、精確性問題。
1) 類腦導(dǎo)航模型適用性。類腦導(dǎo)航模型是動物大腦導(dǎo)航細(xì)胞自組織連接結(jié)構(gòu)及神經(jīng)計算機制啟發(fā)下的神經(jīng)網(wǎng)絡(luò)模型,雖然模型中的大部分連接由大腦結(jié)構(gòu)預(yù)先定義,但其連接權(quán)值大多仍需采用學(xué)習(xí)的方法進行優(yōu)化和確定,習(xí)得的模型在相近場景中具有較好適用性,但差別較大場景還有待進一步提高,需要解決模型遷移或快速自學(xué)習(xí)問題,這是類腦導(dǎo)航走向?qū)嶋H應(yīng)用首要問題。
2) 類腦導(dǎo)航可解釋性。類腦導(dǎo)航的3個過程:類腦環(huán)境感知、類腦空間認(rèn)知以及面向目標(biāo)類腦導(dǎo)航部分模型仍依賴黑箱建模的深度學(xué)習(xí),當(dāng)前的深度學(xué)習(xí)的可解釋性還相對較差,若應(yīng)用在實際無人機密集集群系統(tǒng)中出了問題很難找到問題的原因,也比較難排查,因此,如何引入更多的大腦導(dǎo)航腦區(qū)結(jié)構(gòu)及信息處理機制,提高深度學(xué)習(xí)的可解釋性具有重要的研究意義。
3) 類腦導(dǎo)航精確性。當(dāng)前類腦導(dǎo)航還難以精確解算三維姿態(tài)、速度和位置等導(dǎo)航參數(shù),較為成熟的研究是通過建立環(huán)境感知與行為決策之間的智能連接,解決“到哪去”以及“怎么去”等推理和決策問題。然而,當(dāng)前階段這些精確導(dǎo)航參數(shù)仍是無人機密集集群系統(tǒng)控制技術(shù)不可缺少的信息[71]。因此,目前類腦導(dǎo)航無法單獨應(yīng)用于無人機密集集群系統(tǒng),需要傳統(tǒng)導(dǎo)航算法的支持。
類腦導(dǎo)航技術(shù)初步形成了環(huán)境感知、空間認(rèn)知與自主路徑規(guī)劃決策一體化的端到端技術(shù)特征,表現(xiàn)了一定的動物導(dǎo)航自主智能性,進一步將重點向與更多類腦智能行為耦合、神經(jīng)形態(tài)類腦導(dǎo)航系統(tǒng)、以及類腦群體導(dǎo)航發(fā)展。類腦導(dǎo)航研究現(xiàn)狀及未來發(fā)展主要研究內(nèi)容如表1所示,這些研究及其組合有望提高復(fù)雜工作環(huán)境下無人機密集集群導(dǎo)航的魯棒性、準(zhǔn)確性、實時響應(yīng)動作、自主智能性以及計算效率。盡管目前類腦(群體)導(dǎo)航技術(shù)僅僅是對所發(fā)現(xiàn)的少數(shù)部分動物大腦導(dǎo)航機理借鑒,未能從系統(tǒng)層面模擬和借鑒動物大腦導(dǎo)航機理。隨著腦與神經(jīng)科學(xué)、人工智能、神經(jīng)形態(tài)技術(shù)以及硬件技術(shù)的持續(xù)發(fā)展,類腦導(dǎo)航技術(shù)可以展現(xiàn)出更強大的功能和智能性,在無人機密集集群系統(tǒng)的應(yīng)用中具有較大潛力。

表1 類腦導(dǎo)航技術(shù)典型研究Table 1 Typical studies of brain-inspired navigation