
腦機接口的下一個錨點就是接口,或者說是連接。

袁嵐峰《錨點》科學(xué)對談人
月eua,曾經(jīng)只存在科幻中的技術(shù),今,憑借自主研發(fā)的256導(dǎo)柔性腦機接口,讓患者成功發(fā)出了世界上首段靠意念完成的新年祝福,被譽為里程碑突破。腦機接口究竟做到了什么、沒做到什么?科幻場景將來有多少能變成現(xiàn)實?未來腦機接口又該如何發(fā)展?
我的中國科學(xué)技術(shù)大學(xué)師弟、陶虎認為,過去十年來,腦機接口行業(yè)處于漸進式發(fā)展的狀態(tài),當(dāng)前該領(lǐng)域面臨的核心挑戰(zhàn)在于硬件的工程化集成,而非單點技術(shù)突破。未來,除了醫(yī)療領(lǐng)域,他比較看好的是“腦機接口 + ”的潛力,如結(jié)合大語言模型、機器人、智能控制等,賦能更廣泛的應(yīng)用場景。同時,他呼吁腦機接口從前沿研究快速轉(zhuǎn)向產(chǎn)品落地。
腦機接口是解密大腦的核心工具
據(jù)有關(guān)媒體報道,你們在腦機接口的某些點上已經(jīng)達到了世界領(lǐng)先!具體做了什么?中國在腦機接口領(lǐng)域做到了哪些世界領(lǐng)先?
與其說世界領(lǐng)先,可能更多應(yīng)該叫作“國內(nèi)首次”。我們首次用腦機接口實現(xiàn)了漢語的實時解碼,而且我們是用全自主研發(fā)的技術(shù)來做整個系統(tǒng)的搭建,包括植入手術(shù)。從這兩個方面來看,確實具有很大的突破性。
語言作為一種更高級的功能,往往覆蓋更多腦區(qū),它本身的機制也不完全明朗,所以相比運動腦機接口,做語言腦機接口這一塊可以借鑒的以往案例并不多,很多進展都是我們在實踐中一步步探索出來的。
之前也有團隊能做語言腦機接口,但是做不到實時解碼,他們完成解碼大概需要10秒的時間,但是現(xiàn)在我們可以做到0.1秒。這樣的話可以保證每分鐘40個字左右的語言合成速度。雖然相比我們面對面的日常交流(每分鐘大概能說 150~200 個字)還是要慢很多,但是基本上已經(jīng)可以媲美用手機發(fā)信息的速度了。
語言解碼會涉及大范圍的腦區(qū)嗎?
大腦是一個非常復(fù)雜的器官。我們的大腦里可以有800多億個神經(jīng)元,然后每個神經(jīng)元跟旁邊成千上萬個神經(jīng)元都有信息和物質(zhì)的交換,這使得大腦成為已知宇宙里面最為復(fù)雜的計算或連接網(wǎng)絡(luò)。任何對外體現(xiàn)出來的大腦功能,不管是運動、語言,還是思考,其實都應(yīng)該是底層相應(yīng)的神經(jīng)元,特別是多個(甚至是成片的)神經(jīng)元,或者說是多個腦區(qū)協(xié)同工作的結(jié)果。所以,越是涉及高級功能(如語言),相對來說需要協(xié)同的腦區(qū)就越多。這對腦機接口技術(shù),特別是神經(jīng)電極的能力,提出了更高的要求,比如說通量要更高(即需要的電極點位更多),以覆蓋多個腦區(qū)。
覆蓋多個腦區(qū)意味著很多不同的地方都要采樣嗎?
是的。語言合成其實有很多途徑,有的是直接的,有的是間接的。像霍金用那個眼動儀,其實更多是在做選擇題,他在26個字母上掃,掃到A就是A。這是一種間接的方式。之前也有通過運動腦機接口來做文字或者語言解碼的,設(shè)備還是放在他的運動區(qū),但他腦袋里先想象的是筆畫,是ABCD等字母的筆畫,然后再將其變成單詞。這是一種只需要用運動腦機接口就可以做到語言解碼的方式,但它其實更多是意念打字或者意念敲字,而不是意念合成語言。
漢語跟英語還是有很大區(qū)別的。漢語是有語調(diào)的(普通話有四聲),這一點我們需要加以利用,針對不同的語調(diào)進行調(diào)整。除此之外,回到文字本身,哪怕漢字已經(jīng)發(fā)展到簡化字這個階段,有些字還是屬于會意文字,這就意味著在漢語的編解碼機制里,語意本身參與的程度可能會更高一些。我們通過對幾例受試者做的實驗發(fā)現(xiàn),這些在腦電特征以及編解碼算法、范式設(shè)計里都會體現(xiàn)出來。
一位本身可以說話的受試者如果想要說什么,會通過相應(yīng)的面喉部肌肉把音發(fā)出來。這一過程至少會涉及兩個非常主要的腦區(qū):第一個是跟語意相關(guān)的,就是“我”到底想要說什么;第二個是跟運動相關(guān)的,就是“我”把這個東西說出來。我們現(xiàn)在就在嘗試把受試者“發(fā)”相關(guān)字的放電活動捕捉起來,同時結(jié)合其語意相關(guān)的放電活動進行聯(lián)合解碼,這樣效率會高很多。
既然這位受試者本來就可以說話,為什么還要用腦機接口來讓她說話呢?
她本身是一個語言區(qū)腫瘤占位的癲癇患者,手術(shù)過程中這一塊可能需要切除,切除后也許會影響她的語言功能。據(jù)我們了解,這是接受腦機接口漢語實時解碼嘗試的第一例患者。我們不能無中生有地編一個編解碼機制,得有初始的腦電數(shù)據(jù)和樣本,所以我們必須在她還能正確說話的時候觀察她的腦電活動是怎樣的,并將其解碼出來。這樣后期如果真的有需要,就可以利用上(慶幸的是,現(xiàn)在這個患者整體恢復(fù)情況較好)。
而對于有些病癥,比如說漸凍癥,患者的語言功能是會慢慢消失的。針對這種情況,我們就可以在早期他還能正常說話的時候,給他植入一個腦機接口,通過這個腦機接口來進行語言功能的重塑。如此一來,后期他就可以用意念合成語言來與外界交流。
以及用于維持整個系統(tǒng)運作的電池一我們希望將這些整體封裝成一個足夠小的package(包裝)。它要么植入顱骨里面,要么就放在顱骨上,不能給病人本身帶來極大的負擔(dān),而且在運行過程中,如果有大量數(shù)據(jù)需要實時處理,還不能有太大的功耗,否則一天到晚充電都來不及。
其實,腦機接口本身還有一個很大的潛在作用,就是可以作為一個平臺工具或者輔助工具來用。現(xiàn)在開發(fā)的很多新藥和治療手段用在漸凍癥病人身上得到的反饋都不多,效率也是比較低的。但腦機接口作為一個“金標(biāo)準(zhǔn)”,它插在大腦里,我們就能知道這個神經(jīng)元凋亡還是沒凋亡,這對藥物藥效的及時開發(fā),甚至是不同治療手段的聯(lián)動都有幫助。
另外,功耗大還涉及發(fā)熱的問題。身體其他地方有一些熱我們或許還能忍受,但大腦只要提高兩攝氏度,人就會休克,這也是我們需要控制的。所以很多時候,我們這個領(lǐng)域做的事情其實是一種妥協(xié)。
可能是單看每一項,每一項都不難,但集成在一塊幾就會變得非常難。
所以,我們一直說自己做的是腦機接口的接口,就是讓電極跟芯片接口能匹配,芯片跟算法接口能匹配,算法跟無線通信能匹配。
這里只是以漸凍癥為例。除此之外,像失明、失語以及成癮、抑郁等精神類病癥,情況大抵相同。腦機接口在其中更多是作為一種核心工具和手段,賦予我們更多的方式去了解大腦,而且是實時地了解。
這個維度聽起來很有趣。據(jù)我所知,米格爾·尼可萊利斯(MiguelNicolelis)在2014年巴西世界杯的時候做了一件非常有意思的事情:他借助腦機接口和外骨骼技術(shù)成功讓一位截癱青年為世界杯開球。為什么我們現(xiàn)在看起來還是在做類似的事情?十年過去了,難道這個領(lǐng)域進步如此之慢嗎?
能達到這樣的效果,你們的技術(shù)訣竅是什么?
一般來說,植入式設(shè)備大多是三類醫(yī)療器械(中國醫(yī)療器械分類管理中最高風(fēng)險級別的器械),長期在體的比短期的(比如說術(shù)中要用的)要難一些,放在腦袋里的又比放在骨頭里的相對來說難一些。所以,相對而言,我們走的是最難的一條路線。
我們更多還是在做全鏈條的技術(shù)研發(fā)。從系統(tǒng)框架來講,它其實是一個微系統(tǒng),前端有非常重要的用于大腦信號采集和調(diào)控的電極,用于信號處理的芯片,用于信號分析的編解碼算法,用于信號傳輸?shù)臒o線協(xié)議、無線天線,
如果只是用意念開球,根本不用植入式腦機接口,因為不需要踢得有多準(zhǔn)。但是運動本身也有流暢度、自由度、實時的延遲等維度的比較,這個是永無止境的。現(xiàn)在大家就是在(試圖讓截癱人士)從簡簡單單踢個球轉(zhuǎn)變到可以像正常人一樣踢球,這中間雖然在不停地迭代優(yōu)化,但還是差得很遠。
在我看來,這十年所取得的只能說是很漸進式的變化,還沒有顛覆性的變化。我內(nèi)心有自己的判斷標(biāo)準(zhǔn)。第一個就是把病人變成“正常人”。比如說語言,如果語言合成的速度能達到我們正常說話的速度,我認為這就是一個很重
腦機接口不能再停留在前沿科技層面,而是要快速轉(zhuǎn)向聚焦到產(chǎn)品落地上來
要的里程碑。下一個里程碑是看什么時候能夠超過正常人的速度。腦機接口是什么?它是繞過我們的五官四肢跟外面直接建立聯(lián)系。比如說運動,如果我們針對某個單項技能使用腦機接口這種運動控制,它可能確實會比人的操作還要快。在我看來,這也是一個里程碑,不過目前還沒有見到。
人體最發(fā)達的就是大腦。可以說,我們的五官四肢是配不上我們的大腦的,無論是數(shù)量上還是質(zhì)量上都配不上。例如,數(shù)量上我們只有兩只手,質(zhì)量上我們的視力也比不過老鷹。但是隨著硅基技術(shù)的發(fā)展,現(xiàn)在我們有了傳感器,它比老鷹看得還準(zhǔn);我們也有了機械手,可以做8個機械手、10個機械手,這完全沒有限制。
也就是說,現(xiàn)在我們有了比自身五官四肢更好的外部設(shè)備。即便如此,在性能功耗比方面,我們依然沒有看到任何一個計算機比大腦更好。腦機接口就是要把我們的大腦跟外面更強的執(zhí)行器、傳感器連接起來,但里面的核心技術(shù)一直沒有太大的突破。這里的突破指的是能夠安全可靠地大規(guī)模進行神經(jīng)編解碼的分析。它的核心技術(shù)卡在什么地方呢?神經(jīng)電極的通道數(shù)依然很少。從早期的 1 個通道、4個通道到目前為止依然在用的100個通道的猶他電極,以及以埃隆·馬斯克為首的團隊終于做到了幾千個通道…我們深刻意識到,在硬件上有所突破,才能做到更高效率的編解碼。但總體來看,我們在硬件上其實一直沒有太多突破,這是因為在腦科學(xué)領(lǐng)域,做硬件、做工具的人太少。
神經(jīng)科學(xué)家有很多,也許是因為破解一些未知的科學(xué)難題更吸引人,相比之下,做工程就沒有那么吸引人了,再加上硬件本身投入比較大,周期也比較長,就會導(dǎo)致愿意從事硬件開發(fā)的人相對較少。但是,近些年大家慢慢開始看到腦機接口在臨床上有一些確切的應(yīng)用前景,意識到它確實是有用的。我相信,在接下來的 3~5 年腦機接口領(lǐng)域會迎來大爆發(fā)。
前面談的應(yīng)用場景主要還是醫(yī)療。除了醫(yī)療領(lǐng)域之外,腦機接口還有哪些應(yīng)用場景?
腦機接口在我心中的定義就是接口。既然是接口,現(xiàn)在要討論的就不是腦機接口能干什么,而是腦機接口加什么。
就像“人工智能 + ”是吧?
對,這是“腦機接口 + ”。首先是“腦機接口 + 語言大模型”。當(dāng)我們能做到語言的編解碼的時候,就會發(fā)現(xiàn)腦機接口加語言大模型非常有意思。在這一場景下,人們不僅可以跟語言大模型進行互動,而且可以快速積累數(shù)據(jù)。其次就是“腦機接口 + 機器人”。腦機接口如果本身針對的是患者肢體有障礙的問題,和機器人結(jié)合在一起就可以做很多事情,包括康復(fù)、陪伴、執(zhí)行任務(wù)等。再次,還有“腦機接口 + 智能控制”,不管是控制智能家居,還是后面能做得更加可靠和成熟的無人駕駛,都可以實現(xiàn)。除此之外,主流行業(yè)里類似的對人們有很大影響的東西,其實都可以通過腦機接口的方式加以賦能、拔高,甚至做出顛覆性的改變。
所以我想說的是,腦機接口這個賽道要有人去做,腦機接口跟其他賽道之間的接口也要有人去做,而我們正在做的就是把腦機接口發(fā)展成一種容易接入其他賽道的平臺技術(shù)。
近些年關(guān)于腦機接口,宣傳最多的可能就是馬斯克的Neuralink。人們對其有肯定,也有批評,比如,很多人認為馬斯克的宣傳是過度夸大的。對此,你怎么看?
馬斯克本質(zhì)上還是商人,所以他會用商業(yè)化的方式來催熟一門技術(shù)。在我看來,馬斯克在一些項目(包括Neuralink、特斯拉在內(nèi))中做得非常成功的一點一同時也是一直以來我覺得我們需要認真學(xué)習(xí)的地方一就是系統(tǒng)工程學(xué)。他的每一個產(chǎn)品依靠的都不是單點的優(yōu)勢,至少目前看下來是這樣的。從理論創(chuàng)新的角度來講,我(在他那兒)甚至都沒有看到一個顛覆性的前沿產(chǎn)品。他就是把現(xiàn)有的,甚至只是稍微有一點突破的東西,通過系統(tǒng)工程學(xué)的方式進行優(yōu)化,包括它的成本、開發(fā)周期等。然而,這恰恰是國內(nèi)過去缺乏的。
我們原來更擅長什么呢?是點上的突破。根據(jù)報道,國內(nèi)現(xiàn)在已經(jīng)有了超級高通道一通道數(shù)能達萬級。甚至如果我們想做,未來百萬級也是可以實現(xiàn)的。問題是,即便做到百萬通道,沒有芯片匹配有什么用呢?芯片如果能匹配,功耗降不下來,耗電量降不下來,放上去10秒鐘就沒電了,又有什么用呢?怎么通過系統(tǒng)工程學(xué)的方式,把已有的六七成的技術(shù),集成在一起做到八成、九成,這是之前國內(nèi)科學(xué)家創(chuàng)業(yè)時很難去想的事情。在點上比別人的性能好,不代表做出來的產(chǎn)品就比別人的性能好。
此外,在實驗室里獲得的發(fā)現(xiàn)、在文章里發(fā)出來的東西跟產(chǎn)品本身是不一樣的。做產(chǎn)品,特別是醫(yī)療產(chǎn)品,10個里面有一個壞的都不行。因為做產(chǎn)品跟做科研有本質(zhì)上的區(qū)別,你不能將關(guān)于產(chǎn)品的要求套用在科研上,也不能按科研要求的先進程度來要求產(chǎn)品,這是兩回事。但目前我認為,腦機接口不能再停留在前沿科技層面,而是要快速轉(zhuǎn)向,聚焦到產(chǎn)品落地上來。
一定要讓政府、讓病人、讓市場看到它作為一個產(chǎn)品真正能帶來的收益。
2025年 1 月10日,上海發(fā)布了《上海市腦機接口未來產(chǎn)業(yè)培育行動方案(2025—2030年)》。這對整個行業(yè)來說應(yīng)該是巨大利好,對嗎?
首先,現(xiàn)在整體上明確了“企業(yè)家 + 科學(xué)家 + 投資人”三位一體的工作方式。其實,原來有很大一部分都是科學(xué)家在牽頭,但僅靠科學(xué)家是不夠的;也有一段時間在考慮是不是讓企業(yè)家牽頭,先把產(chǎn)品做出來再說,結(jié)果發(fā)現(xiàn)里面的科技屬性又太淡了。現(xiàn)在,我們發(fā)現(xiàn)科學(xué)家和企業(yè)家之間還有資本驅(qū)動的情況存在,因為它畢竟是一個需要資源助力的行業(yè)。如此一來,明確三位一體的工作方式對行業(yè)發(fā)展來說顯然是有利的。其次,腦機接口一定是以應(yīng)用場景需求驅(qū)動的方式發(fā)展,它的執(zhí)行主體一定是企業(yè),它必然以產(chǎn)品形態(tài)出現(xiàn)。我們不能再以文章、論文的形式來做這些。最后,腦機接口的發(fā)展也需要國家機構(gòu)的監(jiān)督,需要多方配合、共同制定標(biāo)準(zhǔn)。著眼于這個方案,我們可以非常明確地看到上海市要以產(chǎn)品為導(dǎo)向發(fā)展腦機接口行業(yè)的決心。
在你看來,腦機接口領(lǐng)域下一個亟待解決的重要問題是什么?或者說,下一個錨點是什么?
下一個錨點就是接口,或者說是連接。我們希望腦機接口這樣的技術(shù)可以連接不同領(lǐng)域、不同學(xué)科的專家,甚至可以連接不同國家,大家一起來做這件事情。因為這件事情對全人類的現(xiàn)在,包括未來,都是有歷史價值的。 ? 《錨點》專欄由《世界科學(xué)》編輯部和東方衛(wèi)視《錨點》節(jié)目組聯(lián)合開發(fā),該節(jié)自由中國科學(xué)技術(shù)大學(xué)科技傳播系副主任袁嵐峰研究員主持。原節(jié)目題為《腦機接口,中國后來居上?》