999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于功能磁共振成像的人腦效應連接網絡識別方法綜述

2021-04-18 08:29:54冀俊忠鄒愛笑劉金鐸
自動化學報 2021年2期
關鍵詞:效應方法模型

冀俊忠 鄒愛笑 劉金鐸

伴隨美國、歐盟、日本等國近年來人腦計劃的發布和啟動,腦科學的研究得到了越來越多的重視,許 多國家已經將腦科學的研究上升至國家戰略的高度.為理解大腦認知的運行機制以及洞悉腦疾病的發病機理,人腦的研究也必須從各個腦區及其相互作用構成的腦網絡來分析和把握大腦的整體性[1],因此人腦連接組成為繼人類基因組、蛋白質組后生命科學乃至自然科學領域中的一項前沿課題.目前已有的研究發現許多神經精神疾病與腦結構和腦功能網絡的異常拓撲變化有關,所以人腦連接組研究不僅能為神經精神疾病病理機制的理解提供新視角,而且能為疾病的早期診斷和治療評價提供新的腦網絡影像學標記[2].

腦功能網絡主要包括功能連接網絡和效應連接網絡.腦功能連接網絡是一種由節點和無向邊構成的圖模型,其中節點表示腦區,無向邊表示空間上相互分離的腦區之間神經活動的統計依賴關系[3].雖然功能連接網絡描述了腦區間的統計相關性,但它無法揭示腦區間神經活動的因果效應.事實上,識別腦區間的因果效應為理解人腦的神經活動機制提供了更加豐富的信息[3?4],并且在一些腦疾病的診斷和預測上依據腦區間的因果效應比統計相關性獲得了更好的效果[5?6].

腦效應連接網絡是一種由節點和有向邊構成的圖模型,其中節點代表腦區,有向邊刻畫了一個腦區施加于另一個腦區神經活動的因果效應[7],而與邊相關的連接參數則表示邊的連接強度[8?9].由于腦效應連接網絡的識別是評價正常腦功能和多種腦疾病(如阿爾茲海默病(Alzheimer' s disease,AD)、帕金森病(Parkinson' s disease,PD)、精神分裂癥(Schizophrenia)、抑郁癥(Depression)和自閉癥譜系障礙(Autism spectrum disorder,ASD)等)相關損傷的有效手段,故成為人腦連接組研究中的一項極為關鍵的科學問題.目前,利用計算方法從人腦功能磁共振成像(Functional magnetic resonance imaging,fMRI)數據中進行腦效應連接網絡的識別已成為該項研究中的前沿熱點.這是因為如果能夠通過對fMRI 數據的學習準確地獲得腦效應連接網絡,將對于理解腦疾病的發病機理,進行腦疾病的早期診斷以及病理的研究具有重要的意義[2,10?11].具體來說,對腦區間因果效應連接的準確識別,有益于了解大腦的工作機制,加深對人腦功能復雜性的理解[10];而生命科學的研究表明人腦效應連接的變化通常先于人體異常行為癥狀的顯現,所以通過腦效應連接模式異常的發現可為一些腦疾病的早期診斷提供新線索[11].由于腦效應連接網絡識別和應用的研究具有重要的理論意義和應用價值,所以該研究課題吸引了來自生物、醫學、心理、認知和計算機科學等眾多領域研究者的廣泛興趣,掀起了一股跨學科的研究熱潮.近年來,新的識別方法層出不窮,新的應用不斷被拓展.Science[12?16],Nature[1,17],Proceedings of the National Academy of Sciences of theUnited Statesof America (PNAS)[18?21],Brain[22?23],IEEE Transactions on Pattern Analysis and Machine Intelligence[24?26]等不同領域的權威國際雜志以及數據挖掘領域權威國際會議ACM SIGKDD[27]多次報道這方面的研究工作,極大地推動了腦認知和腦科學的快速發展.

在以上研究背景下,本文對基于功能磁共振成像的腦效應連接網絡識別方法的研究現狀進行了綜述,并結合該領域目前所面臨的挑戰性問題,對未來可能的前沿方向進行了展望.論文試圖為腦效應連接網絡的識別勾畫出一個較為全面和清晰的概貌,以期對該領域的相關研究提供有益的參考.

1 腦效應連接網絡的識別過程

利用fMRI 數據進行人腦效應連接網絡識別的過程通常包括5個步驟:數據采集、數據預處理、感興趣區域劃分、時間序列數據獲取、網絡學習和評價,這與獲取腦功能連接網絡的主要流程大致相同,兩者的主要區別在于對網絡結構的學習,腦功能連接網絡是學習腦區間的統計相關性,而腦效應連接網絡旨在學習腦區間的因果效應.圖1展示了人腦效應連接網絡識別的主要流程,下面將對此過程進行詳細地介紹.

1)數據采集

圖1 人腦效應連接網絡識別的流程Fig.1 The process of human brain effective connectivity networks identification

功能磁共振成像是一種通過檢測血氧水平的BOLD信號變化來捕捉大腦神經活動的磁共振成像技術.具體來說,大腦某區域的激活引發局部耗氧量增加,促使該區域的血流量加快以及時補充所需的氧氣,造成血液中的脫氧血紅蛋白和氧合血紅蛋白的濃度發生變化,導致該區域的磁共振信號明顯強于其他區域,這一現象被稱為血氧水平依賴(Blood oxygen level dependent,BOLD)效應[28].fMRI 數據采集正是利用磁共振掃描儀(如圖1(a)[29]所示)以一定的時間分辨率對BOLD信號進行采樣,從而獲得能夠反映人腦神經活動的時間序列數據(如圖1(b)所示).所采集的f MRI 數據通常分為兩大類:任務態fMRI 數據和靜息態fMRI數據.采集任務態fMRI數據需要設計具有特定任務的實驗范式,以考察大腦在實驗任務刺激下激活腦區的神經元活動;而靜息態fMRI數據的采集過程無需試驗任務的刺激,它是在被試不做任何刻意的運動或思考,并保持意識清醒情況下的功能磁共振成像.

2)數據預處理

由于采集fMRI數據易受到成像設備以及掃描過程中被試頭動、呼吸和心跳等不可控因素的干擾,因此需要對所采集的數據進行預處理,此過程與功能連接網絡的數據預處理過程基本一致.目前,常見的f MRI 數據的預處理工具包括:AFNI[30]、ANTs[31]、FSL[32]、SPM[33]、REST[34]、DPABI[35]和最近提出的fMRIPrep等[36],它們的設計機理和功能特點各有不同,可根據實際情況合理地選擇和使用.對于靜息態和任務態的fMRI數據來說,兩者的預處理步驟均包括:時間層校正、頭動校正、結構像與功能像配準、空間標準化和平滑處理.此外,靜息態f MRI數據的預處理還包括去線性漂移和低頻帶通濾波;而在任務態fMRI的預處理過程中,通常利用統計分析的方法來檢驗任務態與對照狀態下腦區信號的顯著差異性,從而獲得在特定實驗任務下的激活腦區.預處理后的f MRI數據(如圖1(c)所示)被進一步用于腦效應連接網絡的識別.

3)感興趣區域劃分

由于fMRI成像的空間分辨率很高,它將人腦劃分成數以萬計的體素,并針對每個體素采集時間序列數據,因此所采集的fMRI數據具有高維性的特點.為了降低計算復雜度,通常需要對人腦進行感興趣區域的劃分,并將劃分后的感興趣區域作為腦效應連接網絡的節點(如圖1(d)所示),這是識別腦效應連接網絡的關鍵步驟之一.

一般來說,腦效應連接網絡可以從微觀尺度、中間尺度和大尺度3個水平上進行識別,但依靠現有的技術從微觀尺度和中間尺度來識別腦效應連接網絡十分困難.目前,對腦效應連接網絡的研究主要集中在大尺度水平上,通過劃分感興趣區域來定義腦效應連接網絡中的節點.常見的劃分方法主要包括3種:a)對于任務態fMRI 數據,通常依據特定的實驗任務,將激活的腦區定義為感興趣區域[37];b)在分析靜息態fMRI 數據時,可以利用獨立成分分析方法,從混合信號中分解出多個空間上相互獨立的特定的腦網絡,并將每一個腦網絡定義為一個節點,通過探究各節點間的因果效應連接來揭示靜息態下不同腦網絡間的信息交互方式[38?39];c)采用腦模板將全腦劃分成若干個腦區,進而識別大規模的效應連接網絡.目前,常用的腦模板包括:自動解剖標記模板(Automated anatomical labeling,AAL)[40]、神經成像實驗室概率模板(Laboratory of neuroimaging probabilistic brain atlas,LPBA)[41]、蔣田仔研究團隊提出的包含246個精細腦區亞區的腦網絡連接組[42]以及Glasser組繪制的包含360個腦區的模板[43]等.由于合理地劃分感興趣區域對于研究大腦各區域的功能活動,識別高質量的腦效應連接網絡非常重要,因此在劃分感興趣區域時需要根據具體的研究內容選擇最佳的劃分方法.

4)時間序列數據獲取

由于每個感興趣區域內包含大量的體素,而各體素的fMRI數據存在差異,因此通常采用以下兩種方式獲取每個感興趣區域的時間序列:a)提取感興趣區域內所有體素的fMRI數據的平均值.例如,在貝葉斯網絡評分搜索中主要運用此方法來提取時間序列[44?45];b)采用主成分分析方法提取感興趣區域內所有體素fMRI 數據的主成分.該方法已在動態因果模型、格蘭杰因果等方法的數據獲取中得到了廣泛應用[46?47].在此步驟所提取的時間序列數據(如圖1(e)所示)將被用于效應連接網絡的學習和評價.

5)網絡學習和評價

網絡學習和評價是整個腦效應連接網絡識別過程中最核心的步驟,該步驟基于各腦區的fMRI數據設計合理的識別方法來學習腦區間神經活動的因果效應,并對所得到的效應連接網絡(如圖1(f)所示)進行評價.一般來說,通常先在具有標準網絡的仿真數據集(例如Smith、Sanchez[8,48]等)上識別效應連接網絡,并依據精度、召回率和F度量等評價指標來驗證方法的有效性,再利用真實數據集探究方法的實際應用效果.

經過近十年的快速發展,已經涌現出了許多基于不同識別機理的腦效應連接網絡識別方法,下面將主要圍繞識別方法進行討論,分析和比較現有識別方法的基本原理、特點、不足以及有待解決的問題.

2 腦效應連接網絡的識別方法

根據所采用的計算模型和機理,我們可以將腦效應連接網絡劃分為基于全局評價的識別方法和基于局部度量的識別方法兩大類.基于全局評價的識別方法又可進一步分為基于假設模型的識別方法和基于貝葉斯網絡評分搜索的識別方法,而基于局部度量的識別方法可細分為基于時間滯后的識別方法和基于概率分布的識別方法.更系統的腦效應連接網絡識別方法的分類體系如圖2所示,在每個子類方法下又包含多種不同的具體算法.

2.1 基于全局評價的識別方法

基于全局評價的識別方法是同時考慮所有腦區之間的相互作用關系,通過對模型的整體評價來識別腦區間的效應連接.根據識別方法的性質,基于全局評價的識別方法又可分為2類:1)基于假設模型的識別方法,此類方法依據所構建的假設模型來間接估計神經活動信號間的因果效應;2)基于貝葉斯網評分搜索的識別方法,此類方法采用無監督的數據驅動方式直接從腦區fMRI 數據中學習腦效應連接網絡.

2.1.1 基于假設模型的識別方法

此類方法首先利用模型來描述腦區間神經活動的因果效應,然后估計模型參數得到多個相互競爭的假設模型,最終通過模型選擇,從假設模型中獲得一個具有最大化模型證據的模型.目前,基于假設模型識別腦效應連接的方法主要包括3種:基于結構方程模型(Structural equation models,SEM)的識別方法、基于動態因果模型(Dynamic causal models,DCM)的識別方法和基于Ornstein-Uhlenbeck模型(Ornstein-Uhlenbeck models,OUM)的識別方法.

1)基于結構方程模型的識別方法

SEM 是一種從計量經濟學領域發展而來的多元線性統計模型,它基于變量間的協方差矩陣來間接地估計變量間的因果關系.1994年,Mclntosh 等首次將SEM 用于人腦功能網絡的識別[49],為基于SEM識別腦效應連接網絡提供了新思路.下面將對基于SEM識別腦效應連接網絡的主要過程進行描述:

首先,令xi表示第i個腦區變量,t表示采樣時間,且t∈[1,···,T],n為腦區個數,xt=[x1t,···,xnt]表示所有腦區的神經元活動在t時刻的觀測值.利用一個概率生成模型來描述腦區中神經元活動與效應連接的關系,其計算公式如下:

圖2 人腦效應連接網絡識別方法的分類體系Fig.2 The category system for identification methods of human brain effective connectivity networks

式中,θ表示模型參數;xt服從均值為零、協方差為Σ(θ)的高斯分布.然后通過一個多元回歸方程模型表示腦區間的相互作用關系,如式(2)所示:

式中,M表示腦效應連接網絡的參數矩陣,εt=[ε1t,···,εnt]表示腦區噪聲.向式(2)中引入一個單位矩陣In,則xt可表示為如下形式:

再利用模型的協方差矩陣與腦區觀測數據的協方差矩陣構建目標函數,如式(4)所示:

由于SEM具有模型簡單、魯棒性和靈活性強等優勢,故已成為識別腦效應連接網絡的常用方法之一.但該方法仍存在一定的不足[50?52]:1)在缺乏先驗知識時,難以準確地識別腦區間的因果關系;2)僅能用于描述腦區神經活動信號間的同期因果效應,無法有效地利用f MRI 數據的時序信息;3)SEM假設腦區間的因果關系是線性的,無法揭示腦區間非線性的因果關系;4)將外部輸入視為不確定性變量,故不適用于建模與事件相關的腦區間的效應連接.近年來,已有許多研究者針對SEM的缺陷,對SEM的基本識別過程進行了改進,設計了多種基于結構方程模型識別腦效應連接網絡的新方法.

2006年,Shimizu 等在結構方程模型中引入了三個基本假設:1)觀測數據的生成過程是線性的;2)不存在隱變量;3)噪聲服從非高斯分布且是相互獨立的連續隨機變量,故將驗證性的結構方程模型改進為一種探索性的數據驅動模型—LiNGAM(Linear non-gaussian acyclic model)[53],該模型不需要預先獲悉腦區間因果關系的先驗信息,僅利用基于獨立成分分析的方法就能從觀測數據中學習腦區間的效應連接.但LiNGAM存在對初始值敏感而易陷入局部最優的問題.為了克服這一不足,他們隨后又提出了一種非參數的(Direct linear nongaussian acyclic model,Direct LiNGAM)算法[54],該算法通過從給定的數據中依次消除各獨立成分的影響來估計腦區間的因果結構,并利用剪枝算法完善整個腦效應連接網絡的識別.與LiNGAM相比,新算法不需要進行初始猜測,能夠在有限步驟內較快地搜索到最優解.

在文獻[55]中,Kim等考慮到fMRI 數據的時序特性,將結構方程模型與向量自回歸模型相結合,設計了一種能同時刻畫人腦神經活動的同期和滯后因果效應的統一結構方程模型(Unified SEM,uSEM),并將uSEM與廣義線性模型融合于統一框架,以探究被試的年齡、性別等協變量對效應連接的影響.由于u SEM將外界刺激視為不確性變量,故無法識別與事件相關的腦區效應連接網絡.為了克服此不足,Gates等受DCM的啟發,在uSEM中引入一個血液動力學響應函數,使其與外部刺激信號做卷積,進而構建一個離散的雙線性模型—eu-SEM(Extended unified SEM)[56]來描述外部刺激對腦區的影響以及腦區間效應連接的變化.與uSEM相比,euSEM不僅能夠刻畫腦區間同期和滯后的因果效應,而且可以描述人腦在受到外部刺激時的功能整合.此外,euSEM是結構方程模型從驗證性方法向探索性方法發展的一個成功范例,它能夠根據具體的研究內容,自適應地選擇以驗證性或數據驅動的方式對腦區間的因果關系建模,從而為基于fMRI數據識別腦效應連接網絡提供了一種十分靈活的方法.

目前,在組水平上識別效應連接網絡通常是對所有被試的腦結構和功能數據做同質性假設,但事實上不同被試的腦部存在顯著差異,其腦結構和功能數據均具有異質性,這導致所獲得的腦效應連接網絡缺乏可靠性[57?58].為了解決此問題,Gates等在2012年提出了GIMME(Group iterative multiple model estimation)算法[58],這為從異質數據中識別組水平和個體水平的腦效應連接網絡提供了一個有效且可靠的方法.該方法主要分為兩個階段:第1個階段利用所有被試的fMRI數據建立euSEM,并采用極大似然估計確定模型參數,然后依據修正指數選擇適合于多數個體的參數來獲取組水平的公共因果網絡;第2個階段是在獲取公共因果網絡基礎上識別每個被試的效應連接網絡,以半限定的方式建立個體水平的euSEM,然后使用階段1中的方法估計參數,并選擇適合于個體且同時存在于公共因果網絡中的參數,從而得到個體水平的腦效應連接網絡.2019年,Henry 等對GIMME算法做了進一步擴展,提出了cs-GIMME(Confirmatory subgrouping GIMME)算法[59],該算法通過對子組進行預定義,并檢測預定義子組中大多數個體一致存在的連接,有效地提高了識別精度,使算法在識別組間差異上獲得了更好的效果.

2)基于動態因果模型的識別方法

DCM是一種根據腦區神經元之間的耦合關系而設計的動力學模型,最早用于識別與事件相關的腦區間的效應連接網絡.首先,令xi表示第i個腦區變量,x=[x1,···,xn]表示所有腦區的神經元活動狀態.利用一個非線性函數F來描述輸入信號對腦區神經元活動的影響,如式(5)所示:

由于腦區中神經元活動將引發附近區域的血液動力學狀態發生變化,而這一動態過程可通過血液動力學模型來描述,該模型先利用一組微分方程來描述血液動力學狀態的變化趨勢,再通過一個非線性函數將血液動力學狀態映射為BOLD 響應信號[60].對于任一腦區,其血液動力學狀態在某個采樣時刻的變化趨勢如式(7)所示:

在一段采樣時間內,人腦某個腦區的神經生理學響應信號映射為BOLD響應信號的過程如圖3所示.由圖可知,在刺激信號的作用下,人腦中某個腦區被激活,該腦區的神經元活動會引發血管舒張信號增強,導致局部血液流入量增加,促使血液流出量、血容積和脫氧血紅蛋白含量均發生相應的改變,其中,血液流出量對血液流入量具有抑制作用,并且對脫氧血紅蛋白含量造成影響;而血容積的大小與血液流出量和脫氧血紅蛋白含量密切相關.最終在血容積和脫氧血紅蛋白的共同作用下生成BOLD響應信號.

圖3 神經生理學響應信號映射為BOLD響應信號的過程Fig.3 The process of mapping a neurophysiological response signal to a BOLD response signal

最后,通常利用動態期望最大化或者廣義濾波的方法來估計模型參數,并通過貝葉斯模型選擇,獲得一個具有最大化模型證據的模型,從而得到腦效應連接網絡.DCM的優勢在于它通過神經生理學響應所引發的BOLD響應信號來識別腦區間的因果效應,因此具有良好的生理學可解釋性.

事實上,DCM不僅可以識別與事件相關的腦效應連接網絡,而且能夠揭示大腦內部自發性的神經活動規律[61].2014年,Friston等將時域DCM轉換到頻域,提出一種利用頻譜動態因果模型(Spectral dynamic causal models,sp DCM)從靜息態fMRI數據中學習腦效應連接網絡的方法[62],該方法利用交叉譜函數對腦區神經元的內源性波動和噪聲進行編碼,通過對交叉譜函數的參數估計來識別腦區神經活動信號間的因果效應,巧妙地解決了估計神經元活動的復雜問題.實驗結果表明,該方法具有識別精度好、計算效率高、對組間差異敏感等優點[62?63].但該算法是利用sp DCM對靜息態fMRI數據識別腦效應連接網絡的初步探索,仍存在2個主要問題尚未解決:1)sp DCM僅識別了較小規模的效應連接網絡,如何進一步提高算法的計算效率,使其在識別大規模效應連接網絡中發揮作用,是后續研究中亟待解決的問題;2)sp DCM依賴于平穩性假設,忽略了效應連接的動態性.如何利用sp DCM來探究效應連接的動態性是未來需要解決的另一問題.

伴隨著腦區個數增多,腦效應連接參數會激增[64],這將導致模型的計算復雜度顯著增加,所以動態因果模型常用于識別小規模的腦效應連接網絡[65].但實際上這些連接參數中包含了大量的冗余信息,因此設計合理的方法約減冗余連接參數將有利于此類方法識別更大規模的腦效應連接網絡.2017年,Razi等提出了一種將功能連接矩陣作為收縮先驗來約減冗余連接的算法[66].該算法首先利用奇異值分解從fMRI數據中提取特征向量,并通過貝葉斯估計確定特征維數,然后提取特征向量間的功能連接矩陣來構建效應連接參數的收縮先驗,從而剔除了冗余參數,提高了模型反演的效率.該算法是基于sp DCM識別較大規模的腦效應連網絡的一個良好的范例,但其不足之處在于算法對特征向量的維度比較敏感.

同年,Frassle等提出了一種回歸動態因果模型(Regression dynamic causal models,rDCM)算法[67],該算法將復雜的非線性反演問題轉化為一個易求解的貝葉斯線性回歸模型來解決.具體來說,首先利用傅里葉變換將時域的神經元狀態方程轉換到頻域,并與一個固定的血液動力學響應函數做卷積,再引入平均場近似假設腦區信號的測量噪聲是獨立隨機向量,然后為效應連接參數和噪聲精度構造先驗分布,將rDCM形式化為一個易估計的貝葉斯線性回歸模型,并利用變分貝葉斯估計模型的參數和超參數.與傳統的DCM算法相比,r DCM有效地解決了大規模腦效應連接網絡參數估計困難的問題,顯著提高了反演效率.文獻[68]對r DCM做了進一步的擴展,提出了一種利用稀疏約束自動約減冗余連接的稀疏回歸動態因果模型(Sparse regression dynamic causal models,sparse r DCM)算法.該算法首先利用一個全連接網絡描述腦區間的相互作用,然后向貝葉斯線性回歸模型中引入一個二進制指示變量作為特征選擇器,使其在反演過程中將全連接網絡自動優化為稀疏網絡,進一步提高了算法的效率.實驗結果表明,該算法不僅能夠快速地識別大規模腦效應連接網絡,而且具有良好的準確性和特異性.

由于sp DCM依賴于平穩性假設,因此忽略了效應連接隨時間變化的動態性.為了彌補此不足,2018年,Park 等設計了一種利用sp DCM識別腦區間動態效應連接的方法[46],該方法首先利用滑動窗口算法對單個被試在一段采樣時間內的f MRI數據進行劃分,并利用sp DCM為每個窗口內的基線連接和窗口間效應連接的變化建模,然后采用參數經驗貝葉斯(Parametric empirical Bayes,PEB)[69?70]的層次模型對窗口內和窗口間的效應連接進行估計,最終通過疊加基線連接和線性模型的隨機效應來識別腦效應連接網絡的動態變化.由于該方法具有良好的泛化能力,因此可將其進行擴展到識別組水平上的動態效應連接網絡.

3)基于Ornstein-Uhlenbeck模型的識別方法

OUM是一種描述隨機過程的模型,它能夠表示大腦的神經元活動狀態,并通過捕捉腦區間的功能連接來間接地刻畫神經元活動的因果效應.基于OUM識別效應連接網絡的主要過程為:首先利用大腦的結構數據構建結構連接網絡,將其作為效應連接網絡的基本骨架;然后利用OUM建立人腦的神經活動與效應連接的關系,并通過估計模型參數(腦區間的協方差矩陣和效應連接的鄰接矩陣),獲得一個與腦區fMRI 數據的功能連接網絡擬合程度最佳的模型.圖4給出了基于OUM方法識別腦效應連接網絡的主要流程.在圖4中,ECij表示任意兩個腦區之間的效應連接,Σij表示腦區間的協方差矩陣.

圖4 基于OUM方法識別腦效應連接網絡的流程圖Fig.4 The process of identifying a brain effective connectivity network by the OUM method

早期對腦功能連接的研究主要基于靜態的描述,最近一些研究者圍繞腦功能連接的動態特性展開研究,研究結果表明動態功能連接不僅包含了大腦豐富的時空信息,而且與大腦內部自發性的神經活動密切相關,這為利用腦功能連接來識別腦效應連接網絡提供了重要依據.2016年,Gilson等設計了一種利用OUM從靜息態fMRI數據中估計全腦效應連接網絡的方法[71],該方法首先依據結構連接網絡構建效應連接網絡的基本骨架,然后利用OUM捕捉腦區間當前時刻和滯后時刻的功能連接,并采用一個Lyapunov函數迭代地優化效應連接參數和腦區間的協方差矩陣,使由模型計算得到的BOLD信號間的功能連接網絡與實際fMRI 數據間的功能連接網絡達到最佳的擬合程度,最終通過估計模型參數來識別腦效應連接網絡.隨后,他們又基于此方法來識別與事件相關的腦效應連接網絡[72],通過設計觀看電影與黑屏休息的交替任務的實驗范式來探究被試處于兩種狀態時腦效應連接網絡的差異.該方法為識別大規模腦區間的效應連接網絡提供了一種新思路,但它能準確識別腦效應連接網絡的條件是:功能連接的滯后時間需要與動態系統的時間常數相匹配.一旦不能滿足此條件,將難以獲得高質量的腦效應連接網絡.

2018年,Schiefer等提出了一種通過OUM來識別腦區間因果效應的方法[73],該方法基于“對撞”結構[74]的思想,即,若兩個腦區x和y之間的因果關系由另一個變量z決定,則x和y具有相關性,此時根據x和y的相關性可以估計腦區間的效應連接.具體來說,該方法首先將外部輸入作為驅動變量,通過一個Ornstein-Uhlenbeck 模型來刻畫腦區間神經活動的因果效應,并利用觀測數據和外部輸入信號的零時滯的交叉譜密度來表示腦區間的效應連接,然后對交叉譜密度進行酉變換并構建帶有L1懲罰項的代價函數,最終通過梯度下降算法最小化代價函數,從而實現對效應連接的參數估計.該方法基于零時滯的交叉譜密度函數識別效應連接網絡,巧妙地避免了使用滯后信息對腦區間因果關系所造成的不良影響,但是該方法易受給定條件的限制,且存在對噪聲敏感的缺陷.

雖然基于假設模型的方法在識別腦效應連接網絡方面發揮了重要作用,但此類方法仍存在以下幾個方面的不足:首先,此類方法在識別過程中通常依賴于先驗知識,當先驗知識不足時容易對識別結果造成不良影響;然后,基于結構方程模型和基于Ornstein-Uhlenbeck 模型的方法均未充分考慮腦區神經活動所導致的血液動力學狀態變化,故缺乏生理學的可解釋性;最后,盡管基于假設模型的方法在利用f MRI數據的時序特征方面開展了一些探索,但仍處于初步階段,如何針對fMRI 數據的時序特征設計更合理的方法將是此類方法未來的一個重要發展方向.

2.1.2 基于貝葉斯網絡評分搜索的識別方法

貝葉斯網絡(Bayesian networks,BN)是一種由節點和有向弧構成的概率圖模型,其節點表示變量,有向弧對應變量間的因果關系,所有變量間的條件概率關系統一用一張有向無環圖表現出來.基于BN評分搜索識別腦效應連接網絡通常被視為一個模型選擇問題,其目的是通過BN結構學習搜索與腦區變量間的條件依賴關系擬合程度最佳的網絡結構,并在確定網絡結構的前提下計算腦區間的連接強度.由此可見,準確地學習腦區間的因果結構將是基于貝葉斯網絡評分搜索方法識別效應連接網絡的關鍵.具體來說,此類方法將學習視為最優化問題,利用評分搜索方法在候選網絡結構空間中進行迭代搜索,并將得分最高的網絡結構作為學習到的腦效應連接網絡結構.基于貝葉斯網絡評分搜索方法識別效應連接網絡結構的流程圖如圖5所示.

圖5 基于貝葉斯網絡評分搜索方法識別腦效應連接網絡結構的流程圖Fig.5 The process of identifying a brain effective connectivity network structure by the Bayesian network scoring search method

根據是否利用fMRI 數據的時序特征識別腦效應連接網絡,基于貝葉斯網絡評分搜索識別腦效應連接的方法可分為兩類:一類是基于靜態貝葉斯網絡評分搜索的識別方法[75?76],此類方法將所有采樣時刻的fMRI數據視為一個整體向量,利用基于評分搜索的貝葉斯網絡結構學習方法來識別腦效應連接網絡;另一類是基于動態貝葉斯網絡(Dynamic Bayesian networks,DBN)評分搜索的識別方法[77?78],DBN是靜態貝葉斯網絡在時序過程建模方面的擴展,它充分考慮了fMRI數據的時序特性,不僅能識別在同一時間片上腦區間的因果關系,而且也可以分析不同時間片的腦區間時域的相關性,已成為一種揭示腦效應連接網絡時序動態性的重要方法.這兩類方法在識別腦效應連接網絡中均發揮了重要作用.由于貝葉斯網絡具有良好的理論基礎和豐富的實現方法,故基于貝葉斯網絡評分搜索方法識別腦效應連接網絡已逐漸成為目前該領域的一個研究熱點.

1)基于靜態貝葉斯網絡評分搜索的識別方法

2016年,Ji 等將人工免疫算法(Artificial immune algorithm,AIA)與BN算法相結合,提出一種識別腦效應連接網絡的AIAEC(Artificial immune algorithm effective connectivity)算法[44],該算法首先構建了一個由記憶抗體和隨機生成抗體組成的初始解,然后通過克隆選擇、交叉和變異算子優化當前種群中的抗體,并利用抑制算子來更新種群,重復這個迭代過程直到搜索到K 2評分最高的抗體,即得到最優的腦效應連接網絡.由于AIAEC算法具有快速的局部尋優能力和良好的全局搜索能力,因此在識別精度和效率上均獲得了良好的性能.但該算法不能定量地描述效應連接強度.為了彌補此缺陷,他們隨后又提出一種根據蟻群尋優機制實現的基于評分搜索的腦效應連接網絡學習算法ACOEC(Ant colony optimization effective connectivity)[45],該算法利用K2評分度量來引導蟻群在可行解空間中搜索到全局最優解(腦效應連接網絡).其主要過程為:每只螞蟻將空圖作為初始解,通過從候選弧集中選擇有向弧增量地構建個體可行解,重復此操作直到評分不再增加時獲得該螞蟻的當前解,當蟻群全部迭代優化完成后所獲得的K2評分最高的解為最終的腦效應連接網絡.該算法的特點是通過更新信息素濃度來指導蟻群搜索,有效地提高了搜索效率,且其在迭代過程中定期調用增弧、減弧和反向弧的優化策略能避免算法陷入局部最優值.與AIAEC相比,ACOEC不僅在連接方向的識別上具有更高的精度,而且利用信息素濃度定量地描述了腦區之間的連接強度.但該算法的不足在于求解效率較低,尤其在面對大規模腦區時,算法的時間復雜度較高.

為了進一步提高算法的性能,2019年,冀俊忠等又提出一種融合多源信息的蟻群優化學習算法[79],該算法首先利用結構與功能的內在約束關系,將從彌散張量成像(Diffusion tensor imaging,DTI)數據中獲取的皮爾森正相關作為結構約束知識來壓縮搜索空間,既有效地提高了蟻群的搜索效率,又保證了最優解的所有組件(弧)都能作為螞蟻選擇的候選弧;然后通過在啟發函數中融合基于fMRI數據的體素聯合激活信息來增強螞蟻尋優的目的性,以提高算法的求解速度;最終在兩種優化策略的共同作用下獲取高質量的網絡結構.與ACOEC算法相比,新算法在優化效率和魯棒性上都獲得了更好的效果.

2)基于動態貝葉斯網絡評分搜索的識別方法

2014 年,Wu 等提出一種采用高斯動態貝葉斯網絡(Gaussian dynamic Bayesian network,GDBN)識別腦效應連接網絡的方法[80],該方法首先將大腦視為一個一階線性動態系統,并假設腦區的fMRI數據服從高斯分布,然后采用基于貝葉斯信息準則的評分搜索方法來確定能最佳表征腦區變量在相鄰時間片之間轉移概率的網絡結構,并通過參數學習來獲取腦區間的連接強度,最終得到隨時間演化的腦效應連接網絡.與之前采用離散動態貝葉斯網絡識別腦效應連接網絡的工作[78]相比,GDBN不需要對數據進行離散化處理,有效地避免了由此而引發的信息丟失.但該方法僅使用了一階馬爾科夫鏈DBN模型,并未對跨多個時間片的腦區間的交互作用建模.實際上,不同腦區間的反饋以及調節作用并非同步發生,且其時延長短也存在差異,而采用高階動態貝葉斯網絡模型將是解決這些問題的有效方法.

2017 年,Dang 等提出了一種融合動態規劃策略的高階動態貝葉斯網絡結構學習方法[81],該方法能夠對異步多時延的腦區間的循環和調節作用建模,并采用動態規劃策略壓縮搜索空間,以提升算法的求解效率,從而準確、高效地刻畫腦效應連接網絡的動態變化.為了進一步提高識別精度,他們隨后又提出了一種融合fMRI 和DTI 數據于動態貝葉斯網絡學習框架的腦效應連接網絡識別方法[82],該方法首先對僅具有功能信息的網絡評分進行改進,重新構建了包含結構信息的基于解剖連接的(Tractography-based,TB)評分函數,并利用一個全局閾值參數確保評分函數中結構信息的有效性,然后基于TB評分函數學習DBN,最終獲得隨時間變化的腦效應連接網絡.該方法利用DBN模擬了人腦的調節和反饋機制,能夠揭示不同時間片的腦區間的交互作用.實驗結果表明,該方法在識別精度和魯棒性上均具有良好的性能.

基于貝葉斯網絡評分搜索的識別方法本質上是一種探索性的方法,它采用無監督的數據驅動方式從fMRI 數據中識別腦效應連接網絡,具有精度高、魯棒性和泛化能力強等優勢,但此類方法仍存在一定的局限性,由于靜態貝葉斯網絡只能對時不變系統建模,無法考慮前后時刻信息的關聯性和互補性,因此不能有效地利用fMRI數據的時序特性來識別腦區間的效應連接.而盡管動態貝葉斯網絡能夠刻畫不同時刻的腦效應連接網絡,實現了對時序過程的建模,但隨著DBN模型階數的增多,其計算復雜度將顯著增加.

2.2 基于局部度量的識別方法

基于局部度量的識別方法主要包括兩個步驟:1)利用度量計算方法識別局部腦區之間的因果網絡;2)合并各局部腦區間的因果網絡以獲得完整的腦效應連接網絡.此類方法又可分為基于時間滯后的識別方法和基于概率分布的識別方法.

2.2.1 基于時間滯后的識別方法

基于時間滯后的識別方法是一類利用fMRI 數據的滯后信息來預測當前時刻腦區之間效應連接的方法,此類方法不僅充分考慮了fMRI數據的時序特性,而且能夠直接從腦區觀測數據中學習因果效應和連接強度,是一類快速、準確地識別腦效應連接的有效手段.根據計算機理的不同,此類方法又可以分為基于格蘭杰因果的識別方法、基于預測相關性的識別方法和基于相空間重構的識別方法.

1)基于格蘭杰因果的識別方法

基于格蘭杰因果的識別方法是一類依據滯后的時序信息預測當前腦區間效應連接的方法,該方法強調預測性是因果關系存在的必要條件,即在對當前腦區信號進行預測時,若加入其他腦區滯后的fMRI時間序列能獲得更準確的預測結果,則稱后者是前者的原因[83?84].腦區間的格蘭杰因果關系由線性自回歸模型進行描述,最初是在時域內利用雙變量自回歸模型識別每對腦區間的格蘭杰因果關系,但此模型無法準確地區分直接和間接的因果關系,容易識別到假陽性的連接.為了解決此問題,基于多變量自回歸模型的格蘭杰因果分析方法被相繼提出,包括條件格蘭杰因果[85]和偏格蘭杰因果[86]等方法.這些多元格蘭杰因果方法不僅能夠有效地消除腦區間的間接連接,而且可以避免由外部干擾因素對識別結果造成的影響.

事實上,時域格蘭杰因果的頻域表示形式可用于檢測不同頻率點或頻段的神經活動信號間的因果關系,從而更精確地刻畫腦區間的效應連接,于是,偏有向相干、廣義偏有向相干、有向傳遞函數和全頻域有向傳遞函數[87?89]等頻域內的格蘭杰因果方法被陸續提出,在識別腦效應連接上發揮了重要作用.

隨著格蘭杰因果檢測技術的不斷發展,此類方法已逐步擺脫了僅用于描述腦區間線性因果關系的束縛,核格蘭杰因果[90]、傳遞熵[91]等非線性格蘭杰因果方法為揭示腦區間的非線性依賴關系提供了新思路.因此,在時域和頻域內,基于格蘭杰因果的識別方法能夠捕捉腦區間線性和非線性的因果效應,全面地揭示大腦的神經活動規律.

2015年,Ting 等提出一種基于子空間向量自回歸模型(Subspace vector autoregressive,SVAR)識別大規模腦效應連接網絡的方法[92].首先利用因子模型對高維fMRI數據進行降維,然后在低維子空間建立多變量自回歸模型,并采用偏有向相干算法識別腦區間的格蘭杰因果關系,最終將識別結果映射到高維狀態空間以獲得腦效應連接網絡.該方法利用少量因子表征高維fMRI數據,降低了算法的計算復雜度,提高了識別效率,能夠快速地識別大規模腦區間的效應連接網絡.為了進一步探究效應連接的動態變化,他們隨后提出了將馬爾科夫區制轉移模型和SVAR 模型相結合的動態效應連接網絡識別方法[93?94],該方法將SVAR 模型表示為狀態空間形式,通過卡爾曼濾波和平滑變換捕捉腦區間連接狀態的變化,并將狀態空間劃分成不同區制,基于各區制的腦區間的因果效應來獲得腦區間的動態效應連接網絡.該方法不受固定窗口尺寸的限制,能跟隨時間尺度的變化自適應地劃分區制,具有較強的靈活性和實用性.但其不足之處在于因子模型的降維策略有時對一些特殊腦區缺乏適用性.

2016年,Wei等提出一種融合時域和頻域多元格蘭杰因果方法的識別框架[95],將偏格蘭杰因果(Partial granger causality,PGC)算法和偏有向相干(Partial directed coherence,PDC)算法相結合來識別特發性癲癇患者核心認知腦區的效應連接.具體分為2個步驟:a)利用fMRI 數據計算每個被試的PGC和PDC測度,并獲取兩種方法度量結果的平均值;b)采用自舉重采樣構建替代數據集,假設替代數據集的PGC和PDC測度均滿足零假設,通過顯著性閾值法判斷原始數據和替代數據的檢驗統計量之間是否具有顯著性差異,并根據PGC和PDC的一致性度量結果識別腦區間的效應連接.該方法結合了時、頻域格蘭杰因果分析的優勢,不僅有效地避免了外部輸入對識別結果的影響,而且更精細地反映了不同頻率的因果響應.不過該方法存在對模型階數敏感的缺陷.

2017 年,Karanikolas等設計了一種基于多核格蘭杰因果模型識別腦區間效應連接的方法[90],其核心思想是在非線性特征空間內通過多核學習識別腦區間的因果關系.首先依據腦區fMRI 的滯后時間序列構建多元線性回歸模型,并將其擴展到再生核希爾伯特空間,利用基于核函數的非線性回歸模型進行PGC度量;然后采用多核學習算法構建多個基本核的凸組合,通過L2范數從預先選擇的核函數字典中學習與樣本數據擬合程度最佳的基本核組合,最終運用偏格蘭杰因果算法估計腦區間的效應連接.該方法將線性模型轉化到非線性空間,準確地捕捉到腦區間的非線性相互作用關系,并利用靈活性較強的多核學習來提高模型的預測精度,獲得了良好的識別效果.

同年,Meier等提出一種將傳染病模型和傳遞熵融合于統一框架來識別個體水平的大腦信息流向的方法[96].首先利用DTI 數據構建腦區間的結構連接網絡,然后通過傳染病模型定義腦區的狀態,描述腦區的激活過程,再使用傳遞熵計算從一個腦區傳遞到另一個腦區的信息量,并依據熵值大小判斷每對腦區間的信息流向,最終通過計算PA(Posterior-anterior)指數來估計整個大腦皮層的信息流動的全局模式.該方法采用基于信息理論的傳遞熵方法來估計腦區間的信息交換強度和信息流向,是一種準確、高效的非參數非線性識別方法.

2019年,Chockanathan 等提出了一種大規模格蘭杰因果(Large-scale Granger causality,lsGC)方法[97],用于識別大規模腦區間的效應連接網絡.該方法首先采用主成分分析對高維fMRI數據進行降維,然后在低維空間中建立多元向量自回歸模型,并計算每對腦區間的lsGC指數來判斷因果關系,最終將低維空間的識別結果映射到高維空間中,從而得到腦效應連接網絡.實驗結果表明,該方法在由AAL、Harvard-Oxford 和Brainnetome等多種腦模板所劃分的大規模腦區上均獲得了良好的識別效果,為識別大規模效應連接網絡提供了一種可靠的手段.

基于格蘭杰因果的識別方法是一類基于時間優先級識別腦效應連接的方法,一般適用于分析時間分辨率較高的MEG(Magnetoencephalography)、EEG(Electroencephalogram)等數據,例如:最近提出的利用高斯回歸過程對因果核函數進行非參數學習的GP Cake 算法[98],以及融合自適應神經網絡—模糊推理系統的條件格蘭杰因果[99]方法.為了從時間分辨率相對較低的fMRI數據中也能獲得較好的格蘭杰因果識別結果,通常選取較短的滯后時間和較低的模型階數,盡管這在一定程度上提高了算法識別的精度和效率,但仍存在一定的局限性:首先,該方法依賴于平穩性假設,當fMRI數據不滿足此條件時容易產生假陽性的識別結果;其次,由于fMRI數據的時間分辨率較低,因此不同腦區的血液動力學響應的延遲時間存在差異,這有可能對格蘭杰因果關系的識別造成混淆.

2)基于預測相關性的識別方法

2017 年,Xu 等提出了一種基于預測相關性識別效應連接的方法[100],該方法首先設計了一個線性時不變因果模型,然后通過該模型利用一個腦區f MRI時間序列的滯后信息獲取另一個腦區f MRI時間序列的估計值,并計算腦區fMRI 時間序列的估計值與實際值間的相關系數.由于相關系數反映了每對腦區間的相互預測能力,因此依據非對稱的相關系數可以判斷腦區間的因果效應,進而得到完整的腦效應連接網絡.實驗結果表明,該算法具有靈敏度高、魯棒性強的特點.與基于格蘭杰因果的識別方法相比,該方法的優勢在于:a)識別機理有所改進,該方法無需測量腦區間依賴關系的統計量,而是通過比較算法對腦區fMRI數據的預測準確性來識別因果關系,容易獲得更高的識別精度;b)該方法不依賴于平穩性假設,在腦區信號為非高斯分布的情況下仍能獲得良好的識別結果.

3)基于相空間重構的識別方法

基于相空間重構的識別方法是一種無監督的數據驅動方法,該方法利用腦區的時間序列數據重構奇異吸引子相空間,并通過研究其非線性動力學特征分析腦區間的因果效應.相空間重構方法主要包括兩類:延時坐標重構和導數重構.由于數值微分容易產生對誤差敏感的問題,因此通常采用延時坐標重構來識別效應連接.具體來說,首先假設每對腦區的fMRI時間序列由同一個確定性的非線性動力系統所決定,然后利用選取的嵌入維數和延遲時間重構兩個腦區時間序列的相空間矢量,最后依據相空間矢量識別腦區間的效應連接.

早在2002年,Quian等就提出了一種基于相空間重構來評估神經同步性的廣義同步(Generalized synchronization,GS)算法[101],該算法利用延遲坐標重構將腦區的時間序列數據映射為相空間矢量,并依據三個非線性獨立度量指標(Sd,Hd和Nd)來評估兩個腦區神經活動的相互依賴關系.GS算法可用于識別效應連接的方向,但有時三個度量指標所估計的方向存在不一致性.

2018年,Dsouza 等提出一種利用互連接分析(Mutual connectivity analysis,MCA)識別效應連接的算法[102].首先將每對腦區x和y的fMRI時間序列重構為相空間中d維的局部鄰域模型,然后使用腦區x的局部模型預測腦區y的當前時刻值,并通過預測值和真實值的相似性度量判斷x對y的預測能力,重復此過程,獲取y對x的預測值,最終通過對比每對腦區間交叉預測能力的強弱識別腦區間的因果效應.與GS算法相比,MCA不僅能更準確地識別連接方向,而且在數據樣本量不足時仍具有良好的性能,是一種精度高、適應性強的識別方法.

基于相空間重構的方法是一種識別腦區間非線性因果關系的可靠手段,但此類方法往往計算復雜度較高,且對數據噪聲敏感,因此使用此類方法需要注意以下2個方面的問題:1)由于高維動力系統的運動軌道往往最終收斂到相空間的低維吸引子上,并且時序數據中包含大量的冗余信息,因此合理地選擇嵌入維數和延遲時間對于提高識別方法的精度和效率十分重要;2)此類方法存在非線性系統對噪聲和初始條件敏感的固有缺陷,而構建魯棒性更強的平滑相空間將有望緩解此問題.

2.2.2 基于概率分布的識別方法

基于概率分布的識別方法是一類依據統計學的理論框架分析腦區間因果效應的方法,此類方法識別效應連接通常包括兩個步驟:1)針對每對腦區fMRI數據的相關信息進行概率統計以獲取腦區間的統計相關性;2)從獲得的概率分布規律中預測腦區間神經活動的因果效應.近年來,一些基于概率分布的方法已逐漸在識別腦效應連接網絡上發揮重要作用.

2006年,Patel等提出一種依據條件依賴關系度量每對腦區間效應連接的方法[103].該方法首先通過定義一個二進制值的列向量來表示每個腦區在一段采樣時間內的激活狀態,然后利用狄利克雷先驗分布的多項式似然函數為每對腦體素的聯合激活構建二元變量的伯努利貝葉斯模型,并計算不同聯合激活狀態下每對腦體素的聯合激活概率,最終通過由聯合激活概率所構成的度量指標κ和τ來評估每對腦區間的連接強度和連接方向.該方法對腦區連接方向的識別具有很高的準確性.

2013年,Hyv?rinen 等提出了一種基于LiNGAM算法的似然比來度量兩個非高斯變量間因果關系的方法[104],該方法首先度量每對腦區在兩個方向上的因果效應的累積量,然后通過累積量測度的一階近似似然比來識別腦區間的效應連接,是一種計算效率高且魯棒性強的識別方法.

2019年,Bielczy k等提出了一種通過腦區BOLD信號分布函數的分數矩識別效應連接的方法[105].該方法首先對每個腦區fMRI 時間序列進行標準化處理,并計算其m階原點矩,用于表示BOLD信號的多種不同分布情況(期望、方差和偏態等);然后計算這些BOLD分布的分數矩累積量,并根據每對腦區間不對稱的分數矩累積量識別腦區間的效應連接.該方法綜合考慮了BOLD信號多方面的信息,具有良好的魯棒性和準確性.

2019年,Lee 等提出一種基于Copula 模型來估計每對腦區間有向依賴關系的方法[106].該方法首先假設每對腦區變量服從[0,1]上的均勻分布,然后利用這兩個腦區變量的邊緣分布和聯合分布構建Copula模型,再分別通過一個腦區變量的邊緣分布獲取另一個腦區變量的邊緣分布的條件期望值,并計算邊緣分布的期望值與實際值的方差比,由于該比值刻畫了一個腦區對另一個腦區的預測能力,因此依據每對腦區相互預測能力的強弱可以估計腦區間的因果效應.因為Copula模型對邊緣分布的選擇不受限制,并且能夠測量腦區間的單調非線性相依關系,所以該方法是一種靈活、穩健地度量腦區間非線性因果關系的可靠方法.

上述內容對效應連接網絡的識別方法進行了較詳細的分類和介紹,并對一些代表性方法做了具體說明.為了能夠更好地幫助讀者理解和使用這些方法,我們從多個方面對各類方法中的部分典型方法進行了對比和總結,如表1所示.

3 腦效應連接網絡識別面臨的挑戰

在腦科學研究中準確地識別腦效應連接網絡,不僅有利于研究者探究人腦的功能整合規律,而且能為腦疾病的診斷以及病理研究提供重要的依據.

例如,在腦功能預測方面,如果發現人體的某些行為模式、情感認知與人腦的某些特定腦區的功能活動密切相關,那么可以對這些腦區的功能進行合理地預測;在腦疾病的診斷和治療方面,如果能夠及時、準確地發現人腦效應連接模式的異常,就有可能為腦疾病的早期診斷提供一些新線索,并為腦疾病的臨床治療和藥物研發提供有力的幫助.

表1 人腦效應連接網絡的部分典型識別方法對比Table 1 The comparisons of several typical identification methods on human brain effective connectivity networks

正是由于腦效應連接網絡識別在腦科學研究中具有重要的應用價值,所以利用機器學習、數據挖掘中的一些理論和方法識別腦效應連接網絡已成為腦信息學中一項重要的研究內容,并取得了許多豐碩的成果.但是隨著研究的深入,一些極具挑戰性的問題被凸顯出來:

1)fMRI 數據的局限性問題:功能磁共振成像以其無創性、易重復、實驗范式靈活、時空信息豐富等優勢,已逐漸成為探究人腦功能復雜性和腦疾病診斷的一個重要手段.然而,目前基于fMRI數據識別腦效應連接網絡仍存在一定的局限性:首先,由于fMRI 數據具有高維特性,因此直接從全腦體素的時間序列中識別效應連接網絡十分困難;其次,在采集腦疾病患者的數據時,通常由于被試的配合度低難以保證所采集數據的完整性,導致實際可用于識別腦效應連接網絡的fMRI數據樣本量缺乏;再次,所采集的fMRI 數據通常包含較多的噪聲,盡管預處理能在一定程度上消除噪聲影響,但處理后的數據仍包含一些無法避免的干擾因素,造成fMRI數據的信噪比較低,影響了識別結果的準確性;最后,由于fMRI 數據的時間分辨率較低,導致基于時間滯后的方法容易識別到虛假連接,因此如何針對維度高、樣本量少、噪聲多、時間分辨率較低的fMRI數據,設計更有效的識別方法來克服fMRI數據的局限性是一個極具挑戰性的研究問題.

2)腦效應連接網絡的識別精度問題:在腦效應連接網絡中,三個腦區x,y和z所構成的因果結構通常分為3種:a)鏈式結構(x→y →z):x與y之間存在效應連接,并且y與z之間也存在效應連接;b)v 型結構(x→z ←y):x和y均與z之間存在效應連接;c)同父結構(x←z →y):z分別與x和y之間存在效應連接.由于這三種因果結構具有馬爾科夫等價性,因此已有的大多數識別方法難以對其進行準確的區分,導致所識別的腦效應連接網絡極易包含錯誤的連接.此外,在鏈式結構和v 型結構中,兩個不相鄰腦區之間的因果效應通常因受第三個腦區的影響而包含間接的因果效應.因此,如何準確地識別因果結構并消除混淆變量的不良影響是識別高精度的腦效應連接網絡的另一挑戰性問題.

3)識別方法的實際應用問題:腦效應連接網絡識別方法的發展不僅要有豐富而合理的理論作為支撐,還應該在腦認知和疾病診斷的實際應用中發揮作用.目前,大部分的研究思路是首先基于仿真數據集來驗證方法的有效性,再利用真實數據集探究方法的實用性.雖然這在一定程度上能夠挖掘方法的實用價值,但距離真正的實際應用仍存在較大差距.其面臨的主要挑戰在于真實的fMRI 數據集往往缺乏統一的衡量標準,難以對所識別的效應連接網絡的可靠性進行評價.因此,如何為識別方法構建科學的評價標準或者從腦認知和工作機制的角度對識別結果進行更具解釋性的分析是值得研究者們思考的問題.

4 未來的發展方向

面對上述挑戰,結合腦科學的發展趨勢和實際需求,以下幾個方面的研究將是該領域今后重要的發展方向.

1)多模態腦影像信息融合的識別方法將是一個前沿熱點:迄今為止,常見的腦影像數據除fMRI以外,還包括DTI、MRI、PET和EEG等.由于每一種腦影像數據僅從一個方面反映了大腦的某種特性,因此多模態腦影像信息融合的識別方法能充分利用大腦的時空信息,發揮各模態數據的優勢,有效地緩解fMRI數據樣本量不足、時間分辨率較低等問題,從而更加準確、高效地識別腦效應連接網絡.目前已有一些研究利用多模態腦影像信息融合的方法來識別效應連接網絡,取得了不錯的效果.冀俊忠等設計了一種融合fMRI和DTI數據的腦效應連接網絡蟻群學習算法[79],該算法利用結構信息來壓縮蟻群搜索的空間,并從fMRI數據中提取的體素聯合激活信息對蟻群尋優的啟發函數進行修正,在識別效應連接的準確性和效率上均獲得了良好的性能.Chiang 等提出了一種通過融合f MRI和MRI數據的貝葉斯矢量自回歸模型識別效應連接網絡的方法[107],該方法能準確地識別個體水平和組水平的腦效應連接網絡.Riedl 等給出了一種基于代謝連接映射(Metabolic connectivity mapping,MCM)識別效應連接的方法[20],該方法首先利用fMRI數據構建視覺活動相關腦區的功能連接網絡,然后通過PET數據獲取局部能量代謝信息來識別功能連接網絡中的信息流向.Anwar 等分別利用fNIRS、fMRI 和EEG數據對手指運動過程中皮層感覺運動網絡進行格蘭杰因果分析[108],并通過分析基于三種模態腦影像數據的識別結果來估計該網絡的效應連接.這些多模態腦影像信息融合的識別方法的研究成果已經顯現出一定的優勢,但尚處于初步探索階段.隨著腦科學研究的進一步深入,人們獲取的人腦的數據來源將越來越豐富,利用先進的計算機理論和技術進行多源信息融合,設計新穎、高效且準確的識別方法將是該領域未來追求的研究目標.

2)新型的高精度腦效應連接網絡識別方法將層出不窮:識別準確可靠的腦效應連接網絡對于探究人腦的功能活動規律、揭示腦疾病的生理病理機制具十分重要意義.為此,基于機器學習的新探索將日益豐富:

a)基于群智能優化的腦效應連接網絡識別方法:研究魯棒性更強的識別方法將是克服不良數據影響,獲取高質量腦效應連接網絡的關鍵.群智能算法是一類基于簡單個體相互作用時涌現的整體智能行為而提出的元啟發搜索方法.其特點是在求解各種組合優化問題時,通過模擬社會型生物(如蜜蜂、螞蟻、鳥、魚等)群體間的協作行為來有效獲取問題的近似最優解.此類算法具有天然的自組織、自適應的隨機搜索機制,能夠在候選空間中進行全局搜索,即使在噪聲較多等不良環境下仍具有全局收斂的魯棒性.同時,群智能算法固有的并行機制使其具有高效搜索的能力,能夠較快地獲得全局最優解.因此基于群智能優化算法識別腦效應連接網絡,有可能在識別精度和效率上均獲得良好的性能.2019年,紀子龍等提出一種帶有繁殖機制的腦效應連接網絡螢火蟲學習方法(Firefly algorithm with reproductive mechanism for learning brain effective connectivity network,FAR-EC)[109],該方法使用K2評分作為目標函數來衡量螢火蟲個體的絕對亮度,通過螢火蟲種群的迭代尋優和繁殖機制搜索最佳的腦效應連接網絡結構,為識別高質量的腦效應連接網絡提供了一個很好的范例,但該方法存在參數多、時間復雜度高等缺陷.為了克服這些不足,他們隨后又提出一種基于雙螢火蟲種群并行搜索的腦效應連接網絡學習方法(Parallel searching of double firefly populations for learning brain effective connectivity network,DFA-EC)[110],該方法首先將螢火蟲種群劃分為精英種群和普通種群,然后通過精英種群的定向移動和普通種群的隨機移動分別逐步識別腦效應連接網絡,再利用遷移操作動態地調整精英種群和普通種群的規模,以實現兩個種群之間的信息交流.在經過一定代數的尋優后,使用基于多樣性度量的種群自適應更新機制對兩個種群進行更新,最終學習到最佳的腦效應連接網絡.相較于FAR-EC,DFA-EC在識別精度和效率上均得到了顯著提高.這些基于群智能優化算法識別腦效應連接網絡的成功范例為識別方法的發展提供了新思路.但此類方法的研究和應用尚未形成更大的規模,在今后的研究中,如何利用群智能優化增強大規模腦效應連接網絡的求解精度和效率將是值得嘗試的研究方向.

b)基于深度學習的腦效應連接網絡識別方法:隨著深度學習的蓬勃發展及其在自然語言處理、圖像和語音識別等諸多領域獲得的巨大成功,該項技術已成為近年來最受矚目的技術熱點之一.目前,深度學習的主要模型包括卷積神經網絡、遞歸神經網絡、長短時記憶網絡和生成式對抗網絡等,還有一些蓄勢待發的基于深度學習與其他方法相結合的混合學習方法正在引領前沿,如深度強化學習、深度森林和深度貝葉斯網絡學習等.最近一些新的研究嘗試利用基于深度學習的方法識別數據間的因果關系,并獲得了不錯的效果.2018年,Goudet等提出一種通過因果生成式神經網絡(Causal generative neural networks,CGNNs)從觀測數據中學習功能因果模型的方法[111],該方法利用深度生成模型的表征學習能力,同時考慮了數據的條件獨立性和分布的不對稱性,能夠準確地識別數據間的因果結構.他們隨后又設計了一種基于對抗生成式網絡識別數據間因果關系的SAM(Structural agnostic model)[112]算法,該算法不僅能有效地消除混淆變量的影響,而且在噪聲較多等不良條件下仍具有很強的魯棒性.2019年,Njah等利用深度貝葉斯網絡學習算法來預測大規模數據集中的因果關系[113],在可解釋性和魯棒性上均獲得了良好的效果.同年,Dasgupta 等通過元強化學習訓練了一個遞歸網絡模型,將端到端學習與歸納推理相結合來識別數據間的因果結構,是一種準確、高效的因果推理方法[114].這些深度學習技術在因果網絡識別中的良好表現為腦效應連接網絡識別方法的發展開辟了新思路,我們相信基于深度學習方法識別效應連接網絡將成為未來發展的必然趨勢.

c)針對fMRI數據時序特性的識別方法將引起人們的廣泛關注:獲悉腦效應連接網絡的動態變化以及滯后信息對當前腦效應連接網絡的影響,對于理解人腦的功能整合和腦疾病的發病機制具有十分重要的實際意義.然而,目前大部分的識別方法是將每個腦區在一段采樣時間內的fMRI 數據作為向量來分析腦區間的因果關系,并未針對fMRI數據的時序特性進行深入的研究.盡管基于格蘭杰因果和基于動態貝葉斯網絡評分搜索的識別方法考慮了fMRI 數據的時序特性,但它們在腦效應連接網絡的識別上均存在一定的不足.所以,針對fMRI 數據的時序特性,結合新型的機器學習技術,設計新穎、準確且高效的識別方法將是今后該領域的一個重要研究方向.

d)腦效應連接網絡的可解釋性研究將引起人們的足夠重視:在目前識別腦效應連接網絡的方法中,僅有基于動態因果模型的方法在識別機理中融合了生理學模型,它利用一個血液動力學模型,將腦區神經生理學響應信號映射為BOLD響應信號,再通過模型反演來估計腦區間的效應連接.然而此類方法受到先驗知識的制約,故其靈活性較差;而其他的識別方法雖然在識別精度和效率等方面各具優勢,但它們均未將生理學的相關信息融合到識別機理中,故導致所識別的腦效應連接網絡缺乏生理學的可解釋性.目前,盡管已有一些研究在識別方法中引入了血液動力學模型[56,115],但這些方法的研究和應用仍處于初步階段.因此,為了增強識別結果的可解釋性,使所識別的腦效應連接網絡能更真實地反映人腦的神經活動規律,更方便地應用于臨床的腦疾病診斷,融合生理學模型的識別方法將有望成為該領域中新的研究熱點.

5 總結

腦效應連接網絡是人腦連接組研究中的一項重要的研究課題,識別腦效應連接網絡已成為評價腦功能及其與神經退化疾病相關損傷的一種有效手段.本文首先系統地闡述了腦效應連接網絡的識別過程,然后全面地分析和總結了腦效應連接網絡的識別方法,最后深入地剖析了腦效應連接網絡識別的挑戰性問題,并對該領域未來的研究方向做了展望.總之,腦效應連接網絡識別方法的創新與進步具有十分重要的理論意義和應用前景,一方面將推動腦認知和臨床腦疾病診斷的發展;另一方面將為腦科學與人工智能的協同發展帶來光明前景.

猜你喜歡
效應方法模型
一半模型
鈾對大型溞的急性毒性效應
懶馬效應
今日農業(2020年19期)2020-12-14 14:16:52
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
應變效應及其應用
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
主站蜘蛛池模板: 高清不卡一区二区三区香蕉| 亚洲最大综合网| 激情无码字幕综合| 精品国产电影久久九九| 亚洲精品成人片在线观看| 青青草久久伊人| 久草视频中文| 一级爆乳无码av| 国产成人91精品免费网址在线| 中文国产成人精品久久| 国产剧情国内精品原创| 日本免费一区视频| 青青青国产在线播放| 中文字幕在线一区二区在线| 欧洲欧美人成免费全部视频| 国产永久在线观看| 97超级碰碰碰碰精品| 99er这里只有精品| 亚洲精品无码久久毛片波多野吉| 亚洲视频一区| 欧美日韩精品综合在线一区| 99久久精彩视频| 538国产视频| 国产拍在线| 丁香六月激情综合| 一区二区自拍| 91无码视频在线观看| 欧美成人免费| 国产女人喷水视频| 成人小视频网| 亚洲系列中文字幕一区二区| 日本高清在线看免费观看| 国产成人综合在线视频| 2022精品国偷自产免费观看| 国产人妖视频一区在线观看| 亚洲精品大秀视频| 国产日韩欧美中文| 国产丝袜一区二区三区视频免下载| 超碰免费91| 国产亚洲精品精品精品| 国产91透明丝袜美腿在线| 99国产在线视频| 五月天丁香婷婷综合久久| 直接黄91麻豆网站| 中国一级特黄视频| 综合人妻久久一区二区精品 | 久久精品中文字幕少妇| 性激烈欧美三级在线播放| 性网站在线观看| 欧美伊人色综合久久天天| 91免费片| 亚洲天堂高清| 久久精品国产电影| 欧美成人免费午夜全| 小说 亚洲 无码 精品| 高清无码手机在线观看| 欧美a在线视频| 一级毛片免费播放视频| 真实国产精品vr专区| 久久综合伊人 六十路| 在线观看国产精美视频| 在线不卡免费视频| 国产精品永久久久久| 国产剧情一区二区| 综合天天色| 91精品久久久无码中文字幕vr| 亚洲国产AV无码综合原创| 日本午夜网站| 中文字幕日韩视频欧美一区| 亚洲成人一区二区| 国产91高清视频| 国产一区二区三区在线观看免费| 国产精品综合久久久| 人妻丰满熟妇AV无码区| 手机成人午夜在线视频| 国产精品免费久久久久影院无码| 九九视频免费在线观看| 在线播放真实国产乱子伦| 久久亚洲国产最新网站| 亚洲无线观看| 国产精品30p| 久久一级电影|