李舒婷,李 瑤,王昕璨,趙云芃,陳俊杰
(太原理工大學 a.信息與計算機學院,b.藝術學院,太原 030024)
復雜腦網(wǎng)絡的分析與研究是近幾年來神經(jīng)精神疾病領域的研究熱點。作為復雜網(wǎng)絡理論在神經(jīng)認知科學的具體應用,復雜腦網(wǎng)絡在了解有關神經(jīng)精神疾病的發(fā)病機理方面起到了很重要的作用,也為相關影像學標志物以及腦疾病臨床的診斷和評價貢獻了潛在價值和新的方法。
盡管目前復雜腦網(wǎng)絡領域的研究受到眾多學者廣泛關注,但是由于網(wǎng)絡分析技術的不成熟、特征選擇及分類模型構建方法的多樣性等,這一領域仍然存在著諸多亟待解決的問題。比如,傳統(tǒng)復雜網(wǎng)絡分析方法在不同組間進行對比的標準化問題[1]。標準化指的是網(wǎng)絡的規(guī)模,包括網(wǎng)絡大小(即節(jié)點的數(shù)目)、網(wǎng)絡稀疏度(即存在連接的占比)以及平均度(即每個節(jié)點的連接數(shù))等。需要注意的是,目前該領域內(nèi)對復雜腦網(wǎng)絡的稀疏度尚未形成統(tǒng)一的結論。基于此,有研究人員提出利用最小生成樹(minimum spanning tree,MST)方法來進行全腦范圍的復雜腦網(wǎng)絡的構建[2-3]。這一無偏方法可以在保證所有節(jié)點均連入網(wǎng)絡的前提下,網(wǎng)絡中的邊被最大化的精簡,網(wǎng)絡結構得到極大的簡化,而網(wǎng)絡核心框架仍可以被保留。因此,最小生成樹網(wǎng)絡在保證網(wǎng)絡連接的同時,盡可能地保持較高的連接強度。通過這一方法,在一定程度上解決了網(wǎng)絡稀疏度等因素配置對網(wǎng)絡結構的影響,已被廣泛應用于腦疾病的研究中。
然而,在全腦構建MST的方法仍存在一些局限。在這一方法中,不考慮所有的連接以防止聚類,從而獲得固定的網(wǎng)絡大小和密度,以使網(wǎng)絡可以比較。因此,MST可能低估了其他有趣信息的重要性,如低權重連接、腦網(wǎng)絡中的聚類信息處理和組間差異表示等[4]。由于最小生成樹對全腦網(wǎng)絡的過度簡化,使用局部可量化指標表達信息較少,進而導致組間差異表達能力降低。研究表明,僅采用最小生成樹網(wǎng)絡特征來進行分類研究,較其他網(wǎng)絡特征而言,其分類準確率明顯偏低[5]。
本文提出了一種在局部差異網(wǎng)絡的基礎上構建最小生成樹功能腦網(wǎng)絡進行特征提取的新方法,可最大程度實現(xiàn)組間差異表征,且能提供更有效的分類特征,以服務分類研究。該方法通過對抑郁組和正常組的腦網(wǎng)絡進行組間基于網(wǎng)絡的統(tǒng)計(network-based statistic,NBS),尋找組間功能連接強度有明顯區(qū)別的連接以連接涉及的大腦區(qū)域;再分別構建以每個腦區(qū)及其差異連接涉及的腦區(qū)為節(jié)點的功能連接子網(wǎng);在此基礎上,對每個子網(wǎng)進行最小生成樹功能連接網(wǎng)絡的構建,進行進一步的分析研究。
本文研究框架如圖1所示。首先采集數(shù)據(jù)并進行預處理,其次利用Pearson相關構建低序功能連接網(wǎng)絡,在此基礎上利用NBS找到差異連接,并分別構建局部差異網(wǎng)絡,接下來采用Kruskal算法構建局部差異最小生成樹腦網(wǎng)絡,進行局部指標的計算并提取特征,最后構建分類器驗證分類結果。

圖1 本文的研究框架Fig.1 Research framework of this paper
本研究的受試者由山西醫(yī)科大學第一醫(yī)院招募,共70名。在后續(xù)的實驗數(shù)據(jù)處理過程中發(fā)現(xiàn),有4例受試者的數(shù)據(jù)不符合要求,因此,本文只對其余66名受試者的數(shù)據(jù)進行研究。其中,38名是首次發(fā)病且未服用任何藥物的重性抑郁癥患者;另外28名是健康志愿者,作為本實驗的對照組。在進行掃描前,研究人員與所有被掃描者通過書面方式達成一致意見(抑郁癥患者與其家屬簽訂協(xié)議,對照組志愿者與本人簽訂協(xié)議)。患病嚴重程度由24項Hamilton Rating Scale for Depression(HAMD)以及Clinical Global Impression of Severity(CGI-S)來表征。具體如表1所示,其中,數(shù)據(jù)范圍是最小值-最大值(平均值±標準差)。其中,a表示雙樣本雙尾T檢驗,b為雙尾皮爾遜卡方檢驗。

表1 被試人員基本信息Table 1 Demographics and clinical characteristics of the subjects
本實驗使用的數(shù)據(jù)均是由山西醫(yī)科大學第一醫(yī)院的放射科專業(yè)磁共振醫(yī)師采集。使用的是德國西門子磁共振設備(siemens trio 3-tesla scanner,siemens,erlangen,germany)。受試者在掃描期間,研究人員用海綿固定其頭部,以防止來回晃動。受試者需保持身心的放松,閉目,處于一種不去想特定的事情但又不能進入睡眠的狀態(tài)。掃描參數(shù)設置為:回波時間(Echo Time)30 ms,射頻重復時間(Repetition Time)2 000 ms,層厚(Slice Thickness)4 mm, 層間間隔0,視野范圍(Field of View)192 mm×192 mm,翻轉(zhuǎn)角90°,存儲矩陣64×64.實驗共采集了248個時間點。此外,由于磁化的穩(wěn)定性,磁共振掃描數(shù)據(jù)的時間序列的前十項被拋棄。
本次研究的受試者磁共振成像數(shù)據(jù)利用SPM8(statistical parametric mapping)軟件做預處理。在對數(shù)據(jù)整體做頭動校正和時間片校正時,抑郁組(major depressive disorder,MDD)有2例受試者的數(shù)據(jù)、正常組(normal control,NC)有2例受試者的數(shù)據(jù)因為其頭部運動大于3 mm或者其頭部轉(zhuǎn)動幅度大于3°,在校正過程中被舍棄。本文的66例實驗數(shù)據(jù)不包含此4例數(shù)據(jù)。通過12維仿射變換,使校正后的圖像得到進一步優(yōu)化,然后將其標準化到3 mm體素的MNI(montreal neurological institute)標準模板上。最后,用線性下降和0.01~0.10 Hz帶通濾波縮小高頻生物干擾以及低頻漂移對實驗的影響。
本文利用MNI機構的標準腦解剖圖AAL(anatomical automatic labeling)模板將大腦劃分成90個腦部區(qū)域(左右半球?qū)ΨQ,各包含45個區(qū)域)。腦網(wǎng)絡中的每個節(jié)點用所劃分的大腦區(qū)域來表示[6],節(jié)點值是每個腦區(qū)中全部體素的算術平均值。
在本研究中,Pearson相關系數(shù)代表腦網(wǎng)絡的邊。掃描過程中會產(chǎn)生一定的頭部移動的偽差異,腦脊液還有白質(zhì)信號的噪聲,通過用多元線性回歸的方法減小其對實驗的影響。通過Pearson相關,對殘差進行計算,就得到了任兩節(jié)點間平均時間序列的相關系數(shù)γij,生成一個90×90的相關矩陣。數(shù)學定義為:
(1)

本文使用NBS方法識別MDD和NC之間功能連接強度存在顯著組間差異的連接及涉及到的腦區(qū)[7]。主要的步驟如下:
1) 對Pearson相關矩陣應用Fisher r-z轉(zhuǎn)換,求Z-score矩陣,提升相關性系數(shù)的正態(tài)性;
2) 采用多元線性回歸方法對Z-score進行年齡和性別混雜因子的校正;
3) 在MDD和NC的Z-score矩陣之間進行NBS.
本文將模板中的90個腦區(qū)分別作為90個ROI(Region of Interest),以每個ROI及其與之相關的差異連接涉及到的腦區(qū)為節(jié)點,構建功能連接子網(wǎng),局部差異網(wǎng)絡構建完成。
神經(jīng)精神腦疾病研究中,Kruskal算法常用于腦網(wǎng)絡最小生成樹的構建[8-9]。本文使用Kruskal算法[10]進行局部差異最小生成樹腦網(wǎng)絡LDN-MST(minimum spanning tree based on local difference network)的構建。詳細過程:第一步,將皮爾遜相關矩陣里所有的邊按照權重值大小從大到小依次排列;第二步,連續(xù)向網(wǎng)絡加入權重最大的邊。其中,如果加入邊后有環(huán)出現(xiàn),那么就把加入的這個邊丟棄;當所有的邊都被放入到網(wǎng)絡中時, Kruskal算法構建過程就結束了。最后,MDD組和NC組的LDN-MST構建完成。
構建完成局部差異最小生成樹腦網(wǎng)絡后,要進行網(wǎng)絡屬性值計算和網(wǎng)絡拓撲結構的對比。經(jīng)過相關文獻的查閱和大量的試驗分析,介數(shù)中心度、度、離心率,以及樹層次、葉子分數(shù)、直徑和平均離心率分別是本文最后選用的3個局部屬性和4個全局屬性。
此外,為了判斷混雜因子(年齡、教育程度、性別)對最小生成樹4個全局屬性的影響,本文通過多元線性回歸方法進行分析。分析表明,混雜因子與局部差異最小生成樹腦網(wǎng)絡的平均離心率、樹層次、葉子分數(shù)、直徑等4個屬性之間沒有顯著相關性。
為了對MDD組和NC組局部差異最小生成樹網(wǎng)絡的3個局部指標進行統(tǒng)計分析,本次研究采用Kolmogorov-Smirnov非參數(shù)置換檢驗檢測組間存在顯著差異的大腦區(qū)域。同時,利用該檢驗對網(wǎng)絡的直徑、葉子分數(shù)、樹層次和平均離心率4個全局屬性進行分析,并對NC組和MDD組的網(wǎng)絡拓撲結構進行比較。
本文使用Benjamini-Hochberg假陽性率法(q=0.05)對結果進行校正。FDR(False Discovery Rate)方法適用于樣本量相對小的比較結果的校正,因為總Ⅰ型出錯率可以較好地在多重比較中被控制。
本文利用機器學習構造分類器。被人們廣為使用的分類器多種多樣,如決策樹、支持向量機等,根據(jù)不同的情境選擇合適的分類算法。支持向量機(support vector machine,SVM)這一分類算法比較適合且經(jīng)常被用于對數(shù)據(jù)量小的樣本的處理[11]。根據(jù)功能磁共振數(shù)據(jù)的自有特征,本文選用SVM進行分類研究,通過徑向基核函數(shù)進行分類模型的構建,使用留一交叉驗證來度量分類器的泛化能力。具體而言,假設總樣本數(shù)為N,每一次都從總樣本中拿出其中的一個樣本作為測試集,那么除此之外的N-1個樣本就成為訓練集。按這樣的規(guī)則,確保每個樣本都可以做一次測試樣本,這樣將會產(chǎn)生N個分類器并通過計算得出N個測試結果,最后N個結果取平均值來衡量分類器模型的性能。
本文用正確率、靈敏度、特異度和AUC值這4個最常被使用的度量指標作為標準。其中,正確率是樣本中被正確分類的樣本數(shù)除以樣本總數(shù)所得的商;敏感度體現(xiàn)的是正例被正確分為正例的樣本數(shù)與全部正例數(shù)之比,可以衡量出分類器對正例的辨別能力;特異度體現(xiàn)的是負例被正確分類為負例的樣本數(shù)與全部負例數(shù)之比,能夠衡量出分類器對負例的辨別能力。
如圖2所示,通過基于網(wǎng)絡的統(tǒng)計我們發(fā)現(xiàn)了MDD與NC存在有明顯組間差異的連接(P<0.05,F(xiàn)DR校正)。具體的,有28個ROI與其余腦區(qū)間的連接無顯著組差異;有26個ROI與其余腦區(qū)間存在顯著組間差異的連接數(shù)為1條;有11個ROI存在顯著組間差異的連接數(shù)為2條;其余25個ROI存在顯著組間差異的連接數(shù)大于等于3條。表2列舉了差異連接條數(shù)大于等于3的腦區(qū)及其具體差異連接條數(shù)。

圖2 差異連接及腦區(qū)Fig.2 Differential connection and brain area
本文將差異連接條數(shù)大于等于3的ROI和其差異連接涉及腦區(qū)共同作為局部差異網(wǎng)絡的節(jié)點來構建局部差異網(wǎng)絡,并且在其基礎上構建了最小生成樹功能連接子網(wǎng)絡,最后一共構建了25個功能連接子網(wǎng)。
本文通過Kolmogorov-Smirnov非參數(shù)置換檢驗,對平均離心率、樹層次、葉子分數(shù)、直徑4個指標進行了分析,辨別NC組與MDD局部差異最小生成腦網(wǎng)絡的拓撲差異(P<0.05,F(xiàn)DR校正)。其中,25個子網(wǎng)中只有6個ROI形成的子網(wǎng)其指標有顯著性差異,且差異只出現(xiàn)在平均離心率和直徑這兩個指標上。抑郁組的平均離心率和直徑均比對照組低。

表2 腦區(qū)及其差異連接數(shù)量Table 2 Brain regions and the number of different connections
全局屬性檢驗結果如圖3所示。圖中為,以(a)左側(cè)中央前回、(b)左側(cè)中央溝蓋、(c)右側(cè)楔葉、(d)左側(cè)豆狀殼核、(e)左側(cè)顳上回以及(f)左側(cè)內(nèi)側(cè)和旁扣帶腦回為ROI網(wǎng)絡的直徑與平均離心率的結果。其中,每幅圖中左側(cè)為直徑的結果,右側(cè)為平均離心率的結果;圖(f)中,左側(cè)內(nèi)側(cè)和旁扣帶腦回為ROI的局部差異最小生成樹網(wǎng)絡中,只有在平均離心率這一指標上存在明顯組差異。
對每個受試者,計算了局部差異最小生成樹腦網(wǎng)絡的離心率、介數(shù)、度,并且使用Kolmogorov-Smirnov檢驗來分析計算的指標。選擇MDD組與NC組之間有特別明顯差異的腦區(qū)作為分類特征進行之后的實驗。
如圖4所示,這些大腦區(qū)域的局部屬性都有明顯的組差異(P<0.05,F(xiàn)DR校正)。
本文使用留一交叉驗證法(leave-one-out cross validation,LOOCV)度量分類器模型的泛化能力。評價分類器性能的指標很多,本文用準確性(Accu-racy)、靈敏度(Sensitivity)、特異性(Specificity)以及AUC(area under curve)這幾個最常被使用的指標作為度量標準。

圖3 全局屬性結果Fig.3 Results of global properties

圖4 局部屬性結果Fig.4 Results of local properties
其中,選取作為分類的腦區(qū)特征是MDD和NC每組子網(wǎng)中的離心率、度、介數(shù)中心度3個局部屬性中組間差異非常明顯的總共24個特征,用來進行之后的分類,具體見表3所示。
在表4中,SACCHET et al[12]和ERGUZEL et al[13]通過全局指標進行分類;GUO et al[14]采用的分類特征是3個局部指標:節(jié)點效率、度、介數(shù);WEE et al[15]的分類特征是局部聚類系數(shù);GUO et al[5]在全腦構建最小生成樹網(wǎng)絡時,利用局部指標進行分類。前面所提到的分類是按腦區(qū)的相關信息進行的,多個腦區(qū)之間的拓撲信息受到損失。本文所提方法能保證一定的組間差異表征能力,能獲得更多的組間信息,彌補在全腦上用最小生成樹構建網(wǎng)絡的不足,特征的有效性和分類的準確率得到進一步的提升,最高分類準確率可達83.3%.
本文提出的局部差異最小生成樹腦網(wǎng)絡分類方法在真實的抑郁癥患者數(shù)據(jù)集上得到驗證,且實驗結果與實際情況相符,證明了其可行性。與傳統(tǒng)分類方法相比,在進行抑郁癥分類時采用局部差異最小生成樹腦網(wǎng)絡分類方法可顯著提升準確率,證明該方法可以應用到抑郁癥的輔助診斷中。

表3 局部指標異常腦區(qū)及其顯著性Table 3 Abnormal brain area of local properties and its significance

表4 不同研究的分類結果對比Table 4 Comparison of classification results of different studies