999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Di-LSTM 算法的注意力缺陷多動障礙癥分類

2022-02-27 03:27:10張淼陳宏濤
電子設(shè)計工程 2022年4期
關(guān)鍵詞:分類方法模型

張淼,陳宏濤

(太原理工大學(xué)信息與計算機學(xué)院,山西晉中 030600)

ADHD[1]是一種以多動、注意力不集中和行為沖動為特點的精神障礙,在兒童和青少年中常被診斷出來,并且最近有記錄證明其可能會持續(xù)到成年期,這種疾病在男孩中更為普遍。通常,ADHD 的診斷是基于使用不同版本的精神疾病診斷和統(tǒng)計手冊(Diagnostic and Statistical Manual of mental disorders,DSM)或國際疾病分類(International Classification of Diseases,ICD)的標準進行的,由于診斷是通過教師、家長和行為科學(xué)家進行的主觀觀察來完成的,因此尋找有助于診斷ADHD 的定量技術(shù)已經(jīng)引起人們的關(guān)注。

近些年來,靜息態(tài)功能磁共振成像(resting statefunctional Magnetic Resonance Image,rs-fMRI)因其無創(chuàng)、無輻射、時空分辨率高且不需要被試完成復(fù)雜的任務(wù),已經(jīng)被廣泛地用于精神疾病的研究[2]。已有許多在fMRI 上使用機器學(xué)習(xí)來研究ADHD,杜海鵬等人[3]提出一種基于多目標支持向量機的分類模型,經(jīng)過對比,其準確率顯著提高,達到了75.3%。但是由于傳統(tǒng)的機器學(xué)習(xí)模型大多是淺層模型,對于高維fMRI 數(shù)據(jù)的擬合效果并不理想,并且大多需要人工進行特征選擇,一些相關(guān)性較弱的體素會被忽視。所以,深度學(xué)習(xí)逐漸被引入相關(guān)研究,2017 年毛振宇、蘇怡等人[4]基于靜息態(tài)fMRI 數(shù)據(jù),提出了一種基于4-D CNN 的深度學(xué)習(xí)模型用于ADHD 的分類,得到實驗結(jié)果準確率為71.3%,AUC 為0.8;2020 年張濤、李存波等人[5]通過將分離通道卷積神經(jīng)網(wǎng)絡(luò)(SC-CNN)與基于注意力的網(wǎng)絡(luò)(SC-CNN-attention)相結(jié)合,提出了一種新的兩階段網(wǎng)絡(luò)結(jié)構(gòu),以大規(guī)模區(qū)分ADHD 和健康控制多站點數(shù)據(jù)庫,分類結(jié)果為68.6%。

“深度空間”的卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)和“時間深度”的遞歸神經(jīng)網(wǎng)絡(luò)(Recursive Neural Network,RNN)是兩個經(jīng)典的深度學(xué)習(xí)分支。RNN 模型(例如長短期記憶(Long Short Term Memory,LSTM)[6])和門控循環(huán)單元(Gated Recurrent Unit,GRU[7])已被大量用于精神疾病的識別與分類,例如使用fMRI 識別孤獨癥譜系障礙[8]和阿茲海默癥[9]等。

文中提出了將字典學(xué)習(xí)和長短期記憶網(wǎng)絡(luò)相結(jié)合的方法對rs-fMRI 數(shù)據(jù)進行處理,最終用來預(yù)測ADHD 患者和正常人。

1 材料和方法

ICA(Independent Component Algorithm)由于其可以很好地處理稀疏分量[10]被廣泛應(yīng)用于rs-fMRI 數(shù)據(jù)的處理,但是由于其具有一定的限制和局限性。字典學(xué)習(xí)算法有著更為稀疏的表示,因此受到學(xué)者們的重視[11]。

首先利用ADHD 和正常被試數(shù)據(jù)相結(jié)合,基于FastICA 初始化的在線字典學(xué)習(xí)獲取ROI 時間序列,結(jié)合LSTM 對于序列類數(shù)據(jù)處理的優(yōu)勢,再將獲得的時間序列輸入提出的LSTM 模型中進行訓(xùn)練,然后進行預(yù)測。實驗流程如圖1 所示。

圖1 實驗流程

1.1 在線字典學(xué)習(xí)

在線字典學(xué)習(xí)算法可以在線解決字典學(xué)習(xí)矩陣分解問題,通過求解式(1)找到用于近似數(shù)據(jù)矩陣的最佳字典和相應(yīng)的稀疏編碼。

式中,V是字典,U是稀疏編碼,Z是數(shù)據(jù)矩陣,α為正則化參數(shù)。顯然,式(1)的第一項是希望很好地重構(gòu)Z,第二項則是希望U盡量稀疏,k為字典V的行索引。

在線字典學(xué)習(xí)需要獲得稀疏編碼和學(xué)習(xí)字典矩陣,文中采用交替優(yōu)化的策略來求解式(1),包括稀疏編碼和更新字典兩個階段,其中,利用最小角度回歸法來解決Lasso 問題,迭代次數(shù)設(shè)為100,批量大小為η(值為3),通過批量處理可以加快算法的收斂速度。在在線字典學(xué)習(xí)開始之前,已經(jīng)通FastICA 結(jié)合嶺回歸獲得了字典初始化矩陣,以此來初始化式(1)中的V。在之后的每次迭代順序循環(huán)選擇3 行數(shù)據(jù)進行計算。

1)稀疏編碼與更新輔助變量

創(chuàng)建矩陣A以及矩陣B來保存輔助變量(零矩陣),方便后續(xù)的迭代更新。Ut的計算如式(3)所示:

式(3)中,t為第幾次迭代,k即為設(shè)定的成分數(shù)目,每次迭代過程都選擇數(shù)據(jù)中的η行。

2)字典更新

字典更新開始時使用Vt-1進行熱啟動。Vt的計算如式(4)所示:

在字典更新中循環(huán)k次,k為成分數(shù),即字典的行數(shù)。

1.2 長短期記憶模型

長短期記憶(Long Short Term Memory)模型屬于一種特殊的RNN 模型,它的提出是為了解決RNN 模型梯度彌散的問題,由重復(fù)的單元組成,這些單元接收來自前一個單元的輸入以及當(dāng)前時間步長t的數(shù)據(jù)輸入xt。每個LSTM 單元包含一個單元狀態(tài)ct和隱藏狀態(tài)ht,它們由控制進出單元存儲器的信息流的4 個神經(jīng)網(wǎng)絡(luò)層進行調(diào)制??刂芁STM 的方程為:

具體來說,輸入門控制輸入xt和ht-1對當(dāng)前存儲單元的影響程度(式(5));遺忘門ft控制前一個存儲單元ct-1對當(dāng)前存儲單元ct的影響程度(式(6));輸出門控制當(dāng)前單元ct對隱藏狀態(tài)單元ht的影響程度(式(7));存儲單元ct是兩個分量的總和:前一個存儲單元ct-1由ft和gt調(diào)制(式(8)),輸入門it調(diào)制的當(dāng)前輸入和先前隱藏狀態(tài)進行加權(quán)組合(式(9));同樣,用輸出門ot過濾單元狀態(tài),用于隱藏狀態(tài)更新,這是LSTM 單元的最終輸出(式(10))。

2 數(shù) 據(jù)

2.1 數(shù)據(jù)集

選擇NeuroBureau 為ADHD-200 競賽發(fā)布的北京大學(xué)站點預(yù)處理后的數(shù)據(jù)。該數(shù)據(jù)由rs-fMRI 數(shù)據(jù)以及每個被試的不同表型信息(非成像數(shù)據(jù))組成。其中,訓(xùn)練集中有144 個被試,測試集中有50 個被試,所有被試都是右利手。數(shù)據(jù)集信息如表1所示。

表1 數(shù)據(jù)集信息

2.2 數(shù)據(jù)預(yù)處理

數(shù)據(jù)是基于NIAK 管道預(yù)處理的,使用了MINC工具包和自定義Matlab/Octave 腳本[12]。預(yù)處理步驟包括去除前3 個時間點、時間層校正、頭動校正、校正時間漂移和生理噪聲,將功能數(shù)據(jù)配準到3×3×3 mm3分辨率的蒙特利爾神經(jīng)病學(xué)研究所(Montreal Neurological Institute,MNI)的標準空間模板,最后采用6 mm 全寬半高(Full Width at Half Maximum,F(xiàn)WHM)高斯核空間對圖形進行平滑化處理。在后續(xù)的實驗中,學(xué)習(xí)大腦ROI 是在訓(xùn)練集上進行的,防止過擬合[13]。

3 實 驗

3.1 字典學(xué)習(xí)提取ROI

ROI 的常見確定方法:一種是基于各種大腦模板圖譜的自動解剖標記(Automated Anatomical Labeling,AAL),這是一個大腦結(jié)構(gòu)圖譜,包括116 個ROI。穩(wěn)定集群自舉分析(Bootstrap Analysis of Stable Clusers,BASC)是一個多尺度的功能圖譜,具有不同數(shù)量ROI 圖譜的選擇,包括36、64、122、197、325 和444。另一種是通過數(shù)據(jù)驅(qū)動的方式來獲取ROI,包括k-means、ward 和最近提出的ReNA 聚類算法[14],以及ICA 方法和字典學(xué)習(xí)方法,后兩者在fMRI 數(shù)據(jù)上表現(xiàn)比前者更好?;诖竽X圖譜的方法在獲取被試的大腦網(wǎng)絡(luò)時可能存在一定的偏差,選擇數(shù)據(jù)驅(qū)動的方法來獲取所需的ROI 時間序列。與經(jīng)典批處理算法相比,在線字典學(xué)習(xí)有著更好的性能,且能獲得更好的字典,文中提出將FastICA 應(yīng)用到在線字典學(xué)習(xí)的初始化環(huán)節(jié),使得分類效果有所提升。

3.1.1 計算字典初始值

除了比較常見的利用SVD 來構(gòu)建初始化字典,還可以通過已知的腦網(wǎng)絡(luò)來獲取初始化的字典[15]。文中利用FastICA 算法獲取相應(yīng)的腦網(wǎng)絡(luò)并計算出字典初始值。每個被試的rs-fMRI 數(shù)據(jù)是形如(49,58,47,232)的四維圖像,其中第四維是時間點,前三維構(gòu)成了包含3D 大腦的立方體。

在對rs-fMRI 圖像預(yù)處理之后,利用訓(xùn)練集所有被試的圖像獲得共同的大腦掩模,大腦掩??梢蕴崛?D 立方體空間中只屬于大腦內(nèi)部的體素,結(jié)合大腦掩模將每個被試的rs-fMRI 圖像轉(zhuǎn)換為形如(28 546,232)的二維時間序列,28 546 為體素個數(shù)。對每個被試的體素時間序列進行PCA 降維,再將所有被試降維后的數(shù)據(jù)疊加到一起形成了組成級別分析所需的數(shù)據(jù)Z,如(28 546,n*60),其中n為被試個數(shù),60 為指定的降維數(shù)目。在對數(shù)據(jù)Z進行標準化以及典型相關(guān)分析之后,利用FastICA 算法即可獲取相應(yīng)的腦網(wǎng)絡(luò)成分,即獨立成分。

利用FastICA 獲取的腦網(wǎng)絡(luò)成分(即獨立成分)和數(shù)據(jù)Z結(jié)合嶺回歸即可獲取相應(yīng)的回歸系數(shù),使之作為字典初始值。嶺回歸相比最小二乘法獲得的回歸系數(shù)更切合實際、更可靠,通過對回歸系數(shù)增加懲罰項來實現(xiàn)。

3.1.2 在線字典學(xué)習(xí)

實驗中對字典更新迭代100 次便得到了更新后的字典V,結(jié)合數(shù)據(jù)Z可以計算得到所需要的稀疏編碼U,即在線字典學(xué)習(xí)腦網(wǎng)絡(luò)成分。在線字典學(xué)習(xí)獲取的眾多成分中每一個都可以稱為腦網(wǎng)絡(luò),并且所有腦網(wǎng)絡(luò)可以被概念化為腦功能圖譜,如圖2 所示。獲取的時間序列如圖3 所示。

圖2 使用字典學(xué)習(xí)獲得的ROI圖譜

圖3 獲取的時間序列

依據(jù)訓(xùn)練集學(xué)習(xí)到的功能圖譜,對被試相應(yīng)ROI 區(qū)域內(nèi)體素時間序列求平均值即可獲得被試的ROI 時間序列。

3.2 擴充時間序列

在得到每個受試者的平均時間序列之后,為了得到更多的輸入樣本防止過擬合,選擇提取長度T=30 的一系列子時間序列[16-17],從每個被試的時間序列里截取10 個長度為T的序列,這樣我們就得到了原來數(shù)據(jù)10 倍的時間序列,總共1 940 個數(shù)據(jù)作為模型的輸入。

3.3 模型訓(xùn)練

文中提出了一種LSTM 體系結(jié)構(gòu),該體系結(jié)構(gòu)將功能磁共振成像即上面所獲得的1 940 個時間序列作為輸入。

提出的LSTM 模型總共有4 層,采用最基本的框架,如圖4 所示。在給定來自前一個時間點T的時間序列數(shù)據(jù)的情況下,預(yù)測在時間T+1 時的fMRI 時間序列數(shù)據(jù)。測試數(shù)據(jù)被輸入到LSTM 層,最后一層輸出被送到完全連接層。使用Kears 對LSTM 進行了相應(yīng)的訓(xùn)練和測試,并且使用了自適應(yīng)矩估計(Adam)優(yōu)化器來最小化真實標簽和預(yù)測標簽之間的損失值,將batch size 設(shè)置為32,學(xué)習(xí)率從0.001開始,并在每個時期后以10-2的衰減率衰減,損失函數(shù)為交叉熵損失。

圖4 模型結(jié)構(gòu)

為了提高模型的泛化性能并克服過度擬合,還使用了dropout(dropout=0.5)和L1,2-范數(shù)正則化(L1=0.000 5,L2=0.000 5)來調(diào)節(jié)模型參數(shù)。當(dāng)驗證損失停止減少50 個epoch 或執(zhí)行了最大epoch(1 000 個epoch)時,訓(xùn)練過程就停止了,顯著性檢驗采用雙尾配對t檢驗,α=0.05。

為了對模型進行評估,文中使用了10 倍的交叉驗證,對數(shù)據(jù)集進行了分割,對25%進行測試,75%進行訓(xùn)練。

4 結(jié)果與分析

4.1 評估指標

根據(jù)交叉驗證的結(jié)果,選擇了靈敏度(sensitivity)、特異性(specificity)以及分類準確率(accuracy)3 個分類結(jié)果評估指標。指標計算方法如下:

式中,TP為真正例,F(xiàn)N為假反例,F(xiàn)P為假正例,TN為真反例,SN為靈敏度,SP為特異性,ACC為分類準確率,F(xiàn)PR為假陽性率,ROC 曲線下的面積可以反映分類器的性能,面積越大分類器的性能越好。

4.2 TC提取策略的分類比較

除了使用文中所提出的基于在線字典學(xué)習(xí)的方式提取時間序列之外,傳統(tǒng)方式還可以通過各種腦區(qū)模板來對時間序列進行提取。為了驗證方法的有效性,通過使用概率圖譜(MSDL)、自動解剖標簽(AAL)和史密斯地圖集(Smith Atlas)3 種模板來提取時間序列,并和提出的方法做對比,不同模板提取時間序列結(jié)果比較如表2 所示。

表2 不同模板提取時間序列結(jié)果比較

通過實驗可知,基于已知模板的方式直接提取相應(yīng)時間序列,該方式與文中提出的基于FastICA 初始化的在線字典學(xué)習(xí)算法提取前期的ROI 相比,文中方式在準確率上達到了79.01%,在靈敏度和特異性方面也分別達到了62.70%和88.90%,很明顯Di-LSTM 方法得到的大腦ROI 圖譜更加穩(wěn)定和精確,分類效果也較優(yōu)。

4.3 不同方法分類性能比較

目前,對于ADHD 分類的研究,很多方法是基于功能連接結(jié)合機器學(xué)習(xí)的算法。為了驗證方法的有效性,基于ADHD-200 數(shù)據(jù)集設(shè)計了3 個對比實驗:對基于多尺度SVM、SC-CNN-Attention、Di-DNN 3種分類方法結(jié)果作對比。

Di-DNN 將字典學(xué)習(xí)和深度神經(jīng)網(wǎng)絡(luò)相結(jié)合,利用ADHD 和正常被試數(shù)據(jù)結(jié)合基于FastICA 初始化的在線字典學(xué)習(xí)獲取ROI 時間序列,之后結(jié)合深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks,DNN)算法進行分類,得到的分類結(jié)果為另一組對比實驗,表3 是文獻中方法與Di-DNN 以及Di-LSTM 方法進行對比的結(jié)果。深度神經(jīng)網(wǎng)絡(luò)由4 層全連接層構(gòu)成,每層的神經(jīng)元個數(shù)分別為512、256、128、2,每個全連接層之后均有一個dropout 層,且前三層的激活函數(shù)為LeakyReLU(alpha=0.05),最后一層為softmax。

表3 不同方法分類對比結(jié)果

由表3可知,Di-LSTM算法準確率達到了79.01%,而相應(yīng)的ROC 圖如圖5 所示,達到了0.88,整體表現(xiàn)較好。

圖5 使用Di-LSTM方法分類ROC圖

文獻[3]使用多目標支持向量機對ADHD 進行分類,準確率為75.30%;文獻[5]使用了帶有注意力網(wǎng)絡(luò)的分離通道卷積神經(jīng)網(wǎng)絡(luò)(SC-CNN-Attention),處理了基于AAL 模板提取的時間序列信號,最后得到的準確率為68.6%;字典學(xué)習(xí)和深度神經(jīng)網(wǎng)絡(luò)(DNN)相結(jié)合達到的分類結(jié)果準確率為70.1%;Di-LSTM 用字典學(xué)習(xí)和LSTM 相結(jié)合的方法對ADHD疾病進行預(yù)測分類,最終得到的平均準確率達到了79.01%,分類的結(jié)果分別比文獻[3]、文獻[5]、字典學(xué)習(xí)和DNN 結(jié)合的方法提高了3.71%、10.41%、8.91%。實驗結(jié)果驗證了Di-LSTM 算法在ADHD 疾病領(lǐng)域分類的可用性。

5 結(jié)論

文中提出了一種基于在線字典學(xué)習(xí)和LSTM 的方法對多動癥進行功能磁共振成像分類。文中的時間序列利用FastICA 初始化的在線字典學(xué)習(xí)算法獲取被試數(shù)據(jù)的稀疏表示,其次使用LSTM 模型對所獲得的時間序列進行訓(xùn)練。由此產(chǎn)生的網(wǎng)絡(luò)實現(xiàn)了在注意力缺陷多動癥ADHD-200 數(shù)據(jù)集上對典型個體和注意力缺陷多動癥患者進行分類的先進性能。在未來,定位注意力缺陷多動癥的典型腦運動模式,并構(gòu)建更深入的學(xué)習(xí)模型,以用于注意力缺陷多動癥和其他精神障礙的診斷,將是一個有意義的方向。

猜你喜歡
分類方法模型
一半模型
分類算一算
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
分類討論求坐標
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
主站蜘蛛池模板: 性欧美在线| 亚洲欧美一区二区三区蜜芽| 国产综合欧美| 色天堂无毒不卡| 国产91线观看| 被公侵犯人妻少妇一区二区三区| 成人国产一区二区三区| 波多野吉衣一区二区三区av| 国产亚洲精品无码专| av大片在线无码免费| 美女视频黄频a免费高清不卡| JIZZ亚洲国产| 天天视频在线91频| 免费不卡视频| 久久男人资源站| 欧美精品1区| 国产99精品久久| 午夜精品久久久久久久无码软件| 亚洲欧美日韩另类| 久久综合色视频| 国产乱子伦手机在线| 日韩精品一区二区三区免费| 这里只有精品免费视频| 99999久久久久久亚洲| 久久99国产综合精品1| 久久国产免费观看| 扒开粉嫩的小缝隙喷白浆视频| 国产精品一区不卡| 在线无码九区| 欧美日本激情| 91麻豆国产视频| 污视频日本| 波多野结衣中文字幕一区二区 | 午夜毛片免费观看视频 | 亚洲欧洲一区二区三区| 在线不卡免费视频| 99re在线免费视频| 美女内射视频WWW网站午夜| 国产97视频在线| 亚洲综合二区| 欧美午夜理伦三级在线观看 | 99精品免费在线| 国产一区自拍视频| 97国产在线视频| 亚洲天堂免费| 免费在线成人网| 精品国产女同疯狂摩擦2| 91精品国产91久久久久久三级| 亚洲天堂网在线视频| 激情无码视频在线看| 四虎免费视频网站| 久久永久免费人妻精品| 欧美在线三级| 亚洲人网站| 谁有在线观看日韩亚洲最新视频| 久久久亚洲国产美女国产盗摄| 久久国产高清视频| 在线观看亚洲人成网站| 69综合网| 国产精品精品视频| 国产成人精品一区二区不卡| 国产免费看久久久| 国产在线视频导航| 亚洲高清日韩heyzo| 中字无码av在线电影| 亚洲精品不卡午夜精品| 國產尤物AV尤物在線觀看| 91九色最新地址| 日韩高清成人| 成年人久久黄色网站| 2021国产乱人伦在线播放 | 91系列在线观看| 日韩一级二级三级| 92精品国产自产在线观看| 国产剧情一区二区| 福利视频久久| 欧美一级视频免费| 波多野结衣一区二区三视频| 中文字幕无码av专区久久| 亚洲一区二区成人| 露脸一二三区国语对白| 在线精品欧美日韩|