999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

阿爾茨海默病的多模態主成分分析診斷方法

2021-11-15 11:48:14林偉銘林俊強
計算機應用與軟件 2021年11期
關鍵詞:模態特征方法

林偉銘 林俊強

1(廈門理工學院光電與通信工程學院 福建 廈門 361024) 2(福建省通信網絡與信息處理重點實驗室 福建 廈門 361024) 3(福州大學物理與信息工程學院 福建 福州 350116)

0 引 言

阿爾茨海默病(Alzheimer’s Disease,AD)是一種退行性的癡呆疾病,患者通常會隨著病情惡化逐漸出現失憶、認知力降低、語言障礙和方向混亂等癥狀,最后死亡[1]。癡呆疾病易發病于老年人群,據統計65歲以上人群患有癡呆的比例為9%,而85歲以上人群患病比例更是達到了34%[2]。隨著人口的老齡化,將有越來越多的人患上阿爾茨海默病。該病目前沒有有效的治療方法或藥物,只有盡早發現該病,醫生才能及時制定護理方案,延緩疾病的惡化。因此設計高精度的阿爾茨海默病計算機輔助診斷方法是近幾年的一個研究熱點[3-5]。

目前常用于阿爾茨海默病輔助診斷的醫學數據主要有結構性磁共振成像(structural Magnetic Resonance Imaging,sMRI)、氟代脫氧葡萄糖正電子發射計算機斷層顯像(FDG-PET)、脊髓液(Cerebrospinal Fluid,CSF)中的T-tau、P-tau和Aβ42三種蛋白質含量,以及apolipoproteinE4基因片段信息。阿爾茨海默病通常伴隨著腦神經的萎縮和腦室擴大,通過腦部sMRI圖像可以檢測出這些萎縮模式,從而診斷阿爾茨海默病[6]。患者通常也會出現腦部葡萄糖代謝異常的情況,如果通過FDG-PET圖像檢測并量化腦部組織的代謝,可以從這些異常代謝模式中發現阿爾茨海默病[7]。阿爾茨海默病的發病還伴隨著T-tau、P-tau和Aβ42蛋白質的沉淀,患者的脊髓液中這三種蛋白質的含量要比正常人高出許多,因此這三種蛋白質含量也被當成阿爾茨海默病的生物標記物來使用[8]。除此之外,研究發現在基因序列中存在apolipoproteinE4基因片段的人群,其阿爾茨海默病的發病率要遠高于沒有此基因片段的人群,因此該基因片段也被認為是阿爾茨海默病患病風險的標志之一[9]。

上述多種模態數據反映了阿爾茨海默病的不同生物特征,單純使用某一種模態數據進行計算機輔助診斷的準確率通常不高,而如果利用不同模態數據之間的互補信息,將多個模態數據融合起來進行疾病的診斷,可以大幅提高診斷的準確率[5]。最簡單的融合方法就是將多個模態的特征直接拼接在一起進行診斷,然而該方法顯然不是最有效的融合方式。深度神經網絡[10-11]和非線性圖融合[5]等方式被用于多模態數據融合,診斷準確率都超過直接拼接的方法,但是依然沒有超過92%[5,10]。有效融合多模態數據從而提高診斷準確率依然是有待研究的問題,因此本文基于sMRI、FDG-PET、CSF和基因片段四種模態的數據,提出一種主成分分析(Principal Component Analysis,PCA)結合極限學習機(Extreme Learning Machine,ELM)分類器的多模態數據融合診斷方法,該方法在ADNI(Alzheimer’s Disease Neuroimaging Initiative)數據庫的數據集上進行十折交叉驗證。其準確率大幅超過基于單一模態數據的診斷方式,與其他文獻方法比較也取得了更好的診斷性能。

1 方 法

本文提出的多模態醫學數據融合診斷方法思路如圖1所示,該方法采用了四種模態數據作為輸入,其中sMRI的數據包含了全腦的解剖特征數據,腦部萎縮不僅與疾病有關,也與年齡有關。所以首先對sMRI的特征進行年齡校正。由于并非所有腦部解剖學特征都與阿爾茨海默病有關,無關特征會對診斷精度產生影響。所以sMRI特征數據還使用Lasso(least absolute shrinkage and selection operator)算法進行特征選擇,剔除無關的特征。隨后四種數據合并在一起進行主成分分析,保留前面能量較大的主成分作為融合結果和新的特征數據。隨后將新的特征數據輸入極限學習機進行分類診斷。接下來將對該方法使用的主要算法進行介紹。

圖1 本文方法的研究思路

1.1 sMRI特征年齡校正

雖然sMRI圖像中的解剖學特征包含了腦萎縮信息,可用于阿爾茨海默病診斷。但正常人隨著年齡的增加也會出現腦萎縮,這種正常老齡化的腦萎縮會對阿爾茨海默病的診斷造成干擾。為了抵消正常萎縮的影響,需要估計正常萎縮與年齡之間的關系,然后根據年齡將這部分萎縮情況去除[12]。本文采用所有正常人的特征,將特征的數值與其對應的年齡進行最小二乘線性擬合,從而估計該特征在正常人群中隨年齡增加出現的線性變化。其原理為:假設待處理的特征為第m個特征,來自N位正常人的該特征向量為ym=[y1m,y2m,…,ynm,…,yNm]T,對應的年齡向量為x=[x1,x2,…,xn,…,xN]T,使用最小二乘線性擬合到直線ym=amx+bm,其中am和bm分別為擬合直線的斜率與截距,因此斜率系數am就是估計得到的第m個特征隨年齡變換的趨勢。

具體的實現過程為:首先設置年齡矩陣X、特征矩陣Y和系數矩陣β:

(1)

(2)

(3)

式中:N和M分別為正常人個數和特征個數。隨后擬合線性回歸模型Y=Xβ+ε。其中ε是擬合誤差,擬合的目標為∑ε2最小,根據最小二乘線性擬合的原理,系數矩陣β的解為:

β=(XTX)-1XTY

(4)

從矩陣β中就可以得知所有特征與年齡之間的正常變化關系。最后將測試對象的所有特征中的年齡因素去除,計算新的特征數值:

(5)

1.2 sMRI特征選擇

并不是所有的sMRI解剖學特征都與阿爾茨海默病有關。將這些無關的特征用于診斷阿爾茨海默病會降低準確率。因此,本文采用Lasso算法用于特征選擇。Lasso算法也稱為最小絕對收縮選擇算子,它是一種稀疏回歸模型[13],可以同時進行正則化的回歸分析和特征選擇。其原理可以解釋為:假設有N個樣本,這些樣本的標簽組成的N×1標簽向量使用L表示。每個樣本有M個特征,所有樣本組成的N×M特征矩陣使用X表示。現在有M個系數組成的M×1向量α,使得每個樣本的特征與α的相乘之和可以估計樣本標簽,即可以表示為:

Xα=L+ε

(6)

式中:ε表示估計誤差。尋找最優的系數向量α使得估計誤差∑ε2最小,可以用式(7)的優化目標模型表示:

(7)

當該模型找到最優解時,α里的系數代表了M個特征對估計標簽的貢獻,系數越大表示對應的特征對于估計標簽有更大的作用。Lasso算法在此優化目標模型的基礎上,對α增加L1范數的懲罰項,如下:

(8)

式中:λ是懲罰系數,該懲罰項是為了使α里的非零值盡量少,從而令α最優解的內部只有稀疏的值不為零。這些不為零系數對應的特征對樣本標簽的估計有不可替代的作用,保留這些特征,剔除其他無用特征,可以達到特征選擇的目的。

1.3 主成分分析

主成分分析算法是一種無監督學習的特征降維方法,該算法使用正交變換將原始樣本特征轉移到新的坐標空間中,并且使得新的坐標空間中,特征數據的每個維度都是不相關的,最后保留差異性最大的幾個主要維度成分。該算法如圖2所示,為了方便在平面圖中顯示,假設每個樣本的特征數量只有2個,即在特征空間有2個特征維度x1和x2,圖2中的每個圓點表示1個樣本。可以發現x1值較大的樣本,其x2值也會較大,說明這2個特征存在相關性。將該坐標空間正交變換到新的坐標φ1和φ2,在新特征空間中的2個特征φ1和φ2幾乎是不相關的。如果將差異度較大的φ1特征作為主成分保留,差異度小的φ2作為噪聲拋棄,此時原來需要2個特征x1和x2表示的樣本,就可以只使用1個特征φ1近似地表示。該方法有效地利用特征間的相關性進行特征的融合,還能降低無用成分的干擾,將其應用于多模態的數據融合上,能夠提高阿爾茨海默病的診斷性能。

圖2 主成分分析算法示意圖

主成分分析算法的計算過程可以描述為:假設有N個樣本,每個樣本有M個特征,對樣本數據進行均值去除后,樣本矩陣可以表示為:

(9)

該矩陣的每行表示一個樣本。對該矩陣進行奇異值分解(Singular Value Decomposition,SVD),可以得到:

X=WΣVT

(10)

式中:N×N矩陣W是協方差矩陣XXT的特征向量矩陣;Σ是N×M的非負矩形對角矩陣;V是XTX的特征向量矩陣,大小為M×M。新的樣本數據可以通過式(11)進行正交變換到新的坐標空間得到。

Y=WX

(11)

式中:Y的第一列是第一主成分,第二列是第二主成分,依此類推。因此可以根據需求保留前面幾列的主要成分作為數據降維和特征融合的結果。

1.4 極限學習機

極限學習機是一種一步到位的機器學習算法,其訓練速度和分類精確度都要好于支持向量機(SVM)[14]。極限學習機有兩種版本,第一種是只有一個隱藏層的神經網絡,該網絡的輸入系數隨機生成,隨后通過優化算法直接計算輸出系數的值,因此不需要迭代訓練,速度較快。但是隨機生成輸入系數的方法使其性能并非最佳。第二種是引入了核函數,利用核函數來代替輸入系數和輸出系數的計算,避免了隨機生成系數的過程,在分類上具有更好的性能。本文采用高斯核的極限學習機作為分類診斷器,其原理可描述為:假設有N個訓練樣本[x1,x2,…,xN],xn表示第n個訓練樣本的特征向量,而x表示待測樣本的特征向量。Y是訓練樣本的N×2標簽矩陣,該矩陣有兩列代表兩類標簽。每行代表每個樣本的標簽,并且只有樣本標簽對應位置的元素置1,其余元素置-1。極限學習機的輸出可以表示為:

(12)

式中:I是N×N的單位矩陣,C是歸一化系數,通常被置為1。K(x,xn)是高斯核函數。高斯核函數可以表示為:

(13)

式中:γ是高斯核函數的參數,其取值與樣本特征數量有關。

Ω是N×N的高斯核矩陣,矩陣中的每個元素都是訓練樣本的之間的高斯核計算結果,可以表示為:

(14)

式(12)的計算結果是包含兩個元素的向量[s0,s1],其中s0和s1之中最大值的下標即待測樣本x的分類標簽。

2 實驗與結果分析

2.1 實驗環境

本文在Windows 10系統中的Python環境下進行算法驗證。計算機平臺為:CPU為Intel I7 8700k,內存為16 GB。Python的版本是3.6.4,本文使用的Lasso和主成分分析算法采用Scikit-learn包庫里的Lasso和PCA模塊函數,Scikit-learn版本為0.21.2。其他算法使用numpy包提供的矩陣計算工具進行設計。

2.2 實驗數據

本文實驗數據來自ADNI數據庫,該數據庫招募了超過1 500位志愿者作為測試對象。然而并不是所有測試對象都進行了四種醫學數據的采集,因此排除數據缺失的對象,本文的測試對象包括了200位正常人和102位患者,測試對象的統計信息如表1所示。

表1 測試對象統計信息

采集了這302位測試對象的四種醫學數據。其中sMRI圖像通過開源軟件FreeSurfer進行顱骨剝離、配準和區域分割等處理后,計算得到313個腦部解剖學特征,例如海馬體(或其他組織)的體積、面積和厚度。PET圖像則提取了五個腦組織(左、右腦角回,左、右顳下回和雙側后扣帶回)代謝率的平均值、最大值、最小值和標準差共20個特征。再加上CSF中的3種蛋白質含量以及1個基于序列是否存在的信息,每位測試對象有337個特征。這些特征數據可以在ADNI網站下載獲取。

2.3 數據的處理結果

實驗過程中首先對sMRI特征進行了年齡矯正和特征選擇的預處理。使用200位正常人的數據對313個sMRI特征分別進行正常老齡化引起的變化因素估計,圖3演示了正常人隨年齡增加海馬體的體積和厚度的線性擬合模型結果(黑色直線)。可以發現,正常人隨著年齡的增加,海馬體體積和厚度都會跟著變小。如果沒有將這部分因素去除,則年齡大的正常人也會有較大概率被誤診為患者。

(a) (b)圖3 估計年齡變化對特征的影響

隨后對313個sMRI特征使用Lasso算法進行特征選擇。在本文實驗中,式(8)里的懲罰系數設置為0.02。在進行該模型訓練中使用的sMRI數據不是來自302位測試對象,而是來自缺乏其他模態數據而被排除在外的樣本,因此不存在對實驗所用302位對象數據的二次挖掘情況。通過Lasso算法求得稀疏向量α后,通過其中的非零值來選擇有效特征。最后有41個特征被保留作為后續診斷阿爾茨海默病的sMRI數據。

實驗采用的四種模態數據都是與阿爾茨海默病相關的特征數據,因此必然在特征之間存在著一定的相關性。同時這些數據中也會存在一些與阿爾茨海默病不相關的無用信息。為了更好地融合不同模態的特征,將四種模態數據特征合并后使用主成分分析法進行正交變換,在新的特征空間中保留前10個主要成分,其余成分作為影響診斷的噪聲被拋棄。

2.4 方法性能驗證

實驗對本文方法在阿爾茨海默病計算機輔助診斷上的性能進行驗證。性能指標使用準確率(診斷結果與實際一致的數量/所有樣本數量)、敏感度(真實陽性對象中被診斷成陽性的數量/真實陽性對象數量)、特異度(真實陰性對象中被診斷為陰性的數量/真實陰性對象數量)和接收者操作特征曲線下面積(Area Under receiver operating characteristic Curve,AUC)進行評估。為了測試方法的魯棒性,驗證過程采用十折交叉驗證。將樣本集分割成10份,9份用于訓練分類器,剩余1份用于測試驗證。反復進行10次直到所有的樣本都作為測試樣本測試一遍。為了得到可靠的實驗結果,所有實驗都進行了100次的隨機排序十折交叉驗證。

實驗還對本文方法和直接使用原始多模態數據方法的性能進行了比較。此外本文還測試了單獨模態下的診斷性能以及某種算法缺失下的診斷性能,測試結果如表2所示。

表2 阿爾茨海默病診斷實驗結果(%)

可以看出在單模態數據中,sMRI數據對阿爾茨海默病的診斷具有最高的準確率。由于基因數據不能直接用于診斷所以將其與CSF數據合并進行診斷,然而診斷性能最差。而PET數據具有與sMRI數據接近的診斷性能。將這四種數據直接拼湊在一起后進行診斷的準確率約為91.6%,而使用本文方法進行多模態數據融合后診斷的準確率提升到了95.1%左右,有3.5百分點的提升。從上述實驗結果還可以看出本文方法的AUC相比單模態數據診斷的方法和四種模態數據直接拼合的方法,均有所提高。本文方法的診斷敏感度對比使用單模態數據方法有很大提升,例如比sMRI單模態數據方法的敏感度提高了13.2百分點,而診斷敏感度的提高說明了本文方法具有更低的漏診率。

當把年齡校正、特征選擇和主成分分析算法從本文方法中分別去除后,可以發現診斷性能均有所下降,說明了這三種數據處理方法都對本文的診斷性能提升具有較大貢獻。由于sMRI數據在四種模態數據中具有最重要的作用,因此對其進行了年齡校正和特征選擇后,對算法的整體性能提升有明顯的作用。其中特征選擇算法排除了大量不相關的sMRI特征,使得在進行主成分分析的過程中可以更為準確地提取有效主成分。因此當不使用特征選擇時,這些不相關特征使得主成分的計算出現較大的偏差,導致診斷性能有較大幅度的下降。

2.5 方法性能比較

本文還將該方法的診斷性能與文獻[3-6,10]進行比較,比較結果如表3所示。

表3 本文算法性能與其他先進算法比較(%)

表3所列出的各種方法中,文獻[3]將3D卷積神經網絡應用于sMRI數據診斷,受限于單模態數據信息的限制和訓練樣本數量,其準確率只有約84%。同樣文獻[6]也使用了卷積神經網絡進行sMRI單模態圖像的分析以及診斷,通過數據增廣的方式將準確率提高到了88%左右。文獻[10]采用sMRI和PET模態數據并使用深度神經網絡進行特征學習與診斷,其準確率達到91.4%左右。文獻[4]利用多模態數據的相關特征表達進行診斷,準確率達到了92%左右。文獻[5]采用非線性圖融合的方式合并sMRI、PET、CSF和基因數據四種模態數據,其準確率達到了91.8%。而本文方法同樣采用四種模態數據,在阿爾茨海默病的診斷上取得95.1%左右的準確率,比上述幾種方法具有更好的診斷性能。此外,表3還比較了使用支持向量機作為分類器的性能,可以發現,使用極限學習機作為分類器,其診斷準確率要高于線性支持向量機(SVMlinear)和高斯徑向基核函數支持向量機(SVMrbf)。

3 結 語

本文提出一種基于主成分分析與極限學習機的阿爾茨海默病的高精度輔助診斷方法,通過主成分分析算法對多模態數據進行有效融合,并使用極限學習機的分類診斷,本文方法在阿爾茨海默病的診斷準確率、敏感度、特異度和AUC等性能指標上大幅超過使用單一模態數據或原始多模態數據直接拼接方法的診斷性能,說明本文方法對阿爾茨海默病的高精度輔助診斷具有重要的貢獻,其結果可以為醫生的臨床診斷提供可靠的參考。此外本文還與其他文獻的算法進行比較,結果表明本文方法相較于其他算法也有一定的性能優勢。

猜你喜歡
模態特征方法
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
國內多模態教學研究回顧與展望
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
基于HHT和Prony算法的電力系統低頻振蕩模態識別
由單個模態構造對稱簡支梁的抗彎剛度
計算物理(2014年2期)2014-03-11 17:01:39
線性代數的應用特征
河南科技(2014年23期)2014-02-27 14:19:15
主站蜘蛛池模板: 国产精品成人久久| 香港一级毛片免费看| 亚洲,国产,日韩,综合一区| 国产精品所毛片视频| 久久婷婷色综合老司机| 亚洲福利视频一区二区| 久久久久久午夜精品| 老司机久久99久久精品播放| 99久久精品免费看国产电影| 免费人成在线观看成人片| 精品成人一区二区三区电影| 国产H片无码不卡在线视频| 国产精品观看视频免费完整版| 欧美一区二区啪啪| 在线欧美一区| 亚洲永久色| 无码国产伊人| 多人乱p欧美在线观看| 国产精品漂亮美女在线观看| 欧美性爱精品一区二区三区 | 欧美人人干| 亚洲中文字幕在线精品一区| 青青草原国产| 亚洲欧洲一区二区三区| 人妻无码AⅤ中文字| 国产乱人视频免费观看| 草草线在成年免费视频2| 亚洲成人网在线播放| 久久国语对白| 成人国产一区二区三区| 日韩一级二级三级| 亚洲丝袜第一页| 免费日韩在线视频| 中文字幕在线永久在线视频2020| 国产视频 第一页| 亚洲一道AV无码午夜福利| 在线永久免费观看的毛片| 2021国产精品自产拍在线观看| 国产靠逼视频| 五月天久久婷婷| 91麻豆精品视频| 在线国产毛片| 欧美一级色视频| 欧洲欧美人成免费全部视频| 国产精品精品视频| 国产精品yjizz视频网一二区| 亚洲性色永久网址| 亚洲中文字幕久久精品无码一区| 成人国产精品网站在线看| 日本一区高清| 精品一区二区三区视频免费观看| 久久国产精品77777| 亚洲浓毛av| 99久久无色码中文字幕| 国产成人亚洲日韩欧美电影| 91探花国产综合在线精品| 香蕉eeww99国产精选播放| 尤物国产在线| 国产乱子伦精品视频| 十八禁美女裸体网站| 国产99热| 91在线精品免费免费播放| 中文无码精品A∨在线观看不卡 | 亚洲天堂日韩av电影| www.亚洲一区| 欧美在线导航| 国产精品毛片一区视频播 | 国产成人免费观看在线视频| 亚洲无码精品在线播放 | 偷拍久久网| 精品一区二区三区视频免费观看| 欧美国产精品不卡在线观看| 久久国产亚洲欧美日韩精品| 国产一级毛片网站| 色综合久久88色综合天天提莫| 激情六月丁香婷婷四房播| 99视频只有精品| 亚洲精品视频免费观看| 免费国产高清视频| 日韩无码视频专区| 国产成人1024精品下载| 91在线一9|永久视频在线|