999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

神經肌肉疾病影像識別中機器學習算法性能的比較研究?

2019-07-31 09:55:02章鳴嬛程愛蘭劉曉青
計算機與數字工程 2019年7期
關鍵詞:分類模型

陳 瑛 章鳴嬛 沈 瑛 程愛蘭 劉曉青

(1.上海杉達學院信息科學與技術學院大數據分析與處理研究中心 上海 201209)(2.上海交通大學醫學院附屬新華醫院 上海 200092)

1 引言

杜興氏肌營養不良癥(Duchenne Muscular Dystrophy,DMD)是嚴重的神經肌肉罕見疾病之一[1],由Duchenne于1868年描述。該疾病源發于肌肉組織,是一種致死性骨骼肌遺傳疾病。患者的發病年齡幾乎均在10 周歲以下,發病率約為男嬰的1/3500~1/6000。

該疾病目前尚無有效的治療方法,故高效的早期診斷顯得尤為重要。DMD 的傳統診斷流程中包含肌電圖檢查,這是一項創傷性檢查,會令患兒極為痛苦,必然導致患兒的恐懼和不合作。因此,臨床上亟需一種有效且無創的檢測手段,來對DMD疾病進行早期診斷。

計算機輔助檢測(Computer-aided Detection,CAD)是指綜合運用影像學、圖像處理及相關生化手段,利用計算機技術輔助醫務人員發現病灶。磁共振成像(Magnetic Resonance Imaging,MRI)檢查是臨床上一項極具價值的影像學輔助手段[2~3],可以清晰地呈現出肌肉的組織結構和病灶的方位,安全有效。目前,一般仍由醫生直接讀片來獲取MRI的信息,顯然這種方式會受主觀因素的影響。如能利用CAD 對圖像進行分類識別,可減少主觀因素帶來的不利影響,則可提升診斷的可靠性,具有非常積極的意義。

目前已有多種CAD 方法可對醫學圖像進行識別,如統計學習方法、機器學習方法等。傳統的機器學習方法一般先從圖像中提取紋理特征參數,再基于這些參數進行數學建模,達到圖像識別的目的。同時,由人工神經網絡理論[4~6](Artificial Neural Network,ANN)不斷深化而發展出的深度神經網絡(Deep Neural Network,DNN),則可直接讀取圖像并作出判斷。因DNN 具有識別準確度高、無損圖像信息等優點,在圖像識別領域有著廣泛的應用[7~14]。

因此,課題組分別選用K 近鄰(K Nearest Neighbors,KNN)、邏輯回歸(Logistic Regression,LR)、支持向量機(Support Vector Machine,SVM)及深度神經網絡DNN 算法對實驗MRI T1 和MRI T2[15]進行分類識別。隨著算法參數的不斷優化或迭代次數的不斷增加,最終得到四種算法下較優化的模型。分析比對模型的性能后發現,無論是對于T1 還是T2,本文所設計的10 隱層DNN 均具有最優的識別準確度。因此,該模型設計可為臨床醫師提供一種DMD 疾病的輔助診斷方法,這是人工智能在DMD無創檢測中的嘗試探索。

2 數據采集

本研究涉及的所有圖像均來自上海交通大學附屬新華醫院神經內科,成像類型包括MRI T1 和MRI T2。患者組與對照組均為15 例,均為男性兒童。共獲取有效的實驗圖像485 幅,其中患者組圖像為249 幅(T1 和 T2 分別為127 幅和122 幅度),健康對照組圖像為 236 幅(T1 和 T2 分別為 117 幅和119 幅)。圖像樣本類別的歸屬由神經肌肉科醫師依據臨床結果確定。本研究運用四種機器學習算法對圖像進行自動識別,并結合醫師給定的類別進行對比,對實驗的技術路線做出評價。

對實驗圖像進行必要的預處理后,截取感興趣的區域(Region of Interest,ROI),圖像尺寸為256*256。圖像樣例如圖1所示。

圖1 圖像樣例

3 實驗方法

3.1 KNN、LR和SVM

KNN[16]是分類算法的一種,通過計算新樣本與歷史樣本中不同類別數據點之間的距離,來對新樣本進行分類。即根據與新樣本數據點最鄰近的K個數據點的類別歸屬,來判斷新樣本的類別歸屬。

LR[17]屬于廣義線性模型,其因變量滿足二項分布,故也屬于分類算法。LR 與多重線性回歸相比,增加了Sigmoid 或Softmax 函數,可將結果映射為二分類或多分類。該算法模型具有良好的可解釋性。

SVM[18]是非線性分類算法,通過非線性映射算法將低維輸入空間的線性不可分樣本轉換為高維空間的線性可分樣本。SVM應用廣泛,尤其對于小樣本、非線性的分類問題有著優良的分類性能。

3.2 圖像的紋理特征參數提取

以上三種機器學習算法均無法直接識別圖像,須先從圖像中提取紋理特征參數,再將參數記錄劃分成訓練集和測試集進行交叉驗證,達到分類識別的目的。課題組利用小波變換[19]從每幅圖像中提取12 個特征參數,設置2、3、4 三種小波分解層數,根據各算法的分類準確度來判斷何種分解層數最優。12 個紋理特征參數是:水平均值、水平方差、水平能量;垂直均值、垂直方差、垂直能量;對角均值、對角方差、對角能量;全部均值、全部方差、全部能量。以DMD 患者的T1/T2 圖像為例,采用sym4小波基函數,對圖像進行層數為4 的分解。部分小波系數如表1 所示(序號1~12 分別對應上述12 個特征參數)。

表1 小波變換提取紋理參數示例(DMD/level=4/sym4)

3.3 深度神經網絡DNN和卷積神經網絡CNN

相對于傳統的淺層人工神經網絡(ANN)而言,DNN 隱層數目更多,能學習到更復雜的處理函數。卷積神經網絡(Convolutional Neural Network,CNN)是DNN 的重要結構之一,其卷積層可直接與二維數據進行卷積操作,能直接讀取圖像并識別其特征,因此在圖像識別領域有著廣泛的應用。

CNN的基本結構如圖2所示。

圖2 CNN基本結構

CNN 的基本網絡結構可分為五部分:輸入層(Input Layer)、卷積層(Conv Layer)、池化層/下采樣層(Pooling Layer/Subsample Layer)、全連接層(FC Layer)和輸出層(Input Layer)。在卷積層和池化層之間設有激勵層。卷積層是CNN 的核心部分,用于提取輸入數據的特征。該層的主要參數包括卷積核尺寸、步長及填充值等。卷積運算包括連續卷積運算和離散卷積運算,CNN的卷積操作屬于離散卷積,其公式形式如式(1)所示。

卷積層的主要思想可描述為:當卷積核(濾波器)在數據窗口上滑動時,該濾波器可對局部數據進行計算。不同卷積核所提取的輸入數據的特征也各不相同。在進行網絡設計時,可根據實際情況來增減卷積層、池化層及全連接層的數目。

DNN 可直接識別圖像并進行分類識別,故不必通過分析圖像的紋理特征參數來間接判斷樣本的類別歸屬。

3.4 四類算法的模型設計

四類算法模型均分別嘗試了訓練集與測試集的取樣比例為0.7:0.3和0.5:0.5兩種情況。即分別從DMD 患者組和健康對照組中隨機抽取70%(或50%)的樣本作為訓練集、30%(或50%)的樣本作為測試集,將這兩個數據集拼接后形成最終的實驗數據。

設患者的數據標簽為1,健康兒童的數據標簽為0。采用五折交叉驗證方式建立模型并測試。模型以訓練準確度(train acc)和測試準確度(test acc)作為評價指標。“準確度”是指對所有受試者(包括患者和非患者)正確預測的概率,取值在[0,1]之間,取值越大則試驗效果越好。

四類算法的關鍵參數設置可簡述為

1)KNN

根據數據的類型和結構自動選擇合適的內部算法。計算樣本點與最近的5 個樣本點之間的距離,用閔式距離家族中的歐氏距離進行度量。默認訓練數據集和測試數據集的每行為一個樣本,每列為一個屬性。葉節點數目設置為30。當訓練誤差值為10e-3時停止訓練過程。

2)LR

選擇L2 正則化方法,采用交叉驗證來選擇正則化系數。損失函數優化算法選用‘ibfgs’方法,即利用損失函數的二階導數矩陣(海森矩陣)來迭代優化損失函數。設置兩種類別(0/1)的權重相等。

3)SVM

將內核參數gamma 設置為默認值(1/n_features)。核函數分別設置為‘linear’‘poly’,‘rbf’和‘sigmoid’,并比較懲罰因子C 固定時,各種核函數下的模型預測準確度。結論是‘rbf’為最優核函數。再在‘rbf’核函數下,分別設置懲罰因子C取不同值,比較模型預測的準確度。

4)DNN

試驗DNN采用深度學習框架TensorFlow設計,網絡包括1 個輸入層、10 個隱層和1 個輸出層。為加速訓練過程,采用NVIDIA GPU 來訓練網絡。10隱層DNN的結構如圖3所示。

原圖尺寸為256*256,為減小網絡輸入的數據量,將圖像尺寸轉換成128*128。所有激勵層均采用ReLU 激活函數,所有池化層均采用Max Pooling下采樣方式。各層均使用標準差為0.01 的高斯分布函數來初始化網絡權重。網絡的損失采用交叉熵函數(cross entropy)來定義,并用AdamOptimizer方法來最小化損失函數。迭代次數設為100 次,Batch_size 設為30 幅圖像。為進一步優化網絡,試驗設計時采用了dropout 方式來降低可能存在的過擬合現象,保留了80%的神經元。

圖3 10隱層DNN的結構示意圖

試驗DNN 網絡經多次參數調整后得到優良的網絡結構。各層參數設置如表2所示。

表2 10隱層DNN的參數設置

DNN 模型除了以訓練準確度和測試準確度作為評價指標外,還增設了訓練誤差(train loss)和測試誤差兩個指標。訓練誤差或測試誤差分別指訓練集或測試集上的預測值與真實值的誤差絕對值,誤差取值在[0,1]之間,且越小越好。

4 結果

4.1 KNN、LR及SVM算法的預測結果

KNN、LR 及SVM 算法在訓練集和測試集上的分類準確度如表3 所示。“T1_L2”表示對T1 圖像進行小波層數為2 的分解,并根據分解后的小波系數進行分類預測;“T2_L2”表示對T2圖像進行小波層數為2 的分解,并根據分解后的小波系數進行分類測,以此類推。Train:Test 為訓練集與測試集的樣本數量之比,包括 0.5∶0.5 和 0.7∶0.3 兩種比例。Train acc 為訓練集上的準確度,Test acc 為測試集上的準確度。

表3 KNN、LR及SVM算法的預測準確度

可直觀地看出:1)三種機器學習算法對T1 圖像的訓練及測試準確度明顯高于T2 圖像;2)對T1圖像的三種小波分解中,以分解層數為2 時的分類效果最佳;3)取樣比例 Train:Test 為 0.7:0.3 時的分類準確度優于取樣比例為0.5∶0.5。經統計檢驗后可知,上述情況均存在顯著性差異(P<0.05)。因此,下文在對結果作進一步分析討論時,將擇取每種算法最優的分類結果,作為該算法模型的預測準確度。

4.2 DNN迭代過程中誤差及準確度的變化情況

利用上文設計的10 隱層深度神經網絡對MRI T1和MRI T2進行分類識別。隨著迭代次數的不斷增加,測試集及訓練集上的誤差均不斷下降,準確度則不斷提升。最終誤差均接近于0,準確度均接近于1。MRI T1 和MRI T2 在迭代過程中的誤差及準確度變化曲線圖,如圖4所示。橫坐標Iteration times為迭代次數,縱坐標Iteration trend為迭代趨勢。

圖4 迭代過程中的誤差及準確度變化曲線圖

由實驗數據可知,對于MRI T1 圖像來說,當迭代次數從30 次開始一直往后,測試集上的誤差接近于0;同時測試集上的準確度穩定在99.2%左右;對于MRI T2 圖像來說,當迭代次數從55 次開始一直往后,測試集上的誤差接近于0;同時測試集上的準確度穩定在98.9%左右。

5 討論

在所選用的四種分類算法中,KNN 是“懶惰”算法,沒有訓練數據的過程,也沒有形成模型,是最基本的分類算法。LR 屬于廣義線性模型,與多重線性回歸相比,增加了Sigmoid 或Softmax 函數,以便將結果映射為二分類或多分類,該算法模型具有良好的可解釋性。SVM是非線性算法,通過非線性映射算法將低維輸入空間的線性不可分樣本轉換為高維空間的線性可分樣本,是一種優秀的分類算法。ANN 是另一種高效的非線性算法,通過計算網絡誤差并最小化誤差函數,不斷迭代得到優化的網絡結果。DNN 在ANN 理論的基礎上發展而有,其多隱層的網絡結構大大提升了算法的性能。這四種機器學習算法均有一定代表性,各具特點,故選用其對同一數據對象進行比較分析。

四種算法在T1 和T2 上最優的訓練及測試準確度如圖5所示。Train acc_T1為T1訓練集上的準確度,Test acc_T1 為T1 測試集上的準確度,Train acc_T2 為 T2 訓練集上的準確度,Test acc_T2 為 T2測試集上的準確度。

圖5 四種機器學習算法的訓練及測試準確度對比圖

經數據分析后可得出以下結論:

1)四類機器學習算法均對T1 圖像有良好的分類效果,在訓練集和測試集上的準確度均達到95%以上。

2)利用 DNN 對 T1 和 T2 圖像進行分類識別,在訓練集和測試集上均有很好的分類準確度。但從神經網絡的收斂速度來看,T1明顯優于T2。

以上結論究其原因,可以從兩方面考慮:

1)機器學習(不包括DNN)在分類識別時,需先從圖像中提取特征參數再進行分析。在提取特征的過程中可能會損失部分有效的信息,從而導致準確度下降。

2)機器學習或深度學習在處理樣本量大的數據時效果較好。本課題所研究的DMD 屬于罕見病,圖像數量有限,機器學習算法以圖像的絕對數量為研究對象,故限制了機器算法的準確度;但深度神經網絡以圖像的像素點為輸入研究對象,每幅圖像的尺寸均為128*128,保證了一定的輸入神經元數目,因此可達到較好的識別準度。

6 結語

本文分別利用 KNN、LR、SVM 及 DNN 四種機器學習算法進行建模,用以識別兒童腿部罕見病DMD 的磁共振圖像。試驗結果表明,前三種算法模型對于受試者的MRI T1 均有良好的分類效果,但對MRI T2 的分類效果則不盡如人意;而對于DNN 模型,隨著網絡參數的不斷優化和迭代次數的增加,模型在T1 和T2 數據集上的測試準確度均達到98.9%以上。模型穩定可靠,結果收斂。因此,論文所提及的方法路線是判斷該受試者是否罹患DMD 的可行的輔助診斷手段,能有效降低患兒因有創檢測帶來的巨大身心痛苦,可作為DMD 罕見病無創檢測的嘗試探索。

猜你喜歡
分類模型
一半模型
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 大香网伊人久久综合网2020| 国外欧美一区另类中文字幕| 一区二区在线视频免费观看| 真人免费一级毛片一区二区| 免费黄色国产视频| 国产日韩精品一区在线不卡| 国产免费羞羞视频| 人妻丰满熟妇啪啪| 丁香六月激情婷婷| 亚洲中文制服丝袜欧美精品| 99这里只有精品在线| 国产精品私拍在线爆乳| 日本欧美视频在线观看| 青草视频免费在线观看| 就去吻亚洲精品国产欧美| 日本人真淫视频一区二区三区| 亚洲国产欧美国产综合久久| 久久国产精品国产自线拍| 99re精彩视频| 亚洲国产无码有码| 亚洲色无码专线精品观看| 国产欧美自拍视频| 亚洲天堂日韩在线| 人妖无码第一页| 婷婷六月综合| 久久精品66| 97在线视频免费观看| 秋霞国产在线| 欧美一级高清片欧美国产欧美| 看国产毛片| 制服丝袜一区二区三区在线| 91人妻在线视频| 国产色爱av资源综合区| 青青青国产视频| 91视频精品| 国产91九色在线播放| 91国内视频在线观看| 久久国产免费观看| 色综合手机在线| 欧美第一页在线| 精品99在线观看| 亚洲二区视频| 美女免费黄网站| 亚洲中文字幕国产av| 国产成人综合久久精品尤物| 色呦呦手机在线精品| 亚洲国产综合精品中文第一| A级毛片高清免费视频就| 久久亚洲日本不卡一区二区| 一级看片免费视频| 99草精品视频| 国产乱视频网站| 国内黄色精品| 亚洲人成影院在线观看| 美女免费精品高清毛片在线视| 72种姿势欧美久久久大黄蕉| 免费毛片在线| 国产亚洲精品自在线| 天堂va亚洲va欧美va国产| 毛片免费观看视频| 国产日韩久久久久无码精品| 国产鲁鲁视频在线观看| 日韩欧美国产区| 波多野结衣无码中文字幕在线观看一区二区 | 国产91丝袜| 青青青亚洲精品国产| 国产男女免费完整版视频| 欧洲精品视频在线观看| 亚洲欧美综合在线观看| 成人福利在线视频| 免费一级大毛片a一观看不卡| 91青青视频| 亚洲AV无码乱码在线观看代蜜桃 | 一本久道热中字伊人| 国产视频一区二区在线观看| 亚洲欧美日韩精品专区| 国产精品视频久| 日本久久网站| 人妖无码第一页| 日本欧美精品| 久久精品无码一区二区国产区| 毛片网站在线看|