李嶺海
(四川大學計算機學院,成都 610000)
基于深度學習的心臟病檢測的研究
李嶺海
(四川大學計算機學院,成都 610000)
心臟病是一類比較常見的循環系統疾病。醫生可以通過超聲心動圖對患者進行檢查,了解患者的心臟結構。超聲心動圖的圖像質量直接影響結果判定的準確性,通過超聲心動圖來判定心臟病的類型具有一定的難度。深度學習是由多個處理層構成的計算模型,可以通過多層的抽象來學習數據的特征。在語音識別、視覺識別、目標檢測和其他如藥物鑒定,基因檢測等領域,深度學習被廣泛應用。介紹通過深度學習快速準確地識別出患者的心臟病變的類型,降低醫生操作的復雜性。
心臟病;超聲心動圖;深度學習
超聲心動圖是應用超聲波回聲探查心臟和大血管以獲取有關信息的一組無創性檢查方法。通過超聲波技術可以產生心臟連續的圖像,這些圖像記錄了心臟運動的狀態和心臟的結構。各種心臟疾病都會表現為心臟結構異常,如先天性心臟病、心肌病、冠心病等。超聲心動圖是診斷心臟疾病非常重要的一種檢測方法。超聲心動圖檢查主要分為三個檢查位點的8個切面,分別為胸骨旁左室長軸;大動脈短軸,左室三個水平(二尖瓣水平、乳頭肌水平、心尖水平)切面;心尖兩腔心、三腔心、四腔心、五腔心切面。在臨床診斷中通常根據不同切面各心腔大小,雙室壁厚度,房間隔、室間隔是否缺損等結構特征,初步診斷各種心臟疾病。但是在超聲檢查過程中,由于心臟結構識別不清及臨床經驗的欠缺,許多疾病的診斷如先天性心臟病都會花費大量的時間。為了提高心臟病檢查的精確度,根據超聲心動圖更快地檢測出來心臟的病變類型,本文研究和對比了機器學習的方法來提取心臟彩超的特征,對不同的心臟病進行分類。
機器學習是一門人工智能的科學,該領域的主要研究對象是人工智能,特別是如何在經驗學習中改善具體算法的性能。寬泛地來說,圖像識別可以分為兩類。一類是手動的設定好規則的獲取圖像的特征;另一類是自動的獲取圖像的特征。
目前,在手動的檢測和獲取特征的算法中,最常用的是SIFT[1],SURF[2]和KAZE[3]算法。另外也有大量的基于SIFT和SURF改進的算法,如PCA-SIFT[4],ASIFT[5],M-SURF[6]。SIFT,SURF和KAZE算法之間最大的不同是尺度空間的選擇。SIFT和SURF使用高斯向量空間,通過線性擴散或高斯導數的相似性來檢測特征,KAZE使用非線性的濾波擴散。通過構建尺度空間,檢測到極值點,獲取尺度的不變性,最終生成圖像的特征描述,超聲心動圖中包含的心臟結構的信息可以被提取出來,同時可以減少其他噪聲的影像。
深度學習如今最常用的自動獲取圖像特征算法。深度學習屬于機器學習,通過每一層的網絡結構獲取從低級到高級的分層的特征。經常使用的深度學習模型有卷積神經網絡(CNN)[7],深度置信網絡(DBN)[8],回歸神經網絡(RNN)等。得益于高性能計算系統如GPU集群[9]和大的數據集,卷積神經網絡在提取圖像特征方面取得了巨大的成功[10],在CNN的基礎上有些改進的算法,如AlexNet,Network in Network,BGGNet,GoogLe Net等。傳統的CNN一般來說是由線性卷積層、池化層、全連接層堆疊起來的神經網絡。卷積層通過線性濾波器進行線性卷積運算,然后對結果進行非線性運算,最終生成特征圖。這些改進的神經網絡和傳統的CNN相比,擁有更深的層次,可以學習到更加抽象的特征,網絡的參數更少,泛化能力更強,可以應用到多個場景,卷積核的變小,卷積的方式復雜,可以提取出更多的特征。
本文對比了SIFT,SURF,KAZE,深度學習分類超聲心電圖的的準確率,并且闡述了每種算法在心臟病分類的優劣,其中深度學習的算法是對卷積神經網絡的改進,提高了識別的準確率。
常見的心臟病有先天性心臟病、肥心病、冠心病、二尖瓣置換、心臟瓣膜病、主動脈增寬、高血壓、擴心病等,本文選取常見心臟病中的9類進行分類,還有一類是健康人的心臟彩超。每一類的樣本有大約有100個患者的彩超圖像集,每個患者的超聲圖像都包含8個切面圖,患者的年齡從10歲到70歲,平均年齡是35歲,每個切面圖的像素大小是3×430×540。數據采集完成之后要對數據進行預處理,每幅圖像移動滑動像素窗口裁剪成多個3×256×256大小的圖像,然后把裁剪后的圖像按照順時針分別旋轉90度、180度、270度、360度,生成4幅圖像,這樣可以擴大樣本集,每一類的心臟病包含的圖像集約為10000個,然后取9000個作為訓練集,1000個作為測試集。
使用SIFT,SURF,KAZE算法分別在提起所有患者超聲切面圖像的特征,然后用比較測試圖像特征值和訓練圖像特征值的距離,計算出識別的準確率。
圖1展示了深度神經網絡的結構,圖像的大小是3×256×256像素,每次取100幅圖像進行批量訓練,在訓練的過程中需要把像素均值化,本文采用的圖像均值是ImageNet數據中的圖像均值[11]。圖中的1和2指示分別表示最后一層連接的方式,方式1使用全局池化的方式連接,這樣可以減少整個網絡的參數,增強網絡的泛化性。方式2使用兩層全連接的方式,然后進行分類,計算誤差。模型的訓練采用的是批量隨機梯度下降的方法[12],權重參數下降的勢能是0.9,權重減少比重是0.0005。權重參數變化的公式是:

其中i是迭代的索引,v是勢能變量,∈是學習率。初始化參數的時候,采用VGGNet先對每一層進行預訓練,獲得權重的初始化值,激活函數采用RELUs[12]。學習率開始的時候采用0.01,隨著迭代次數的增加學習率不斷的衰減。每一層的學習率相同。

圖1 深度神經網絡的結構
模型的實現使用的是常用的深度學習框架Caffe,Caffe是由加州伯克利大學視覺和學習中心和社區的貢獻者開發維護的深度學習框架,Caffe是開源可擴展的,在GPU上處理圖像,使用NVIDIA K40的GPU可以在1毫秒處理一幅圖像,使用Caffe可以讓訓練好的模型迅速的在工業上使用。本文采用的深度學習模型對比了兩種結構,區別是有沒有采用全連接層,這兩種結構都是使用Caffe來實現,在NVIDIA K40 GPU上訓練模型,訓練好的模型可以在毫秒級的時間中識別心臟病的類型。
對比這幾種算法對于超聲心動圖的識別準確率如表1。其中CNN1代表的是沒有全連接層的深度神經網絡,CNN2代表的是有全連接層的深度神經網絡。

表1 心臟病類型識別的準確率
對比得知,SIFT,SURF和KAZE傳統的提取圖像特征的算法準確率不高,使用深度學習對心臟病的分類取得的效果更好。SIFT,SURF和KAZE提取的都是圖像的淺層特征,如果同一類的圖像發生了變換或者噪聲增加,就會影響判斷的準確性,提取的特征不能真實地反映出圖像的本質。深度神經網絡提取了超聲彩圖的多層特征,越到最高層,提取的特征越能表現出圖像的本質,使用多個卷積核,經過線性和非線性的變換,可以提取出圖像多個維度的信息,神經網絡的訓練比較耗時,因為參數非常之多,全連接層的參數占據了很大的比例,把全連接層換成了全局池化,這樣可以大量的減少參數,而且也可以防止模型的過擬合。總之,一個深度的卷積神經網絡能夠在一些復雜的數據集上取得優秀的結果,網絡的深度和卷積核的數量都會影響模型的準確度。
從目前數據可知,深度學習模擬超聲心動圖對心臟疾病的診斷與傳統醫師檢查重復性較好。目前,超聲心動圖診斷心臟疾病過程較繁雜,醫師需花費大量的時間學習識別切面,且在醫療水平較低的地區,一些少見疾病較易漏診。利用深度學習幫助超聲醫生診斷疾病,可大大減少超聲醫生的工作量,且可與醫師診斷結果對比,較早提示心臟結構異常。
[1]D.Lowe,Distinctive Image Features from Scale-Invariant Key Points,Int.J.Comput.Vision,60(2)(2004)91-110.
[2]H.Bay,A.Ess,T.Tuytelaars,L.Van Gool,Speeded-up Robust Features(SURF),Comput.Vision Image Underst,110(2008):346-359.
[3]P.F.Alcantarilla,A.Bartoli,A.J.Davison,et al..KAZE Features,in:A.Fitzgibbon,et al.(Eds.),ECCV 2012,Part VI,LNCS,7577, Springer-Verlag,Berlin Heidelberg,2012:214-227.
[4]Y.Ke,R.Sukthankar,PCA-SIFT:a More Distinctive Representation for Local Image Descriptors,in:IEEE Conference Computer Vision and Pattern Recognition,2004:506-513.
[5]J.M.Morel,Y.Guoshen,ASIFT:a New Framework for Fully Affine Invariant Image Comparison,SIAM J.Imag.Sci,2(2009):438-469.
[6]M.Agrawal,K.Konolige,M.R.Blas,CenSurE:Center Surround Extremes for Rea-Time Feature Detection and Matching,in:D. Forsyth,P.Torr,A.Zisserman(Eds.),ECCV 2008,Part IV.LNCS,vol.5305,Springer,Heidelberg,2008:102-115.
[7]Yann LeCun,L′eon Bottou,Yoshua Bengio,Patrick Haffner.Gradient-Based Learning Applied to Document Recognition.Proceedings of the IEEE,86(11):2278-2324,1998.
[8]A.Krizhevsky.Convolutional Deep Belief Networks on Cifar-10.Unpublished Manuscript,2010.
[9]Dean,J.,Corrado,G.,Monga,R.,Chen,K.,Devin,M.,Mao,M.,Ranzato,M.,Senior,A.,Tucker,P.,Yang,K.,Le,Q.V.,and Ng,A.Y. Large Scale Distributed Deep Networks.In NIPS,pp.1232-1240,2012.
[10]Alex Krizhevsky,Ilya Sutskever,Geoff Hinton.Imagenet Classification with Deep Convolutional Neural Networks.In Advances in Neural Information Processing Systems 25,pages1106-1114,2012.
[11]J.Deng,W.Dong,R.Socher,L.-J.Li,K.Li,L.Fei-Fei.ImageNet:A Large-Scale Hierarchical Image Database.In CVPR09,2009.
[12]Y.Le Cun,B.Boser,J.S.Denker,D.Henderson,R.E.Howard,W.Hubbard,L.D.Jackel,et al.Handwritten Digit Recognition with a Back-Propagation Network.In Advances in Neural Information Processing Systems,1990.
[13]V.Nair,G.E.Hinton.Rectified Linear Units Improve Restricted Boltzmann Machines.In Proc.27th International Conference on Machine Learning,2010.
Detection of Heart Disease By Echocardiography Based on Deep Learning
LI Ling-hai
(College of Computer Science,Sichuan University,Chengdu 610000)
Heart disease is a common disease of circulatory system.The clinician can examine the patient with the echocardiography,and then know about the heart structure of patient.The quality of echocardiographic images directly affects the accuracy of the examination.It is difficult to determine the type of heart disease by echocardiography.Deep learning allows computational models that are composed of multiple processing layers to learn representations of data with multiple levels of abstraction.These methods have dramatically improved the state-ofthe-art in speech recognition,visual object recognition,object detection and many other domains such as drug discovery and genomics. Introduces the application of deep learning in quick and precise detection of heart disease types and the application can reduce the complexity of operation.
Heart Disease;Echocardiographic Images;Deep Learning
1007-1423(2017)09-0091-04
10.3969/j.issn.1007-1423.2017.09.021
李嶺海(1982-),男,河南南陽人,碩士研究生,研究方向為機器學習、深度學習
2017-02-15
2017-03-15