李秀芹 張慢麗 李琳











摘? 要:為輔助醫師診斷患者是否患有顱內出血,迅速定位出血病灶的大體位置,提出以EfficientNet網絡為基礎的模型,使用群組歸一化技術改進EfficientNet,并與膠囊網絡相結合構建GECapsule模型,用于在計算機斷層掃描(CT)中進行顱內出血亞類型分類。仿真實驗結果表明,GECapsule模型的收斂速度比EfficientNet網絡快,召回率和F1分數與EfficientNet相比分別提升了2.18%、1.24%。該模型是一種準確、高效的顱內出血亞類型分類模型,有助于醫師減少初診的誤診率,輔助醫生做出恰當適宜的臨床決策。
關鍵詞:顱內出血亞類型分類;EfficientNet網絡;膠囊網絡;計算機斷層掃描
中圖分類號:TP18 ? 文獻標識碼:A ? 文章編號:2096-4706(2021)18-0094-05
Abstract: In order to assist doctors in diagnosing patients with intracranial hemorrhage and quickly locate the general location of bleeding focus, this paper puts forward a model based on the EfficientNet network, improves EfficientNet by using Group Normalization technology, and constructs GECapsule model combined with capsule network, which is used to classify intracranial hemorrhage subtypes in computed tomography (CT). Simulation results show that the convergence speed of GECapsule model is faster than that of the EfficientNet network, and the recall rate and F1 score are increased by 2.18% and 1.24% respectively compared with EfficientNet. This model is an accurate and efficient classification model of intracranial hemorrhage subtypes, which is helpful for doctors to reduce the misdiagnosis rate of initial diagnosis and assist doctors in making appropriate clinical decisions.
Keywords: classification of intracranial hemorrhage subtypes; EfficientNet network; capsule network; computed tomography
0? 引? 言
顱內出血(Intracranial Hemorrhage, ICH)是一種相對常見的疾病,是由多種因素造成的,包括顱內動脈瘤破裂、顱內腫瘤、高血壓、顱腦損傷等。根據顱內出血位置的不同,ICH可進一步分為五種亞類型[1]:腦實質出血(Intraparenchymal Hemorrhage, IPH)、腦室內出血(Intraventricular Hemorrhage, IVH)、蛛網膜下腔出血(Subarachnoid Hemorrhage, SAH)、硬膜外出血(Epidural Hemorrhage, EDH)和硬膜下出血(Subdural Hematoma, SDH)。不同的出血類型及程度決定了患者是否需要施行外科手術等干預措施[2,3]。顱內出血的亞類型和病灶區域的準確判斷是臨床醫生用以確定采取何種臨床治療方案的關鍵。目前顱內CT的初步診斷多由低年資放射科醫生提供,后期再由高年資放射科醫生進行審核,多項研究顯示,低年資放射科醫生提供的初步診斷存在不同程度的誤診[4]。
近年來,部分學者嘗試將人工智能算法應用于顱內出血亞類型分類。顱內出血亞類型分類用以判斷CT圖像中是否存在顱內出血情況并對其5種亞類型(IPH、IVH、EDH、SDH、SAH)進行分類[5]。顱內出血亞類型分類可以輔助放射科醫生診斷患者是否患有顱內出血,并幫助醫生迅速定位出血病灶的大體位置。在顱內出血亞類型分類算法的研究中,大多數研究采用卷積神經網絡與循環神經網絡相結合的網絡結構,或是通過引入三維卷積神經網絡來提高顱內出血亞類型分類的效果,然而,這些研究忽略了卷積神經網絡在CT圖像上的特征表達能力不夠,通過結合循環神經網絡或引入三維卷積神經網絡的方式來提高顱內出血亞類型分類的效果,不僅對硬件基礎設施要求高,而且會加劇計算資源的消耗。
針對以上問題,本文提出以下方法來應對這些挑戰:本文算法建立在較大數據集樣本基礎上,基于性能優越的EfficientNet網絡。為節省計算資源,加快網絡收斂速度,提出使用群組歸一化技術(Group Normalization, GN)對EfficientNet網絡進行改進。針對卷積神經網絡EfficientNet在CT圖像上特征提取能力不夠這一問題,將使用通過群組歸一化技術改進后的EfficientNet網絡與膠囊網絡聯合重構GECapsule模型。
1? 相關理論基礎
1.1? EfficientNet網絡分析
EfficientNet網絡利用復合系數統一縮放模型的深度、寬度和分辨率這三個維度,以實現卷積網絡在準確率和效率上的優化。一個卷積網絡的定義如式1所示。
其中,Fi表示對第i層的卷積運算,Li表示層Fi在第i個階段被重復了Li次。<Hi,Wi,Ci>表示第i層輸入的shape。EfficientNet將復合系數的確定轉變為優化問題,如式2所示。
其中,w表示卷積核大小,決定了感受野大小;d表示網絡的深度;r表示分辨率的大小。為了調節d、w、r,使得滿足內存(Memory)和浮點數量(FLOPS)都小于閾值要求的目的,提出以下方法,如式3所示。
其中,α、β、γ作為常數可由小型的網格搜索來確定,為復合系數,用來控制模型的擴增。以上是EfficientNet的復合擴展方式。EfficientNet網絡有8個系列,分別為EfficientNet-B0、EfficientNet-B1、EfficientNet-B2、EfficientNet-B3、EfficientNet-B4、EfficientNet-B5、EfficientNet-B6、EfficientNet-B7,其中后面7個系列都是在EfficientNet-B0基礎上使用復合擴展法對網絡進行擴展得到的。EfficientNet通過平衡網絡寬度、網絡深度和網絡分辨率得到更高的精度及效率,且參數量和浮點數量都下降了一個數量級[6]。這正是顱內出血亞類型分類在臨床試驗中需要用到的,因此本文選擇EfficientNet-B0網絡作為基礎模型,并在此基礎上進行改進,以訓練出性能更好的網絡模型。
1.2? 膠囊網絡原理分析
與卷積神經網絡相比,膠囊網絡是一種向量神經網絡,它通過向量計算進行誤差反饋,并用膠囊代替了池化操作,有效地減少了信息的損失[7]。其優勢在于不僅能夠識別圖中所包含的目標特征,而且能夠識別出目標的位置姿態信息。膠囊網絡中的動態路由算法迭代過程為:假設Capsule的輸入特征分別為u1,u2,…,un,下一層的特征向量是v1,v2,…,vk,Wj是變換矩陣。動態路由算法如式4所示。
其中,squash是激活函數,如式5所示,我們使用squash激活函數對特征向量做一個壓縮。
2? 基于改進EfficientNet網絡重構膠囊網絡的顱內出血亞類型分類
2.1? 數據分析與預處理
本實驗使用的數據集來自北美放射學會組織發布的急性顱內出血檢測比賽中的訓練數據。所用的實驗平臺為tensorflow。在訓練中,網絡使用Adam優化器,學習率設置為0.000 125,隨機梯度下降的批量大小設置為32。由于硬腦膜外出血類型在總數據集中的數量最少,故對其進行過采樣。對于每一張CT掃描切片,我們使用腦窗(窗位=40,窗寬=80)、硬腦膜下窗(窗位=80,窗寬=200)和骨窗(窗位=40,窗寬=380)并將它們拼接成輸入圖像的三個通道輸入網絡中[8]。為評價模型在該數據集上的分類性能,實驗中采用分類任務中常見的幾個性能指標,包括準確率、精準度、敏感性、F1分數和曲線下面積(AUC)[9]。
2.2? 改進EfficientNet重構膠囊網絡的模型結構
本文選擇的卷積神經網絡是當前性能優越的EfficientNet,之所以選擇該網絡是因為其具有更強的表征能力[10],適應不同的計算資源。在實驗中先搭建EfficientNetB0網絡,使用預訓練的imagenet權重。為防止過擬合,在EfficientNetB0輸出層之前添加一個Droupout層。EfficientNetB0網絡結構如表1所示。
目前主流的卷積神經網絡都會采用批量歸一化(Batch Normalization, BN)來解決訓練過程中,中間層數據分布發生改變的問題,EfficientNet網絡也是如此。BN在訓練過程中嚴重依賴批次(Batch Size),如果批次很小,計算出來的均值和方差不足以代表整個數據的分布,往往會惡化網絡性能,批次很大時,會超出內存容量,耗費更多的計算資源。而GN的優點是不受批次的影響,當批次取較小值時,GN的效果會比BN好。基于此,為加快網絡收斂速度,節省計算資源,文中提出使用GN層改進EfficientNet網絡。針對EfficientNet網絡在CT圖像上特征提取能力不足,會在池化層丟失大量信息、降低空間分辨率這一問題,引入膠囊網絡。通過膠囊網絡,詳細的姿態信息(如精確的位置、大小等)被保存,使得模型能夠從輸入樣本中提取更精細的圖像特征,提高模型在CT圖像上的特征表達能力。綜上,本文提出使用GN層改進EfficientNet并結合膠囊網絡構建了GECapsule模型,用于準確地進行顱內出血亞類型分類,GECapsule模型結構如圖1所示。
其中,GECapsule模型結構中MBConv塊的內部結構如圖2所示。
相較于原始EfficientNet網絡,GECapsule網絡參數變化不大。其中,EfficientNet網絡總參數和參與訓練的參數分別為4 057 250和4 015 234,GECapsule網絡總參數和參與訓練的參數分別為4 483 996和4 441 980。
2.3? 實驗結果分析
為了驗證本文提出的GECapsule模型在顱內出血亞類型分類上性能更好,將GECapsule模型與EfficientNet網絡進行了仿真實驗對比。
如圖3所示,從EfficientNet網絡和GECapsule模型的損失函數值對比圖中可以看出,GECapsule模型的收斂速度比EfficientNet網絡的收斂速度快。
EfficientNet網絡和GECapsule模型在顱內出血亞類型分類任務中的準確率在訓練集和測試集上的結果對比如圖4所示,可知GECapsule模型的準確率要高于EfficientNet網絡的準確率。
EfficientNet網絡和GECapsule模型在顱內出血亞類型分類仿真實驗中召回率的對比如圖5所示,從圖中可以看出,GECapsule模型在顱內出血亞類型分類任務中的召回率明顯高于EFFICIENT網絡。EfficientNet網絡和GECapsule模型在顱內出血亞類型分類中的評價指標F1分數對比如圖6所示,可知GECapsule模型的F1分數與EfficientNet網絡相比,前者要高于后者。
EfficientNet網絡和GECapsule模型在顱內出血亞類型分類仿真實驗中精準率的對比如圖7所示,曲線下面積結果對比如圖8所示,可知精準率和曲線下面積這兩個評價指標在訓練集和測試集上的結果大致相同。
為了更加清晰地對比EfficientNet網絡和GECapsule模型的性能,接下來以表格的形式展示兩者在顱內出血亞類型分類上的實驗結果。實驗結果中各評價指標的值取最后三次實驗結果的均值。實驗數據表明,GECapsule模型的性能比EfficientNet網絡的性能優越,具體表現為在其他評價指標結果大致相同的前提下,GECapsule模型的召回率比EfficientNet網絡提高了2.18%,F1分數提高了1.24%。顱內出血亞類型分類的實驗結果如表2所示。
考慮到本實驗使用的數據集正負樣本比例不均衡,所以實驗結果應更為關注精準率與召回率這兩個指標。F1分數同時兼顧了分類模型的精準率和召回率。GECapsule模型的F1分數與EfficientNet網絡相比提高了1.24%,故在顱內出血亞類型分類任務上GECapsule模型比EfficientNet網絡表現更好,性能更優越。
2.4? 與其他方法對比
為展示GECapsule模型的優越性,將GECapsule模型與DenseNet121網絡進行對比,DenseNet是一種常用的卷積神經網絡,多次被用于顱內出血亞類型分類任務中,因此可以作為一種基準模型。DenseNet121網絡的訓練參數與GECapsule模型的訓練方法相同,且使用相同的數據集進行實驗。已知DenseNet網絡的總參數是7 043 654,可訓練參數是6 960 006,比GECapsule的總參數和訓練參數分別多2 986 404、2 944 772。
DenseNet和GECapsule在顱內出血亞類型分類上的實驗結果如表3所示,表中各評價指標的值取最后三次實驗結果的均值。由表3可知,GECapsule模型的F1分數比DenseNet網絡提高了3.15%,GECapsule模型的其他各項指標值比DenseNet網絡也都略有提高。因此,在顱內出血亞類型分類上本文提出的GECapsule比DenseNet更具優勢。
3? 結? 論
本文提出了一種建立在較大數據集樣本基礎上、用于顱內出血亞類型分類的GECapsule模型。該模型在顱內出血亞類型分類任務上收斂速度快,泛化能力強,有望應用于臨床,幫助醫生提高工作效率,降低誤診率。本研究也有一定的缺陷和不足。實驗中使用的數據集正負樣本比例是不平衡的,后續將在平衡正負樣本比例的基礎上展開實驗,以探究能否進一步提高顱內出血亞類型分類的精度。
參考文獻:
[1] TAYLOR C A,BELL J M,BREIDING M J. et al. Traumatic Brain Injury-Related Emergency Department Visits, Hospitalizations, and Deaths - United States, 2007 and 2013 [J].MMWR.Surveillance summaries: Morbidity and mortality weekly report. Surveillance summaries/CDC,2017,66(9):1-16.
[2] 常健博,王任直,馮銘.人工智能在顱內出血診斷與治療中的應用 [J].中國現代神經疾病雜志,2019,19(9):622-626.
[3] 李娟,湯翔宇,沈逸,等.基于卷積神經網絡的深度學習算法對顱內出血的類型識別及血腫分割一致性的研究 [J].放射學實踐,2021,36(1):7-12.
[4] 石立達.基于CT影像的顱內出血亞類型分類及分割算法的研究 [D].吉林:吉林大學,2021.
[5] 李代遠.深度卷積信念網絡在顱內CT圖像分類中的應用 [D].長沙:湖南師范大學,2017.
[6] 葉紫璇,肖滿生,肖哲.基于EfficientNet模型的多特征融合肺癌病理圖像分型 [J].湖南工業大學學報,2021,35(2):51-57.
[7] 邱存月.改進膠囊網絡優化分層卷積的亞健康識別算法研究 [D].沈陽:遼寧大學,2020.
[8] 陳銘林.基于深度學習的顱內出血CT影像分析 [D].深圳:中國科學院大學(中國科學院深圳先進技術研究院),2020.
[9] 張鵬,徐曾春,胡平.融合密集連接與注意機制的顱內出血分割方法 [J].小型微型計算機系統,2021,42(7):1458-1463.
[10] 張嘉穎.基于EfficientNet的皮膚癌識別與分類 [J].現代信息科技,2021,5(9):13-15.
作者簡介:李秀芹(1967—),女,漢族,河南漯河人,教授,博士,研究方向:計算機網絡、數據庫與信息處理;張慢麗(1994—),女,漢族,河南周口人,碩士研究生在讀,研究方向:數據挖掘;李琳(1995—),女,漢族,河南永城人,碩士研究生在讀,研究方向:數據挖掘。