999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于改進卷積神經網絡的肺炎影像判別

2017-05-10 07:02:54劉長征相文波
計算機測量與控制 2017年4期
關鍵詞:特征

劉長征,相文波

(哈爾濱理工大學 計算機科學與技術學院, 哈爾濱 150080)

基于改進卷積神經網絡的肺炎影像判別

劉長征,相文波

(哈爾濱理工大學 計算機科學與技術學院, 哈爾濱 150080)

目前肺炎類型判別主要依靠醫生的經驗,但一些肺炎的CT影像極為近似,即使有經驗的醫生,也容易判別錯誤,造成誤診;為此提出卷積神經網絡分類算法,該算法由3個卷積層、3個亞采樣層及1個完全連接層組成,并且對卷積層進行了特殊結構處理,由反向傳播算法調整網絡參數,并對反向傳播過程提出了改進;臨床實驗證明,該方案較現在普遍研究的分類算法,如adaboost算法和svm算法具有更高的識別率和準確度,并且改進的卷積神經網絡防止了訓練數據時過擬合現象的產生。

肺炎判別; CT影像; 深度學習; 細微特征差異

0 引言

目前肺炎按照病理形態學分類,可以將肺炎分成大葉肺炎、支氣管肺炎、間質肺炎及毛細支氣管炎等。這些肺炎CT圖像十分相似,醫生根據肺部紋理,斑片狀影,陰影密度,炎癥部位進行判斷。由于經驗不足,誤診情況時有發生。

為此國內外做了大量研究。文獻[4]提出了基于圖像處理技術的方法,提取肺炎紋理LBP特征作為識別特征,用bp神經網絡識別,但是識別率太低,bp神經網絡結構的選擇至今尚無一種統一而完整的理論指導,一般只能由經驗選定。網絡結構選擇過大,訓練中效率不高,可能出現過擬合現象,造成網絡性能低,容錯性下降,若選擇過小,則又會造成網絡不收斂。文獻[5]提出了采用方向梯度直方圖特征(Histogram of Oriented Gradient, HOG),加樸素貝葉斯方法對肺炎類型識別的方法。通過計算和統計圖像局部區域的梯度方向直方圖來構成特征,用樸素貝葉斯分類,但hog特征并不能很好地表示斑片狀影,陰影密度,炎癥部位,因而識別率低。 文獻[6]提出采用adaboost算法對肺炎識別判斷,文獻[13]提出采用svm算法對肺炎紋理識別判斷,雖然識別率有所提高,但準確率依然滿足不了實際應用,主要在于人為提取的特征不一定是最好識別特征,除了紋理特征還有陰影密度等等。

深度學習技術是現代人工智能領域的一個新的研究方向,它通過模仿人腦學習過程構建學習模型。深度學習的概念由Hinton等人于2006年提出,其本質上是通過大量有標簽的訓練數據,學習輸入到輸出的一種映射關系,而不需要精確的數學表達式。卷積神經網絡是深度學習技術的一種模型,該模型通過局域感受野、權值共享和次抽樣處理,而具有位移、縮放和扭曲不變性。局域感受野可以提起初級的視覺特征,權值共享可以減少神經元之間的參數,減少訓練學習的時間,次抽樣減小了特征分辨率,實現了扭曲不變性。卷積神經網絡的特征提取是通過訓練數據自主學習,所以在使用卷積神經網絡時,避免了顯示提取特征不理想的缺陷,而隱式地從訓練數據中進行學習。

本文提出基于改進卷積神經網絡的肺炎分類算法。該算法可以通過大量不同肺炎類型CT圖像自主學習出對應肺炎的特征,避免了人為選取特征的缺陷,提高了肺炎分類的準確率。

1 算法設計

1.1 CNN結構設計

識別肺炎類型的CNN網絡結構設計如圖1所示,共有七層,C1層是一個卷積層,由12個60*60像素大小的特征圖(Feature Map)構成。特征圖中的每一個神經元與輸入層中5*5的鄰域相連,用5*5大小的卷積核去遍歷卷積64*64像素大小圖片中的每一個5*5大小的單元,最終獲得(64-5+1)*(64-5+1)=60*60大小的一個特征圖。

圖1 CNN結構

同一個特征圖使用的是同一個卷積核。用12種不同的卷積核就得到了12種不同的特征圖。訓練開始時,這12個卷積核是隨機賦予的初始值,在后面訓練過程中,不斷調整,最終得到能提取出特征的卷積核模板。卷積神經網絡提取特征的實質是訓練出能提取特征的卷積核。S1層是一個下采樣層,它是采用圖像局部相關性的原理,對圖像進行子抽樣,可以減少數據的處理量,加快收斂時間同時保留有用信息,它獲得12個30*30的特征圖。特征圖中的每個單元與C1中相對應特征圖的2*2鄰域相連接。S1層每個單元的4個輸入相加,乘以一個權值,再加上一個偏置。結果通過sigmoid函數計算。

y=Sigmoid[w*sum(xi)+b]

(1)

其中:權值w和偏置b控制著sigmoid函數的非線性程度。如果權值比較小,那么運算近似于線性運算,亞采樣相當于模糊圖像。如果權值比較大,亞采樣可以根據偏置的大小看成是有噪聲的“或”運算或者有噪聲的“與”運算。每個單元的2*2相鄰區域并不相互重疊,因此S2中的每個特征圖的大小都是C1中特征圖大小的1/4(行和列各1/2)。C2層也是一個卷積層,它同樣通過5x5大小的卷積核去卷積S2層,此時有24種不同的特征圖。C2中的每個特征圖是通過連接到S2中的幾個特征圖的不同組合或者全部的12個特征圖。原因有兩點:1)不完全的連接機制將連接的數量保持在合理的范圍內;2)其破壞了網絡的對稱性。由于不同的特征圖來自不同的輸入,所以迫使他們抽取的是不同的特征(希望是互補的)。余下的卷積層及子采樣層與前面的層是一樣的,只是隨著深度的加深,提取的特征更加抽象,也更具有表達能力。輸出層是與S3的一個全連接層。輸出層共有兩個神經元,可用二進制,代表4種肺炎類型,S3有24*5*5=600個神經元,則輸出層共有600*2=1200個鏈接。

1.2 卷積層結構改進

為了避免卷積神經網絡在訓練時產生過擬合現象,在卷積層中,加入了如兩個特殊標志符x1、x2,其中x1記錄經過卷積后,該數據的波動范圍,x2記錄該數據是否被激活。如果x1在設置的特定閾值范圍內波動范圍小于該值,該數據下次迭代訓練時停止更新,這樣可以防止過度擬合。當x2處于激活狀態是,該神經元數據下次進行正常卷積,若果處于非激活狀態則不進行卷積。這樣在訓練總是一部分神經元參與訓練。對于每次輸入到網絡中的樣本,其對應的網絡結構都是不同的,但所有的這些不同的網絡結構又同時共享隱含節點的權值。這樣不同的樣本就對應不同的模型,這樣就可以很好地防止了過擬合現象的產生。圖2和圖3是示意圖。圖2表示標準神經元訓練時的情況,圖3表示改進神經元訓練時的情況。其中虛線表示非激活神經元鏈接。

圖2 標準神經網絡訓練時情況

圖3 改進后神經網絡訓練時情況

1.3 卷積神經網絡訓練原理

卷積神經網絡的訓練過程就是不斷調整神經元與神經元之間權值的過程,即卷積核數據的調整。當實際輸出與標準輸出不同時,計算誤差,采用反向傳播算法(back propagation,BP)來調整參數,實現權值更新,最終完成學習任務。網絡更新權值[8]公式為:

w(t+1)=w(t)+η*δ(t)*x(t)

(2)

其中:x(t)為神經元的輸出,δ(t)表示該神經元的誤差項,η表示學習率。

卷積神經網絡通過卷積層和亞采樣層的相互配合來學習原始圖像的特征。卷積神經網絡中卷積層的網絡結構采用卷積的離散型[9],表示為:

(3)

其中:Mβ代表輸入特征的一個選擇;k代表卷積核;r代表網絡的層數;b代表每個輸出特征映射添加的偏置,對于特定的輸出映射,輸入的特征映射可以應用不同的卷積核卷積得到;f代表卷積層神經元所用的激活函數,采用的sigmoid函數,sigmoid函數把[-∞,+∞] 映射到[0,1]。亞采樣層的作用是對輸入的特征映射進行采樣,采樣后,輸入特征與輸出的特征數目不會改變,但是輸出特征的大小與輸入特征相比會大幅減少。亞采樣層[12]表示為:

(4)

其中:sub(·)表示亞采樣所用的函數,B和b都是輸出特征的偏置。f的含義與卷積層的類似,表示亞采樣層神經元的激活函數。

2 實驗及結果分析

2.1 實驗設置

實驗是在Matlab2013a環境下完成的,操作系統為Windows7,Dual-CoreCPU,主頻2.94GHz,內存4GB。實驗所用CT圖像均取自哈爾濱醫大二院,共選取了2000張肺炎CT圖像,其中選取大葉肺炎、支氣管肺炎、間質肺炎及毛細支氣管炎CT圖像各500張。

2.2 圖像預處理

卷積神經網絡可以直接從圖像中提取特征,但是每張影像的人體肺部位置、肺部大小有一定差別,如果在整幅圖中直接進行測試會影響結果。因此需要一些圖像預處理操作,采用圖像閾值分割技術,由于肺葉處像素值低于其他部位,因此采用閾值分割技術只提取出兩個肺葉部位的圖像。具體流程:首先復制圖像,根據閾值對圖像進行分割,因肺部有白色紋理,分割出的肺部有空洞,這時采取閉運算操作來彌補空洞,然后進行輪廓提取,此時的輪廓位置就是原圖的輪廓位置。提取原圖的輪廓內像素,按行依次存放到二維數組,因提取出的肺部數據大小不一,同時為了減少卷積神經訓練運算量和確定卷積神經網絡輸入層神經元數目,將提取后的肺葉圖像歸一化為64*64像素大小,在減少運算量的同時,基本特征也保留了下來。提取效過程如圖4,左圖為原圖,中間為處理中間結果,右圖為原圖中提取的輪廓。

圖4 預處理過程圖

2.3 訓練過程

訓練神經網絡設置的迭代次數為1000,誤差為0.05.到誤差小于0.05時即使迭代次數不到1000次,也停止訓練。

在訓練卷積神經網絡時,隨機初始化卷積層中x2值,使其一半處于激活狀態,一半處于非激活狀態,將出現激活狀態的神經元經行卷積,不出現激活狀態的神經元不予處理,保持原有權值。同時還檢測卷積層中x1的數值,當在80次訓練中其波動范圍小于0.01,則讓x2的數值永遠改為非激活狀態。代表著這個數值已經訓練完畢,下次不用再重復計算,這樣可以提高收斂速度,同時避免了再次精確逼近“假理想值”的情況,避免過擬合現象。

2.4 實驗結果

實驗采用簡單的交叉驗證,首選隨機地將肺炎CT圖像分為兩個部分,一部分做為訓練集,另一部分作為測試集。訓練集中隨機的抽取了大葉肺炎、支氣管肺炎、間質肺炎及毛細支氣管炎類型的CT圖像各400。剩下的數據集作為測試組。測試結果如圖5所示。

圖5 測試結果

為了能詳細說明不同肺炎的識別的準確率,統計如表1所示。

表1 統計結果

從實驗結果中可以看出大葉性肺炎和間質性肺炎識別率高達90%以上,支氣管肺炎和毛細支氣管肺炎識別率稍偏低一些,主要是在分類時有一部分支氣管肺炎識別成毛細支氣管肺炎導致的,由于毛細支氣管的炎性往往可累及肺泡,肺泡壁和肺間質,導致毛細支氣管炎并發支氣管肺炎。訓練樣本中可能有一些毛細支氣管炎并發支氣管肺炎,導致這兩種肺炎類型識別率偏低。

2.4.1 本方法與其他識別算法對比

支持向量機(support vector machine,SVM)工具箱選擇林智仁教授開發的libsvm 3.17。實驗中SVM選擇高斯核函數,核函數寬度為5,懲罰系數為1 000。Ababoost算法采用Opencv 2.4.10版本中的庫函數。其中參數設置如下:訓練層數設置為20,分裂子節點數目,選取默認值 2。試驗同樣采用CNN測試的樣本,大葉性肺炎、支氣管肺炎、間質性肺炎、毛細支氣管炎各100張。 實驗結果如表2所示,可知:卷積神經網絡的分類效果明顯優于其他兩個算法,訓練時間雖然比其他兩種算法用時長,但測試時間基本相近。

表2 不同識別方法實驗結果

卷積神經網絡準確率高于Adaboost算法和SVM算法,主要原因是卷積神經網絡不需要人為的提取特征,它自主學習不同類別間的差異,而Adaboost算法和SVM算法都是通過提取肺炎的LBP特征,用于分類識別,而人為提取的特征往往有局限性,不能很完美的多方面表現出不同類別之間的本質特征。卷積神經網絡訓練時間長的主要原因是因為神經元數量多,且需要多次迭代調整權值,計算量大。但訓練完成以后,調整好的權值被保存下來,在測試的時候直接讀取權值,因此測試時間就少了。

2.4.2 本方法與deepLearnToolbox中的CNN算法對比

為了測試改進后的算法準確率和預防過擬合現象效果,分別對不同種類肺炎各100張、150張、200張、250張、300張、350張、400張進行了測試,deepLearnToolbox CNN算法測試結果用藍線表示,改進后的CNN算法測試結果用綠線表示,如圖6所示。

圖6 準確率測試結果

從結果圖中可以看出,改進后的CNN算法,訓練時成功的避免了過擬合現象且準確率基本和標準算法一致。

這是由于在訓練神經網絡時,隱含節點都是以隨機概率出現,這樣就不能保證訓練時都使用同樣的隱含節點,這樣權值的更新不再依賴于有固定關系的隱含節點,一半激活,一半非激活,阻止了某些特征僅僅在其它特定特征下才有效果的情況。在每次迭代過程中,由于每次隨機忽略的隱層節點都不同,這樣每次得到的訓練網絡都是不同的,每次訓練都可以單做一個“新”的模型,隨著訓練的進行,大部分半數網絡都可以給出正確的分類結果,少數服從多數這就避免了一些特例的產生。這樣就很好地避免了過擬合現象的發生。

但是改進后的方案會帶來模型的訓練開銷,由于迭代時總有一些神經元沒有訓練,這樣導致需要多次迭代,導致訓練時間偏長,這可以作為一個繼續解決的技術問題。實驗測試效果如圖7所示。CNN算法測試結果用藍線表示,改進后的CNN算法測試結果用綠線表示。

圖7 訓練時長測試結果

3 結論

為了幫助醫生,減少肺炎類型誤診的情況,設計了計算機輔助診斷的方法,并優化了卷積神經網絡結構和訓練方法。通過實驗證明,改進后的算法相比其他算法識別率要高,與標準CNN算法相比,成功的防止了過擬合現象的產生,該方法具有一定的可行性,可以成為醫生輔助診斷肺炎類型的工具。但是改進后訓練時間偏長,可以作為以后的一個研究方向。

[1] Ripley B D. Pattern recognition and neural networks[M].Posts and Telecom Press, 2012.

[2] Warnick K F.Numerical methods for engineering:an introduction using MATLAB and computational electromagnetic[M].Raleigh, NC: SciTech Pub. ,2013:20-33.

[3] Neural Network Toolbox[Z]. Mathworks,2007:1-13.

[4] 張 亮,王齊凱. 基于bp神經網絡的肺炎分類[J]. 華南理工大學學報(自然科學版),2015,42(1): 72-76.

[5] 李慶華,王 芳. 基于樸素貝葉斯的肺炎分類方法研究[J]. 科技大學學報(自然科學版),2014,12(1): 32-36.

[6] 趙 宏,楊紹強. 基于svm的肺炎分類識別研究[J]. 系統仿真學報,2014,22(3):638-641.

[7] 陳先昌.基于卷積神經網絡的深度學習算法與應用研究[D].杭州:浙江工商大學,2013.

[8] 韓力群.人工神經網絡理論、設計及應用[J].北京:化學工業出版社.2001.

[9] 許 可.卷積神經網絡在圖像識別上的應用研究[D].杭州:浙江大學,2012.

[10] Lawrence S, Giles CL, Tsoi AC, et al. Face recognition: A convolutional neural network approach[J]. IEEE Trans. on NeuralNetworks, 2015, 8(1): 98-113.

[11] Mate S, Akira Y, Munetaka Y, Jun O. Pedestrian detection with convolutional neural networks[A]. IEEE IntelligentVehicles Symposium Proceedings[C]. USA: IEEE, 2014: 224-229.

[12] Kavukcuoglu K,Sermanet P,Boureau Y,et al.Learning convolutional feature hierachies for visual recognition[A].In:Advances in Neural Information Processing Systems[C].2013.

[13] Ji S,Xu W,Yang M,et al.3D convolutional neural networks for human actionrecognition[A]. Proceedings of the 28th International Conference on Machine Learning[C]. 2010:495.502.

[14] 周永騰,張啟明. 基于adaboost算法的肺炎識別研究[D]. 計算機應用研究,2013,42(1): 72-76.

Recognition of Pneumonia Type Based on Improved Convolution Neural Network

Liu Changzheng, Xiang Wenbo

(School of Computer Science and Technology, Harbin University of Science and Technology, Harbin 150080, China)

Currently, the diagnosis of pneumonia type mainly depends on the experience of doctors. But some of the CT images of pneumonia were very similar. It is easy to misdiagnose, even experienced doctors. Therefore, a classification algorithm based on convolution neural network is proposed, which consisted of three convolution layers,three subsampling layers and one fully connected layer , and also a special structural processing is proceeded on the convolution layer. The network parameters are regulated through back propagation algorithm, which can also improve the back propagation process. The clinical experimental results show that the algorithm can accurately classify CT images of different pneumonia than general research recognition algorithm,such as Adaboost and SVM algorithms, and the revised convolution neural network can prevent over-fitting phenomena in training data.

recognition of pneumonia type; CT image; deep learning; subtle differences

2016-11-06;

2016-11-28。

國家自然基金項目(61403109);黑龍江省自然科學基金(F201240);黑龍江省教育廳科技研究項目(12531571)。

劉長征(1969-),男,博士,教授,主要從事虛擬現實技術方向的研究。

1671-4598(2017)04-0185-04

10.16526/j.cnki.11-4762/tp.2017.04.051

TP242.6+2

A

猜你喜歡
特征
抓住特征巧觀察
離散型隨機變量的分布列與數字特征
具有兩個P’維非線性不可約特征標的非可解群
月震特征及與地震的對比
如何表達“特征”
被k(2≤k≤16)整除的正整數的特征
中等數學(2019年8期)2019-11-25 01:38:14
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
詈語的文化蘊含與現代特征
新聞傳播(2018年11期)2018-08-29 08:15:24
抓住特征巧觀察
基于特征篩選的模型選擇
主站蜘蛛池模板: 午夜国产在线观看| 欧美成人综合视频| 亚洲成人在线网| 538精品在线观看| 亚洲第一成年网| 成人国产免费| 成人在线天堂| 日本a级免费| 999精品视频在线| 免费午夜无码18禁无码影院| 国产一级妓女av网站| 欧美综合一区二区三区| 大陆精大陆国产国语精品1024| 亚洲天堂久久久| 精品少妇人妻无码久久| 亚洲视频免费在线| 毛片网站在线看| 国产网站免费观看| 成人无码一区二区三区视频在线观看| 国内精品小视频在线| 国产美女91呻吟求| 亚洲一区二区无码视频| 国产精品成人不卡在线观看| 成人一级免费视频| 亚洲第一黄色网| 国产精品99久久久| 国产乱子伦手机在线| 久久婷婷五月综合97色| 亚洲中文字幕日产无码2021| 无码国产偷倩在线播放老年人| 欲色天天综合网| 日韩在线永久免费播放| 亚洲欧洲日产国产无码AV| 亚洲第一视频免费在线| 极品性荡少妇一区二区色欲| 中文字幕第4页| 国产精品手机视频| 国产精品毛片一区| 国产迷奸在线看| 真实国产精品vr专区| 国产成人亚洲毛片| 久久久精品国产亚洲AV日韩| 国产成人AV男人的天堂| 免费一级α片在线观看| 九九热精品免费视频| 国产欧美精品专区一区二区| 国产无码网站在线观看| 欧美激情成人网| 蜜桃视频一区二区| 国产无码在线调教| 国产精品jizz在线观看软件| 亚洲国产精品久久久久秋霞影院| 亚洲国产欧美目韩成人综合| 91成人在线观看| 欧美中出一区二区| 92午夜福利影院一区二区三区| 成人亚洲国产| 国产精品yjizz视频网一二区| 尤物精品国产福利网站| 欧美精品伊人久久| 日本三级黄在线观看| 亚洲无码精品在线播放| 国产一区二区丝袜高跟鞋| 色爽网免费视频| 人人澡人人爽欧美一区| 伊人久久精品无码麻豆精品 | 国产免费怡红院视频| 91青青视频| 污网站免费在线观看| 欧美黑人欧美精品刺激| 小说 亚洲 无码 精品| 成人在线第一页| 色悠久久综合| 亚洲中文字幕久久精品无码一区| 亚洲色无码专线精品观看| 日本黄色不卡视频| 亚洲一级毛片在线播放| 精品人妻系列无码专区久久| 国产精品hd在线播放| 亚洲人人视频| 成年免费在线观看| 国产成人高清精品免费软件|