999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

3D-CNN 在肺癌圖像識別中的應用研究

2022-07-29 06:54:38李雅迪韓佳芳馬琳琳
智能計算機與應用 2022年8期
關鍵詞:肺癌分類特征

李雅迪,韓佳芳,馬琳琳

(鄭州財稅金融職業學院 信息技術系,鄭州 450048)

0 引言

肺癌是目前嚴重危害人類健康的惡性疾病之一,在全世界范圍內肺癌的發病率和死亡率都在上升。雖然現有各種靶向治療方案,但晚期肺癌的預后很差,一旦確診,絕大多數的患者會在五年內死亡,因此肺癌的早發現、早診斷、早治療在一定程度上能夠提高存活率。現有的肺癌診斷主要是基于肺部計算機斷層掃描(Computed Tomography,CT)圖像的初期篩查,現有的計算機輔助診斷(Computer Aided Diagnosis,CAD)方法就是對肺部CT 圖像進行預處理、分割、特征提取等過程。其中,預處理過程是將肺部可疑組織從復雜的解剖圖像中剝離出來,該步驟操作復雜、工作量巨大。

隨著人工智能的快速發展,基于深度學習技術的卷積神經網絡模型在圖像分類領域取得了很大的進展。將該技術應用到醫療圖像的分類識別中,可以簡化圖像的預處理過程,提取到更豐富的特征信息,而且豐富的數據集和高性能的計算機軟硬件也使得深度學習的訓練過程更加簡便、高效。例如,Google 公司研發的乳腺癌智能檢測系統,檢出率高達92%;Korbar 在2017 年設計了精確度高達93%的卷積神經網絡系統,通過對腸道染色體來識別帶有致癌隱患的腸道息肉等。由于本文采用的數據集是三維立體的肺部CT 掃描圖像,而目前的卷積神經網絡模型多用于處理二維平面圖像,因此在對肺部CT 圖像分類識別時,需要將其切割成二維平面圖像,但在提取圖像特征信息時會丟失CT圖像切片之間的特征信息,對圖像的分類識別造成影響。

針對以上問題,本文以深度學習中卷積神經網絡模型為基礎,對網絡結構進行調整,構建了三維卷積神經網絡(Three-dimensional Convolutional Neural Network,3D-CNN)模型,結合特定順序的輸入策略,并在公開的Kaggle Data Science Bowl 2017 數據集上進行實驗。實驗結果表明,本文提出的方法能夠對原始圖像進行有效分類識別,省略了傳統方法中復雜的圖像預處理過程,有較好的識別率。

1 本文研究方法

1.1 三維卷積神經網絡模型

本文中構建的3D-CNN 模型架構如圖1 所示。圖1 中,首先對所有的肺部CT 圖像進行簡單的預處理,按照先正常人、后肺癌病人的CT 圖像的特定順序重新組織數據集,預處理后的肺部CT 圖像分別經過卷積層層、池化層層、卷積層層、池化層層、卷積層層和池化層層來提取圖像的主要特征信息,全連接層將提取到的分布式特征信息進行整合,判斷輸入圖像所屬類別。

圖1 3D-CNN 架構圖Fig.1 The structure of 3D-CNN

本文提出的端到端的三維卷積神經網絡模型作為肺部CT 圖像的分類模型,其層級結構的具體設置如下:

(1)3D 卷積層。先設定好卷積核的尺寸、步長、填充選項和卷積核的數量,然后與多個相鄰的圖像幀做加權求和的卷積計算,來提取目標圖像特定區域的特征信息,不同的卷積核應用在圖像的不同區域,來提取圖像的多種特征信息。第層的第個特征圖的(,,) 處的輸出,研究推導出的數學公式可寫為:

(2)激活層。由于在卷積層中做加權求和的線性運算,輸出的特征圖譜帶有明顯的線性特征,而線性特征的表現力不足以表達圖像的關鍵信息,需要通過激活函數添加非線性因素,將圖像特征保留并映射出來。激活函數主要有非線性、可微性、單調性和在原點處近似線性等特性,能夠使訓練快速收斂,解決梯度彌散的問題。本文中采用了修正線性單元(Rectified Linear Unit,)激活函數,有單邊抑制特性,小于0 的值全部設為0,大于0 的值則直接輸出,數學公式具體如下:

(3)3D 池化層。池化層的功能是對上層激活層輸出的特征圖譜下采樣,通過該層將特征圖譜關鍵的特征像素標注出來,在一定程度上簡化了參數的運算過程、抑制了過擬合的現象,同時能夠提高模型的泛化能力。池化方法主要有均值池化(Mean Pooling)、最大池化(Max Pooling)、重疊池化(Overlapping Pooling)、均方池化(Pooling)、歸一化池化(Local Contrast Normalization)、隨機池化(Stochastic Pooling)、形變約束池化(Def-pooling)等等。

為了簡化各層的計算過程,提取主要特征,本文選取了最大池化方法,取局部接受域中的最大值為該層輸出,推得的數學公式見式(3):

其中,為池化層的輸入;(,,)分別是高度、寬度和深度三個維度上的池化尺寸;(,,)為3 個維度上的采樣步長值。

(4)全連接層。全連接層(Fully Connected layers,FC)通過對上層輸出的特征圖譜進行卷積計算,將獲取到的分布式特征映射到樣本標記空間,將這些分布式特征組裝成完整的“圖”,確定該特征圖譜所屬分類。該層的優點在于減少特征位置對分類結果的影響,提高整個網絡模型的魯棒性。

(5)算法。由于條件的限制,數據集的種類和質量上存在不足之處,比如類型單一、可用的數據量太少等,導致在模型訓練的過程中出現分類結果曲線與訓練數據曲線重合的情況,即過擬合現象。本文采用算法,在模型訓練的過程中先將輸入數據進行正向地傳輸,并將一部分的神經元以概率丟棄掉,其余神經元以1的概率保留,再將該過程出現的誤差反向重傳回去。

通過函數,實現以概率生成0 值,以概率1生成1 值,相應的數學公式可表示為:

(6)函數。函數又稱歸一化指數函數,是將多分類的結果以概率的形式呈現,在邏輯回歸模型的基礎上解決類別大于1 的分類問題。經過函數的計算可得到圖像屬于某種分類的概率值,該值可由如下公式計算求出:

其中,x為第個節點的輸出值,為輸出節點的個數,即分類的類別數。

(7)交叉熵損失函數。采用的交叉熵損失函數(Cross Entropy Loss Function),通過計算真實概率分布與預測概率分布之間的損失值來評價卷積神經網絡的性能優劣,值越小,說明模型的分類識別效果越好。此時需用到的數學公式為:

1.2 特定順序輸入策略

本文采用了一種特定順序的輸入策略來指導模型的訓練過程。將正常人的肺部CT 掃描圖像放在一起,后面拼接上肺癌高?;颊叩姆尾緾T 掃描圖像,形成一個整體的數據集,再將其輸入到3D-CNN模型中進行訓練。使用該策略能提高模型學習的速度和質量,優化卷積神經網絡模型的訓練過程。

2 實驗與分析

2.1 數據集

本文的數據來自由Kaggle 主辦的數據科學競賽Data Science Bowl 2017 的數據集。該數據集是由1 397個.docom 格式的肺部CT 掃描圖像組成,其中1 036個圖像為正常人的肺部圖像,361 個圖像為肺癌高?;颊叻尾繄D像。先按照CT 圖像中圖像位置屬性對切片進行排序,并實現三維渲染;將512×512 大小的圖片縮放為100×100,并對其進行灰度化處理;最后,將三維CT 圖像合并成數量為20 的切片組合,得到100×100×20 的三維灰度圖像。這里以一個肺癌患者的CT 圖像預處理為例,單個切片的原始圖像和預處理后的圖像如圖2 所示。

圖2 單個切片的原始圖像和預處理圖像Fig.2 Raw and pre-processed images of a single slice

2.2 實驗過程

首先,按照預定的輸入順序重新組織訓練樣本,即將常規的肺部CT 掃描圖像放在一起,拼接上患癌的肺部CT 掃描圖像,形成一個整體的訓練數據集,將其輸入到3D-CNN 模型中進行訓練。

該3D-CNN 模型在對重組后的數據集進行訓練后,就要對未知肺部CT 掃描圖像來做分類識別。其中,第一層卷積層層32 個大小為5×5×5 不同的卷積核過濾,生成32 個大小為100×100×20 的特征圖譜,該層產生的變量總數為32×100×100×20;再將這32 個特征圖譜輸入進第一層池化層層進行最大池化操作,該層選用的池化步長為2×2×2,輸出32 個大小為50×50×10 的特征圖像,產生的變量總數為32×50×50×10;第二層卷積層層采用64個大小為3×3×3 的不同的卷積核進行填充,得到的64 個大小為50×50×10 特征圖譜,產生的變量總數為64×50×50×10;再進行第二層池化層,層的參數設置參照層,由此得到64 個大小為25×25×5 的特征圖譜,而變量總數為64×25×25×5;最后將輸出的特征圖譜進行第三層的卷積操作,第三層選擇128 個大小為3×3×3 的不同的卷積核,經過該層后生成128 個大小為25×25×5 的特征圖譜,變量總數為128×25×25×5;再將此層生成的圖像輸入最后一層池化層中,其參數設置與、保持一致,輸出128 個大小為13×13×3 的特征圖譜,得到的變量總數為128×13×13×3=64 896。3D-CNN 數據處理過程如圖3 所示。

圖3 3D-CNN 數據處理過程Fig.3 3D-CNN data processing

2.3 實驗對比分析

將932 個正常人的肺部CT 圖像數據和325 個肺癌高?;颊叩姆尾緾T 圖像數據混合,形成一個隨機順序的數據集,將其輸入進該3D-CNN 模型中進行訓練,比較2 種方法的性能。根據分類正確的樣本個數占所有樣本個數的比例來計算準確率,并根據公式(9)計算損失值,實驗結果分別見表1 和表2。由表1、表2 可知,采用特定順序輸入策略的3D-CNN 模型的分類準確率最高為76%,高于采用隨機順序輸入策略的3D-CNN 模型的最高準確率(70%),說明特定順序的輸入策略提升了模型的訓練精度,從而有效提高肺癌圖像的分類準確率。

表1 3D-CNN 模型在特定順序輸入策略的結果Tab.1 Results of 3D-CNN model in specific order input strategy

表2 3D-CNN 模型在隨機順序輸入策略的結果Tab.2 Results of 3D-CNN model in random order input strategy

3 結束語

為解決傳統方法在肺癌CT 圖像分類中的預處理過程復雜、工作量大的問題,本文提出了基于3DCNN 的肺部CT 圖像分類模型。該模型以卷積神經網絡為基礎,設計了3D 卷積層、激活層、3D 池化層以及全連接層等層級來獲取圖像的分類特征,結合特定順序的輸入策略來優化模型的訓練過程,并與采用隨機順序輸入策略進行了對比分析。結果表明,該模型對肺癌CT 圖像有良好的分類特性,最高識別準確率達到了76%,對于肺癌的早期診斷有一定的實用價值。但本文提出的3D-CNN模型在架構設計和參數設置上仍有提升的空間,在未來的肺癌圖像識別工作中,將完善肺部CT 數據集、改善網絡結構和優化實驗參數。

猜你喜歡
肺癌分類特征
中醫防治肺癌術后并發癥
保健醫苑(2023年2期)2023-03-15 09:03:04
對比增強磁敏感加權成像對肺癌腦轉移瘤檢出的研究
分類算一算
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
抓住特征巧觀察
microRNA-205在人非小細胞肺癌中的表達及臨床意義
主站蜘蛛池模板: 精品国产Av电影无码久久久| 伊人久久大香线蕉影院| 午夜精品久久久久久久无码软件| 看看一级毛片| 天天色综合4| 欧美在线综合视频| 国产亚洲美日韩AV中文字幕无码成人| 国产欧美日韩资源在线观看| 国产三级国产精品国产普男人 | 99伊人精品| 国产视频入口| 人妖无码第一页| 国产97视频在线| 99国产精品国产| 国产精品网址你懂的| 激情综合婷婷丁香五月尤物| 不卡网亚洲无码| 亚洲性一区| 久久男人资源站| 欧美劲爆第一页| 日韩大片免费观看视频播放| 日韩在线播放中文字幕| 亚洲黄色片免费看| 蜜臀AV在线播放| 精品无码人妻一区二区| 亚洲第一精品福利| 97在线公开视频| 亚洲第一成人在线| 国产一区二区在线视频观看| 毛片在线播放网址| 欧美日韩另类国产| 永久免费无码日韩视频| 高清不卡一区二区三区香蕉| 广东一级毛片| 黄色网在线免费观看| 亚洲国产清纯| 日本亚洲欧美在线| 婷婷色婷婷| 精品国产乱码久久久久久一区二区| 国产精品欧美日本韩免费一区二区三区不卡 | 国产真实乱子伦视频播放| 99999久久久久久亚洲| 亚洲欧美成人| 国产va在线| 亚洲天堂网在线播放| 欧美午夜小视频| 国产欧美日韩视频怡春院| 亚洲国产成人精品青青草原| 黄色一及毛片| 无码av免费不卡在线观看| 免费国产高清视频| 日韩成人免费网站| 天堂av综合网| 毛片一区二区在线看| a在线观看免费| 日韩二区三区| 国产极品美女在线观看| 久久香蕉欧美精品| 欧美亚洲中文精品三区| 国产无吗一区二区三区在线欢| 999福利激情视频| 国产精品成人一区二区不卡| 国产黄网永久免费| 国产不卡网| Aⅴ无码专区在线观看| 青草免费在线观看| 99热这里只有精品2| 久久人人97超碰人人澡爱香蕉| 91视频99| 婷婷色丁香综合激情| 亚洲经典在线中文字幕| 亚洲va视频| 日本三级欧美三级| 97狠狠操| 国产亚洲视频中文字幕视频| 精品午夜国产福利观看| av在线手机播放| 色悠久久综合| 性欧美精品xxxx| 亚洲精品天堂自在久久77| 日本精品αv中文字幕| 国产一区二区三区精品久久呦|