999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于影像組學(xué)和機器學(xué)習(xí)的腦部膠質(zhì)瘤分級模型研究

2022-03-09 01:22:50王俊秀
軟件工程 2022年2期
關(guān)鍵詞:機器學(xué)習(xí)

文章編號:2096-1472(2022)-02-22-03

DOI:10.19644/j.cnki.issn2096-1472.2022.002.006

摘? 要:本文將影像組學(xué)的方法和機器學(xué)習(xí)算法結(jié)合起來,對腦部膠質(zhì)瘤進行分級預(yù)測。利用BraTS2019公開數(shù)據(jù)集,從多模態(tài)MRI圖像中分別提取腫瘤的448 維影像組學(xué)特征:腫瘤形態(tài)學(xué)特征、一階灰度特征、紋理特征等;然后通過最小絕對收縮和選擇算子(Lasso)算法篩選出15 個最佳的影像組學(xué)特征;最后根據(jù)篩選出的最佳特征集,利用隨機森林分類算法構(gòu)建腦部膠質(zhì)瘤的分級預(yù)測模型。基于機器學(xué)習(xí)建立的模型在訓(xùn)練組患者中預(yù)測膠質(zhì)瘤級別的準確率達到95.6%,ROC曲線下面積(AUC)達到0.99;在驗證組患者中預(yù)測膠質(zhì)瘤級別的準確率達到89.3%,AUC達到0.96。可見,基于機器學(xué)習(xí)算法,利用影像組學(xué)的方法可以對腦部腫瘤的高低級別進行準確的預(yù)測和分類。

關(guān)鍵詞:腫瘤分級;影像組學(xué);機器學(xué)習(xí);隨機森林

中圖分類號:TP39? ? ?文獻標識碼:A

Research on Grading Model for Brain Glioma based on?Radiomics and Machine Learning

WANG Junxiu

(Taiyuan Institute of Technology, Taiyuan 030008, China)

wangjx@tit.edu.cn

Abstract: This paper proposes to combine radiomics and machine learning algorithm to classify and predict the brain glioma. Based on BraTS2019 public dataset, 448-dimensional radiomics features of tumors are extracted from multimodal MRI (Magnetic Resonance Imaging) images, including tumor morphological features, first-order grayscale features, and texture features, etc. Then 15 best radiomics features are screened through the least absolute shrinkage and selection operator (Lasso) algorithm. Finally, according to the best screened feature set, the random forest classification algorithm is used to construct the brain glioma grading prediction Model. The accuracy of machine learning-based model is 95.6% and the area under the ROC (AUC) is 0.99 in the training group, and 89.3% and 0.96 in the validation group, respectively. Application of machine learning algorithm and radiomics realizes accurate prediction and classification of brain glioma level.

Keywords: brain glioma grading; radiomics; machine learning; random forest

1? ?引言(Introduction)

腦膠質(zhì)瘤是大腦內(nèi)部最常見的惡性腫瘤,按照世界衛(wèi)生組織的認定標準,根據(jù)膠質(zhì)瘤的嚴重和惡性程度可劃分為低級別膠質(zhì)瘤(Low Grade Glioma, LGG)和高級別膠質(zhì)瘤(High Grade Glioma, HGG)。低級別膠質(zhì)瘤為分化良好的膠質(zhì)瘤,預(yù)后效果比較好。高級別膠質(zhì)瘤為低分化膠質(zhì)瘤,這類腫瘤為惡性腫瘤,患者預(yù)后效果不佳。膠質(zhì)瘤的準確分級對患者的診斷、治療方案的設(shè)計及預(yù)后非常重要。影像組學(xué)研究是一個計算機和醫(yī)學(xué)交叉研究的技術(shù)信息領(lǐng)域,它是指從各種類型的醫(yī)學(xué)圖像如CT、MRI、PET中提取高通量的數(shù)據(jù)信息,然后進一步地挖掘、分析和預(yù)測,最終可以幫助醫(yī)生做出最準確的診斷與治療。影像組學(xué)包括獲取圖像、腫瘤區(qū)域分割、影像組學(xué)特征提取和分類預(yù)測模型構(gòu)建等步驟。利用機器學(xué)習(xí)方法實現(xiàn)的影像組學(xué)已經(jīng)很大程度上提高了醫(yī)學(xué)診斷鑒別及預(yù)后預(yù)測的準確性。

本文主要采用影像組學(xué)的方法和機器學(xué)習(xí)算法來解決腦部膠質(zhì)瘤分級預(yù)測的問題。本研究使用了BraTS2019數(shù)據(jù)集中膠質(zhì)瘤患者的術(shù)前MRI影像,采用影像組學(xué)方法提取影像學(xué)特征;然后采用最小絕對收縮和選擇算子(Least absolute shrinkage and selection operator, Lasso)對高維特征進行降維,篩選出最佳的影像學(xué)特征集;最后根據(jù)所選出的最佳特征集,通過隨機森林(Random Forest, RF)算法建立膠質(zhì)瘤高低級別分類模型。用受試者工作特征曲線(Receiver Operating Characteristic Curve, ROC曲線)來評價分類器模型的預(yù)測效果。

2? ?數(shù)據(jù)(Data)

磁共振成像(Magnetic Resonance Imaging, MRI)是大腦疾病診斷和治療過程中的常規(guī)檢查方法,在軟組織檢查中具有敏感性和卓越的圖像對比度。常見的頭部MRI影像均包含T1加權(quán)成像、增強T1加權(quán)成像(T1ce)和T2加權(quán)成像,以及液體衰減反轉(zhuǎn)恢復(fù)(Flair)成像等序列。每個成像序列從不同的方面對腫瘤病灶進行描述,為腦膠質(zhì)瘤診斷研究提供多個互補信息。

本文使用了BraTS2019數(shù)據(jù)集MRI影像進行研究,該數(shù)據(jù)集是2019 年腦部腫瘤分割競賽數(shù)據(jù)集(Brain Tumor Segmentation Challenge 2019, BraTS2019),包括76 例低級別膠質(zhì)瘤MRI影像和259 例高級別膠質(zhì)瘤MRI影像。數(shù)據(jù)集中包含T1加權(quán)像、增強T1加權(quán)像、T2加權(quán)像和液體衰減反轉(zhuǎn)恢復(fù)序列像四個模態(tài)的MRI影像,另外每例病人還包括醫(yī)學(xué)專家手工標記的腫瘤區(qū)域和腫瘤分級的情況。所有的影像數(shù)據(jù)都進行了圖像預(yù)處理,包括配準、圖像插值和重采樣等。圖1為BraTS2019數(shù)據(jù)集中一例患者的腦部MRI影像。

數(shù)據(jù)集中每例患者的腫瘤區(qū)域都是由多個經(jīng)驗豐富的醫(yī)生按照相同的標注規(guī)范進行分割和驗證的。腫瘤區(qū)域按照病理一般分為四個區(qū)域:(1)增強腫瘤核心區(qū)(Enhanced Core);(2)腫瘤周圍水腫區(qū)(Edema);(3)非增強腫瘤核心區(qū)(Non-enhancing Solid Core);(4)壞死區(qū)/囊性核心區(qū)(Necrotic/Cystic Core)。其中(3)和(4)為真實的膠質(zhì)瘤組織,合并為一個區(qū)域,簡稱為NET區(qū)域;增強的腫瘤核心區(qū)域簡稱為ET區(qū)域;腫瘤周圍水腫區(qū)域簡稱為ED區(qū)域。圖2為一例患者病灶區(qū)域分割的圖像,其中淺灰色ED區(qū)域,深灰色為NET區(qū)域,白色為ET區(qū)域。

3? ?方法(Methods)

3.1? ?特征提取

本文根據(jù)近幾年研究人員提出的對腦部膠質(zhì)瘤圖像提取的特征,從四種模態(tài)圖像(T1、T2、T1ce和Flair)的不同病灶區(qū)域中分別提取了腫瘤形態(tài)學(xué)特征、一階特征及紋理特征,共計448 個影像組學(xué)特征,每種類型的特征從不同的方面對圖像進行描述,解析了圖像的隱含特點。(1)腫瘤形態(tài)學(xué)特征:提取腫瘤原始空間的三維特征,可以量化腫瘤的形狀和大小。(2)一階灰度特征:由感興趣區(qū)域影像特征值直方圖計算而來,可以定量地描述圖像的信號強度分布。(3)紋理特征:可以對腦膠質(zhì)瘤內(nèi)異質(zhì)性進行定量刻畫。紋理特征包括:灰度共生矩陣紋理特征(GLCM)、灰度相關(guān)矩陣紋理特征(GLDM)、灰度游程矩陣紋理特征(GLRLM)、灰度區(qū)域大小矩陣紋理特征(GLSZM)、鄰域灰度差矩陣紋理特征(NGTDM)。

3.2? ?特征選擇

本文主要通過采用L1正則化Lasso回歸分析模型來進行最佳特征篩選。Lasso是一種用于變量壓縮和估計的方法,它可以有效地將高維變量降到十幾維甚至更少,同時不影響模型的預(yù)測能力。目前Lasso算法已經(jīng)被廣泛應(yīng)用在高維數(shù)據(jù)的降維和回歸分析中,特別是影像組學(xué)的特征工程領(lǐng)域。本文采用Lasso回歸模型選擇出和膠質(zhì)瘤高低級別最相關(guān)的影像組學(xué)特征。簡單線性回歸模型的定義如下:

為了去掉冗余的特征,本文采用正則方法進行特征壓縮。當特征維度是2時,我們可以直接在平面上繪制出目標函數(shù)的等高線,而取值范圍是平面上半徑為的范數(shù)圓,等高線與范數(shù)圓的交點就是最優(yōu)解。而更高維的情況下,等高線與范數(shù)球的交點除了角點之外還可能在很多邊的輪廓線上,同樣具有稀疏性。

3.3? ?分級預(yù)測模型的構(gòu)建

基于篩選出的影像組學(xué)特征和隨機森林構(gòu)建模型。隨機森林算法是一種通過采用Bagging的算法將多個無關(guān)聯(lián)的決策樹組合在一起,以投票機制進行分類的有監(jiān)督學(xué)習(xí)算法。隨機森林算法的泛化能力強,分類性能比較好,廣泛應(yīng)用于各種分類任務(wù)中。

決策樹是一種樹形結(jié)構(gòu)的分類器。在構(gòu)建決策樹時,樹中的每個節(jié)點都要選擇最優(yōu)的特征對當前樣本進行分類,直到?jīng)Q策樹能夠滿足所需要的建樹停止的條件。當把一個樣本輸入決策樹中時,可以自動確定一條從根節(jié)點開始到葉節(jié)點的唯一路徑,最后葉節(jié)點也就是這個樣本的類別。隨機森林中構(gòu)建的每一棵決策樹都可以是一個分類器,當把一個樣本輸入隨機森林中時,M 棵決策樹會得到M 個分類結(jié)果,根據(jù)所有決策樹的分類結(jié)果,把次數(shù)最高的類別作為最終分類結(jié)果。本文中隨機森林算法按照腦部膠質(zhì)瘤高低級別的分布情況進行隨機抽樣。模型訓(xùn)練的過程中可采用并行方法,這樣使得模型訓(xùn)練速度快。

決策樹的深度直接影響隨機森林分類器模型的性能,如果決策樹的深度過大會導(dǎo)致分類模型過擬合,而決策樹的深度過小又會導(dǎo)致分類模型欠擬合。決策樹的數(shù)量也會影響隨機森林的分類準確率。在實現(xiàn)過程中,采用TPOT(Tree-based Pipeline Optimization Tool)框架實現(xiàn)隨機森林的自動機器學(xué)習(xí),以確定最優(yōu)的決策樹個數(shù)和決策樹深度。TPOT框架是由美國賓夕法尼亞大學(xué)自主研究和設(shè)計開發(fā)的一個自動機器學(xué)習(xí)的技術(shù)框架。它是一種基于遺傳算法的Python自動機器學(xué)習(xí)工具。TPOT能夠進行自動算法選擇、自動參數(shù)優(yōu)化,為當前數(shù)據(jù)集找到最優(yōu)的算法及其參數(shù)。

4? ?結(jié)果(Results)

將BraTS2019數(shù)據(jù)集的335 例膠質(zhì)瘤患者隨機分為訓(xùn)練集(75%)和驗證集(25%)。每個MRI模態(tài)提取112 個特征,包括19 個腫瘤形態(tài)學(xué)特征、18 個一階灰度特征及75 個紋理特征,四個模態(tài)共提取448 個影像組學(xué)特征。448 個影像組學(xué)特征的Lasso系數(shù)分布如圖3所示。

使用Lasso回歸模型對448 個影像組學(xué)特征進行壓縮,通過交叉驗證和二項式偏差最小化確定Lasso回歸模型中懲罰系數(shù)λ的最優(yōu)值,如圖4所示。同時篩選出系數(shù)非零的最佳特征變量,如表1所示,共篩選出15 個最佳影像組學(xué)特征。

本文采用TPOT框架實現(xiàn)隨機森林分類模型的自動機器學(xué)習(xí),從而確定最優(yōu)的隨機森林分類器參數(shù):決策樹的最大深度(max_depth)為9,基學(xué)習(xí)器的個數(shù)(n_estimators)為100。基于15 個最優(yōu)的影像組學(xué)特征,通過TPOT構(gòu)建的隨機森林分類器來預(yù)測膠質(zhì)瘤高低級別,在訓(xùn)練組患者中預(yù)測膠質(zhì)瘤級別的準確率達到95.6%,在驗證組患者中預(yù)測膠質(zhì)瘤級別的準確率達到89.3%。繪制ROC曲線來評價分級模型,訓(xùn)練組的曲線下面積AUC為0.99,驗證組的AUC為0.96。ROC曲線如圖5所示。

5? ?結(jié)論(Conclusion)

本文采用影像組學(xué)的方法和機器學(xué)習(xí)算法對腦部膠質(zhì)瘤進行高低級別分級預(yù)測。從MRI影像的四個模態(tài)上提取了一系列膠質(zhì)瘤的影像組學(xué)特征,使用Lasso回歸模型進行篩選,得到和膠質(zhì)瘤級別密切相關(guān)的最佳影像組學(xué)特征集,并基于所選的特征建立了隨機森林分類器的預(yù)測模型。我們發(fā)現(xiàn),該模型在訓(xùn)練組和驗證組中均實現(xiàn)了膠質(zhì)瘤高低級別的有效預(yù)測。

參考文獻(References)

[1] MORGAN L L. The epidemiology of glioma in adults: a "state of the science" review[J]. Neuro-Oncology, 2015, 17(4):623-624.

[2] LOUIS D N, PERRY A, REIFENBERGER G, et al. The 2016 world health organization classification of tumors of the central nervous system: A summary[J]. Acta Neuropathologica, 2016, 131(6):803-820.

[3] JANG K, RUSSO C, IEVA A D. Radiomics in gliomas: Clinical implications of computational modeling and fractal-based analysis[J]. Neuroradiology, 2020, 62(7):771-790.

[4] LAMBIN P, RIOS-VELAZQUEZ E, LEIJENAAR R, et al. Radiomics: Extracting more information from medical images using advanced feature analysis[J]. European Journal of Cancer, 2012, 48(4):441-446.

[5] YIP S S, AERTS H J. Applications and limitations of radiomics[J]. Physics in Medicine and Biology, 2016, 61(13):150-166.

[6] FOUKE S J, BENZINGER T, GIBSON D, et al. The role of imaging in the management of adults with diffuse low grade glioma: A systematic review and evidence-based clinical practice guideline[J]. Journal of Neuro Oncology, 2015, 125(3):457-479.

[7] 賈穎,杜學(xué)松,陳君輝,等.基于常規(guī)MRI的定量影像學(xué)特征用于膠質(zhì)瘤分級診斷[J].中國醫(yī)學(xué)影像技術(shù),2018,034(008):1137-1142.

[8] MENZE B H, JAKAB A, BAUER S, et al. The multimodal brain tumor image segmentation benchmark (BRATS)[J]. IEEE Transactions on Medical Imaging, 2015, 34(10):1993-2024.

[9] HARALICK R M, SHANMUGAM K, DINSTEIN I. Textural features for image classification[J]. Studies in Media and Communication, 1973, 3(6):610-621.

[10] SUN C, WEE W G. Neighboring gray level dependence matrix for texture classification[J]. Computer Vision Graphics and Image Processing, 1983, 23(3):341-352.

[11] GALLOWAY M. Texture analysis using gray level run lengths[J]. Computer Graphics and Image Processing, 1975, 4(2):172-179.

[12] THIBAULT G, ANGULO J, MEYER F. Advanced statistical matrices for texture characterization: Application to cell classification[J]. IEEE Transactions on Biomedical Engineering, 2014, 61(3):630-637.

[13] AMADASUN M, KING R. Textural features corresponding to textural properties[J]. IEEE Transactions Systems, Man, and Cybernetics, 1989, 19(5):1264-1274.

[14] TIBSHIRANI R. Regression shrinkage and selection via the lasso: A retrospective[J]. Journal of the Royal Statistical Society: Series B (Statistical Methodology), 2011, 73(3):267-288.

[15] BREIMAN L. Random forests[J]. Machine Learning, 2001, 45(1):5-32.

[16] 王奕森,夏樹濤.集成學(xué)習(xí)之隨機森林算法綜述[J].信息通信技術(shù),2018(1):51-57.

[17] OLSON R S, MOORE J H. TPOT: A tree-based pipeline optimization tool for automating machine learning[C]// HUTTER F, KOTTHOFF L, VANSCHOREN J. Automatic Machine Learning. Cham: Springer, 2016, 64:66-74.

作者簡介:

王俊秀(1987-),女,博士生,講師.研究領(lǐng)域:圖像處理,人工智能,醫(yī)學(xué)圖像.

2789500520331

猜你喜歡
機器學(xué)習(xí)
基于詞典與機器學(xué)習(xí)的中文微博情感分析
基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
下一代廣播電視網(wǎng)中“人工智能”的應(yīng)用
活力(2016年8期)2016-11-12 17:30:08
基于支持向量機的金融數(shù)據(jù)分析研究
基于Spark的大數(shù)據(jù)計算模型
基于樸素貝葉斯算法的垃圾短信智能識別系統(tǒng)
基于圖的半監(jiān)督學(xué)習(xí)方法綜述
機器學(xué)習(xí)理論在高中自主學(xué)習(xí)中的應(yīng)用
極限學(xué)習(xí)機在圖像分割中的應(yīng)用
主站蜘蛛池模板: 亚洲日韩每日更新| 国产精品第一区在线观看| 成人午夜网址| 国产日韩久久久久无码精品| 亚洲精品欧美日韩在线| 漂亮人妻被中出中文字幕久久| 国产日本欧美在线观看| 欧美性爱精品一区二区三区| 亚洲福利片无码最新在线播放| 久久精品亚洲热综合一区二区| 国产喷水视频| a级毛片免费在线观看| 69视频国产| 极品国产在线| 国产在线观看精品| 国产精品美女免费视频大全| 欧美在线网| 国产成人午夜福利免费无码r| 欧美亚洲激情| 91青青视频| 精品国产污污免费网站| 日韩无码真实干出血视频| 99视频只有精品| 99视频精品全国免费品| 国内精品自在欧美一区| 亚洲无码高清一区| 无码高潮喷水在线观看| 亚洲 欧美 日韩综合一区| 88av在线看| 亚洲一道AV无码午夜福利| 中日无码在线观看| 狠狠色综合久久狠狠色综合| 亚洲国产日韩在线成人蜜芽| 亚洲第一中文字幕| 中文字幕永久视频| 欧美成人亚洲综合精品欧美激情| 国产色婷婷| 宅男噜噜噜66国产在线观看| 国产成人无码播放| 精品免费在线视频| 欧美丝袜高跟鞋一区二区| 亚洲欧美在线综合一区二区三区| 亚洲欧美自拍视频| 久久毛片免费基地| 波多野结衣在线se| 91在线国内在线播放老师| 久青草国产高清在线视频| 亚洲欧美国产五月天综合| 午夜啪啪网| 亚洲日韩精品无码专区97| 久久特级毛片| 色网站在线免费观看| 日韩区欧美区| 人人91人人澡人人妻人人爽| 国产综合色在线视频播放线视| 亚洲一级毛片| 老司机午夜精品视频你懂的| 青草精品视频| 色综合婷婷| 亚洲一区二区约美女探花| 国产精品专区第一页在线观看| 亚洲第一综合天堂另类专| 亚洲开心婷婷中文字幕| 国产日韩欧美成人| 国产精品吹潮在线观看中文| 黄色片中文字幕| 日本伊人色综合网| 国产欧美成人不卡视频| 色婷婷综合激情视频免费看 | 美女免费精品高清毛片在线视| 蜜桃视频一区二区| 麻豆国产精品| 波多野结衣在线一区二区| 456亚洲人成高清在线| 国产精品va免费视频| 国产黑丝一区| 国产精品免费久久久久影院无码| 日韩第九页| 伊人91在线| 在线播放91| 亚洲国产精品日韩专区AV| 久久永久视频|