999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于放射組學的泌乳素腺瘤和生長激素腺瘤分類研究

2021-05-13 07:16:04代湖明陳彥如袁平卓碧華
現代計算機 2021年8期
關鍵詞:特征模型

代湖明,陳彥如,袁平,卓碧華

(1.四川大學計算機學院,成都610065;2.重慶市第二師范學院技術與信息工程學院,重慶400067;3.武警警官學院信息技術教研室,成都610213)

0 引言

垂體腺瘤是常見的良性神經內分泌腺瘤,起源于垂體前葉,主要存在于鞍區,其在人群中的發病率大致為每年每10 萬人中有80-90 例,約占所有腦腫瘤中的15%[1-4]。

在腺垂體細胞的分化過程中,垂體轉錄因子決定著腺垂體祖細胞的分化方向。根據2017 版世界衛生組織對垂體腫瘤的分類解讀,垂體轉錄因子主要包括t-box 垂體轉錄因子、表達垂體特異性POU-同源結構域的轉錄因子(PIT-1)、T-PIT 轉錄因子和類固醇生成因子(SF-1)[5-6]。其中,泌乳素細胞和生長激素細胞由表達PIT-1 轉錄因子的細胞分化而來,然而泌乳素腺瘤患者和生長激素腺瘤患者在臨床上的治療有明顯的差異。大多數接受藥物治療的泌乳素腺瘤患者都有較好的效果[7],而生長激素腺瘤患者則必須進行手術切除,故對泌乳素腺瘤和生長激素腺瘤的正確分類在臨床上具有重要的意義。

放射組學能夠把醫學影像數據轉換成大量的定量影像特征,目前已廣泛應用于各種腫瘤特征的提取[8-10]。此研究通過提取泌乳素腺瘤和生長激素腺瘤在核磁共振成像(Magnetic Resonance Imaging,MRI)上的放射組學信息,建立出一個基于放射組學信息的機器學習模型,然后對泌乳素腺瘤和生長激素腺瘤進行精準分類。

1 數據獲取

1.1 圖像采集

本次研究搜集了2016 年1 月至2019 年2 月間確診的110 例垂體瘤患者的術前MRI 圖像(增強T1 加權成像),其中38 例為泌乳素腺瘤,72 例為生長激素腺瘤。兩位經驗豐富的神經外科醫生對所有診斷材料進行了回顧,以獲得準確的診斷結果。數據的納入標準如下:①所有患者均經過組織學診斷為垂體瘤,并通過免疫組化染色對垂體瘤進行了明確的分級;②MRI 圖像質量良好,無明顯偽影,所有MRI 圖像均在術前一周獲得。排除標準包括:①垂體瘤免疫組化染色不清楚;(②MRI 圖像質量差,偽影明顯。從醫院的圖像檔案和通信系統中獲取所有患者的MRI 醫學數字成像(Digital Imaging and Communications in Medicine,DICOM)原圖,用于進一步的定性和定量分析。

1.2 腫瘤手動分割

首先將患者的每一張MRI 序列的DICOM 圖像切片載入到開源軟件ITK-SNAP(version 3.8.0, www.itksnap.org)中,然后由一名神經外科醫生和一名神經放射學家(分別有14 年和13 年的神經腫瘤診斷經驗)在每一張MRI 圖像中勾畫出腫瘤區域,根據勾畫出的腫瘤區域,ITK-SNAP 會為每一個患者的一系列DICOM 圖像切片生成一個NRRD 格式的圖像文件,最后的勾畫結果由另外兩名放射專家進行回顧。

2 特征提取與處理

2.1 圖像預處理

提取放射組學特征的方法是基于1.2 小節中獲得的分割結果。首先對每個患者的原始DICOM 圖像進行標準化處理,如公式(1)所示,然后再對標準化后的圖像進行小波變換,得到8 張小波變換圖像。

公式(1)中x 表示圖像中的每一個像素點,μx表示圖像的均值,σx是圖像的標準差。

2.2 提取放射組學特征

首先,把每個患者的一系列MRI 的DICOM 原圖合并成一張三維圖像,并把1.2 小節中提取到的分割圖像也合并成一張三維圖像,接著把兩張三維圖像輸入提取放射組學信息的開源軟件Pyradiomics(https://pyradiomics.readthedocs.io/)中提取放射組學特征。從原始圖像中提取出18 個一階統計特征、14 個形狀特征、22 個灰度共生矩陣(Gray Level Co-occurrence Matrix,GLCM)特征、16 個灰度行程矩陣特征(Gray Level Run Length Matrix,GLRLM)、16 個灰度區域大小矩陣(Gray Level Size Zone Matrix,GLSZM)以及14 個灰度相關矩陣(Gray Level Dependence Matrix,GLDM),總共從每個患者的MRI 原始圖像中提取100 個特征,從8 張小波變換圖像中提取出688 個相同類型的紋理特征(沒有提取形狀特征),所以總共從每個患者的MRI 序列圖像中提取出了788 個放射組學特征。所有特征的詳細描述信息可以從網站(http://www.radiomics.io/pyradiomics.html)中找到。對每個患者MRI 圖像(增強T1 加權成像)均進行上述的特征提取。

2.3 數據增強

從1.1 小節中可知,收集到的110 名垂體瘤患者中,有38 名患者為泌乳素腺瘤,72 名生長激素腺瘤,數據存在嚴重的類別不平衡現象。通常而言,分類學習方法中都假設不同類別的訓練樣例數目相同。如果某一類別的訓練樣例數比其他類別的訓練樣例數多,那么機器學習模型會更偏向于樣例數多的類別,這是由于機器學習模型只要將樣本的結果判定為樣例數多的類別,模型就能取得較高的精確率,但這樣的模型對于實際應用而言是沒有意義的。為了解決數據中存在的類別不平衡現象,利用SMOTE(Synthetic Minority Oversampling Technique)算法對訓練集進行數據增強。

SMOTE 算法的目的在于生成新的少數類樣本,生成的策略如下:對樣本中的每個少數類樣本a,從它的最近鄰樣本中隨機選出一個樣本b,然后再樣本a、b 之間的連線上隨機選一個點生成新的少數類樣本,如圖1所示。

SMOTE 算法流程:

(1)從少數類中的樣本a,計算它到少數類樣本集中其他所有樣本的歐氏距離,得到k 個與樣本a 距離最近的點。

(2)計算樣本不平衡的比例,從而確定過采樣的倍率N,少數類中的每一個樣本a,從其k 個距離最近的樣本中隨機選擇N 個樣本,假設選擇的樣本為b。

(3)對于每一個隨機選出的樣本b,分別與樣本a按照公式(2)生成新的樣本c。

圖1 SMOTE算法

2.4 數據標準化

從每個病人的MRI 序列中提取到的788 個特征存在量綱上的差異,有的特征值并不是同一個數量級,然而量綱上的差異并不能真實表達出特征的重要性。在模型學習的過程中,量綱大的特征對最終學習到的結果影響更大,會導致最終學到的模型不可信。為了解決這一問題,通過標準化可以使得不同的特征變量具有相同的尺度,那么在使用梯度下降法學習模型參數的時候,不同特征對參數的影響程度就一致了。同時,通過將數據標準化,還可以加速損失函數的收斂速度。本文使用的標準化方法為z-score 標準化,如公式(3)所示。

其中μ為所有樣本數據的均值,σ為所有樣本數據的標準差。

2.5 數據降維

數據集特征維度太高會導致過擬合的現象,特別是當數據樣本較少的時候。由2.2 小節可知,每個病人的MRI 序列可以提取出788 個特征,然而數據集中只有110 個樣本,由此可知目前的特征維度太高。為了增加機器學習模型的泛化能力,減少過擬合的現象,需要對當前的數據集進行降維。

主成分分析(Principal Component Analysis,PCA)是常用的數據降維方法,PCA 通過低維的特征去盡可能的表達原樣本中的高維特征空間,不僅可以將數據壓縮到低維,保留樣本的主要信息,同時還可以使降維之后的數據特征之間相互獨立。另外,PCA 將不重要的信息去掉,能起到一定的去噪效果。

3 實驗

為了更好地評估模型的泛化能力,本文使用五折交叉驗證對模型進行訓練與測試。首先將38 個泌乳素腺瘤樣本和72 個生長激素腺瘤樣本按比例隨機的平均分成5 折,然后將其中四折的共88 個樣本數據作為訓練集用于訓練模型,剩余一折的樣本數據用于測試模型的泛化能力,循環測試5 輪。劃分好訓練集與測試集之后,由于泌乳素腺瘤的樣本數比較少,使用sklearn(https://scikit-learn.org/stable/)的SMOTE 函數對訓練集進行數據增強,得到增強后的訓練集共116個樣本,新生成的樣本均為泌乳素腺瘤樣本。

圖2 五折交叉驗證

對訓練集進行數據增強后,然后使用z-score 對訓練集和測試集分別進行標準化,最后再使用PCA 分別對訓練集和測試集進行數據降維。通過不斷測試,發現把數據降到44 維的時候,模型的泛化能力最好。

把降維后的訓練集樣本輸入到邏輯回歸(Logistics Regression)中進行訓練,然后用測試集測試學習到的模型的效果,得到五折的正確率分別82.6%、91.3%、77.2%、80.95%、85.7%,平均正確率為83.5%。從測試結果可以看出,有幾折的正確率相差較大,這是由于測試集的樣本較少,少量的判斷錯誤就會導致正確率有比較大的降低。

4 結語

本文提出了基于放射組學信息對泌乳素腺瘤和生長激素腺瘤進行精準分類的機器學習模型,通過提取放射組學的專用軟件包Pyradiomics 提取出兩種腫瘤在MRI 圖片上的放射組學信息,再通過SMOTE 算法生成新樣本以平衡樣本數據集,然后再對平衡后的樣本數據集進行z-score 標準化以去除特征間的量綱差異,并利用PCA 對樣本數據集進行特征降維以增強機器學習模型的泛化能力,之后利用五折交叉驗證對邏輯回歸模型進行訓練和測試,模型的平均正確率為83.5%,能精準地對泌乳素腺瘤和生長激素腺瘤進行分類,具有較高的臨床實用價值。

猜你喜歡
特征模型
一半模型
抓住特征巧觀察
重要模型『一線三等角』
新型冠狀病毒及其流行病學特征認識
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 国产一级在线观看www色| 亚洲天堂视频网| 午夜欧美在线| 欧洲精品视频在线观看| 久久香蕉国产线看观看精品蕉| 亚洲精品在线观看91| 国产成人区在线观看视频| 国产精品久久久久久久久kt| 2020精品极品国产色在线观看| 国产成人精品男人的天堂下载| 狠狠干综合| 欧美激情第一欧美在线| 99久久99视频| 国产9191精品免费观看| 黄色网站不卡无码| 日本亚洲欧美在线| 伊人网址在线| 日本欧美午夜| 亚洲欧美日韩成人高清在线一区| 人妻丝袜无码视频| 亚洲天堂.com| 在线无码av一区二区三区| 欧美成人综合在线| 午夜国产理论| 九九久久精品免费观看| 女人18毛片久久| 亚洲人成网7777777国产| 亚洲一区二区三区国产精华液| 国产综合精品一区二区| 欧美亚洲国产一区| 免费无码在线观看| 欧美精品在线视频观看| 国产美女丝袜高潮| 麻豆a级片| 午夜激情福利视频| 女人av社区男人的天堂| 久久久无码人妻精品无码| 精品人妻无码中字系列| 欧美.成人.综合在线| 精品国产成人av免费| 国产欧美日韩18| 欧美福利在线观看| 动漫精品啪啪一区二区三区| 欧美三级视频在线播放| 久久国产黑丝袜视频| 香蕉视频在线观看www| 国产aaaaa一级毛片| 91在线视频福利| 国产aaaaa一级毛片| 欧美日韩成人| 亚洲人成网址| 99热最新网址| 国产aⅴ无码专区亚洲av综合网| 国产视频欧美| 国产一在线观看| 欧美亚洲欧美| 五月婷婷综合在线视频| 亚洲精品无码在线播放网站| 久久夜色精品| 亚洲天堂免费在线视频| 成人亚洲视频| 尤物在线观看乱码| 一区二区欧美日韩高清免费 | 美女潮喷出白浆在线观看视频| 国产激情国语对白普通话| 成人噜噜噜视频在线观看| 欧美日韩午夜| 亚洲香蕉在线| 国产中文一区二区苍井空| 色九九视频| 刘亦菲一区二区在线观看| 国产综合日韩另类一区二区| 露脸一二三区国语对白| 国产精品亚洲片在线va| 国产午夜精品一区二区三区软件| 91亚瑟视频| 波多野结衣无码AV在线| 制服丝袜一区二区三区在线| 香蕉久人久人青草青草| 国产喷水视频| 99国产精品国产高清一区二区| 亚洲床戏一区|