999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

卷積神經(jīng)網(wǎng)絡(luò)在急性髓系白血病流式細(xì)胞術(shù)自動(dòng)診斷中的應(yīng)用

2023-08-02 02:50:36李智偉芮東升郭玉娟擺文麗
關(guān)鍵詞:模型

雷 偉,李智偉,芮東升,張 眉,郭玉娟,擺文麗,王 奎

急性髓系白血病(acute myeloid leukemia,AML)是成人最常見(jiàn)的白血病類型之一,在各類急性白血病中,AML患者生存率最低[1]。流式細(xì)胞術(shù)(flow cytometry,FCM)被廣泛的應(yīng)用于AML的診斷、免疫分型和微小殘留病監(jiān)測(cè)等方面[2]。在FCM應(yīng)用過(guò)程中會(huì)產(chǎn)生高維數(shù)據(jù),傳統(tǒng)數(shù)據(jù)分析方法通常由分析者根據(jù)經(jīng)驗(yàn)在可視化軟件中進(jìn)行設(shè)門操作,得到細(xì)胞亞群信息后結(jié)合相應(yīng)標(biāo)準(zhǔn)診斷AML[3]。這種依靠人工設(shè)門的數(shù)據(jù)分析方法存在主觀性強(qiáng)、效率低、分析維度局限等問(wèn)題,已經(jīng)成為FCM應(yīng)用中的瓶頸[4],因此,提出FCM數(shù)據(jù)的自動(dòng)分析方法輔助臨床診斷AML具有實(shí)用價(jià)值。卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)常用于醫(yī)學(xué)圖像的分類問(wèn)題,可以代替醫(yī)師進(jìn)行重復(fù)的視覺(jué)工作,成為了某些疾病自動(dòng)化診斷的最好方法[5]。該研究旨在提出一種基于圖像矩陣原理的FCM數(shù)據(jù)結(jié)構(gòu),并建立CNN模型,實(shí)現(xiàn)對(duì)AML的自動(dòng)識(shí)別,證明CNN應(yīng)用在FCM數(shù)據(jù)分析中的可行性。

1 材料與方法

1.1 資料來(lái)源本研究使用兩組數(shù)據(jù):數(shù)據(jù)1來(lái)源于FlowRepository數(shù)據(jù)庫(kù)[6],編號(hào)為FR-FCM-ZZYA,包括359例骨髓FCM數(shù)據(jù),其中正常人316例,AML患者43例。數(shù)據(jù)2來(lái)源于2016-2017年新疆維吾爾自治區(qū)人民醫(yī)院臨床檢測(cè)中心存檔數(shù)據(jù),納入的病例組為臨床上按照MIC分型標(biāo)準(zhǔn)[7]確診的AML初診患者,對(duì)照組為非白血病貧血患者或健康志愿者,排除白血病以外所有患有與免疫系統(tǒng)相關(guān)疾病或其他重大疾病的參與者。數(shù)據(jù)為骨髓FCM數(shù)據(jù),由專家分析后給予診斷結(jié)果,其中正常人50例,AML患者22例。兩組數(shù)據(jù)中,每個(gè)數(shù)據(jù)均為8管,數(shù)據(jù)格式為FCS,并且在專家分析階段完成了粘黏細(xì)胞、死細(xì)胞等非有效數(shù)據(jù)的清除。本項(xiàng)目已獲得石河子大學(xué)醫(yī)學(xué)院倫理委員會(huì)批準(zhǔn)(批準(zhǔn)號(hào):2018-015-01),參與者已簽署知情同意書。

1.2 數(shù)據(jù)讀取采用R中Bioconducter-flowcore工具包讀取FCS文件和補(bǔ)償矩陣,對(duì)各抗體熒光強(qiáng)度進(jìn)行補(bǔ)償。分別對(duì)側(cè)向散射光(side scatter,SSC)和各抗原表達(dá)水平進(jìn)行對(duì)數(shù)和雙指數(shù)轉(zhuǎn)化提高數(shù)據(jù)對(duì)稱性[8]。提取SSC及各管中與AML初診相關(guān)的抗原表達(dá)水平[9],包括CD45、CD34、CD117、HLA-DR、CD13和CD33,將各變量以CSV格式存儲(chǔ)。

1.3 歸一化為了更好實(shí)現(xiàn)歸一化,定義數(shù)據(jù)中各變量處于極端為異常值,設(shè)定異常值細(xì)胞占各管總細(xì)胞的0.1%,將異常值去除。對(duì)納入的變量進(jìn)行離差標(biāo)準(zhǔn)化,處理后變量會(huì)被映射到[0,1]之間(公式1)。

(公式1)

式中,vmin和vmax分別表示一組變量的最小值和最大值;x和x*分別表示處理前后的變量值。

1.4 數(shù)據(jù)重構(gòu)在AML流式診斷中,對(duì)SSC和CD45的設(shè)門通常作為一種初始策略,為區(qū)分主要的造血細(xì)胞提供一個(gè)起點(diǎn),再結(jié)合其他標(biāo)志物進(jìn)一步分析。基于以上原則,本研究提出一種數(shù)據(jù)結(jié)構(gòu)(圖1A),以圖像數(shù)據(jù)結(jié)構(gòu)作為參照,定義SSC和CD45作為圖像矩陣像素的定位點(diǎn),將數(shù)據(jù)中SSC和CD45的值分別乘以矩陣寬度(w)和高度(h)后取整,以SSC和CD45為坐標(biāo)可將二維空間劃分為w×h個(gè)區(qū)域,對(duì)其余5個(gè)抗原表達(dá)分別構(gòu)建圖像矩陣的顏色通道。本研究中矩陣的尺寸為32×32×5(對(duì)應(yīng)深度學(xué)習(xí)經(jīng)典圖像數(shù)據(jù)集Cifar-10數(shù)據(jù)尺寸:32×32×3)。該數(shù)據(jù)結(jié)構(gòu)的特點(diǎn)是在不改變?cè)P图軜?gòu)的情況下能夠直接作為圖像CNN的輸入,因而可以兼容目前多數(shù)CNN模型。

圖1 CNN自動(dòng)分析FCM數(shù)據(jù)流程圖A:數(shù)據(jù)結(jié)構(gòu)示意圖;B:FCM數(shù)據(jù)寫入過(guò)程;C:LeNet-5架構(gòu)

1.5 數(shù)據(jù)集建立將數(shù)據(jù)1中AML組和正常組按照6 ∶2 ∶2劃分?jǐn)?shù)據(jù)集,包括訓(xùn)練集215例(AML 25例,正常人190例),驗(yàn)證集72例(AML 9例,正常人63例),測(cè)試集72例(AML 9例,正常人63例),數(shù)據(jù)劃分按照FlowRepository數(shù)據(jù)庫(kù)中給定的順序進(jìn)行。數(shù)據(jù)2中的72例數(shù)據(jù)全部作為測(cè)試集(AML 22例,正常人50例)。在訓(xùn)練集上,從同一個(gè)人的各管數(shù)據(jù)中隨機(jī)抽取細(xì)胞,各抗原表達(dá)水平按照SSC/CD45為定位寫入矩陣的對(duì)應(yīng)通道內(nèi)(圖1B),當(dāng)矩陣中對(duì)應(yīng)位置已被寫入,則此次細(xì)胞抽取無(wú)效,進(jìn)行下一次抽取,直至矩陣中的全部位置被寫入,抽取將停止,該矩陣作為一個(gè)訓(xùn)練樣本。重復(fù)上述過(guò)程,可以持續(xù)產(chǎn)生訓(xùn)練樣本,以滿足CNN對(duì)大樣本的需求。為盡可能保證訓(xùn)練集中正負(fù)樣本均衡,對(duì)25例AML和190例正常人數(shù)據(jù)分別進(jìn)行190輪和25輪抽取,最終得到25×190+190×25=9 500 個(gè)訓(xùn)練樣本。為增強(qiáng)CNN模型的泛化能力,防止過(guò)擬合,對(duì)所有訓(xùn)練樣本進(jìn)行數(shù)據(jù)增強(qiáng),隨機(jī)進(jìn)行各方向上20%的平移和縮放。在驗(yàn)證集和測(cè)試集上,從同一個(gè)人各管數(shù)據(jù)依次選擇全部細(xì)胞,將抗原表達(dá)信息按照SSC/CD45為定位寫入矩陣的對(duì)應(yīng)通道內(nèi),對(duì)矩陣中相同位置的抗原表達(dá)水平取均值,該矩陣作為一個(gè)驗(yàn)證或測(cè)試樣本。

1.6 模型的構(gòu)建本研究中CNN模型選擇LeNet-5架構(gòu),該架構(gòu)是現(xiàn)代CNN的起源架構(gòu)之一,具有代表性(圖1C)。為保證客觀性,除調(diào)整模型的輸入和輸出尺寸外,不改變模型其他參數(shù)。訓(xùn)練時(shí),用訓(xùn)練集和驗(yàn)證集分別進(jìn)行模型的訓(xùn)練和調(diào)參,損失函數(shù)選擇交叉熵函數(shù)(公式2)。

(公式2)

式中,N代表樣本總數(shù);yi表示樣本i的標(biāo)簽,正類為1,負(fù)類為0;pi表示樣本i預(yù)測(cè)為正類的概率。

采用隨機(jī)梯度下降法(stochastic gradient descent,SGD)作為優(yōu)化器在訓(xùn)練中更新參數(shù),訓(xùn)練完畢后模型以h5格式存儲(chǔ)。測(cè)試時(shí),將測(cè)試集輸入模型,信號(hào)在模型中向前傳播后通過(guò)sigmoid函數(shù)(公式3)計(jì)算得到二分類概率值,模型定義0.5為截?cái)嘀狄詤^(qū)分AML和正常人。

(公式3)

式中,x為分類器前網(wǎng)絡(luò)的輸出,S(x)取值范圍在[0,1]之間,當(dāng)x=0時(shí),S(x)=0.5。

對(duì)模型在測(cè)試集上的性能進(jìn)行評(píng)價(jià),評(píng)價(jià)指標(biāo)包括準(zhǔn)確率、靈敏度(查全率)、特異度、查準(zhǔn)率和F1分?jǐn)?shù)(公式4)。

(公式4)

式中,P表示查準(zhǔn)率,R表示查全率,F1分?jǐn)?shù)取值范圍在[0,1]之間,是用來(lái)綜合評(píng)價(jià)二分類模型精確度的指標(biāo)。

1.7 統(tǒng)計(jì)學(xué)處理采用R 4.0.2 軟件中Bioconducter-flowcore工具包實(shí)現(xiàn)FCS數(shù)據(jù)的信息提取。采用Python 3.7.1軟件中sklearn、numpy工具包實(shí)現(xiàn)數(shù)據(jù)集的建立,模型框架的搭建及訓(xùn)練和測(cè)試的全過(guò)程均使用keras工具包實(shí)現(xiàn),文中與模型相關(guān)但未說(shuō)明的參數(shù)均為keras中的默認(rèn)參數(shù)。采用matplotlib工具包繪制受試者工作曲線(receiver operator characteristic curve,ROC),計(jì)算曲線下面積(area under curve,AUC)評(píng)價(jià)模型的優(yōu)劣。

2 結(jié)果

2.1 FCM數(shù)據(jù)各抗原表達(dá)水平單因素分析對(duì)FCM數(shù)據(jù)各抗原表達(dá)水平進(jìn)行單因素分析,見(jiàn)表1。在數(shù)據(jù)1中,正常人和AML患者在CD33、HLA-DR、CD117、CD34抗原表達(dá)水平差異有統(tǒng)計(jì)學(xué)意義;在數(shù)據(jù)2中,正常人與AML患者在CD45、HLA-DR、CD117、CD34抗原表達(dá)水平差異有統(tǒng)計(jì)學(xué)意義。

表1 各抗原表達(dá)水平與AML患者的關(guān)系

2.2 CNN模型訓(xùn)練過(guò)程設(shè)置初始學(xué)習(xí)率為0.005,訓(xùn)練輪次為30,在CNN模型的訓(xùn)練過(guò)程中(圖2),訓(xùn)練集上損失函數(shù)不斷下降并趨于平緩,表明模型能夠從訓(xùn)練集上學(xué)習(xí)到特征。以驗(yàn)證集損失函數(shù)作為模型泛化性能評(píng)價(jià)指標(biāo),為避免模型出現(xiàn)過(guò)擬合,在驗(yàn)證集損失函數(shù)達(dá)到最低點(diǎn)時(shí)終止訓(xùn)練,訓(xùn)練時(shí)驗(yàn)證集損失函數(shù)在第18輪訓(xùn)練時(shí)達(dá)到最低點(diǎn),將訓(xùn)練完成后的模型保存。

圖2 CNN訓(xùn)練中損失函數(shù)變化圖

2.3 CNN模型性能評(píng)估運(yùn)用多個(gè)指標(biāo)評(píng)價(jià)模型在測(cè)試集上的性能(表2),在數(shù)據(jù)1、數(shù)據(jù)2和合并后數(shù)據(jù)的AUC分別為0.940(0.922~0.958)、0.917(0.885~0.949)和0.932(0.916~0.948),見(jiàn)圖3。

表2 CNN在測(cè)試集上的性能

圖3 CNN模型在測(cè)試集上的ROC曲線

3 討論

AML的精確診斷是其治療和預(yù)后判斷的關(guān)鍵,目前MICM分型依據(jù)是國(guó)際上通用的診斷方法,即細(xì)胞形態(tài)學(xué)、免疫學(xué)、細(xì)胞遺傳學(xué)和分子生物學(xué)分型,其中免疫學(xué)分型是由FCM來(lái)實(shí)現(xiàn)的。隨著對(duì)疾病的認(rèn)識(shí)逐漸加深,越來(lái)越多的生物標(biāo)志物被應(yīng)用于AML的流式診斷中,給數(shù)據(jù)分析工作帶來(lái)更大挑戰(zhàn),探究FCM數(shù)據(jù)自動(dòng)分析成為近年來(lái)的研究熱點(diǎn)[10-12]。Cheung et al[13]對(duì)現(xiàn)有的自動(dòng)分析方法進(jìn)行了使用調(diào)查后指出,雖然一些方法已經(jīng)被證明有不錯(cuò)的效果,但仍然存在問(wèn)題。例如許多軟件通常只針對(duì)特定來(lái)源的數(shù)據(jù)進(jìn)行自動(dòng)分析,軟件的跨平臺(tái)使用問(wèn)題依然難以解決,并且目前還沒(méi)有針對(duì)白血病診斷的軟件出現(xiàn),已提出多數(shù)自動(dòng)分析方法以無(wú)監(jiān)督的機(jī)器學(xué)習(xí)為主,得到的結(jié)果需要人工進(jìn)行二次分析,難以實(shí)現(xiàn)完全的自動(dòng)化。因此尚沒(méi)有任何一種自動(dòng)分析方法能夠被普遍接受,在實(shí)際臨床工作中仍以人工分析為主。

傳統(tǒng)的數(shù)據(jù)分析方法已經(jīng)證明了將FCM數(shù)據(jù)轉(zhuǎn)化為圖像是一種切實(shí)可行的策略,其局限性產(chǎn)生原因是人類視覺(jué)的限制,而CNN模型已經(jīng)成為代替人類視覺(jué)進(jìn)行圖像分析的最好方法,被廣泛的應(yīng)用于醫(yī)學(xué)圖像分類和識(shí)別方面,并證明在很多問(wèn)題上與專業(yè)醫(yī)師相當(dāng)[14-15]。本研究針對(duì)AML提出了一種FCM數(shù)據(jù)結(jié)構(gòu),該結(jié)構(gòu)參考了圖像數(shù)據(jù)的存儲(chǔ)方式,以常作為骨髓細(xì)胞類型判斷依據(jù)的SSC和CD45作為像素的定位點(diǎn),將其余與AML初步診斷相關(guān)抗原的表達(dá)水平寫入圖像數(shù)據(jù)的顏色通道。這種結(jié)構(gòu)的優(yōu)點(diǎn)是顯而易見(jiàn)的,首先,該結(jié)構(gòu)能夠?qū)CM多管數(shù)據(jù)整合在同一矩陣中,可以通過(guò)調(diào)整矩陣的尺寸改變分辨率和納入抗原的數(shù)量,有利于形成統(tǒng)一的標(biāo)準(zhǔn);其次,該結(jié)構(gòu)可以體現(xiàn)各抗原表達(dá)水平間的交互關(guān)系,有助于發(fā)現(xiàn)人工設(shè)門中可能遺漏的信息;另外,該結(jié)構(gòu)可以在不改變模型參數(shù)的情況下兼容多數(shù)CNN架構(gòu),便于后續(xù)的自動(dòng)化研究。本研究中選擇了兩組不同來(lái)源的數(shù)據(jù),用公開(kāi)數(shù)據(jù)進(jìn)行建模后直接對(duì)本地?cái)?shù)據(jù)進(jìn)行測(cè)試,在本地?cái)?shù)據(jù)上的測(cè)試結(jié)果與公開(kāi)數(shù)據(jù)相似,均具有較高準(zhǔn)確率,證明模型不僅能夠準(zhǔn)確識(shí)別AML,還具有很強(qiáng)的魯棒性,可以解決軟件跨平臺(tái)使用的問(wèn)題,相較于其他算法更具有臨床應(yīng)用價(jià)值。

同時(shí),本研究還存在一些局限性。由于本研究中使用的數(shù)據(jù)僅提供了AML患者和正常人的標(biāo)簽,缺乏更詳細(xì)的疾病信息,因此僅探討了CNN模型在AML初步診斷中的應(yīng)用,對(duì)于免疫分型和微小殘留病等問(wèn)題并未提及。本研究?jī)H納入7個(gè)參數(shù),且數(shù)據(jù)為二分類,因此選擇了結(jié)構(gòu)相對(duì)簡(jiǎn)單的LeNet-5架構(gòu),如果后續(xù)需要納入更多變量或解決更加復(fù)雜的多分類問(wèn)題,也可以選擇深度更大的CNN模型。在本研究中對(duì)訓(xùn)練集采用了細(xì)胞隨機(jī)抽樣和數(shù)據(jù)增強(qiáng),雖然一定程度上能彌補(bǔ)小樣本對(duì)模型的不良影響,但是無(wú)法從根本上解決數(shù)據(jù)缺乏導(dǎo)致的模型訓(xùn)練中有效特征遺漏問(wèn)題,如需進(jìn)一步提高模型性能,擴(kuò)大數(shù)據(jù)量是必須的途徑。為了保證結(jié)果的客觀性,本研究沒(méi)有深入探討模型參數(shù)的選擇,而是盡可能的選擇工具包默認(rèn)參數(shù),可能導(dǎo)致得到的模型并不是最優(yōu)的,可在將來(lái)實(shí)用過(guò)程中進(jìn)一步完善。

綜上所述,本研究提出了一種FCM數(shù)據(jù)結(jié)構(gòu),并用CNN模型實(shí)現(xiàn)了AML的自動(dòng)識(shí)別,表明CNN在FCM數(shù)據(jù)分析中具有一定的應(yīng)用價(jià)值。

猜你喜歡
模型
一半模型
一種去中心化的域名服務(wù)本地化模型
適用于BDS-3 PPP的隨機(jī)模型
提煉模型 突破難點(diǎn)
函數(shù)模型及應(yīng)用
p150Glued在帕金森病模型中的表達(dá)及分布
函數(shù)模型及應(yīng)用
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 老司国产精品视频91| 亚洲日本中文字幕天堂网| 久久综合伊人 六十路| 成年人视频一区二区| 免费国产在线精品一区| 婷婷色在线视频| 亚洲欧美日韩另类在线一| 国产香蕉在线视频| 永久毛片在线播| 99久久99这里只有免费的精品| 真人免费一级毛片一区二区| 国产一区二区三区精品久久呦| 欧美另类图片视频无弹跳第一页| 男女性色大片免费网站| 婷五月综合| 日日拍夜夜操| 国产免费a级片| 亚洲综合狠狠| 91国内视频在线观看| 午夜a视频| 永久免费无码成人网站| 欧美区一区二区三| 国产在线欧美| 亚洲一区国色天香| 91人妻日韩人妻无码专区精品| 欧美在线视频不卡| 综合色在线| 精品无码一区二区在线观看| 手机精品视频在线观看免费| 操美女免费网站| 欧美日韩资源| 日本午夜精品一本在线观看| 日本a级免费| 99成人在线观看| 国产精品亚洲综合久久小说| 中文字幕啪啪| 亚洲精品片911| 四虎精品黑人视频| 日本免费高清一区| 亚洲国产成人超福利久久精品| 成人国产小视频| 四虎免费视频网站| 国产精品开放后亚洲| 欧美日韩另类在线| 少妇高潮惨叫久久久久久| 欧美日韩成人| 91精选国产大片| 激情综合网激情综合| 久久人午夜亚洲精品无码区| 婷婷中文在线| 欧美一级99在线观看国产| 中文字幕首页系列人妻| 亚洲乱码在线视频| 美女黄网十八禁免费看| 欧美日韩成人在线观看| 久久毛片基地| 夜夜操天天摸| 91综合色区亚洲熟妇p| 亚洲精品在线观看91| 国产无码性爱一区二区三区| 另类欧美日韩| 99精品国产高清一区二区| 日韩AV无码免费一二三区 | 亚洲精品无码成人片在线观看 | 无码啪啪精品天堂浪潮av| 国产日韩欧美成人| 欧美va亚洲va香蕉在线| 四虎精品免费久久| 亚洲欧洲日韩综合色天使| 精品91在线| 久久精品无码一区二区国产区| 青青草国产一区二区三区| 亚洲动漫h| 日韩小视频在线观看| 亚洲国产成人综合精品2020| 69av免费视频| 国产精品成人AⅤ在线一二三四 | 91精品免费高清在线| 国产精品毛片一区视频播| 福利视频一区| 一级爆乳无码av| 精品视频在线一区|