999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

糖尿病線性判別診斷模型的建立

2011-09-20 03:20:18魏玉輝傅松波武新安
衛(wèi)生職業(yè)教育 2011年17期
關(guān)鍵詞:糖尿病

李 雯,魏玉輝,傅松波,武新安

(蘭州大學(xué)第一醫(yī)院,甘肅 蘭州 730000)

近年來(lái),糖尿病發(fā)病率呈逐年上升趨勢(shì),已成為發(fā)達(dá)國(guó)家繼心血管病和腫瘤之后的第三大非傳染性疾病。流行病調(diào)查顯示,我國(guó)目前大約有4000萬(wàn)糖尿病患者,預(yù)計(jì)到2025年,我國(guó)糖尿病患者將達(dá)到1 億。因而對(duì)糖尿病進(jìn)行早期診斷及分類研究非常重要[1]。分類體系在醫(yī)學(xué)診斷中的應(yīng)用日趨廣泛,從患者臨床檢驗(yàn)數(shù)據(jù)到專家決策,均是臨床評(píng)價(jià)的重要過(guò)程。機(jī)器學(xué)習(xí)算法可以通過(guò)大量臨床檢驗(yàn)數(shù)據(jù)和專家決策進(jìn)行學(xué)習(xí),尋找數(shù)據(jù)中存在的規(guī)律及影響疾病診斷的主要因素。目前,機(jī)器學(xué)習(xí)算法在疾病輔助診斷中的應(yīng)用越來(lái)越廣泛,使用的算法涉及人工神經(jīng)網(wǎng)絡(luò)(ANN)、支持向量基(SVM)、遺傳算法(GA)、線性判別分析(LDA)等[2~8]。LDA 是用于判別個(gè)體所屬群體的一種統(tǒng)計(jì)方法,是多元統(tǒng)計(jì)分析中判別樣品所屬類型的一種重要方法,特別適合多變量的兩分類或多分類研究。目前,機(jī)器學(xué)習(xí)算法用于糖尿病診斷的研究少有報(bào)道[3]。本文采用臨床常規(guī)檢查指標(biāo)(血常規(guī)、生化)與LDA 相結(jié)合的方法建立計(jì)算機(jī)輔助糖尿病診斷模型,取得了較為滿意的結(jié)果。

1 研究資料

1.1 資料來(lái)源

研究病例來(lái)自蘭州大學(xué)第一醫(yī)院病歷庫(kù),所收集的資料均為醫(yī)院內(nèi)分泌科、普外科2007年全年出院患者。

1.2 研究對(duì)象

均由有經(jīng)驗(yàn)的內(nèi)分泌科醫(yī)師診斷。糖尿病病例352例,非糖尿病病例389例;男性428例,女性313例;年齡8~84歲,平均年齡(58 ±14)歲。錄入信息包括患者基本情況(年齡、性別、入院日期、出院日期等)、血常規(guī)檢查指標(biāo)(白細(xì)胞、紅細(xì)胞等)、生化檢查指標(biāo)(天冬氨酸氨基轉(zhuǎn)移酶、丙氨酸氨基轉(zhuǎn)移酶等)。

1.3 納入及排除

分別以1型、2型糖尿病,其他特異性糖尿病及妊娠期糖尿病的臨床診斷標(biāo)準(zhǔn)為納入標(biāo)準(zhǔn)收集病例。由有經(jīng)驗(yàn)的內(nèi)分泌科醫(yī)師診斷為糖尿病的出院患者、普外科出院患者,排除其中基本情況、血常規(guī)檢查、生化檢查指標(biāo)不齊全者,其余均納入研究。

2 研究方法

2.1 線性判別分析

判別分析是用于幫助研究者尋找區(qū)別各組差異的變量,將對(duì)象較準(zhǔn)確地判入各組的方法[4]。判別分析最常見的應(yīng)用是為了判定哪些變量具有組間判別效力而對(duì)研究對(duì)象中多個(gè)測(cè)量變量進(jìn)行選擇[3]。經(jīng)過(guò)判別分析之后就會(huì)得到判別函數(shù)。判別分析適用于2組以上,且每個(gè)病例必須有2個(gè)以上變量的分類分析。

一般說(shuō)來(lái),我們可對(duì)2組間的判別擬合一個(gè)線性方程:Y=a+b1X1+b2X2+...+bnXn式中a 為常數(shù),b1 到 bn 為回歸系數(shù)。判別函數(shù)對(duì)2組判別問(wèn)題的解釋較直接,具有最大相關(guān)系數(shù)的變量對(duì)預(yù)測(cè)組別的貢獻(xiàn)最大[3]。本實(shí)驗(yàn)為了研究方便,定義糖尿病病例為1,而非糖尿病病例為-1。

2.2 逐步判別原理

逐步判別分析是根據(jù)多元方差分析中的wilk′s 統(tǒng)計(jì)量及F 值進(jìn)行變量的篩選。每一步選一個(gè)判別能力最大的指標(biāo)進(jìn)入判別函數(shù),直到被引入模型的變量沒(méi)有一個(gè)符合進(jìn)入模型的條件時(shí),變量引入過(guò)程結(jié)束。逐步判別分析以wilk′s 統(tǒng)計(jì)量最小者入選,本研究中模型引入變量的最小F 值為10,剔除變量的最大F 值為2.71。這樣得到的判別函數(shù)所包含的指標(biāo)都很重要。

2.3 病例收集與分類

按上述納入與排除標(biāo)準(zhǔn)收集病例,結(jié)合臨床檢驗(yàn)結(jié)果與有經(jīng)驗(yàn)臨床醫(yī)生的診斷對(duì)所收集病例進(jìn)行分類,同時(shí)建立相應(yīng)數(shù)據(jù)庫(kù)。

2.4 訓(xùn)練集和測(cè)試集的選擇

研究對(duì)象共741例,所有收集的病例以4∶1 比例分為訓(xùn)練集樣本和測(cè)試集樣本。為使計(jì)算機(jī)能更合理地從資料中獲取信息,訓(xùn)練集樣本應(yīng)能很好地代表患者真實(shí)情況,因此,運(yùn)用數(shù)據(jù)庫(kù)中已知其類別的樣本作為訓(xùn)練集,從741例樣本中選擇594例(糖尿病病例281例,非糖尿病病例313例)樣本組成訓(xùn)練集。為了檢驗(yàn)從訓(xùn)練集中得到識(shí)別函數(shù)的可靠程度,可利用一些未包括在訓(xùn)練集中的樣本構(gòu)成測(cè)試集,以檢驗(yàn)其識(shí)別的可靠性,因此,將剩余147例(糖尿病病例71例,非糖尿病病例76例)樣本構(gòu)成測(cè)試集,以驗(yàn)證模型的預(yù)測(cè)能力。

2.5 判別函數(shù)的建立

通過(guò)訓(xùn)練集獲得判別函數(shù)建立模型。將訓(xùn)練集患者的基本情況、血常規(guī)檢查及生化檢查信息從Microsoft-Excel 數(shù)據(jù)庫(kù)導(dǎo)入SPSS 數(shù)據(jù)庫(kù)。然后用SPSS 統(tǒng)計(jì)軟件提供的判別分析方法對(duì)這些數(shù)據(jù)進(jìn)行判別分析,選出對(duì)預(yù)測(cè)組別貢獻(xiàn)較大的變量,建立判別函數(shù)。

2.6 模型的評(píng)價(jià)

用訓(xùn)練集與測(cè)試集的誤判率對(duì)模型進(jìn)行判別效果評(píng)價(jià),并引入特異性和敏感性指標(biāo)進(jìn)一步判斷LDA 的預(yù)測(cè)能力。

3 結(jié)果與討論

3.1 特征變量及判別函數(shù)

經(jīng)LDA 法進(jìn)行判別分析后,逐步選出8項(xiàng)對(duì)區(qū)別各組貢獻(xiàn)較大的變量。判別函數(shù)的變量及Wilk′s 值,見表1。

表1 逐步判別分析篩選出的特征變量

在疾病診斷中常需根據(jù)就診者的檢查指標(biāo)、體征等的分析,作出是否患有某種疾病的診斷,這種問(wèn)題就可用判別分析解決[5]。逐步判別分析可以篩選出對(duì)于鑒別2類具有不同屬性的人群有較大貢獻(xiàn)的變量,從而使其結(jié)果具有較好的區(qū)分度。表中F 的絕對(duì)值越大就意味著該變量對(duì)模型的貢獻(xiàn)越大。由表1 中的F 值可知,變量總膽固醇比其他變量相對(duì)重要,這些變量所代表的臨床意義與診斷模型之間的關(guān)系有待進(jìn)一步研究。由8個(gè)特征變量相對(duì)應(yīng)的判別函數(shù)系數(shù)建立的糖尿病與非糖尿病分類判別函數(shù)如下。

糖尿病判別函數(shù):Y=-55.570+0.168X1+3.610X2+0.413X3+0.004X4-0.030X5+2.278X6+0.083X7+1.405X8

非糖尿病判別函數(shù):Y=-42.9820+0.115X1+2.849X2+0.372X3+0.008X4-0.010X5+2.149X6+0.071X7+0.871X8

3.2 判別結(jié)果及判別正確率

將741例合格病例以4∶1 比例分為訓(xùn)練集樣本和測(cè)試集樣本,經(jīng)交互檢驗(yàn)法驗(yàn)證可得訓(xùn)練集的預(yù)測(cè)情況,見表2。

由表2可知,訓(xùn)練集和測(cè)試集的預(yù)測(cè)準(zhǔn)確率分別是85.7%和81.6%,模型總判別準(zhǔn)確率為84.9%。

表2 LDA 判別模型預(yù)測(cè)準(zhǔn)確率

3.3 特異性和敏感性

LDA 對(duì)于糖尿病和非糖尿病的判別效果較好,為了進(jìn)一步判斷LDA 的預(yù)測(cè)能力,實(shí)驗(yàn)引入了特異性(Specificity)和敏感性(Sensitivity)指標(biāo)。

其中TP 指真陽(yáng)性數(shù),F(xiàn)N 指假陰性數(shù),TN 指真陰性數(shù),F(xiàn)P指假陽(yáng)性數(shù)。在LDA 法判斷結(jié)果中,測(cè)試集的假陽(yáng)性病例是31例,假陰性病例是54例。由此求得測(cè)試集樣本的敏感性是0.75,特異性是 0.88。

4 結(jié)論

本文是首次源于臨床常規(guī)檢查指標(biāo)(血常規(guī)、生化)與機(jī)器學(xué)習(xí)算法相結(jié)合建立計(jì)算機(jī)輔助糖尿病診斷模型。逐步判別分析的總判別準(zhǔn)確率達(dá)到84.9%,雖然判別效果較好,但還可通過(guò)進(jìn)一步擴(kuò)大樣本量,或采用更加適合的機(jī)器學(xué)習(xí)算法提高判別能力。

[1]陳文彬.診斷學(xué)[M].第5版.北京:人民衛(wèi)生出版社,2004.

[2]Kemal Polat,Salih Gunes,Ahmet Arslan.A cascade learning system for classification of diabetes disease:Generalized Discriminant Analysis and Least Square Support Vector Machine[J].Expert Systems with Applications,2008(34):482~487.

[3]J Liang,R Du.Model-based Fault Detection and Diagnosis of HVAC systems using Support Vector Machine method[J].International Journal of Refrigeration,2007(30):1104~1114.

[4]Kemal Polat,Salih Gune.Breast cancer diagnosis using least square support vector machine[J].Digital Signal Processing,2007(17):694~701.

[5]Tim W,Nattkemper,Bert Arnrich,et al.Evaluation of radiological features for breast tumour classification in clinical screening with machine learning methods[J].Artificial Intelligence in Medicine,2005(34):129~139.

[6]Weida Tong,Qian Xie.Using Decision Forest to Clissify Prostate Cancer Samples on Basis of SELDI-TOF MS Data:Assessing Chance Correlation and Prediction Confidence[J].Environmental Health Perspectives,2004(112):1622~1627.

[7]Kemal Polat,Salih Gunes.Computer aided medical diagnosis systerm based on principal component analysis and artificial immune recognition systerm classifier algorithm[J].Expert Systems with Applications,2008(34):773~779.

[8]Marco A,M énde z,Christian Hodar,et al.Discriminant analysis to evaluate clustering of gene expression data[J].FEBS Letters,2002(522):24~28.

猜你喜歡
糖尿病
糖尿病知識(shí)問(wèn)答
中老年保健(2022年5期)2022-08-24 02:35:42
糖尿病知識(shí)問(wèn)答
中老年保健(2022年1期)2022-08-17 06:14:56
糖尿病知識(shí)問(wèn)答
中老年保健(2021年5期)2021-08-24 07:07:20
糖尿病知識(shí)問(wèn)答
中老年保健(2021年9期)2021-08-24 03:51:04
糖尿病知識(shí)問(wèn)答
中老年保健(2021年7期)2021-08-22 07:42:16
糖尿病知識(shí)問(wèn)答
中老年保健(2021年3期)2021-08-22 06:49:56
糖尿病知識(shí)問(wèn)答
糖尿病離你真的很遙遠(yuǎn)嗎
糖尿病離你真的很遠(yuǎn)嗎
得了糖尿病,應(yīng)該怎么吃
主站蜘蛛池模板: 午夜精品一区二区蜜桃| v天堂中文在线| 国产精品一区二区在线播放| 99热这里都是国产精品| 九色综合伊人久久富二代| 亚洲免费人成影院| 视频一本大道香蕉久在线播放 | 一本色道久久88| 国产真实乱人视频| 白浆免费视频国产精品视频| 国产成人h在线观看网站站| 久久无码av三级| 久久精品免费国产大片| 国产视频a| 色综合天天综合中文网| 久久久久青草线综合超碰| 免费无码一区二区| 婷婷午夜天| 亚洲成人一区二区| 一级做a爰片久久毛片毛片| 久久精品无码国产一区二区三区| 精品国产免费观看| 夜夜爽免费视频| 一级毛片在线直接观看| av在线人妻熟妇| 性色一区| 四虎影视无码永久免费观看| 国产高清国内精品福利| 中文字幕在线一区二区在线| 一级片免费网站| 国产成人91精品| 久久久久亚洲AV成人人电影软件| 国产欧美日韩精品第二区| 国产va在线观看| 久久精品丝袜| 一本大道香蕉高清久久| 114级毛片免费观看| 五月丁香伊人啪啪手机免费观看| 亚欧乱色视频网站大全| 伊人激情综合网| 欧美激情,国产精品| 97se综合| 欧美天堂久久| 香蕉eeww99国产在线观看| 国产精品极品美女自在线看免费一区二区| 99精品免费在线| 亚洲无码37.| 91久久青青草原精品国产| 国产白浆视频| 欧美色视频日本| 国产精品亚洲αv天堂无码| 国产精品露脸视频| 久久久久国产精品熟女影院| 黄色网页在线播放| 亚洲高清资源| 国产精品福利社| 高潮毛片无遮挡高清视频播放| 亚洲一区二区成人| 国产精品综合久久久| 亚洲天堂网在线观看视频| 亚洲看片网| 中文字幕丝袜一区二区| 青青国产视频| 亚洲国产精品一区二区第一页免| 狠狠做深爱婷婷久久一区| 亚洲午夜国产精品无卡| 在线视频亚洲色图| 自慰网址在线观看| 亚洲欧美天堂网| 久久77777| a天堂视频| 亚洲欧美成人在线视频| 精品国产成人a在线观看| 91精品啪在线观看国产91九色| 欧美色视频在线| 自拍偷拍一区| 超级碰免费视频91| 亚洲第一黄片大全| 亚洲成人在线免费观看| 9cao视频精品| 美女潮喷出白浆在线观看视频| 国产成人高清精品免费5388|