999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

決策曲線分析在R語言中的實現(xiàn)

2018-12-29 03:51:04中南大學(xué)湘雅公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計系410078
中國衛(wèi)生統(tǒng)計 2018年6期
關(guān)鍵詞:模型研究

中南大學(xué)湘雅公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計系(410078)

陳樂陶 楊土保 陳 橙 張靜航 賀志敏 鄭 贊 秦家碧△

受試者工作特征曲線(receiver operator characteristic curve,ROC曲線)作為一種臨床預(yù)測模型,被廣大醫(yī)學(xué)研究工作者使用。ROC曲線利用真陽性率和假陰性率作圖,得到靈敏度和特異度的關(guān)系,確定診斷試驗的最佳臨界值,并通過曲線下面積(area under curve,AUC)比較不同模型的優(yōu)劣。但ROC曲線唯一關(guān)注的就是預(yù)測模型的準確性,并不能在實際臨床模型效用判斷中提供幫助[1]。而決策曲線分析(decision curve analysis,DCA)恰好彌補了這一缺陷。DCA是一種能體現(xiàn)臨床結(jié)局變量并可用于評估和比較不同預(yù)測模型的方法,受到越來越多來自醫(yī)學(xué)研究工作者的重視。近些年,在醫(yī)學(xué)外文期刊例如Lancet、JAMA、J ClinOncl等中陸續(xù)有文章采納、介紹并推薦DCA的應(yīng)用[2-4]。

方法與原理

1.背景介紹

DCA最早由Andrew J.Vickers和Elena B.Elkin在2006年介紹并發(fā)表于Medical Decision Making雜志上[1]。作者以一項預(yù)測前列腺癌患者是否應(yīng)該接受全精囊切除手術(shù)的研究展開對DCA的闡述。前列腺癌的治療手術(shù)在切除前列腺的同時往往還要切除全部精囊,以防止癌細胞擴散到精囊發(fā)生精囊浸潤(seminal vesicle invasion,SVI)。SVI只有在切除手術(shù)后才能被檢測,而對于那些實際并沒有SVI的患者來說,將承受尿失禁或陽痿等較嚴重的副作用。所以有研究者建議對于SVI預(yù)測發(fā)生率高的患者直接采取精囊全切手術(shù),而對于預(yù)測發(fā)生率低的患者采取精囊尖端保留的手術(shù)治療。保留精囊尖端能避免切除重要的神經(jīng)和血管,可減少副作用的發(fā)生風(fēng)險,同樣也會增加癌癥復(fù)發(fā)的可能性。如何選擇手術(shù)方法成了外科醫(yī)生和患者共同面臨的問題。之前的研究者普遍采用ROC預(yù)測,但并不能判別該模型結(jié)局的實際臨床效益。所以Vickers引進了DCA這種方法,在不同的SVI發(fā)生率下,權(quán)衡患者可能得到或損失的臨床效益(如健康、經(jīng)濟、精神等方面),通過比較凈獲益(net benefit,NB)值的大小預(yù)測實施哪種手術(shù)方法。至今為止,DCA已經(jīng)被廣泛應(yīng)用在癌癥研究且逐漸擴展到其他研究領(lǐng)域中[4]。

2.應(yīng)用領(lǐng)域

DCA方法實質(zhì)上是根據(jù)不同影響因素構(gòu)建的模型來預(yù)測臨床結(jié)局。通過預(yù)測不良事件發(fā)生的概率制定干預(yù)措施,從而改善患者健康、提高個性化治療的應(yīng)用,促進公共衛(wèi)生領(lǐng)域的發(fā)展[5]。目前DCA方法主要應(yīng)用于預(yù)測診斷試驗結(jié)局、術(shù)后結(jié)局及比較不同模型的優(yōu)劣。例如預(yù)測前列腺癌患者存在SVI的概率[1](預(yù)測診斷結(jié)局),預(yù)測心臟手術(shù)后患者的死亡率[6](預(yù)測術(shù)后結(jié)局),選擇評價房顫患者口服抗凝藥出血風(fēng)險的最優(yōu)模型[2](比較不同模型優(yōu)劣)。同時,為了完善和改進DCA方法,很多研究者就其方法學(xué)進行深入的研究與探索。

我們在Pubmed上以decision curve analysis為關(guān)鍵詞限定在題目和摘要檢索,共檢索出259篇相關(guān)文獻。從2006年到2016年有關(guān)DCA主題的發(fā)表文獻數(shù)量及趨勢見圖1。這表明DCA模型已經(jīng)受到了越來越多來自醫(yī)學(xué)相關(guān)工作者的關(guān)注,并逐漸滲透、應(yīng)用于實際臨床科研中。

圖1 在Pubmed上檢索的不同發(fā)表年份下關(guān)于DCA的發(fā)表文獻數(shù)量趨勢圖

3.DCA原理

DCA的產(chǎn)生基于一個原則[7],即假陽性(如不必要的活檢)和假陰性(如漏診癌癥)的相對損失值可以用閾概率表示。假定患癌癥的概率大于20%時應(yīng)選擇活檢,那么當(dāng)受試者患癌癥的概率小于20%時,漏診癌癥產(chǎn)生的損失值是接受不必要活檢損失值的四倍,這意味著閾概率的值決定了損失的相對比值。總之,閾概率的值既可以決定受試者的臨床結(jié)局又可以使用臨床凈效益函數(shù)對真陽性和假陽性的臨床結(jié)果建模:

其中,n為樣本量、Pt為閾概率、true positive、false positive分別為真陽性和假陽性患者的數(shù)量。NB就是根據(jù)這一理論平衡了收益值與損失值之間的關(guān)系。如果受試者的NB在可接受范圍之內(nèi),就會被建議采取干預(yù)或相應(yīng)治療措施[4]。

DCA曲線的產(chǎn)生可以分解為以下步驟[7]:

(1)選擇合適的閾概率Pt;

(2)受試者A發(fā)生不良結(jié)局的概率為a,當(dāng)Pa>Pt時,為陽性;

(3)計算真陽性和假陽性的個數(shù);

(4)計算凈收益值;

(5)改變Pt值并重復(fù)上述步驟。

事實上,DCA曲線的產(chǎn)生就是通過一系列閾概率的變化從而改變NB的大小。

4.DCA與ROC的聯(lián)系與區(qū)別

ROC和DCA都屬于預(yù)測模型,都可以用來評價不同模型的優(yōu)劣,但ROC和DCA在理論構(gòu)建上有著本質(zhì)區(qū)別[5]。

ROC結(jié)合了所有靈敏度與特異度,通過比較AUC決定預(yù)測模型的準確性。但在實際臨床應(yīng)用中,AUC值最大并不代表模型最優(yōu)。就好比上文中提過的前列腺癌患者的全精囊切除手術(shù),盡可能降低假陽性患者的數(shù)量是決策者需要考慮的問題,盡管此時的ROC未必最優(yōu)。另一方面,對于極端情況,準確性已不那么重要。比如患病的概率小于0.2時可以不做任何干預(yù)或治療措施,概率大于0.8時應(yīng)采取措施,細小的概率差異顯然不會影響醫(yī)生的決斷。而當(dāng)概率在0.2~0.8之間時,是否采取措施才是醫(yī)生和患者需要考慮的,此時顯然要使用DCA這種預(yù)測模型。

DCA是用來預(yù)測臨床結(jié)局變量的模型。DCA最適用的情況是,有癥狀預(yù)示可能患病但未被確診時,是否采取及采取何種篩查方法來診斷疾病。由于篩查方法往往存在著不同的風(fēng)險和副作用,受試者患病的概率、可能的副作用、患者的意愿及醫(yī)生的經(jīng)驗都會影響最終的決定。很顯然,在極端情況下如何抉擇并不難,而在特定的區(qū)間概率范圍內(nèi)就依靠DCA提供決策評價。ROC與DCA具體的區(qū)別如表1所示。

表1 ROC與DCA區(qū)別

實例分析

為了更好地說明DCA方法的應(yīng)用,我們以一項病例對照研究為例具體展示R語言的操作。該研究目的是探究不同影響因素與冠心病發(fā)生的關(guān)系。研究對象為湖南省長沙市居民,研究樣本量為324,其中冠心病患者組156人,對照組168人,自變量分別為x1(年齡)、x2(高血壓史)、x3(高血壓家族史)、x4(吸煙)、x5(高血脂史)、x6(動物脂肪攝入)、x7(體重指數(shù)BMI)等,結(jié)局變量為Y(是否發(fā)生冠心病)。查閱文獻資料得出中國城市居民的冠心病發(fā)病率約為1.3%[8]。

為比較不同變量構(gòu)成方式對冠心病發(fā)生的預(yù)測,在此構(gòu)建三種模型。模型single、triple、total分別代表納入一種、三種及全部變量,即分別探討單因素、部分研究因素、全部研究因素與冠心病發(fā)生的關(guān)系,通過DCA作圖,直觀觀察并選擇預(yù)測結(jié)局的最佳模型。

(1)安裝程序輔助包

DCA的繪制無法直接在R軟件中實現(xiàn),需另下載專有的DCA相關(guān)R輔助軟件包。

在R (3.4.1) 軟件中直接輸入以下程序,即可以下載完成繪制DCA所需的安裝包。

library(devtools)

install_github(“mdbrown/NetBenefitCurve”)

或直接輸入install.packages(“rmda”)

rmda:為risk model decision analysis的縮寫,是繪制DCA所需的R輔助包

(2)讀取數(shù)據(jù)

安裝包下載安裝成功后,直接在R軟件中輸入下列程序:

setwd("D:\DCA")

Data<-read.csv("coronary heart disease.csv",header=TRUE,sep=",")

library(rmda)

數(shù)據(jù)以D盤DCA文件夾下名為coronary heart disease的excel格式存儲的

read.csv:讀取excel格式的數(shù)據(jù);library(rmda) 激活R輔助包。

(3)構(gòu)建三種模型

single<-decision_curve(Y~x7,data = Data,family=binomial(link =′logit′),

thresholds= seq(0,1,by = 0.01),confidence.intervals =0.95,

study.design= ′case-control′,population.prevalence=0.13)

探討單因素與結(jié)局變量的關(guān)系;在logistic回歸基礎(chǔ)上,以Y為因變量,x7為自變量構(gòu)建模型。thresholds設(shè)定閾概率的范圍為0~1,也可根據(jù)具體實際情況規(guī)定閾概率范圍。該例研究為病例對照研究,人群發(fā)病率為1.3%。

需要說明的是,此套R程序同樣適用隊列研究,只需將代碼’case-control’換為’cohort’,將population.prevalence= 語句刪除,即可。

triple<-decision_curve(Y~x1+x2+x7,data = Data,

family = binomial(link =′logit′),thresholds= seq(0,1,by = 0.01),

confidence.intervals =0.95,study.design = ′case-control′,

population.prevalence = 0.13)

探討部分研究因素與結(jié)局變量的關(guān)系。

total<-decision_curve(Y~x1+x2+x3+x4+x5+x6+x7,data = Data,

family = binomial(link =′logit′),thresholds = seq(0,1,by = 0.01),

confidence.intervals= 0.95,study.design = ′ case-control’,

population.prevalence= 0.13)

探討全部研究因素與結(jié)局變量的關(guān)系。

4.繪制DCA

List<-list(single,triple,total)

將single、triple、total三條曲線并列在一張表格上

plot_decision_curve(List,curve.names= c(′single′,′triple′,′total′),

cost.benefit.axis =FALSE,col = c(′red′,′green′,′blue′),

confidence.intervals =FALSE,standardize = FALSE,

xlab="Threshold Probablity")

以Threshold Probablity為橫軸,Net Benefit為縱軸,繪制DCA曲線圖。如只需單條曲線預(yù)測模型,將代碼List換為single或triple或total,在names和col保留想要的曲線名稱和顏色即可。

圖2 對三種不同模型進行比較的決策曲線分析圖

決策曲線的解釋依賴于預(yù)測曲線的凈收益與兩種極端情況曲線的凈收益相比較。在特定的Pt中,擁有最高的凈收益值的策略是最優(yōu)的。圖2是三種不同預(yù)測模型結(jié)局獲益的比較。五條曲線分別代表:三種不同納入因素的預(yù)測結(jié)局;所有受試者都不是冠心病患者(Pa

討 論

ROC曲線、校正曲線及分類表等評價方法主要注重如何提高預(yù)測模型的準確性,對模型之后的臨床結(jié)局關(guān)注甚少。但往往臨床結(jié)局的預(yù)測結(jié)果會直接影響醫(yī)生的決斷,而一味地追求準確性可能會忽視患者真實的需求[9]。

DCA方法實質(zhì)上是根據(jù)不同影響因素構(gòu)建的模型來預(yù)測臨床結(jié)局。通過預(yù)測不良事件發(fā)生的概率制定干預(yù)措施,從而改善患者健康、提高個性化治療的應(yīng)用,促進公共衛(wèi)生領(lǐng)域的發(fā)展。作為一種評價診斷試驗、預(yù)測模型和分子標(biāo)記的新興方法[7],DCA正逐步應(yīng)用于醫(yī)學(xué)研究中。如何準確繪制DCA曲線也成為當(dāng)前需要解決的問題。到目前為止,并沒有具體文獻指導(dǎo)操作DCA的繪制方法。本研究以實例為證,闡述針對隊列研究和病例對照研究,如何在R軟件中實

現(xiàn)DCA曲線的繪制,方便醫(yī)學(xué)研究工作者的使用,為推進DCA方法的應(yīng)用與探索提供幫助。

猜你喜歡
模型研究
一半模型
FMS與YBT相關(guān)性的實證研究
2020年國內(nèi)翻譯研究述評
遼代千人邑研究述論
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
視錯覺在平面設(shè)計中的應(yīng)用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統(tǒng)研究
新版C-NCAP側(cè)面碰撞假人損傷研究
3D打印中的模型分割與打包
主站蜘蛛池模板: 精品视频一区二区三区在线播 | 99在线视频免费观看| 日韩精品一区二区三区swag| 国产浮力第一页永久地址| 国产精品九九视频| 四虎永久免费网站| 亚洲黄网在线| 国产精品网拍在线| 在线观看国产小视频| a毛片在线播放| 国产内射一区亚洲| 一级全免费视频播放| 91伊人国产| 青青草欧美| 性欧美久久| 91免费观看视频| 玖玖精品在线| 日韩高清一区 | 国产香蕉97碰碰视频VA碰碰看| 美女被操黄色视频网站| 欧美成人在线免费| 日本免费新一区视频| 亚洲男人在线| 午夜福利亚洲精品| 久久国产乱子伦视频无卡顿| 国产综合网站| 91福利国产成人精品导航| 亚洲国产在一区二区三区| 高清无码一本到东京热| 国产午夜精品鲁丝片| 91精品视频网站| 伊人久久精品无码麻豆精品| 欧美日韩高清| 国产一线在线| 伊人色综合久久天天| 中文国产成人久久精品小说| 亚洲国产精品一区二区高清无码久久| 亚洲综合专区| 制服丝袜亚洲| 日本少妇又色又爽又高潮| 日本不卡在线视频| 国产无码性爱一区二区三区| 精品一区二区三区四区五区| 国产精品手机在线播放| 亚洲精品在线观看91| 99er精品视频| 在线综合亚洲欧美网站| 真人高潮娇喘嗯啊在线观看| 国产美女在线观看| 在线观看免费黄色网址| 最新日本中文字幕| 亚洲色图综合在线| 在线精品欧美日韩| 免费观看欧美性一级| 激情综合五月网| 男女性色大片免费网站| 亚洲资源站av无码网址| 亚洲天堂福利视频| 色综合天天视频在线观看| 国产专区综合另类日韩一区| 四虎成人精品在永久免费| 性网站在线观看| 免费人欧美成又黄又爽的视频| 狠狠色噜噜狠狠狠狠奇米777| 老汉色老汉首页a亚洲| 97se综合| 久久国产拍爱| 日韩人妻无码制服丝袜视频| 亚洲综合香蕉| 亚洲欧美一区二区三区麻豆| 综合五月天网| 99精品在线视频观看| 欧美国产成人在线| YW尤物AV无码国产在线观看| 99视频有精品视频免费观看| 久久黄色毛片| 四虎综合网| 一区二区日韩国产精久久| 尤物精品视频一区二区三区| 国产成人91精品免费网址在线| 91精选国产大片| 国产精品自拍露脸视频 |