999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

PLS-DA模型四種診斷統計量在代謝組學應用中的比較*

2014-03-10 05:25:16哈爾濱醫科大學衛生統計學教研室150086柯朝甫武曉巖
中國衛生統計 2014年3期
關鍵詞:差異模型

哈爾濱醫科大學衛生統計學教研室(150086) 柯朝甫 武曉巖 李 康

PLS-DA模型四種診斷統計量在代謝組學應用中的比較*

哈爾濱醫科大學衛生統計學教研室(150086) 柯朝甫 武曉巖 李 康Δ

目的比較PLS-DA模型四種診斷統計量在代謝組學數據分析中的檢驗效能和穩定性。方法采用雙重交叉驗證和置換檢驗的PLS-DA模型驗證策略,并分別使用四種診斷統計量對模擬數據和實際數據進行分析。結果AUC統計量較誤判數(率)、Q2和DQ2統計量具有更高的檢驗效能;同時,AUC統計量與其他三種診斷統計量相比較,具有更高的穩定性。結論AUC統計量是PLS-DA模型驗證過程中一種穩定有效的診斷統計量,推薦作為代謝組學研究中進行PLS-DA分析時的首選診斷統計量。

PLS-DA 代謝組學 診斷統計量 雙重交叉驗證 置換檢驗

近年來,偏最小二乘判別分析(PLS-DA)在高維組學數據分析中應用十分普遍,特別在代謝組學領域,已成為一種常用的數據分析方法[1-2]。PLS-DA是一種集合了主成分分析、典型相關分析和多元線性回歸特點的數據分析方法,與主成分分析相同的是都試圖提取出反映數據變異的最大信息,但主成分分析法只考慮自變量矩陣,而偏最小二乘法還需要同時考慮應變量(通常有病編碼為1,無病編碼為0),即通過自變量數據之間的協方差及與應變量之間的協方差構建正交得分向量(潛變量或主成分)[3]。在建立PLS-DA模型時,需要事先指定用于建模的主成分,不同的主成分數對應著不同的PLS-DA模型,一般按照一定的準則選取前面幾個主成分建立PLS-DA模型。

然而,作為一種判別分析方法,PLS-DA在處理高維(如m>1000)、小樣本(n<100)的組學數據時很容易產生過擬合現象,實際中為了判斷是否產生過擬合可以采用交叉驗證、置換檢驗等方法對模型進行診斷。目前最常用的診斷統計量有誤判數(誤判率)、受試者工作特征曲線下面積(AUC)、Q2及DQ2[4],這四種診斷統計量在應用上存在一定的差異。本文在簡要介紹這四種診斷統計量的基礎上,結合模擬實驗和實例分析,為如何選擇診斷統計量提供一定的依據。

四種診斷統計量

模型驗證的最好方法是采用前瞻性外部驗證,但在實際中由于樣本量不足,驗證模型的有效性通常采用交叉驗證方法(如5~7折交叉驗證),即將整個數據集分為訓練數據和測試數據兩部分,使用訓練數據建立基于一定主成分數的PLS-DA模型并對測試數據預測,這種形式的交叉驗證稱之為簡單交叉驗證。但是,建立PLS-DA模型時如果主觀選擇主成分數,容易產生過擬合現象。為此,針對PLS-DA模型,Westerhuis等提出使用雙重交叉驗證的方法[5],即將整個數據集隨機分為三部分,包括訓練數據、驗證數據和測試數據,使用訓練數據和驗證數據建立模型并優化模型參數,然后使用測試數據進行預測。雙重交叉驗證在建模選擇主成分時,通過內嵌在建模數據中的驗證數據確定,避免了過擬合的問題。模型評價可以采用下述四種統計量。

1.誤判數

通過PLS-DA模型分析,可以獲得每個樣品的預測類別,通過與真實類別相比較結果分別為真陽性、假陽性、真陰性和假陰性四種結果,誤判數為假陽性數目與假陰性數目之和,由此可以算出誤判率。在樣本例數一定的情況下,誤判數直接反映了PLS-DA模型誤判的樣品例數,簡單直觀。

2.受試者工作特征曲線下面積

使用PLS-DA模型進行分析,可以得到二分類應變量的偏最小二乘回歸結果,并可以根據交叉驗證的測試數據計算出受試者工作特征曲線下面積(AUC)[6]。這是一種把靈敏度和特異度結合起來綜合評價預測準確度的一種方法,當AUC>0.5時,其值越接近1,說明兩組的可區分度越高;同理,當AUC<0.5時,AUC越接近0,說明兩組的可區分度越高;當AUC=0.5時,說明兩組完全不可區分。

3.Q2統計量

Q2是目前代謝組學研究中應用最多的一種診斷統計量,用來衡量PLS-DA模型的預測效果,是代謝組學中使用最多的診斷統計量,其定義為

其中Ym為每個樣品的真實標簽,m為通過交叉驗證得到的每個樣品的預測值,m為所有樣品的平均值為預測殘差平方和,它定量地衡量了樣品預測值偏離真實標簽的程度[7]。Q2的意義和線性回歸分析中的決定系數R2相似,區別在于后者反映的是模型的擬合效果,而Q2則通過交叉驗證的測試數據計算得到,描述的是模型的預測能力。Q2的取值可以是負值(-∞<Q2≤1),其值越接近1說明模型的預測效果越好,如果其值為負值則表示預測能力差或完全沒有預測能力。

4.DQ2統計量

由于PLS-DA是一個線性判別模型,在兩組數據情況下(有病=1,正常=0),每個樣品的預測值m取值范圍并非為[0,1],有可能超出這一范圍,這時無論預測是否準確,都會增加預測殘差。例如,一個樣品的原始標簽是1,PLS-DA模型的預測值為2,雖然預測非常準確,但是同樣會增加預測殘差值使Q2減小。為此,Westerhuis等提出使用DQ2統計量解決這種不合理的現象[8]。

DQ2是對Q2的改進,即當預測值在原始標簽的同方向范圍以外,則將該樣品對殘差的貢獻視作0,具體定義為

這樣,當原始標簽為1而PLS-DA模型預測值為2時,該次預測對PRESSD的貢獻為0,DQ2值不會因為正確的預測而受到懲罰。由此可見,DQ2更加符合真實預測情況。

模擬實驗

實驗目的:在接近真實代謝組數據結構和樣本量時,比較四種診斷統計量在不同總體參數設置條件下的估計值及標準差,并考核其置換檢驗的效能。

模擬方法:模擬產生樣本量為45的A、B兩組數據,變量個數為8,其中A組中各變量服從N(0,1)的正態分布,B組中各變量服從N(μd,1)的正態分布,任意兩變量間的相關系數設為ρ=0.5。為了保持代謝組學的實際數據結構,取90例正常人血漿樣本得到代謝組學數據Z=(Z1,Z2,…,Z535),并將其隨機等分為兩組(n1=n2=45),與上面模擬產生的A、B兩組差異變量數據合并(圖1)。為了模擬病例組數據和對照組數據之間不同程度的差異,每次產生A、B兩組數據時分別按照μd=0,0.2,0.4,0.6,…2.0進行設置,合計共產生11次不同差異的模擬數據。

按照上述方法,根據不同的μd取值每種情況模擬1000次,擬合PLS-DA模型,并使用7折雙重交叉驗證,計算四種診斷統計量的均數及標準差。四種統計量的假設檢驗采用置換檢驗方法,原假設H0的統計量分布通過模擬數據和真實數據不斷打亂標簽形成。

圖1 模擬實驗數據結構示意圖

模擬結果:隨著類別間差異的增大,整體上模型分類效果變好。從表1看出:①當8個差異變量的均值相差為1.0時,AUC值已達0.7128,但Q2和DQ2此時分別為0.0206和0.0362;②在差別較小時(μd<1),Q2和DQ2為負值;③當AUC值較大(如大于0.85)時,Q2和DQ2亦顯示出較高的判別效果。

圖2給出了檢驗效能結果。結果顯示,當一類錯誤α控制在0.05時,并且在組間差異較小的情況下(μd<1.4),AUC的檢驗效能最高,其次為誤判數(率),DQ2和Q2的檢驗效能最低。另外,當一類錯誤α控制在0.01時,AUC在組間具有一定差異情況下(如μd<1.6)的檢驗效能顯著高于另外三個統計量,而誤判數(率)則與Q2和DQ2相當。當兩組間的差異足夠大時(如μd=1.6),AUC、誤判數、Q2和DQ2的檢驗效能在兩種情況下均趨近于1。綜上所述,AUC與誤判數、Q2、DQ2相比較,能夠發現微小的組間差異,具有更高的檢驗效能。

表1 模擬1000次不同組間差異時PLS-DA模型的分類效果(均數±標準差)

圖2 四種PLS-DA診斷統計量在兩種不同檢驗水準時檢驗效能比較

實例驗證

2009年9月至2010年5月期間在哈醫大附屬腫瘤醫院收集了50例卵巢癌患者血漿樣本、50例卵巢良性腫瘤血漿樣本,經過UPLC-MS-Q-TOF儀器檢測分析和預處理后得到535個變量。

對卵巢癌和卵巢良性腫瘤代謝組學數據進行2000次7折PLS-DA雙重交叉驗證,然后計算四種診斷統計量的各種統計描述指標如均數、標準差等,結果見表2。由表2可見,AUC的均值達到0.8564,Q2和DQ2值都在0.32以上,說明卵巢癌患者與卵巢良性腫瘤患者的血漿代謝輪廓存在較大差異。根據上面的模擬實驗可知,當AUC=0.8223(μd=1.4)時,按照α=0.05檢驗水準,四種診斷統計量的檢驗效能將均接近1。該實例通過置換檢驗給出四種診斷統計量的P值,經過2000次置換檢驗,四種統計量的絕大多數P值小于0.0005,其中AUC統計量均有P<0.0005,另外三種統計量均有P<0.05,說明卵巢癌患者與卵巢良性腫瘤患者的血漿代謝輪廓之間的差異是具有統計學意義的。

為了進一步對四種診斷統計量的穩定性能進行比較,計算2000次7折PLS-DA雙重交叉驗證后所得四種診斷統計量的變異系數。從圖3可以看出,AUC的變異系數明顯小于其余三種診斷統計量,說明AUC比其余三個診斷統計量更為穩定。為了更加全面客觀地考察四種診斷統計量的變異性,我們基于前20個主成分數依次進行2000次7折PLS-DA簡單交叉驗證,并計算相應的四種診斷統計量的變異系數(圖4)。結果顯示,AUC的變異系數均最小,誤判數的變異系數略高,而Q2和DQ2在利用前面幾個主成分建模時其變異性尚可,而當主成分數大于10時,其變異系數明顯增大,Q2的穩定性最差。綜上所述,AUC在四個診斷統計量中最為穩定,其他依次為誤判數、DQ2和Q2。

表2 2000次雙重交叉驗證中四種診斷統計量分布的統計描述指標

圖3 2000次雙重交叉驗證中四種診斷統計量的變異系數

圖4 2000次簡單交叉驗證中四種診斷統計量的變異系數

討 論

AUC、誤判數、Q2和DQ2是PLS-DA模型在代謝組學應用中最常用的四種診斷統計量,但如何選用存在一定爭議。這四種診斷統計量的特點是,既可以用來衡量兩組的分類效果,同時可以通過置換檢驗的方法做假設檢驗。另一重要問題,目前計算這些統計量采用的是簡單交叉驗證方法,通常由主觀確定主成分數,容易出現過擬合現象,因此本文推薦使用雙重交叉驗證方法,即主成分數通過內嵌在建模數據中的驗證數據確定,可以使檢驗結果更加可信。代謝組學研究中,生物樣品之間的變異性較大,而各種生物狀態之間的差異和相互關系復雜,尋找一種檢驗效能高而又穩定的診斷統計量具有重要的現實意義。本文通過模擬實驗和實例驗證的方法對四種診斷統計量在PLS-DA模型驗證過程中的檢驗效能和穩定性進行了研究和比較。結果顯示,在檢驗效能方面,AUC比誤判數、Q2和DQ2更容易發現較小的差異,這與Westerhuis等近期的研究結論是一致的[4]。此外,AUC統計量比其他三個診斷統計量具有更高的穩定性。綜上所述,AUC是PLS-DA模型驗證過程中一種穩定有效的診斷統計量,可作為代謝組學研究中進行PLS-DA分析時的首選診斷統計量。本研究中的雙重交叉驗證計算程序用R語言編寫。

1.Bryan K,Brennan L,Cunningham P.MetaFIND:a feature analysis tool formetabolomics data.BMC Bioinformatics,2008,9(1):470-482.

2.Zhang T,Wu XY,Ke CF,etal.Identification of Potential Biomarkers for Ovarian Cancer by Urinary Metabolomic Profiling.J Proteome Res,2013,12(1):505-516.

3.蔣紅衛,夏結來,李園,等.偏最小二乘判別分析在基因微陣列分型中的應用.中國衛生統計,2007,24(4):372-374.

4.Szymanska E,Saccenti E,Smilde AK,et al.Double-check:validation of diagnostic statistics for PLS-DA models in metabolomics studies.Metabolomics,2012,8(Suppl1):3-16.

5.Westerhuis JA,Hoefsloot HCJ,Smit S,etal.Assessmentof PLSDA cross validation.Metabolomics,2008,4(1):81-89.

6.李康,林一帆.評價判別模型診斷效果的AUC分析.中國衛生統計,1996,13(3):9-12.

7.Cruciani G,Baroni M,Clementi S,et al.Predictive ability of regression models.Part I:Standard-deviation of prediction errors(SDEP).Journal of Chemometrics,1992,6(6):335-346.

8.Westerhuis JA,van Velzen EJJ,Hoefsloot HCJ,et al.Discrim inant Q2(DQ2)for improved discrim ination in PLSDA models.Metabolom ics,2008,4(4):293-296.

(責任編輯:郭海強)

A Com parative Analysis of Four PLS-DA Diagnostic Statistics in the Application of M etabolom ics

Ke Chaofu,Wu Xiaoyan,Li Kang(DepartmentofBiostatistics,HarbinMedicalUniversity(150086),Harbin)

ObjectiveTo compare the statistical power and stability of four PLS-DA diagnostic statistics in the analysis ofmetabolomic data.MethodsThe simulated data and realistic data were analyzed based on the PLS-DA validation strategy of double cross validation and permutation test in conjunction w ith four diagnostic statistics.ResultsAUC showed higher statistical power than misclassification number(rate),Q2andDQ2;in themeanwhile,AUC wasmore stable than the other diagnostic statistics.ConclusionAUC is a stable and effective diagnostic statistic in the validation of PLS-DA models,and is recommended as the preferred diagnostic statistic in the PLS-DA analysis ofmetabolomic studies.

PLS-DA;Metabolom ics;Diagnostic statistic;Double cross validation;Permutation test

*國家支撐項目資助(2011BAI09B02);國家自然科學基金(81172767)

Δ通信作者:李康,likang@ems.hrbmu.edu.cn

猜你喜歡
差異模型
一半模型
相似與差異
音樂探索(2022年2期)2022-05-30 21:01:37
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
找句子差異
DL/T 868—2014與NB/T 47014—2011主要差異比較與分析
生物為什么會有差異?
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
M1型、M2型巨噬細胞及腫瘤相關巨噬細胞中miR-146a表達的差異
主站蜘蛛池模板: 成人免费网站久久久| 免费jizz在线播放| 秋霞一区二区三区| 亚洲一区二区三区麻豆| 亚洲毛片一级带毛片基地| 天天摸天天操免费播放小视频| 久久精品一品道久久精品| 99re66精品视频在线观看| 91精品啪在线观看国产60岁| 成人免费黄色小视频| 国产成人精品一区二区不卡| 99久久国产自偷自偷免费一区| 久久这里只精品国产99热8| 国产综合在线观看视频| 免费jjzz在在线播放国产| 亚洲免费黄色网| 国产午夜人做人免费视频中文| 3344在线观看无码| 久久国产亚洲欧美日韩精品| 5555国产在线观看| 精品乱码久久久久久久| 亚洲精品不卡午夜精品| 亚洲区视频在线观看| 大香伊人久久| 色国产视频| 99精品在线视频观看| 亚洲精品片911| 国产在线自在拍91精品黑人| 亚洲综合国产一区二区三区| 亚洲av无码牛牛影视在线二区| 啪啪国产视频| a网站在线观看| 亚洲日本中文综合在线| 国产特级毛片| 久久永久精品免费视频| 日韩国产高清无码| 成人福利在线免费观看| 欧美成人日韩| 成人亚洲国产| 国产自无码视频在线观看| 国产91丝袜| 日韩大片免费观看视频播放| 九九久久精品免费观看| 无码国产伊人| 国产一区亚洲一区| 青青青草国产| 97影院午夜在线观看视频| 69视频国产| 视频二区中文无码| 久久a级片| 福利在线一区| 中国一级毛片免费观看| 91免费观看视频| 国产人前露出系列视频| 手机在线看片不卡中文字幕| 国产香蕉国产精品偷在线观看| 55夜色66夜色国产精品视频| 婷婷亚洲天堂| 成人日韩视频| 国产肉感大码AV无码| 最新精品国偷自产在线| 狠狠干综合| 欧美影院久久| 久久精品日日躁夜夜躁欧美| 亚洲欧美一级一级a| 黑人巨大精品欧美一区二区区| 99视频在线精品免费观看6| 亚洲国产综合精品一区| 欧美成人影院亚洲综合图| 亚洲成人网在线播放| 国产色婷婷| 欧美日韩中文国产| 国产剧情一区二区| 五月丁香在线视频| 国产美女视频黄a视频全免费网站| 国产综合另类小说色区色噜噜| 亚洲妓女综合网995久久| 任我操在线视频| 欧美人在线一区二区三区| 成人在线观看一区| 亚洲第一区欧美国产综合| 婷婷中文在线|