999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

代謝組學中核磁共振技術的數(shù)據(jù)分析方法

2014-01-27 10:59:15孫雨航許楚楚李昌盛
中國獸醫(yī)雜志 2014年12期
關鍵詞:模式識別差異模型

孫雨航,許楚楚,徐 闖,李昌盛,吳 凌,夏 成

(黑龍江八一農墾大學動物科技學院,黑龍江 大慶163319)

近年來,隨著科學技術的不斷創(chuàng)新,各種組學(Omics)技術應運而生。1999年Nicholson首次給出了代謝組學(Metabolomics)的完整定義,是研究在內、外因素作用下,生物體所含內源性小分子代謝物(相對分子質量小于1 000)在種類和數(shù)量上的動態(tài)變化規(guī)律以及生理、病理變化的一門技術[1]。代謝組學主要包括3個檢測平臺,分別為氣相色譜質譜聯(lián)用,液相色譜質譜聯(lián)用和核磁共振技術(nuclearmagnetic resonance,NMR)。其中,NMR已被廣泛應用于生命科學的各個領域。

1 NMR數(shù)據(jù)預處理

從生物學角度來說,生物種類繁多,內源性代謝物濃度差異很大,濃度高的代謝物不一定比濃度低的代謝物更重要,而某些濃度非常低的代謝物在某些生理過程中恰恰不容忽視[2],所以為了保證所有的化合物在無偏性NMR檢測后能夠得到公平的分析,就需要對圖譜數(shù)據(jù)進行標準化,主要包括歸一化、中心化和尺度方差規(guī)模化。

目前常規(guī)使用的數(shù)據(jù)預處理軟件是Topspin(Bruker GmBH,Karlsruhe,Germany)和MestReNova(Mestrelab Research,Santiago de Compostela,Spain)。在Topspin軟件中,所有原始譜圖自動進行分段積分,手動調零、校正基線和相位;在MestReNova軟件中,原始譜圖被保存為包含所有代謝物化學位移的“txt”文本,用于后續(xù)統(tǒng)計分析。

2 多變量模式識別軟件

為了從大量的NMR數(shù)據(jù)中得到有價值的代謝物,需要運用降維思想,借助多變量模式識別[3]。目前,常用的模式識別軟件通常是昂貴的商用軟件或者內部教學軟件,主要包括SMICA(Umetrics,Ume?,Sweden)和R語言(www.R-project.org),前者最為常見,操作簡便且智能化,但是分析模式較少;后者指令復雜,需要專業(yè)人員操做,但是模式識別種類較多。最近,研究學者又提出了一種新的核磁數(shù)據(jù)處理軟件MVAPACK,它可以完成數(shù)據(jù)預處理、模式識別和模型驗證的整個過程,并已通過實踐檢驗,相信不久的將來許多研究學者可以通過應用免費軟件親自進行數(shù)據(jù)分析。

3 主成分分析(Principal component analysis,PCA)

PCA類似于聚類分析,是一種無師監(jiān)督分析方法。從數(shù)學角度來說,PCA是一種高緯數(shù)據(jù)降緯的方法,就是將分散在一組變量的信息集中到某幾個綜合指標(主要成分)上[3],從而利用主要成分提取數(shù)據(jù)集的特征,形成一個二維或三維的得分圖[4]。從生物學角度來說,PCA就是在不分組的情況下,從整體上來描述樣品的離散趨勢[5]。

在PCA得分圖中,通常以前兩個主成分(PC1、PC2)為參數(shù)構建模型,主成分后的數(shù)值代表此成分對于模型分組的貢獻率,數(shù)值越大表示其對分組的主導作用越大。通常,所有的樣品都將呈現(xiàn)在一個95%的置信區(qū)間中,區(qū)間以外的樣品被視為異常值。需要注意的是,對于異常值的處理,需要進行異常值檢測[6],建立離群模型[7],綜合考慮分析結果及其生物學意義,再決定是否剔除。因此,當樣品組間差異較大,組內差異較小時,PCA可以很好地區(qū)分不同組樣品。但是,當組間差異較小,組內差異較大(組內差異變量甚至大于樣本含量)時,樣本含量較大的一組將會主導模型,無法呈現(xiàn)組間差異,需要進行有師監(jiān)督的模式識別來凸顯組間差異。

4 偏最小二乘法判別分析(Partial least squares discrim inant ana lysis,PLS-DA)

PLS-DA是一種有師監(jiān)督分析方法(可以通過多次練習達到最佳效果),通過利用已知樣品分組信息對多變量數(shù)據(jù)進行歸類、識別和預測[8]。從模型構建上來說,PLS-DA是對PCA模型的延伸,在PCA模型不分組的基礎上利用虛擬變量分組,人為地將組別定義為Y變量,從而凸顯組間差異。

此外,PLS-DA模型還是一種線性分析法,其優(yōu)勢就在于其可以結合載荷圖篩選出代謝物差異[9],鑒別生物標記物[10]。PLS-DA模型也存在自身局限性,因為多變量和偏差系數(shù)的存在可能使其忽視真正的相關變量[11]。

5 正交的偏最小二乘法判別分析(Orthogonalpartial least squares discrim inant ana lysis,OPLS-DA)

OPLS-DA的構建就是為了對PLS-DA進行修正,通過移除與Y變量(分組)無關的X變量從而最大化組間差異,也可以將其看做一個純粹的數(shù)據(jù)預處理過程,或者是一個具有正交變量優(yōu)勢的簡單PLS-DA模型[11]。

與PLS-DA模型相同,在OPLS-DA模型中,參數(shù)R2表示模型的解釋率,Q2表示模型的預測率,R2和Q2的比值越接近于1表示模型越可靠。

OPLS-DA模型驗證包括:內部驗證,7倍交差驗證和1 000次(200次)排列驗證;外部驗證:應用受試者工作特征(ReceiverOperating Characteristic,ROC)曲線確定生物標記物的準確性、敏感性和特異性[12]。

對于篩選生物標記物,則需要結合載荷圖、S圖、皮爾遜相關系數(shù),單因素方差分析和學生t檢驗的P值等,來確定差異代謝物,然后進行代謝物通路分析,最終完成生物標記物的鑒定。條件允許的情況下,還可以進行生物標記物的相關性分析,甚至計算臨界值[13]。

6 OSC-PLS-DA

OSC被認為是一種基于PLS模型的數(shù)據(jù)過濾處理技術,能夠移除與Y響應矩陣不相關的X矩陣,從而使基于相關性X矩陣的PLS模型能夠更加專一地分析有意義變量。有報道指出,OSC-PLS-DA就是在PLS-DA[14]或OPLS-DA[15]基礎上結合正交信號修正過濾器所建立的分析模型,并且OSC還可以對PCA模型[16]或NMR光譜[17]進行優(yōu)化。在OSC-PLS-DA模型中,OSC可以等于0,1,2,3···,直到PLS-DA模型最佳為止,通過一次次去掉與模型分組無關的潛在變量,達到最大化組間差異的目的。

7 結論

核磁數(shù)據(jù)預處理是保證所有數(shù)據(jù)能夠被公平地進行多變量模式識別的基礎;PCA是首要的,是對所有變量的無偏性呈現(xiàn),能夠使人們從整體上把握樣品水平;而其他3種方法是平行的,互相之間有比較也有優(yōu)化,都能夠直接應用于篩選生物標記物。在應用時需要根據(jù)樣品組成選擇合適的模式識別,使之既不過于復雜又能獲得理想效果。

[1]Nicholson J K,Lindon J C,Holmes E.'Metabonomics':understanding themetabolic responses of living systems to pathophysiological stimuli via multivariate statistical analysis of biological NMR spectroscopic data[J].Xenobiotica,1999,29:1181-1189.

[2] 王敏,黃寅,張偉,等.代謝組學信息獲取與數(shù)據(jù)預處理瓶頸問題探討[J].藥學進展,2014,38(2):81-88.

[3] O'Connell TM.Recent advances in metabolomics in oncology[J].Bioanalysis,2012,4:431-451.

[4] Solanky K S,Bailey N J,Beckwith-Hall B M,et al.Application of biofluid<sup>1</sup>H nuclear magnetic resonance-based metabonomic techniques for the analysis of the biochemical effects of dietary isoflavones on human plasma profile[J].Analytical biochemistry,2003,323:197-204.

[5] Sun Y,Lian Z,Jiang C,et al.Beneficial Metabolic Effectsof 2′,3′,5′-tri-acetyl-N6-(3-Hydroxylaniline)Adenosine in the Liver and Plasma of Hyperlipidemic Hamsters[J].PloSone,2012,7:e32115.

[6] Rousseeuw P J,Hubert M.Robust statistics for outlier detection[J].Wiley Interdisciplinary Reviews:Data Mining and Knowledge Discovery,2011,1:73-79.

[7]Hubert M,Rousseeuw P J,Vanden Branden K.ROBPCA:a new approach to robustprincipal componentanalysis[J].Technometrics,2005,47:64-79.

[8] Worley B,Halouska S,Powers R.Utilities for quantifying separation in PCA/PLS-DA scores plots[J].Analytical biochemistry,2013,433:102-104.

[9]Li M,Wang J,Lu Z,et al.NMR-based metabolomics approach to study the toxicity of lambda-cyhalothrin to goldfish(<i>Carassius auratus</i>)[J].Aquatic Toxicology,2014,146:82-92.

[10]Madsen R,Lundstedt T,Trygg J.Chemometrics in metabolomicsa review in human disease diagnosis[J].Analytica Chimica Acta,2010,659:23-33.

[11]Sadeghi-Bazargani H,Bangdiwala S I,Mohammad K,et al.Compared application of the new OPLS-DA statistical model versus partial least squares regression to manage large numbers of variables in an injury case-control study[J].Sci Res Essays,2011,6:4369-4377.

[12]Banday K M,Pasikanti K K,Chan E C Y,et al.Use of urine volatile organic compounds to discriminate tuberculosis patients from healthy subjects[J].Analytical chemistry,2011,83:5526-5534.

[13]Zhang A,Sun H,Han Y,etal.Exploratory urinarymetabolic biomarkers and pathways using UPLC-Q-TOF-HDMS coupled with pattern recognition approach[J].Analyst,2012,137:4200-4208.

[14]Lodi A,Tiziani S,Khanim F L,et al.Proton NMR-basedmetabolite analyses of archived serial paired serum and urine samples from myeloma patients at different stages of disease activity identifies acetylcarnitine as a novel marker of active disease[J].PloS one,2013,8:e56422.

[15]Davis V W,Schiller D E,Eurich D,et al.Urinary metabolomic signature of esophageal cancer and Barrett′s esophagus[J].World JSurg Oncol,2012,10:271-283.

[16]Gavaghan C,Wilson I,Nicholson J.Physiological variation in metabolic phenotyping and functional genomic studies:use of orthogonal signal correction and PLS-DA[J].FEBS letters,2002,530:191-196.

[17]Shariff M I,Ladep N G,Cox IJ,et al.Characterization of urinary biomarkers of hepatocellular carcinoma usingmagnetic resonance spectroscopy in a Nigerian population[J].Journal of proteome research,2010,9:1096-1103.

猜你喜歡
模式識別差異模型
一半模型
相似與差異
音樂探索(2022年2期)2022-05-30 21:01:37
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
找句子差異
生物為什么會有差異?
淺談模式識別在圖像識別中的應用
電子測試(2017年23期)2017-04-04 05:06:50
第四屆亞洲模式識別會議
3D打印中的模型分割與打包
M1型、M2型巨噬細胞及腫瘤相關巨噬細胞中miR-146a表達的差異
主站蜘蛛池模板: 国产在线小视频| 国产在线视频福利资源站| 日韩精品成人在线| 亚洲国产欧美目韩成人综合| 蜜芽国产尤物av尤物在线看| 毛片久久久| 国产在线一区视频| 欧美日韩91| 欧美日韩精品一区二区在线线 | 亚洲国产中文精品va在线播放| 在线va视频| 亚洲无线国产观看| 免费网站成人亚洲| 欧美成人区| 国产本道久久一区二区三区| 国产精品高清国产三级囯产AV| 国产一级裸网站| 日本人妻一区二区三区不卡影院 | 久久综合丝袜长腿丝袜| 亚洲日韩第九十九页| 久久午夜夜伦鲁鲁片不卡 | 国产主播一区二区三区| 亚洲精品天堂自在久久77| yy6080理论大片一级久久| 亚洲欧美日本国产综合在线 | 亚洲a级在线观看| 日本黄色a视频| 久久久久久久蜜桃| 在线国产91| 亚洲国产中文精品va在线播放| 亚洲AV无码久久精品色欲| 亚洲Va中文字幕久久一区| 四虎国产精品永久一区| 国产91导航| 亚洲国产精品一区二区高清无码久久 | 国产麻豆91网在线看| 欧美翘臀一区二区三区| 日韩午夜伦| 97se亚洲| 毛片在线看网站| 亚洲欧美成人影院| 免费中文字幕在在线不卡 | 网友自拍视频精品区| 人妻无码中文字幕一区二区三区| 国产精品福利在线观看无码卡| 精品久久综合1区2区3区激情| 国产精品人莉莉成在线播放| 亚洲欧美自拍一区| 国产精品亚洲一区二区三区在线观看 | 97人人模人人爽人人喊小说| 欧美亚洲国产日韩电影在线| 亚洲成人黄色在线观看| 亚洲最大福利网站| 久久夜色撩人精品国产| 日本欧美中文字幕精品亚洲| 亚洲国产中文精品va在线播放| 亚洲欧洲日本在线| 啪啪啪亚洲无码| 中文字幕欧美成人免费| 国产在线精品人成导航| 国产特级毛片aaaaaa| 亚洲天堂久久新| 国产在线观看精品| 99精品国产高清一区二区| 欧美日韩国产高清一区二区三区| 国产中文在线亚洲精品官网| 欧美另类精品一区二区三区| 亚洲精品人成网线在线| 最新无码专区超级碰碰碰| 久久黄色视频影| 久久亚洲国产视频| 久久国产高潮流白浆免费观看| 亚洲欧美成人影院| 片在线无码观看| 日韩欧美91| 免费日韩在线视频| 国产凹凸视频在线观看| 午夜老司机永久免费看片| 2022精品国偷自产免费观看| 久久人妻xunleige无码| www.精品国产| 欧美a级在线|