999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

關于GSEA在全基因組表達譜芯片數據分析中的應用探討

2020-05-08 09:31:35方燕鄭曉雪
健康之家 2020年13期
關鍵詞:數據分析

方燕 鄭曉雪

【摘要】近年來,對多組學層進行綜合分析的要求日益突出,從而產生了一些多組學富集工具。每種方法在通用性方面都有缺點和局限性。在此,基于GSEA程序包以幫助在多個組學層上計算基于基因集富集分析的組合途徑富集,該軟件包查詢8個不同的路徑數據庫,并依賴基因集富集分析算法進行單組學富集分析。最后,將這些分數相結合,以創建可靠的復合多組學途徑富集措施。

【關鍵詞】基因集富集分析;數據分析;全基因組表達譜芯片

1基因集富集分析(GSEA)的相關概述

某種治療的分子反應或深入了解臨床表型時,基因集或途徑富集技術是從高維分子組學數據推斷機械生物學信息的首選工具。通過不同的統計技術,如過度代表性分析(ORA)或GSEA,能夠識別特定的基因集或特定治療或疾病引發的分子反應/信號途徑。這些集合可能代表特定的分子功能,如基因本體論(GO)、生物學過程或實驗衍生的基因集所定義。這些基因集可在數據庫或分子特征數據庫(MSigDB)中公開。目前,已經開發了100種算法來豐富基因集分析,每一個都有自身的優點和缺點。原則上,這些方法可以分為兩類:一是純基因集富集,其中算法只關注一個簡單的特征列表;二是基于拓撲的富集,其中算法包括來自路徑或網絡數據庫的附加信息,例如,哪些基因或蛋白質是直接連接以及它們是如何連接的相互影響。在其最新版本中,GSEA適用于11種不同生物體(包括人、小鼠或大鼠)的轉錄組、蛋白質組和代謝組數據的組合[1]。

2工作流—收集路徑定義、特征提取和映射

在過去的幾十年里,已經建立了幾個路徑數據庫。其中一些是同行評審和人工策劃的,另一些則遵循基于社區的方法來開發和確定路徑。然而,這些數據庫通常包含自己的格式,提供了路徑定義,這使得一個分析工作流中包含多個數據庫變得很麻煩。“graphite”和“R”軟件包旨在彌合這一差距,因為其能夠從8個公開可用的數據庫中提供路徑定義——數量為2。這些數據庫中目前可用的人類路徑定義列于括號中:KEGG(311)、Biocarta(247)、Reactome(2208)、NCI/自然路徑交互數據庫(212)、HumanCyc(48682)、Panther、smpdb(48668)和PharmGKB(66)。在GSEA工作流程的第一步中,應用Graphite軟件包從多達8個公眾中檢索路徑定義數據庫。在數據庫中,路徑特征(節點)用不同的ID編碼格式。例如,KEGG數據庫使用Entrez基因ID作為轉錄物和蛋白質,而KEGG化合物則使用IDs用于代謝產物。相反,Reactome數據庫通過Uniprot標識符存儲轉錄和蛋白質,而ChEBI ID則用于代謝產物。進一步的代謝物ID格式是CAS編號和Pubchem ID。為了解決這個問題,特別是在一次分析中使用多個路徑數據庫時,為所有三個支持的omics層實現了一個ID映射。為了提高可用性,將這個全面的代謝物映射數據集封裝在一個獨立的AnnotationHub包中,稱為代謝物idmapping(Canzler,2020)。在其當前版本中,該軟件包包含超過110萬種化合物,并從四個不同的數據庫中收集和集成:Comptox儀表盤12、HMDB3和ChEBI4。

3基因集富集分析的應用

測定的的組學數據是計算基因集富集分數所必需的,為上一步從外部數據庫中提取特定路徑特征中定義的每個omics層加載這些數據。在計算富集分數之前,必須進行差異表達分析,以便所有的組學特征都具有相關的倍數變化和P值。預處理步驟必須在外部完成,不屬于多個SEA的一部分包裝[2]。第二步,GSEA通過在每個omics層上分別應用fgsea Rpackage來計算富集分數。最初形式的GSEA算法首次被描述為闡明2型糖尿病的機理基礎,更新和最常用的版本是由Subramanian等人提出的。測量的組學特征用于差異表達測試,以得出褶皺變化和相關P值。這兩個值都用于計算所謂的局部統計,即基于折疊變化方向和對數轉換P值的排序基因列表。在接下來的步驟中,GSEA算法測試基因集是聚集在這些有序基因載體的頂部還是底部。這里使用的fgsea版本是一個高效但精確的實現了突出的GSEA算法。它的性能是通過實施累積的GSEA統計計算來實現的,允許在不同基因集大小之間重用樣本。在多GSEA工作流程的第二部分之后,每個下載的路徑都被分配了基于SEA的富集分數、P值和調整后的P值分開。

參考文獻:

[1]劉虎,吳思浛,包楚陽,等.基因集富集分析探討HER2基因對胃癌代謝的影響[J].安徽醫科大學學報,2020,5(9):1339-1342.

[2]廖存,廖錫文,韋瑞麗,等.基于全基因組RNA測序數據和基因集富集分析方法對直腸癌發病機制的初步探討[J].結直腸肛門外科,2019,25(4):422-426.

猜你喜歡
數據分析
電子物證檢驗的數據分析與信息應用研究
基于matlab曲線擬合的數據預測分析
商情(2016年40期)2016-11-28 11:28:07
分眾媒體趨勢下場景營銷的商業前景
商(2016年32期)2016-11-24 17:39:41
佛山某給水管線控制測量探討
科技資訊(2016年18期)2016-11-15 18:05:53
SPSS在環境地球化學中的應用
考試周刊(2016年84期)2016-11-11 23:57:34
大數據時代高校數據管理的思考
科技視界(2016年18期)2016-11-03 22:51:40
我校如何利用體育大課間活動解決男生引體向上這個薄弱環節
體育時空(2016年8期)2016-10-25 18:02:39
Excel電子表格在財務日常工作中的應用
淺析大數據時代背景下的市場營銷策略
新常態下集團公司內部審計工作研究
中國市場(2016年36期)2016-10-19 04:31:23
主站蜘蛛池模板: 伊人久综合| 大香伊人久久| 国产欧美日韩综合在线第一| 精品偷拍一区二区| 女人毛片a级大学毛片免费| 亚洲自拍另类| 国产又粗又爽视频| 亚洲欧美日本国产综合在线| 老司机久久精品视频| 97视频免费看| 免费无码AV片在线观看国产| 一级成人a毛片免费播放| 国产麻豆永久视频| 67194亚洲无码| 成年午夜精品久久精品| 九九热在线视频| 一级成人a毛片免费播放| 亚洲成人黄色在线观看| 在线日本国产成人免费的| 69视频国产| 九九视频在线免费观看| 国产手机在线观看| lhav亚洲精品| av尤物免费在线观看| 日本中文字幕久久网站| 国产原创自拍不卡第一页| 国产综合色在线视频播放线视| 亚洲精品动漫| 综合色在线| 中文字幕佐山爱一区二区免费| 亚洲va视频| 亚洲第一视频网| 亚洲综合久久成人AV| 美女无遮挡被啪啪到高潮免费| 亚洲成av人无码综合在线观看| 高清码无在线看| 女人av社区男人的天堂| 亚洲国产欧洲精品路线久久| 天天色综网| 久久先锋资源| 久久人人爽人人爽人人片aV东京热| 免费人成视频在线观看网站| 中文无码精品A∨在线观看不卡| 成人国产小视频| 亚洲国产成人精品一二区| 国产精品福利在线观看无码卡| 黄色网页在线播放| 亚洲视频免费播放| 日韩欧美中文在线| 制服丝袜 91视频| 久久91精品牛牛| 伊人色婷婷| 中国一级特黄视频| 日韩在线播放欧美字幕| 亚洲 日韩 激情 无码 中出| 欧美国产日韩另类| 国产小视频a在线观看| 亚洲国产天堂在线观看| 欧美性猛交一区二区三区| 国产激情在线视频| 99热国产在线精品99| 久久久久国产一区二区| 精品国产成人国产在线| 国产男女免费完整版视频| 青草视频网站在线观看| 97se亚洲综合在线| 国产在线98福利播放视频免费| 国产免费黄| 黄色网站在线观看无码| 97视频在线观看免费视频| 四虎AV麻豆| 亚洲日本www| 亚洲第一成年网| 色婷婷综合激情视频免费看| 国产成人盗摄精品| 国产一二视频| 亚洲91在线精品| 亚洲动漫h| 亚洲成人高清无码| 欧美日韩午夜| 在线观看亚洲精品福利片| 99视频全部免费|