999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析篩選結(jié)腸腺癌預(yù)后關(guān)鍵基因

2022-02-07 14:18:36李卓陽張皓旻劉格良陳浩然陳熙勐盧學(xué)春賀培鳳
關(guān)鍵詞:數(shù)據(jù)庫分析

李卓陽, 張皓旻, 劉格良, 陳浩然, 智 鵬, 陳熙勐, 盧學(xué)春, 賀培鳳

1.山西醫(yī)科大學(xué)管理學(xué)院,山西 太原 030001;2.中國人民解放軍總醫(yī)院第二醫(yī)學(xué)中心血液科 國家老年疾病臨床醫(yī)學(xué)研究中心

結(jié)腸癌是最常見的惡性腫瘤之一,是我國惡性腫瘤死亡的第4常見原因[1]。結(jié)腸腺癌(colon adenocarcinoma,COAD)是發(fā)生于腺上皮細(xì)胞的惡性腫瘤,是結(jié)腸癌最主要的病理類型之一,目前的治療手段包括外科手術(shù)切除、化學(xué)療法、免疫療法等。由于復(fù)發(fā)等因素,術(shù)后患者的5年生存率僅為60%~70%[1-3],提高患者的生存優(yōu)勢仍是一個挑戰(zhàn)。

全轉(zhuǎn)錄組測序(RNA-seq)可同時檢測全部已知基因的表達(dá)模式,通過差異表達(dá)基因分析,可鑒定腫瘤與正常組織之間的差異表達(dá)基因[4]。近年來,研究者基于癌癥基因圖譜(The Cancer Genome Atlas,TCGA)、基因表達(dá)綜合(Gene Expression Omnibus,GEO)等開源數(shù)據(jù)庫開展的生物信息分析發(fā)現(xiàn),COAD的發(fā)生與大量基因的顯著變化有關(guān)。同時,基因間調(diào)控機(jī)制復(fù)雜,且其發(fā)展涉及多種信號通路異常[5-7]。目前,結(jié)腸癌已有預(yù)測預(yù)后基因的篩選研究,但未見基于基因表達(dá)與臨床表型關(guān)系篩選預(yù)后基因的相關(guān)研究。加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析(weighted gene co-expression network analysis,WGCNA)是一種根據(jù)表達(dá)譜數(shù)據(jù)探索特定基因模塊與臨床表型間相關(guān)關(guān)系的系統(tǒng)生物學(xué)方法,可用于鑒定候選生物標(biāo)志物、預(yù)后基因及治療靶標(biāo)[8-9]。

本研究應(yīng)用WGCNA方法,對來自TCGA和GEO數(shù)據(jù)庫的COAD RNA-seq數(shù)據(jù),構(gòu)建COAD的差異基因共表達(dá)網(wǎng)絡(luò),篩選與COAD發(fā)生發(fā)展密切相關(guān)的基因模塊,隨后結(jié)合Kaplan-Meier方法鑒定COAD預(yù)后基因,為COAD預(yù)后相關(guān)基因的進(jìn)一步基礎(chǔ)及臨床研究提供方向和指導(dǎo)。

1 材料與方法

1.1 數(shù)據(jù)獲取從TCGA數(shù)據(jù)庫[10]中獲取COAD轉(zhuǎn)錄組數(shù)據(jù)和相應(yīng)的臨床信息。其中,轉(zhuǎn)錄組數(shù)據(jù)包括398例COAD樣本和39例正常結(jié)腸組織樣本;臨床信息包括COAD患者的生存狀態(tài)和生存時間。

從GEO數(shù)據(jù)庫[11]中以“colon adenocarcinoma”檢索COAD基因表達(dá)譜數(shù)據(jù)。篩選條件包括:研究物種為人或小鼠;全基因組表達(dá)芯片數(shù)據(jù)或轉(zhuǎn)錄組測序數(shù)據(jù);生物學(xué)樣本組織來源類型一致;有對照組;每組至少3個生物學(xué)重復(fù);實驗設(shè)計思路清晰以及數(shù)據(jù)質(zhì)量良好。最終篩選得到GSE110224數(shù)據(jù)集[12]。該數(shù)據(jù)集包括17例原發(fā)性COAD樣本和17例配對的正常結(jié)腸組織樣本,基于GPL570平臺分析原發(fā)性COAD的整體基因表達(dá)變化。

1.2 差異表達(dá)基因分析采用R語言軟件包limma,分別對來自TCGA和GEO的轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化和差異表達(dá)基因(differentially expressed genes,DEGs)分析,得到兩組DEGs。差異表達(dá)基因的篩選標(biāo)準(zhǔn),TCGA為|logFC|≥1、FDR<0.05;GEO為|logFC|≥1、FDR<0.05。當(dāng)多個探針與一個相同的基因匹配時,則以平均值作為該基因的表達(dá)值。最后采用R語言軟件包ggplot2對DEGs的表達(dá)模式進(jìn)行可視化。

1.3 加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析采用R語言軟件包WGCNA,分別對來自TCGA和GEO的轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析。填補(bǔ)缺失值后,構(gòu)建鄰接矩陣并轉(zhuǎn)換為拓?fù)渲丿B矩陣。采用動態(tài)剪切法構(gòu)建基因聚類樹狀圖,將表達(dá)相似的基因聚類為不同的基因共表達(dá)模塊,規(guī)定每個模塊最少基因數(shù)目為50。隨后采用Pearson相關(guān)分析計算每個基因與各個模塊、不同臨床特征基因顯著性的相關(guān)系數(shù)r值和P值,獲取腫瘤相關(guān)性最高的模塊及該模塊中的基因。最后采用R語言軟件包VennDiagram,將相關(guān)系數(shù)最高模塊中的基因與TCGA、GEO的DEGs取交集,得到最終的DEGs,用以后續(xù)分析。

1.4 GO富集和KEGG通路富集分析采用R語言軟件包clusterProfiler,對上述DEGs進(jìn)行GO[13-14]富集分析和KEGG通路[15]富集分析。以FDR<0.05、P<0.05為閾值,篩選富集的GO條目和KEGG通路。

1.5 蛋白互作網(wǎng)絡(luò)構(gòu)建及COAD預(yù)后相關(guān)的核心基因篩選采用STRING v11.0開源數(shù)據(jù)庫(https://string-db.org/cgi/input.pl)構(gòu)建蛋白互作(protein-protein interaction,PPI)網(wǎng)絡(luò),以描述DEGs編碼蛋白之間的相互作用關(guān)系。選擇物種為“Homosapiens”,設(shè)置可靠性閾值>0.4,去除游離節(jié)點后下載PPI網(wǎng)絡(luò)數(shù)據(jù)。將數(shù)據(jù)導(dǎo)入Cytoscape軟件對PPI網(wǎng)絡(luò)進(jìn)行可視化,并使用Cytohubba插件中的MMC算法,篩選值最高的10個節(jié)點作為COAD預(yù)后相關(guān)的核心基因。

1.6 生存分析確定COAD預(yù)后相關(guān)的關(guān)鍵基因采用R軟件語言包survival,基于TCGA數(shù)據(jù)庫的COAD基因表達(dá)譜數(shù)據(jù)和臨床信息(患者生存狀態(tài)和生存時間),通過Kaplan-Meier生存分析法,分析與患者總生存期(overall survival, OS)顯著相關(guān)的基因,以初步篩選出與患者預(yù)后不良有關(guān)的基因。隨后采用在線分析工具GEPIA2(http://gepia2.cancer-pku.cn/),分析上述10個核心基因與患者無病生存期(disease-free survival,DFS)之間的關(guān)系。以P<0.05為閾值,篩選同時與OS和DFS有關(guān)的基因,作為COAD預(yù)后相關(guān)的關(guān)鍵基因。

1.7 HPA數(shù)據(jù)庫驗證關(guān)鍵基因的蛋白質(zhì)表達(dá)人類蛋白質(zhì)圖譜(The Human Protein Atlas,HPA)(https://www.proteinatlas.org/)數(shù)據(jù)庫是利用轉(zhuǎn)錄組學(xué)和蛋白質(zhì)組學(xué)技術(shù),從RNA和蛋白水平研究人類不同組織和器官中的蛋白表達(dá)情況。采用HPA數(shù)據(jù)庫,分析關(guān)鍵基因所編碼的蛋白在腫瘤組織和正常組織中的不同表達(dá)之處,進(jìn)一步明確與COAD預(yù)后相關(guān)的關(guān)鍵基因。

2 結(jié)果

2.1 差異表達(dá)基因篩選從TCGA數(shù)據(jù)庫下載COAD數(shù)據(jù)集,經(jīng)分析得到差異表達(dá)基因3 544個,其中上調(diào)基因1 293個,下調(diào)基因2 251個。從GEO數(shù)據(jù)庫下載GSE110224數(shù)據(jù)集,經(jīng)分析得到差異表達(dá)基因515個,其中上調(diào)基因223個,下調(diào)基因292個(見圖1)。

圖1 TCGA和GEO中COAD的DEGs火山圖

2.2 加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析基于加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析,來自TCGA和GEO的所有基因分別被分為20個和18個模塊(見圖2~3)。如圖所示,與腫瘤正相關(guān)性最強(qiáng)的模塊分別是TCGA黃色(r=0.54,P=1e-34)和GEO棕色(r=0.65,P=3e-05),與腫瘤負(fù)相關(guān)性最強(qiáng)的模塊分別是TCGA棕色(r=-0.87,P=1e-135)和GEO青色(r=-0.63,P=7e-05)。分別獲取模塊TCGA黃色和GEO棕色、TCGA棕色和GEO青色的共同基因,將兩組基因合并后再與TCGA和GEO的DEGs取交集,得到最終的153個DEGs,進(jìn)行后續(xù)分析(見圖4)。

注:A:基因聚類樹狀圖;B:基因模塊與腫瘤之間相關(guān)性的熱圖。

注:A:基因聚類樹狀圖;B:特征基因模塊與COAD關(guān)系圖。

圖4 DEGs與WGCNA模塊中基因的韋恩圖

2.3 GO富集和KEGG通路富集分析GO富集從三個方面注釋了基因的生物學(xué)特性:生物學(xué)進(jìn)程(biological process,BP)、細(xì)胞成分(molecular function,CC)和分子功能(molecular function,MF)(見圖5)。其中,BP集中于離子運(yùn)輸、激素代謝等;CC主要與細(xì)胞的頂端部分、頂質(zhì)膜、刷狀緣、微絨毛等細(xì)胞結(jié)構(gòu)有關(guān);MF則主要與離子和分子跨膜轉(zhuǎn)運(yùn)蛋白,以及碳酸鹽脫水酶活性、類固醇脫水酶活性等有關(guān)。

注:橫坐標(biāo)代表富集在各GO條目的基因數(shù)目比率,縱坐標(biāo)代表GO條目名稱。

篩選得到KEGG通路富集有21條(見圖6),發(fā)現(xiàn)這些基因主要參與膽汁分泌、類固醇激素合成、戊糖和葡萄糖醛酸酯相互轉(zhuǎn)化,以及氮、視黃醇、絡(luò)氨酸、丙酮酸等代謝過程。

注:橫坐標(biāo)代表富集在各通路的基因數(shù)目比率,縱坐標(biāo)代表通路名稱。

2.4 PPI網(wǎng)絡(luò)構(gòu)建和COAD預(yù)后相關(guān)核心基因篩選PPI網(wǎng)絡(luò)中共出現(xiàn)153個節(jié)點和385條連線(見圖7A)。根據(jù)Closeness算法,凝聚素Ⅰ復(fù)合物亞基G(non-SMC condensin I complex subunit G,NCAPG)、細(xì)胞分裂周期6(cell division cycle 6 homolog,CDC6)、核受體亞家族1,組H,成員4(nuclear receptor subfamily 1, group H, member 4,NR1H4)、甲狀腺素受體結(jié)合因子13(thyroid hormone receptor interactor 13,TRIP13)、氯離子通道輔助蛋白1(chloride channel, calcium activated, family member 1,CLCA1)、腸促胰高素樣肽1類似物胰高血糖素(glucagon,GCG)、核苷酸還原酶M2肽(ribonucleotide reductase M2 polypeptide,RRM2)、蔗糖酶異麥芽糖酶復(fù)合物(sucrase isomaltase,SI)、周期蛋白B1(Cyclin B1,CCNB1)、叉頭框M1(forkhead box M1,F(xiàn)OXM1)等10個基因為其中的核心基因(見圖7B)。

注:A:153個DEGs的PPI網(wǎng)絡(luò);B:153個DEGs的核心基因。

2.5 關(guān)鍵基因的確定與驗證10個核心基因中,OS分析結(jié)果顯示,CLCA1低表達(dá)患者的OS明顯比高表達(dá)組短(P<0.001,見圖8);DFS分析結(jié)果顯示,TRIP3低表達(dá)、CLCA1低表達(dá)與患者的DFS顯著相關(guān)(P<0.05,見圖9)。選擇CLCA1基因作為關(guān)鍵基因。根據(jù)HPA數(shù)據(jù)庫,與正常結(jié)腸組織相比,腫瘤組織中CLCA1基因的蛋白質(zhì)水平顯著降低(見圖10)。

圖8 OS分析結(jié)果

圖9 10個核心基因的DFS分析結(jié)果

注:A;正常結(jié)腸組織,B;結(jié)腸腺癌組織。

3 討論

本研究通過對TCGA和GEO數(shù)據(jù)庫中的COAD轉(zhuǎn)錄組數(shù)據(jù)進(jìn)行差異表達(dá)基因分析和加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析,發(fā)現(xiàn)COAD主要與患者體內(nèi)的153個基因異常表達(dá)有關(guān)。富集分析發(fā)現(xiàn)這些基因大多與離子運(yùn)輸、激素代謝等生命活動有關(guān)。最后通過蛋白互作網(wǎng)絡(luò)分析和生存分析,發(fā)現(xiàn)CLCA1基因與COAD患者的不良預(yù)后顯著相關(guān)。

細(xì)胞內(nèi)離子通道在所有細(xì)胞中無處不在,研究表明包括K+、Cl-、Ca2+和Na+在內(nèi)的離子通道在胃腸道癌癥中均有表達(dá)和失調(diào),這可能是導(dǎo)致正常細(xì)胞向癌細(xì)胞轉(zhuǎn)化的重要原因[16]。本研究中DEGs主要與無機(jī)和有機(jī)離子通道的激活和抑制等生物學(xué)進(jìn)程有關(guān),提示離子通道的異常表達(dá)或功能障礙對COAD患者體內(nèi)癌細(xì)胞轉(zhuǎn)化、侵襲和轉(zhuǎn)移等過程具有重要作用。Warburg等發(fā)現(xiàn)癌細(xì)胞會比正常細(xì)胞消耗更多的葡萄糖[17]。葡萄糖進(jìn)入細(xì)胞后參與細(xì)胞質(zhì)內(nèi)的糖酵解活動,其終產(chǎn)物丙酮酸經(jīng)過酶促反應(yīng)轉(zhuǎn)化生產(chǎn)乳酸;乳酸可通過多種機(jī)制促進(jìn)腫瘤的血管形成、細(xì)胞遷移和逃避免疫監(jiān)視[18]。本研究中部分DEGs參與丙酮酸代謝活動,這提示癌細(xì)胞可能是通過糖酵解途徑改變機(jī)體內(nèi)能量代謝方式,從而促進(jìn)COAD的發(fā)生和發(fā)展。此外,本研究中部分DEGs富集于膽汁分泌信號通路,提示COAD患者的病情進(jìn)展與膽汁分泌具有密切聯(lián)系。已有研究證實,相對于健康人群,結(jié)直腸癌患者的腸道微生物組群落發(fā)生變化[19-20]。Ridlon等[21]發(fā)現(xiàn),飲食中飽和脂肪會誘導(dǎo)膽汁分泌增多,進(jìn)入腸道后產(chǎn)生脫氧膽酸和石膽酸等二級膽汁酸,激活細(xì)胞信號級聯(lián)反應(yīng),從而促進(jìn)結(jié)直腸癌細(xì)胞的增殖和遷徙。

鈣激活的氯離子通道蛋白參與細(xì)胞內(nèi)信號傳導(dǎo)并激活特定的細(xì)胞應(yīng)答,如與癌癥相關(guān)的增殖、凋亡、遷移和血管生成[22],并被認(rèn)為是新興的藥物靶點[23-24]。CLCA1基因是鈣激活的CLCA家族成員,胃腸道中CLCA1主要在小腸、結(jié)腸和闌尾表達(dá),為胃腸道提供防護(hù)作用。目前,針對CLCA1在結(jié)直腸癌中的機(jī)制已有研究。CLCA1可以通過提高黏附分子E-cadherin和腸堿性磷酸酶的表達(dá)從而促進(jìn)腸上皮分化[25],而敲除CLCA1(Caco-2細(xì)胞系)則可以抑制細(xì)胞分化并促進(jìn)細(xì)胞增殖[26]。同時,有研究發(fā)現(xiàn)CLCA1表達(dá)水平的升高可抑制Wnt信號通路和上皮-間充質(zhì)轉(zhuǎn)化(epithelial-mesenchymal transition,EMT)過程,表明該基因具有腫瘤抑制作用[25,27-28]。此外,c-myc這一原癌基因的產(chǎn)物參與細(xì)胞增殖和凋亡的調(diào)節(jié),有研究發(fā)現(xiàn)CLCA1的轉(zhuǎn)錄則與c-myc的轉(zhuǎn)錄具有一定相關(guān)性[29],但其中具體機(jī)制仍有待明確。

尋找新的治療靶點一直是結(jié)直腸癌研究的關(guān)注要點。目前已有包括西妥昔單抗、帕尼單抗在內(nèi)的以EGFR為靶點的藥物被批準(zhǔn)應(yīng)用于臨床中的靶向治療,但患者仍表現(xiàn)出耐藥性[30]。離子通道的功能表達(dá)及其受類固醇激素和生長因子的調(diào)控是卵巢癌發(fā)生發(fā)展的重要組成部分,也可能與患者產(chǎn)生耐藥性有關(guān)[31]。Musrap等[32]發(fā)現(xiàn),CLCA1是聚集形成的卵巢癌細(xì)胞中上調(diào)較多的蛋白;而使用氯離子通道阻滯劑或敲除CLCA1則會降低癌細(xì)胞形成聚集體的能力,表明CLCA1可能是惡性腫瘤新的治療靶點[33]。CLCA1的低表達(dá)與結(jié)直腸癌的低生存率和高疾病復(fù)發(fā)率有關(guān)[22],將其作為靶標(biāo)進(jìn)行靶向藥物研發(fā),有望為COAD的治療提供新方法。

本文的不足之處在于,雖基于WGCNA方法對COAD潛在的預(yù)后基因展開了一系列的生物信息學(xué)分析和預(yù)測,但該分析結(jié)果仍需進(jìn)一步的基礎(chǔ)或臨床實驗加以驗證。

綜上,進(jìn)一步明確CLCA1對于COAD發(fā)生和發(fā)展的具體機(jī)制,可能有利于提高臨床預(yù)后的判斷力和個性化治療方案的優(yōu)化。建議將CLCA1作為靶點進(jìn)行針對性的臨床研究和靶向藥物研發(fā),使得更多COAD患者獲益。

猜你喜歡
數(shù)據(jù)庫分析
隱蔽失效適航要求符合性驗證分析
電力系統(tǒng)不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
數(shù)據(jù)庫
財經(jīng)(2017年15期)2017-07-03 22:40:49
數(shù)據(jù)庫
財經(jīng)(2017年2期)2017-03-10 14:35:35
電力系統(tǒng)及其自動化發(fā)展趨勢分析
數(shù)據(jù)庫
財經(jīng)(2016年15期)2016-06-03 07:38:02
數(shù)據(jù)庫
財經(jīng)(2016年3期)2016-03-07 07:44:46
數(shù)據(jù)庫
財經(jīng)(2016年6期)2016-02-24 07:41:51
中西醫(yī)結(jié)合治療抑郁癥100例分析
在線教育與MOOC的比較分析
主站蜘蛛池模板: 亚洲成av人无码综合在线观看| 亚洲精品第五页| 亚洲伊人天堂| 欧美福利在线观看| 九九香蕉视频| 欧美亚洲网| 啪啪国产视频| 欧美一级黄色影院| 波多野结衣视频一区二区| 国产欧美视频一区二区三区| 国产精品人人做人人爽人人添| 国产精品成人一区二区不卡| 亚洲福利一区二区三区| 国产精品第| 爱色欧美亚洲综合图区| 狠狠色香婷婷久久亚洲精品| 亚洲性影院| 欧美日韩国产一级| 色综合热无码热国产| 91福利免费| 亚洲黄色成人| 国产永久免费视频m3u8| 玖玖免费视频在线观看| 92精品国产自产在线观看| 久久无码av三级| 成人噜噜噜视频在线观看| 日韩 欧美 国产 精品 综合| 男女性午夜福利网站| 美女一区二区在线观看| 刘亦菲一区二区在线观看| 九色视频线上播放| 亚洲最大在线观看| 中文无码毛片又爽又刺激| 99激情网| 欧美啪啪一区| 伊人久久婷婷五月综合97色| av性天堂网| 四虎国产精品永久一区| 亚洲精品图区| 51国产偷自视频区视频手机观看 | 无码国产偷倩在线播放老年人 | 国产在线视频二区| 亚洲一区二区日韩欧美gif| 国产精品一线天| 噜噜噜综合亚洲| 国产成人精品高清在线| 无码电影在线观看| 99国产精品国产| 国产成人综合亚洲欧洲色就色| 无码AV日韩一二三区| 亚洲性网站| 国产成人综合在线视频| 青青青视频蜜桃一区二区| 国产H片无码不卡在线视频| 一区二区三区国产精品视频| 亚洲女同欧美在线| 五月天丁香婷婷综合久久| 伊人久久青草青青综合| 成人亚洲国产| 欧美日韩一区二区在线播放| 无码专区在线观看| 久久久久国产一区二区| 亚洲欧美精品日韩欧美| 国产经典三级在线| 亚洲码在线中文在线观看| 日韩一区二区在线电影| 免费播放毛片| 亚洲国产高清精品线久久| 精品一区二区三区视频免费观看| 无码中字出轨中文人妻中文中| 亚洲精品不卡午夜精品| 日日摸夜夜爽无码| 国产网站免费| 亚洲日本在线免费观看| 亚洲成人播放| 青青久视频| 福利视频久久| 国产一级一级毛片永久| 日韩欧美视频第一区在线观看| 国产第一页屁屁影院| 亚洲午夜综合网| 动漫精品中文字幕无码|