瞿根義,湯乘,徐勇,柳成孟,陽光,段紅桃,向茂林
膀胱癌是泌尿系統(tǒng)常見的疾病之一,其發(fā)病率呈逐年上升趨勢,全世界每年超過43萬例患者被診斷為膀胱癌,并有16.5萬例患者死于膀胱癌[1]。在中國,膀胱癌的發(fā)病率為7.68/10萬,在泌尿系腫瘤發(fā)病率中居首[2]。膀胱尿路上皮癌是膀胱癌最主要的類型,目前最主要的治療方式是手術切除,但術后易反復、預后差且缺乏有效的生物標志物,對于膀胱尿路上皮癌具體的發(fā)生、發(fā)展機制也尚不清楚。因此,尋求膀胱尿路上皮癌有效預防和控制復發(fā)的方案一直是研究的熱點。生物信息學是將計算機技術和分子生物學相結合的技術,為基因的研究提供了明確的方向,可揭示大量生物信息。癌癥基因組圖譜(the cancer genome atlas,TCGA) 和Oncomine數據庫作為當前世界上最大的腫瘤基因芯片數據庫,具有大樣本和豐富臨床數據的優(yōu)勢。本研究通過TCGA和Oncomine數據庫深入挖掘膀胱尿路上皮癌差異表達基因,進行差異基因GO富集分析和KEGG通路富集分析,制作蛋白質—蛋白質相互作用(PPI)網絡,篩選關鍵基因(Hub gene),并且進一步通過Oncomine數據庫進行Meta分析,以挖掘膀胱尿路上皮癌發(fā)生發(fā)展的關鍵基因,為膀胱尿路上皮癌的靶向精準治療提供研究基礎,報道如下。
1.1 材料 登陸TCGA 數據庫(https://cancergenome.nih.gov/)網站下載公開的膀胱尿路上皮癌轉錄組數據,其中膀胱尿路上皮癌樣本414例,正常癌旁組織19例。
1.2 方法
1.2.1 獲取差異基因:應用R 語言軟件(3.5.3版本)中的edgeR 軟件包對數據進行標準化及差異表達分析,篩選log2FC 絕對值>1.5,錯誤發(fā)現率(FDR)<0.05 的基因為表達差異基因。ggplot2軟件包對數據進行圖形可視化。
1.2.2 差異表達基因的GO富集分析和KEGG富集分析:通過DAVID 數據庫( https://david.ncifcrf.gov)對篩選的顯著差異基因進行GO富集分析和KEGG通路富集分析,P<0.05為差異有統(tǒng)計學意義,應用R語言軟件及相應的clusterProfiler包進行注釋及可視化。
1.2.3 差異表達基因的PPI網絡分析:STRING數據庫(https://string-db.org/)用于識別已知和預測PPI[3]。使用STRING對差異表達基因進行分析并構建PPI網絡,使用 Cytoscape軟件中的Cytohubba篩選PPI網絡中的前10位Hub基因。
1.2.4 Oncomine數據庫提取Hub基因在膀胱尿路上皮癌中的表達數據并進行Meta分析:在Oncomine數據庫中(https://www.oncomine.org)進行檢索。檢索條件:(1)Gene:hub基因名;(2)Analysis Type:Cancer vs.Normal Analysis;(3) Cancer Type:Bladder urothelial carcinoma;(4) THRESHOLD BY:P-VALUE<0.0001,FOLD CHANGE>2,GENE RANK=Top 10%。獲取Oncomine數據庫中Hub基因與膀胱尿路上皮癌的相關數據,并以P<0.05篩選數據進一步進行Meta分析。
2.1 膀胱尿路上皮癌差異表達基因篩選 從TCGA數據庫下載膀胱尿路上皮癌轉錄組數據,其中膀胱尿路上皮癌樣本414例,正常癌旁組織19例。對數據進行歸一化、對數化,將沒有對應基因注釋信息的探針和重復的探針去掉,最終得到18 768個基因,433個樣本的表達譜。通過edgeR軟件包,以log2FC絕對值>1.5,FDR<0.05為差異表達基因篩選條件,共篩選出膀胱尿路上皮癌差異表達基因1 650個,其中表達上調基因565個,表達下調基因1 085個,并繪制基因火山圖,見圖1。
2.2 差異表達基因的GO富集分析和KEGG通路富集分析 通過GO富集分析和KEGG通路富集分析篩選差異表達基因的生物學功能,在GO富集分析中包括生物學過程(biological process,BP)、細胞組成(cell composition,CC)和分子功能(molecular function,MF),在BP中差異基因主要富集于鈣離子跨膜轉運、細胞外基質組織和RNA聚合酶Ⅱ啟動子轉錄的負調控,在CC中差異基因主要富集于細胞外區(qū)域、細胞外空間和質膜,在MF中差異基因主要富集于轉錄激活子活性、RNA聚合酶Ⅱ核心啟動子近端區(qū)域序列特異性結合和序列特異性DNA結合。在KEGG通路分析中主要富集于cGMP-PKG信號通路、鈣信號通路和神經活性配體—受體相互作用。見表1、表2和圖2。

表1 膀胱尿路上皮癌差異表達基因GO富集分析

表2 膀胱尿路上皮癌差異表達基因 KEGG通路富集分析
2.3 差異表達基因的PPI網絡分析 通過STRING數據庫對差異表達基因構建PPI網絡,應用Cytoscape軟件中的Cytohubba篩選PPI網絡中連接程度前10位Hub基因,分別為:GNG7、GNG11、BDKRB2、BDKRB1、NMUR1、NPSR1、CHRM5、TACR2、TAC1、TACR1,見圖3。
2.4 Oncomine數據庫Hub基因分析及Meta分析 獲取Oncomine數據庫中Hub基因與膀胱尿路上皮癌的相關數據,并以P<0.05篩選數據進一步進行Meta分析,獲得1個關鍵基因為TACR1,其在3個分析研究間的比較顯示過表達,見圖4。
膀胱癌是泌尿系統(tǒng)常見的惡性腫瘤之一,其中膀胱尿路上皮癌是膀胱癌最主要的類型,膀胱尿路上皮癌具有發(fā)病率高、易復發(fā)和預后差等特征,其發(fā)生發(fā)展是一個復雜的過程,參與腫瘤發(fā)生發(fā)展及轉移的調控因子眾多,但其具體機制目前仍不清楚,另外對于膀胱尿路上皮癌發(fā)生發(fā)展及生存預后缺乏有效的腫瘤標志物。因此進一步研究膀胱尿路上皮癌具體的發(fā)生發(fā)展機制,挖掘有效的生物標志物對膀胱尿路上皮癌的診斷治療及預后評估具有重要的臨床意義。
癌癥基因組圖譜(TCGA) 是由美國癌癥中心和美國人類基因組研究中心在2006 年共同發(fā)起的項目,主要利用高通量測序技術建成的一個綜合的、多維的癌癥地圖,大大提高了對癌癥發(fā)生、診斷和治療的理解,以及對癌癥發(fā)病機制的認識[4]。傳統(tǒng)的分子生物學實驗僅能同時研究少數幾個基因的功能,而生物信息學是將計算機技術和分子生物學相結合的技術,通過對TCGA數據庫的挖掘揭示大量生物信息。
本研究利用生物信息學技術,通過從TCGA下載的膀胱尿路上皮癌基因組數據進行挖掘,共挖掘出膀胱尿路上皮癌差異表達基因1 650個,其中表達上調基因565個,表達下調基因1 085個。用DAVID在線工具對差異基因進行功能富集分析,結果發(fā)現,在BP中差異基因主要富集于肌肉收縮、細胞外基質組織和RNA聚合酶Ⅱ啟動子轉錄的負調控,在CC中差異基因主要富集于細胞外區(qū)域、細胞外空間和質膜,在MF中差異基因主要富集于轉錄激活子活性、RNA聚合酶Ⅱ核心啟動子近端區(qū)域序列特異性結合和序列特異性DNA結合。進一步通過STRING數據庫對膀胱尿路上皮癌差異表達基因構建PPI網絡,結果發(fā)現這些基因編碼的蛋白調節(jié)點主要集中在GNG7、GNG11、BDKRB2、BDKRB1、NMUR1、NPSR1、CHRM5、TACR2、TAC1、TACR1等10個基因。進一步對Oncomine數據庫挖掘并進行Meta分析,發(fā)現TACR1為膀胱尿路上皮癌發(fā)生發(fā)展的關鍵基因[5-6]。
TACR1基因編碼的蛋白為截短型神經激肽1受體(neurokinin 1 receptor,NK1R),NK1R屬于G蛋白偶聯受體,同P物質(SP)的結合能力最強,是SP的偏嗜性受體[7]。研究顯示,NK1R在疾病和健康狀態(tài)下的功能特點表明其可作為疾病治療的靶點[8-9]。速激肽中SP結合NK1R后可調控腫瘤細胞的增殖、侵襲和血管生成等生物學過程,且應用NK1R拮抗劑可特異性抑制腫瘤細胞的增殖侵襲[10-11]。研究也證實,SP通過激活并結合NK1R發(fā)揮生物學效應的通路是抗腫瘤的獨立靶點[12]。其中在胃癌、結腸癌和乳腺癌中NK1R均出現顯著高表達[13-15],并且NK1R表達與乳腺癌的浸潤轉移呈負相關,SP的表達與乳腺癌的浸潤轉移呈正相關。進一步研究顯示,SP-NK1R可作為乳腺癌診斷治療的新靶點[14]。目前多項研究證實,NK1R通過調節(jié)腫瘤的增殖侵襲參與腫瘤的發(fā)生發(fā)展,其中在Oncomine數據庫中進行Meta分析顯示,NK1R的靶基因TACR1在膀胱尿路上皮癌中出現顯著高表達,但目前其在膀胱尿路上皮癌中的機制尚未闡明,對SP-NK1R進行進一步研究,對膀胱尿路上皮癌發(fā)生發(fā)展機制將會有更多的發(fā)現。
本研究致力于挖掘膀胱尿路上皮癌發(fā)生發(fā)展關鍵的基因,共發(fā)現1 650個差異表達基因和1個關鍵基因TACR1,可能參與調控膀胱尿路上皮癌的發(fā)生發(fā)展,但是,仍需要進一步的研究來闡明TACR1在膀胱尿路上皮癌發(fā)生發(fā)展機制中的具體生物學功能,為膀胱尿路上皮癌的治療提供新的線索和方向。
利益沖突:所有作者聲明無利益沖突
作者貢獻聲明
瞿根義:實施研究過程,論文撰寫;湯乘:實施研究過程,資料搜集整理;徐勇、柳成孟:提出研究方向、研究思路,研究選題;陽光、段紅桃:統(tǒng)計學分析,論文修改;向茂林:數據獲取