蘇 旭,史維俊,王 靜,吳華彰
(蚌埠醫(yī)學院 1.生命科學學院癌癥轉化醫(yī)學安徽省重點實驗室;2.第一附屬醫(yī)院胃腸外科,安徽 蚌埠 233030)
胃癌是常見的消化道惡性腫瘤之一。據世界癌癥報告統(tǒng)計,2015年全球胃癌的發(fā)病率與死亡率分別居于所有惡性腫瘤中的第5位和第3位[1]。我國更是胃癌的高發(fā)地區(qū),全球胃癌患者約有42%來自于中國[2]。近年來,雖通過手術治療、放化療、靶向藥物等多種治療方法,患者生存期延長,生活質量有所提高。然而,早期胃癌的檢出率很低,大多數患者在診斷時已是晚期階段,失去了治療的最佳時機[3]。因此,識別胃癌進展和預后新的分子靶點[4],開展有效的胃癌靶向治療是迫切需要的。隨著基因組學、表觀基因組學的發(fā)展,現代醫(yī)學已經進入精準醫(yī)學時代,通過對胃癌的生物信息學分析,已有大量關于胃癌發(fā)生發(fā)展、轉移、耐藥及預后相關分子標記物的研究報道,并且研究開發(fā)出分子靶向藥物改變了胃癌的臨床治療模式,如靶向表皮生長因子(epidermal growth factor receptor,EGFR)藥物、PI3K信號通路抑制劑、PARP抑制劑等[5-8]。由此可見,基因組學大數據深度挖掘是尋找胃癌診斷、治療及相關靶點的新型研究手段。在此項研究中,利用生物信息學技術分析胃癌中PDGFRB的表達情況[9],探究PDGFRB與胃癌患者臨床病理特征和預后的關聯(lián),聚焦其在胃癌中可能參與的生物學過程,了解PDGFRB對胃癌發(fā)生發(fā)展和預后的影響及臨床價值,以期為胃癌的早期診斷和靶向治療提供理論依據。
1.1 數據下載與整理TCGA是美國國家癌癥研究所(National Cancer Institute)和美國人類基因組研究所(National Human Genome Research Institute)共同監(jiān)督的一個項目,目前已經收錄了60多種的腫瘤類型。本研究從TCGA數據庫中下載RNA-seq數據和臨床數據(https://www.cancer.gov/),包括正常胃粘膜上皮樣本32例及胃癌患者樣本375例。利用Perl軟件進行基因ID的轉換和臨床數據信息的提取,構建基因表達矩陣,隨后采用R語言根據log(FC)>1,FDR<0.05[10]的篩選標準初步篩選胃癌組織中的差異表達基因,并對差異基因進行熱圖和火山圖的繪制。
1.2 目的基因的篩選為研究差異表達的基因對胃癌患者的影響,對表達上調的差異基因進一步篩選分析,設置篩選標準:log(FC)>1.3,6 1.3 PDGFRB基因的差異表達及臨床病理特征的相關性分析為分析PDGFRB基因表達水平和臨床病理特征的相關性,使用Perl軟件將目的基因表達數據和臨床病理數據相結合,構建成包含目的基因信息和臨床信息的表達矩陣。隨后,利用R軟件獲得目的基因在胃癌組織和正常胃黏膜組織中的差異表達,通過在線分析軟件UALCAN(http://ualcan.path.uab.edu/analysis.html)分析PDGFRB表達水平與與胃癌患者的淋巴結轉移、分期和組織亞型等臨床病理特征的相關性。 1.4 獨立預后分析將臨床數據表達矩陣導入R軟件,利用survival程序包進行Cox回歸分析PDGFRB基因表達水平與胃癌患者生存率、年齡、分期和TMN分期等預后因素的相關性。利用在線分析網站Kaplan-Meier Plotter(https://kmplot.com/)分析PDGFRB基因分別在高表達和低表達胃癌患者中的生存情況。 1.5 PDGFRB基因的富集分析利用Perl軟件輸出應用于目的基因富集分析的表達數據集文件(.gct)和表型數據文件(.cls),進行GSEA軟件的下載安裝(https://www.gsea-msigdb.org/)和Java 8運行環(huán)境[12],將表達數據集文件和表型數據文件導入GSEA,對PDGFRB基因的信號通路進行KEGG富集分析,篩選富集分析標準為(P<0.005,FDR<0.005)。 1.6 PDGFRB基因與潛在靶基因的相關性分析將目的基因PDGFRB輸入STRING數據庫進行分析,并選擇Homo sapiens類別的蛋白質相互作用網絡,構建目的基因蛋白相互作用網絡。將目的基因與潛在靶基因的基因數據導入R軟件,分析目的基因與潛在靶基因的相關性。 2.1 胃癌組織中差異表達基因的篩選對375例胃癌和32例胃粘膜樣本中基因的差異表達情況進行篩選分析,初步篩選出胃癌樣本中差異化表達基因2676個,其中在胃癌組織中高表達和低表達的基因分別為1110和1566個,見圖1。 圖1 胃癌組織中基因差異表達分析 2.2 胃癌組織中目的基因PDGFRB的篩選胃癌是多基因異常導致的復雜性疾病,為研究差異表達基因對胃癌患者的影響,根據篩選標準:log(FC)>1.3,6 表1 候選基因與胃癌患者臨床病理特征相關性分析 2.3 PDGFRB基因在胃癌中的差異表達及臨床病理相關性分析為進一步探討PDGFRB基因是否可能參與了胃癌的發(fā)生發(fā)展,通過R語言中的limma[13]和beeswarm[14]程序包對PDGFRB基因的表達矩陣進行差異化分析顯示,相對于正常胃粘膜組織,PDGFRB基因在胃癌組織中顯著高表達(圖2A)(P<0.001)。對32例配對胃癌及癌旁組織分析發(fā)現,PDGFRB基因表達水平在胃癌組織中顯著增高(圖2B)(P<0.001)。UALCAN在線分析發(fā)現,PDGFRB基因在胃癌組織中顯著高表達(圖2C),且表達水平與淋巴結轉移、分期及亞型顯著相關(圖2D、2E、2F)(P<0.001)。以上結果表明,PDGFRB基因可能作為重要的潛在癌基因參與胃癌的發(fā)生發(fā)展。 圖2 PDGFRB基因在胃癌中的差異表達及臨床病理相關性分析 2.4 PDGFRB基因與胃癌患者的獨立預后分析為進一步確定PDGFRB基因可以作為調控胃癌發(fā)生和影響預后的潛在靶基因,Cox回歸分析顯示,PDGFRB基因表達水平與胃癌患者年齡、分期和TMN分期等獨立預后因素顯著相關(P<0.05),見表2)。另外,K-M Plot在線分析發(fā)現,PDGFRB基因表達水平與胃癌患者總生存率(OS)(圖3A、3B)、首次進展期生存率(FP)(圖3C)、后進展期生存率(PPS)(圖3D)顯著相關(P<0.01)。 表2 PDGFRB基因與胃癌患者的獨立預后分析 圖3 PDGFRB基因表達與胃癌患者預后顯著相關 2.5 PDGFRB基因多GSEA富集分析為探索PDGFRB基因調控胃癌惡性進展的分子機制,利用GSEA富集分析軟件對PDGFRB基因進行信號通路富集分析。結果顯示,在富集的相關信號通路中,PDGFRB基因在Wnt信號通路中富集相關性居于首位且富集分數最高(P<0.01)(表3、圖4)。 表3 PDGFRB基因GSEA富集分析結果 圖4 PDGFRB基因通路富集分析 2.6 PDGFRB基因與潛在靶基因的相關性分析為進一步分析PDGFRB基因通過調控Wnt信號通路影響胃癌發(fā)生發(fā)展的分子機制,利用STRING在線分析網站構建PDGFRB基因蛋白相互作用網絡,蛋白質之間的連接線越多,相互關聯(lián)性越強,分析顯示PDGFRB基因與Wnt2、PLCB2之間具有強關聯(lián)性(圖5A),且PDGFRB基因與Wnt2、PLCB2的表達呈正相關(P<0.001)(圖5B、5C)。 圖5 PDGFRB基因相關的蛋白互作及相關通路中的分子相關性分析 胃癌是世界范圍內發(fā)病率和致死率最高的癌癥之一,近半數的胃癌發(fā)生于東亞地區(qū),尤其是中國、韓國、日本及蒙古國[15]。胃癌的發(fā)生也是多因子、多步驟相互作用的復雜生物學過程,了解胃癌的發(fā)生發(fā)展對于其診斷和治療非常重要[16]。隨著基因組學、表觀基因組學的發(fā)展,通過對胃癌的生物信息學分析,越來越多的胃癌潛在基因治療靶點被研究發(fā)現,為診斷和治療胃癌提供了一個新的方向[17]。 本研究通過對TCGA數據庫中胃癌差異化表達基因的生存、預后及臨床病理相關性分析,通過UALCAN在線分析發(fā)現,PDGFRB基因在胃癌組織中顯著高表達,其表達水平與胃癌患者的淋巴結轉移、分期和組織亞型顯著相關。采用Cox回歸分析顯示,PDGFRB基因可能參與胃癌發(fā)生發(fā)展,且可能是胃癌診斷、治療和預后潛在的生物標志物。為進一步分析PDGFRB基因在調節(jié)胃癌發(fā)生發(fā)展中的分子機制,通過GSEA單基因富集分析發(fā)現,PDGFRB基因在Wnt信號通路上顯著富集[18-20]。利用在線網站STRING構建PDGFRB蛋白互作網絡,該蛋白互作網絡可以更好地理解PDGFRB與其它蛋白之間的功能關聯(lián),結果發(fā)現共有60個預測的功能蛋白與PDGFRB相互作用,其中兩種蛋白基因被證實與胃癌的發(fā)生發(fā)展和預后有關。于是通過R語言對PDGFRB與這兩種基因進行相關性分析,得出PDGFRB基因與Wnt2[21]、PLCB2[22]表達呈正相關,這提示PDGFRB基因可能通過促進Wnt2/PLCB2信號網絡,激活Wnt信號通路,促進細胞惡性增殖從而促進胃癌的發(fā)生發(fā)展。研究表明,Wnt信號通路與人類腫瘤相關,如肺癌[23]、肝癌[24]、結腸癌[25]等。Wnt信號通路激活,促進細胞增殖以及存活而不進入分化,持續(xù)性的激活Wnt信號通路使得信號通路中的其他信號分子有可能發(fā)生突變,例如永久性失活APC復合物,即“遺傳調控門控基因”缺失,進一步激活Wnt信號通路,從而促進腫瘤的發(fā)展[26-30]。 綜上所述,PDGFRB基因在胃癌組織中高表達提示其可能作為重要的潛在癌基因參與胃癌的發(fā)生發(fā)展;PDGFRB基因與臨床病理特征顯著相關,可作為評價胃癌預后的獨立危險因素;PDGFRB基因可能通過促進Wnt2/FZD1信號網絡,激活Wnt信號通路,促進細胞惡性增殖從而促進胃癌的發(fā)生發(fā)展。本研究采用生物信息學方法對PDGFRB基因進行了深入分析,分析結果可為胃癌的實驗研究提供一個重要的研究方向,由于生物信息學分析方法利用了網絡芯片數據和在線數據分析網站,缺乏相應的實驗數據作為支持驗證,存在一定的局限性。因此,PDGFRB在胃癌發(fā)生發(fā)展中的具體功能及其作用機制仍有待進一步實驗研究驗證。2 結果








3 討論