王曉瓊,金巧智,陳武兵,蔡志毅
(1.溫州醫科大學附屬第二醫院 耳鼻喉科,浙江 溫州 325027;2.臺州市立醫院 耳鼻咽喉科, 浙江臺州 318000)
鼻咽癌是頭頸部最常見的惡性腫瘤之一,高發于中國兩廣及江浙一帶[1]。鼻咽癌的臨床特征是:惡性程度高、解剖位置隱蔽、癥狀不典型,容易被忽視和誤診,4年遠處轉移率為30%~40%,5年生存率僅為70%[2]。研究表明,鼻咽癌的發病與多種因素有關,包括遺傳易感性、環境因素、飲食和EB病毒感染[3]。目前鼻咽癌的發病機制尚不十分清楚,臨床上常采用調強放射治療和同步放化療,但鼻咽癌患者的總體生存率并沒有明顯提高。因此,探求其動態發展的分子機制,對降低復發和轉移率具有重要意義。基因芯片技術和生物信息學方法系統分析腫瘤相關基因及其調控機制是當前功能基因組學的一種重要研究手段[4-5]。本研究利用生物信息學技術挖掘鼻咽癌相關基因芯片,分析其差異表達基因并構建蛋白相互作用網絡,進而挖掘關鍵網絡節點。
1.1 資料 基因表達譜芯片篩選及數據處理利用美國國立生物技術信息中心(NCBI)平臺下的基因表達綜合數據庫(Gene Expression Omnibus,GEO)檢索含有人源鼻咽癌樣本的芯片,選取基因芯片GSE12452、GSE13597、GSE64634,見表1。利用R語言軟件包Affy(version 1.50.0,http://bioconductor.org/help/search/index.html?q=affy/)對數據進行表達值背景矯正和表達譜數據的歸一化預處理,包括原始數據格式的轉換,缺失值補充,背景矯正,以及用分位數法進行數據標準化。
1.2 差異表達基因篩選 采用R語言Limma數據包對鼻咽癌與正常組織進行差異表達基因篩選,篩選標準為P<0.05,|FC(fold change)|≥1.5(|log2FC|≥0.585);并將探針名轉化為標準基因名,分別繪制差異表達基因火山圖。篩選出共同差異表達基因,根據log2FC值對基因進行排序,然后進行Rank分析(FDR<0.05,矯正方法為bonferroni矯正法),繪制共同差異基因log2FC熱圖。

表1 3套鼻咽癌基因芯片基本信息
1.3 基因功能富集和注釋 基于前述所得差異表達基因,通過DAVID在線軟件(https://david.ncifcrf.gov),依據基因本體(Gene Ontology,GO)數據庫對差異表達基因進行生物學功能注釋。同時利用京都基因與基因組百科全書(kyoto encyclopedia of genes and genomes,KEGG)通路數據庫進行差異基因信號通路的富集。
1.4 蛋白質相互作用網絡構建 利用STRING10(http://www.string-db.org)構建差異基因編碼蛋白的相互作用網絡,統計互作網絡鄰接節點數目,篩選出關鍵節點基因。通過MCODE插件(MCODE分數>2)對蛋白質相互作用網絡進行關聯度分析,獲得蛋白質相互作用網絡中關鍵蛋白質簇并在Cytoscape中進行可視化顯示,進一步通過基因功能富集得到關鍵基因蛋白質簇功能注釋。
2.1 差異表達基因篩選 篩選GSE12452 中獲得1 994個差異基因(964個上調,1 030個下調);GSE13597中獲得518個差異基因(293個上調,225個下調);GSE64634共獲得617個差異表達基因(227個上調,390個下調),各個芯片差異表達基因表達情況,見圖1-3。取在≥3個數據集中有交集的差異表達基因116個,其中上調基因69個,下調基因47個,見圖4。對其進行生物信息學分析,根據差異基因的平均log2FC值對基因進行排序,通過Rank分析得到40個明顯差異基因,繪制差異基因log2FC熱圖,見圖5。

圖1 GSE12452芯片中鼻咽癌組織與正常鼻咽組織差異基因火山圖

圖2 GSE13597芯片中鼻咽癌組織與正常鼻咽組織差異基因火山圖

圖3 GSE64634芯片中鼻咽癌組織與正常鼻咽組織差異基因火山圖

圖4 3套基因芯片差異基因匯總及交集

圖5 3套鼻咽癌基因芯片共同顯著差異表達基因
2.2 差異表達基因功能富集及通路分析 對差異基因進行GO富集分析,這些基因富集(FDR較正后aP <0.05)在細胞分裂(cell division)、蛋白結合(protein binding)、紡錘體(spindle)、細胞外外泌體(extracellular exosome)上,見表2和圖6。對差異基因進行KEGG通路分析,主要涉及6個通路(FDR較正后bP<0.05):細胞周期、DNA修復、小細胞肺癌、錯配修復、人T細胞白血病病毒1感染、ECM-受體相互作用通路,見表3和圖7。
2.3 蛋白質相互作用網絡的構建和關鍵基因的篩選 用STRING10分析差異基因所對應的蛋白之間的相互作用網絡,見圖8;得到35個與≥29個蛋白有相互作用的蛋白,見圖9。再進一步分析網絡中的關鍵節點和基因簇,結果顯示蛋白質相互作用網絡中存在3個比較重要的基因簇。第1個基因簇關鍵節點為增殖性細胞核抗原(proliferating cell nuclear antigen,PCNA)和微小染色體維持蛋白2(minichromosome maintenance 2,MCM2),該基因簇生物功能主要富集于細胞核、細胞核質、有絲分裂細胞周期的G1/S轉換、基因復制等通路;第2個基因簇關鍵節點為核分裂周期蛋白80(nuclear division cycle 80,NDC80)、細胞周期素B1(cyclin B1,CCNB1)、細胞周期分裂蛋白20(cell division cycle 20,CDC20),該基因簇功能主要有凝聚核染色體外動粒、濃縮核染色體動粒、有絲分裂主軸裝配檢查點、有絲分裂紡錘體裝配;第3個基因簇包括復制因子復合體4(replication factor C subunit 4,RFC4)、復制因子復合體5(replication factor C subunit 5,RFC5)、氧化應激反應因子(Obg like ATPase 1,OLA1),該基因簇主要與腺嘌呤核苷三磷酸結合以及DNA復制相關,見圖10和表4。

表2 鼻咽癌組織與正常鼻咽組織差異表達基因GO富集注釋結果

圖6 鼻咽癌組織與正常鼻咽組織差異表達基因GO富集

表3 鼻咽癌組織與正常鼻咽組織差異表達基因KEGG通路注釋結果

圖7 鼻咽癌組織與正常鼻咽組織差異表達基因KEGG通路富集結果

圖8 鼻咽癌組織與正常鼻咽組織差異表達基因的蛋白質相互作用網絡

圖9 蛋白質相互作用網絡鄰接節點數目

圖10 蛋白質相互作用網絡關鍵基因簇分析
隨著基因芯片的迅速發展,利用基因芯片篩選差異表達基因,并分析其功能是當前研究癌癥發生發展分子機制的一種新的有效方法。本研究選取GEO中3個鼻咽癌基因表達的芯片數據,利用生物信息學進行鼻咽癌相關基因篩選,共篩選到116個差異表達基因進行生物學功能的進一步分析,而其中根據log2FC值排序得到最顯著上調、下調的20個基因。其中乳鐵蛋白(lactotransferrin,LTF)在鼻咽癌組織中顯著下調,這與文獻報道LTF在鼻咽癌組織中低表達一致[9],LTF可能通過抑制AKT信號通路[9]、MAPK信號通路[10]等抑制鼻咽癌細胞增殖分裂。而前列腺素-內過氧化物合酶2(prostaglandin-endoperoxide synthase 2,PTGS2),也稱為環加氧酶,在鼻咽癌組織則顯著上調,目前文獻報道認為PTGS2作為一種潛在的癌基因,在鼻咽癌中表達上調,主要與在細胞有絲分裂發生過程中合成的前列腺素類物質有關,被認為主要負責炎癥反應,而且PTGS2的抑制劑塞來昔布藥物也被證明能減少鼻咽癌中血管的生成[11]。但是包括SCGB1A1(secretoglobin family 1A1)在內的其他差異基因在鼻咽癌組織中的作用及其作用機制還需要進一步實驗探究。
通過GO富集、KEGG分析結果顯示以上差異基因的功能主要富集在細胞分裂的信號通路,調節蛋白結合活性,定位富集在紡錘體以及細胞外外泌體等生物學過程中,主要參與細胞周期、DNA修復、小細胞肺癌、錯配修復、人T細胞白血病病毒1感染、ECM-受體交互等信號通路。值得注意的是其中37個差異基因富集定位在細胞體外泌體上。外泌體是攜帶著如核酸、蛋白質、脂類和糖類等的生物活性分子,它廣泛存在于體液中,被認為可以通過傳遞信息影響靶細胞的功能,激活細胞信號通路,可以在腫瘤的發生發展過程中發揮作用[11]。目前觀點認為患者的血清、尿液、精液、唾液等均檢測出外泌體,而這些外泌體來自癌細胞[12]。本次研究中通過GO富集分析發現37個基因與細胞外泌體相關,其中以CCAT6(CCT-alpha6)基因為例,在外泌體數據庫(ExoCarta)[13]中分析,CCAT6編碼形成的蛋白TCP 1復合物(CCT)廣泛存在于人體尿液、血液中,可以作為肝癌、乳腺癌、卵巢癌、前列腺癌等的潛在生物標志物。但是本研究所選用的是基因芯片取材于鼻咽癌組織和正常鼻腔黏膜組織,因此需要進一步實驗確定以上在細胞外外泌體富集的基因是否可以作為潛在基因,成為非侵入性生物標志物,用于鼻咽癌患者的早期檢測。

表4 蛋白質相互作用網絡關鍵基因簇功能注釋
用STRING10對差異基因進行蛋白相互作用網絡分析,位于中心節點的基因有包括RFC4、拓撲異構酶(DNA topoisomerase II alpha,TOP2A)、PCNA、CCNB1、有絲分裂阻滯缺陷2樣蛋白1(mitotic arrest deficient 2 like 1,MAD2L1)、NDC80 等35個基因。進一步進行基因簇及關鍵網絡節點挖掘顯示,差異基因蛋白相互作用網絡存在3個關鍵基因簇,主要和有絲分裂細胞周期、基因復制、有絲分裂、腺嘌呤核苷三磷酸結合等相關。其中第一關鍵基因簇中,網絡關鍵節點基因PCNA編碼的PCNA蛋白是一種DNA聚合酶δ的輔助蛋白,在G1中期、S期時高表達,而從G2/M期至G1期時開始下降,涉及DNA的復制和修復的過程[14]。莫浩亢等[15]則發現PCNA在鼻咽癌中高表達,且與鼻咽癌放療敏感性有關,而MCM2作為MCMs家族的一員,是一種與DNA復制有密切關系且可作為增殖細胞的特殊標志物。多篇文獻中發現MCM2在鼻咽癌中高表達,與鼻咽癌細胞增殖相關,常提示預后不良[16-17]。第二個基因簇中CCNB1則可以和CDC20復合形成成熟促進因子(maturation promoting factor,MPF),MPF對細胞能否能進入M期起決定性作用。而CCNB1還可以通過紡錘體微管的作用來促進細胞分裂,且已經作為抗腫瘤靶點在多種腫瘤中進行研究[18]。本研究還發現RFC4基因與鄰近45個基因蛋白有連結,RFC4基因編碼復制因子復合體(RFC)的第四大亞基,RFC主要參與促進PCNA與ATP的結合,同樣參與DNA的修復[19]。研究發現RFC4在結直腸癌中、肝癌中高表達,且與不良預后有關[20-21],而ARAI等[21]發現下調RFC4的表達可以增強多柔比星和喜樹堿在肝細胞癌中的細胞毒性作用。
綜上所述,本研究采用生物信息學方法分析已有的鼻咽癌芯片數據,篩選出潛在的鼻咽癌中表達上調下調顯著的基因,還通過建立蛋白質相互作用網絡,分析得到關鍵基因簇和關鍵基因節點,包括基因PCNA、MCM2、CCNB1、RFC4。但因本研究僅涉及生物信息學分析,以上潛在功能基因與鼻咽癌的相關性及相關機制研究仍需在臨床樣本中進行驗證。