李明陽,馬春霞,吳翰欣,吳小海,俞建昆
1.中國醫學科學院北京協和醫學院 醫學生物學研究所中心實驗室,云南 昆明 650118;
2.昆明醫學大學 附屬第二醫院,云南 昆明 650118
鼻咽癌(nasopharyngeal carcinoma,NPC)是常見于我國南方及東南亞地區的鼻咽部惡性腫瘤,尤其高發于廣東省[1]。鼻咽癌的發病與Epstein Barr病毒(Epstein Barr virus,EBV)感染、遺傳因素及環境因素密切相關[2-6]。EBV的再激活與NPC的發展之間存在一定的相關性。隨著高通量測序技術及基因芯片技術的發展,從不同層次如基因組、轉錄組及蛋白質組等方面研究惡性腫瘤的發生發展以及預后已成為全世界科學家的首選方法[7-9]?;蛐酒呢暙I者先前已證明低劑量的N-甲基-N′-硝基-N-亞硝基胍(MNNG)與12-O-十四烷酰佛波醇-13-乙酸酯(TPA)和丁酸鈉(SB)具有協同作用,用于增強攜帶EBV的NPC細胞中的EBV再激活和基因組不穩定性[10]。在此,我們利用生物信息學方法篩選EBV再激活后NPC細胞的差異表達基因(differentiallyexpressed genes,DEGs),為相關臨床研究提供重要的信息基礎。
細胞基因表達譜下載自NCBI的GEO DataSet數據庫(https://www.ncbi.nlm.nih.gov),編號為GSE38453,該芯片中包含2種鼻咽癌細胞系NA細胞NA-P10/TS-MG和NA-P1/mock的表達譜。NA-P10/TS-MG是指具有10次組合的TPA/SB和MNNG(TS-MG)處理的NA細胞,通過將這些細胞與 TPA/SB(10ng/mL和 1.0mmol/L)及 MNNG(0.1 μg/mL)組合周期性溫育來對NA-P10/TSMG細胞進行10次重復化學暴露。NA-P1/mock是經過1次傳代的模擬處理的NA細胞。每種細胞均有2次重復。
利用R語言程序包(edgR包)篩選差異表達基因并繪制基因表達熱圖(標準設置:差異表達倍數∣FC∣>1,FDR<0.05,P<0.05)。利用在線分析工具(https://david.ncifcrf.gov/和http://www.string-db.org/)對篩選出的候選基因進行GO富集、KEGG通路分析及蛋白互相作用網絡分析,以確定核心基因。P<0.05被認為具有統計學意義。
EBV經過化學再刺激后,從鼻咽癌細胞系中共篩選出4496個DEGs,包括1954個上調基因和2542個下調基因(P<0.05)。選取前50個繪制基因表達熱圖(圖1),并選取前246個DEGs進行后續分析。

圖1 基因表達熱圖(Top 50)
GO分析結果顯示,DEGs在生物過程(biological processes,BP)中顯著富集,包括病毒應答、Ⅰ型干擾素信號通路、γ干擾素介導的信號傳導途徑、病毒防御反應、膽固醇生物合成過程、氧化還原過程、類異戊二烯生物合成過程、類固醇代謝過程、脂質代謝過程和花生四烯酸代謝過程(表1);在分子功能(molecular function,MF)中,包括絲氨酸型內肽酶活性、蛋白同二聚化活性、醛脫氫酶(NAD)活性、氧結合、3-氯烯丙基醛脫氫酶活性、血紅素結合、谷胱甘肽轉移酶活性、氧化還原酶活性、鐵離子結合和藥物結合(表2);在細胞組分(cell component,CC)中,包括胞外體、細胞質、細胞器膜、基底外側質膜、胞外空間、內質網膜、內質網、過氧化物酶體、線粒體、頂端質膜(表3)。

表1 生物過程分析結果(Top 10)

表2 分子功能分析結果(Top 10)

表3 細胞組分分析結果(Top 10)
如表4,KEGG通路分析顯示,DEGs在代謝途徑、抗生素生物合成、萜類骨架生物合成、化學致癌作用、丙型肝炎、膽汁分泌、細胞色素P450代謝外源性物質、氨基酸生物合成、類固醇生物合成、精氨酸和脯氨酸代謝等信號通路中顯著富集。
在蛋白互作分析網絡中,MAPK3、IRF7、IRF9、IFI6、TRIM22、IFI27、OAS2、TRIM31、HLA-F和MX1節點度最高,即為核心基因(圖2)。

圖2 候選基因蛋白產物相互作用
EBV是導致鼻咽癌的主要因素,化學致癌物對其的激活作用可能在NPC的發展中起重要作用。已證明TPA和SB可以誘導EBV的再激活,從而增強鼻咽癌細胞的基因組不穩定性和腫瘤發生率[10-11]。此外,聯合治療時,低劑量MNNG(0.1 μg/mL)與TPA/SB具有協同增效作用[12]。由于鼻咽癌高風險地區的居民可能以長期低劑量重復的方式接觸這些致癌物,我們試圖確定攜帶EBV的鼻咽細胞暴露于致癌物的后果。
通過生物信息學分析,我們發現EBV再激活后,宿主細胞中1954個基因上調、2542個基因下調,這些基因主要在代謝途徑、抗生素生物合成、萜類骨架生物合成、化學致癌作用、丙型肝炎、膽汁分泌、細胞色素P450代謝外源性物質、氨基酸生物合成、類固醇生物合成、精氨酸和脯氨酸代謝等信號通路中顯著富集,為相關臨床研究提供了重要的信息基礎。