趙冉,馮圣鋆,宣成昊,蘭蓓
天津醫(yī)科大學基礎(chǔ)醫(yī)學院生物化學與分子生物學系,天津300070
肺癌是全球最常見的惡性腫瘤之一,在我國肺癌發(fā)病率和死亡率位居首位[1]。根據(jù)組織學特征,肺癌可以分為非小細胞肺癌(NSCLC)和小細胞肺癌(SCLC)兩大類,前者約占所有病例的85%。NSCLC可以進一步細分為肺腺癌、鱗狀細胞癌和大細胞癌三種亞型,其中肺腺癌是最常見的組織學亞型。肺腺癌的發(fā)病率近年來顯著升高,并在全球范圍內(nèi)繼續(xù)上升[2]。盡管已經(jīng)在新的篩查技術(shù)、手術(shù)方法、新的化療和放療方面取得了重大進展,但肺腺癌患者的預(yù)后仍然不容樂觀[3],因此發(fā)掘肺腺癌有效的藥物靶點以提高患者的生存率具有十分重要的臨床意義。擴展突觸標記蛋白(extended synaptotagmins,E-SYTS)是一類與突觸標記素相似的具有SMP 和C2 結(jié)構(gòu)域的膜蛋白,ESYT 家族有3 名成員,ESYT1 有5個C2 結(jié)構(gòu)域,ESYT2 和ESYT3 有3個C2結(jié)構(gòu)域[4]。C2 結(jié)構(gòu)域的主要功能是形成內(nèi)質(zhì)網(wǎng)—質(zhì)膜連接,參與兩個細胞器之間的磷脂交換[5]。有文獻報道,小鼠胚胎成纖維細胞中ESYT3 基因的缺失會抑制細胞的遷移能力[6]。但關(guān)于ESYT3 在肺腺癌中的作用未見報道,本研究利用TCGA 數(shù)據(jù)庫數(shù)據(jù)分析ESYT3 基因在肺腺癌組織與正常組織中的表達差異及其臨床意義,并探討其分子作用機制,為其作為肺腺癌的診斷和治療靶點奠定理論基礎(chǔ)。
1.1 數(shù)據(jù)來源 肺腺癌患者RNA FPKM 數(shù)據(jù)集及臨床資料數(shù)據(jù)均來自于TCGA 數(shù)據(jù)庫LUAD 項目,相同患者如有多個腫瘤樣本,則保留原位癌數(shù)據(jù),最后513 例肺腺癌患者數(shù)據(jù)列入本次分析,其中包括57例肺腺癌患者的正常肺組織。
1.2 肺腺癌組織和正常肺組織中ESYT3 RNA 的表達量、ESYT3 DNA 甲基化水平觀察 收集并比較TCGA 數(shù)據(jù)庫LUAD 項目中肺腺癌組織和正常肺組織中ESYT3 RNA 的表達量、ESYT3 DNA 甲基化水平,其中ESYT3 DNA甲基化數(shù)據(jù)來自UALCAN 數(shù)據(jù)庫(http://ualcan. path. uab. edu/index. html),數(shù)據(jù)共有505 例,包括32 例正常肺組織樣本、473 例肺腺癌組織樣本。
1.3 肺腺癌患者ESYT3 RNA 高、低表達分組及其與臨床病理特征的關(guān)系分析 以肺腺癌組織中ESYT3 RNA 表達量中位值為界,將肺腺癌患者分為低表達組和高表達組,以ESYT3 RNA 高、低表達為因變量,以肺腺癌患者性別、年齡、臨床分期和TMN分期為自變量,利用R 語言的“glm”函數(shù)進行單因素Logistic 回歸,分析ESYT3 RNA 高、低表達與肺腺癌患者臨床病理特征的關(guān)系(年齡、臨床分期和T分期、M分期、N分期資料中,各有19、8、3、144、12名患者信息缺失,未納入分析)。
1.4 ESYT3 RNA 高、低表達組患者中位生存期分析 根據(jù)患者的生存時間,通過R 語言“survival”包進行Kaplan-Meier 生存分析,計算并比較兩組患者的中位生存期。
1.5 ESYT3 RNA 高、低表達組患者的差異表達基因篩選、GO 生物過程(Gene Ontology:Biological Process)和KEGG(Kyoto Encyclopedia of Genes and Genomes)信號通路富集分析 通過R 語言“l(fā)imma”包,設(shè)定差異倍數(shù)為1.5 倍、q<0.05,篩選ESYT3 RNA高、低表達組患者的差異表達基因。將低表達組中的差異表達基因提交https://metascape. org/gp/index.html網(wǎng)站,對差異基因進行GO生物過程富集分析和KEGG信號通路富集分析。
1.6 ESYT3 基因與KEGG 細胞周期信號通路基因的相關(guān)性分析 提取參與KEGG 細胞周期信號通路相關(guān)的126個基因,分析126個基因在ESYT3 RNA高、低表達組患者的差異表達情況。通過“ggstatsplot”R 包中的“ggscatterstats”函數(shù)(參數(shù)type=“pearson”),利用Pearson 相關(guān)性分析ESYT3 與上述差異表達基因的相關(guān)性,其中|r|≥0.8 時表示目的基因與潛在靶基因具有高度以上相關(guān)性,0.5≤|r|<0.8 時為中度相關(guān),0.3≤|r|<0.5時為低度相關(guān)。
1.7 統(tǒng)計學方法 利用R 語言R-4.0.3 對數(shù)據(jù)整理和統(tǒng)計學分析,計量資料數(shù)據(jù)呈非正態(tài)分布,以中位數(shù)[M(P25,P75)]表示,比較用Wilcoxon 秩和檢驗。相關(guān)性分析用Pearson 相關(guān)分析法。P<0.05 為差異有統(tǒng)計學意義。
2.1 肺腺癌組織和正常肺組織中ESYT3 RNA 的表達量、ESYT3 DNA 甲基化水平比較 肺腺癌組織中ESYT3 RNA 的表達量為1.335(0.704,2.546),正常肺組織中ESYT3 RNA 的表達量為3.953(2.986,4.737),兩者相比,P<0.001。肺腺癌組織中ESYT3 DNA 甲基化水平為0.246(0.186,0.309),正常肺組織 中ESYT3 DNA 甲 基 化 水 平 為0.219(0.177,0.282),兩者相比,P<0.01。
2.2 ESYT3 RNA 高、低表達與肺腺癌患者臨床病理特征的關(guān)系 以肺腺癌組織中ESYT3 RNA 表達量中位值(MEDIA=1.33)為界進行分組,其中低表達組257 例、高表達組256 例。低表達組257 例患者中,男134 例、女123 例,年齡>65 歲124 例、≤65 歲124例,臨床分期Stage Ⅰ期120例、Stage Ⅱ期67例、Stage Ⅲ期50例、Stage Ⅳ期17例,T分期T1期67例、T2 期146 例、T3 期29 例、T4 期13 例,M 分期M0 期179例、M1期16例,N 分期N0期154例、N1期56例、N2 期42 例、N3 期2 例;高表達組256 例患者中,男103 例、女153 例,年齡>65 歲132 例、≤65 歲114 例,臨床分期Stage Ⅰ期154 例、Stage Ⅱ期54 例、StageⅢ期34例、Stage Ⅳ期9例,T 分期T1期101例、T2期130 例、T3 期18 例、T4 期6 例,M 分期M0 期165 例、M1 期9 例,N 分期N0 期176 例、N1 期39 例、N2 期32例、N3 期0 例。單因素Logistic 回歸分析結(jié)果顯示,ESYT3 RNA 高、低表達與肺腺癌患者性別、臨床分期和T 分期有關(guān)(P均<0.05),而與年齡、M 分期和N分期無關(guān)(P均>0.05)。
2.3 ESYT3 RNA 高、低表達組患者中位生存期比較 低表達組肺腺癌患者中位生存期為2.86 年,高表達組肺腺癌患者中位生存期為4.47 年,兩組相比,P<0.01。
2.4 ESYT3 RNA 高、低表達組患者的差異表達基因篩選、GO 生物過程和KEGG 信號通路富集分析結(jié)果 共篩選出ESYT3 RNA 高、低表達組患者的差異表達基因1 396個,其中656個基因在ESYT3低表達組中表達上調(diào),740個基因在ESYT3 低表達組中表達下調(diào)。GO生物學過程富集分析結(jié)果顯示,表達上調(diào)的基因主要富集在有絲分裂細胞周期、細胞分裂、有絲分裂細胞周期檢查點、DNA 復(fù)制等代謝通路,表達下調(diào)的基因主要富集在MHCⅡ類蛋白復(fù)合物組裝、白細胞介導免疫和B 細胞介導免疫等通路。KEGG 信號通路富集分析結(jié)果顯示,表達上調(diào)的基因主要富集在細胞周期、細胞衰老、P53 信號通路等,表達下調(diào)的基因主要富集在哮喘、類風濕關(guān)節(jié)炎等信號通路。
2.5 ESYT3 基因與KEGG 細胞周期信號通路基因的相關(guān)性 KEGG細胞周期信號通路基因共126個,其 中BUB1、BUB1B、CCNA2、CCNB1、CCNB2、CCNE1、CDC20、CDC25A、CDC25C、CDC45、CDC6、CDK1、CDK6、CDKN2A、CHEK1、DBF4、ESPL1、MAD2L1、MCM2、MCM4、ORC1、ORC6、PKMYT1、PLK1、PTTG1、TTK 共26個基因在ESYT3 高低表達組中差異表達。Pearson 相關(guān)性分析結(jié)果顯示,ESYT3 與CCNA2、MAD2L1、PLK13個基因表達呈中度負相關(guān)關(guān)系,與BUB1、BUB1B、CCNB1、CCNB2、CCNE1、CDC20、CDC25A、CDC25C、CDC45、CDC6、CDK1、CDK6、CHEK1、DBF4、ESPL1、MCM2、MCM4、ORC1、ORC6、PKMYT1、PPTG1 和TTK 共22個基因表達具有低度的負相關(guān)關(guān)系,與CDKN2A 基因表達無相關(guān)性。
ESYT3蛋白是E-Syt蛋白亞家族中的一員,含有多個C2結(jié)構(gòu)域,在脂質(zhì)穩(wěn)態(tài)和細胞內(nèi)信號傳導中起著重要作用[7]。另有研究[8]表明,敲除小鼠下丘腦POMC 神經(jīng)元中的ESYT3可抑制小鼠食欲并促進產(chǎn)熱,說明ESYT3 在營養(yǎng)性肥胖的形成中也發(fā)揮著重要作用。然而,關(guān)于ESYT3 在肺腺癌中的作用未見報道。
本研究通過對TCGA 數(shù)據(jù)庫分析發(fā)現(xiàn),肺腺癌組織中ESYT3 RNA 表達量低于正常組織。DNA甲基化是一種化學修飾,在表觀遺傳基因表達[9]、X 染色體失活[10]和基因組穩(wěn)定性[11]的調(diào)控中起著重要作用,異常DNA 甲基化模式的形成是癌細胞的標志[12]。我們通過對ESYT3 DNA 甲基化水平分析發(fā)現(xiàn),肺腺癌組織中ESYT3 DNA 甲基化水平增加,提示我們肺腺癌中ESYT3 DNA 甲基化水平增加有可能是ESYT3 基因表達水平減少的原因之一。進一步分析ESYT3 的表達與臨床病理參數(shù)的關(guān)系,單因素Logistic 結(jié)果顯示ESYT3 表達與患者性別、臨床分期和T 分期有關(guān),而與年齡、M 分期和N 分期無關(guān);分析ESYT3 表達水平對患者預(yù)后生存的影響,發(fā)現(xiàn)ESYT3 低表達患者預(yù)后較差,提示ESYT3 可能發(fā)揮了抑制肺腺癌發(fā)生發(fā)展的作用。
深入分析ESYT3 潛在的分子作用機制,我們篩選出ESYT3 高、低表達組的差異表達基因,并對這些差異表達基因進行GO 生物過程和KEGG 信號通路富集分析,結(jié)果顯示在ESYT3 低表達組中表達上調(diào)基因主要富集在細胞周期等癌癥相關(guān)通路。細胞周期進展異常是腫瘤發(fā)生的基本機制之一,細胞紡錘體檢查點的丟失、嚴重的染色體分離缺陷[13]、細胞周期相關(guān)的基因的缺失、點突變以及基因表達水平的變化均與腫瘤發(fā)生有關(guān)[14]。細胞周期抑制劑的藥物也已經(jīng)開始應(yīng)用于相關(guān)癌癥的治療[15]。GO 和KEGG 富集分析結(jié)果都顯示,ESYT3 差異表達基因集中在細胞周期信號通路。為了進一步分析ESYT3通過細胞周期信號通路調(diào)控肺腺癌進展可能的機制,尋找ESYT3 潛在的靶基因,我們提取細胞周期信號通路相關(guān)的126個基因,分析后發(fā)現(xiàn)其中有26個基因在ESYT3 高表達組和低表達組中差異表達。對以上26個基因表達與ESYT3 基因表達進行Pearson 相關(guān)性分析,發(fā)現(xiàn)CCNA2、MAD2L1、PLK1 等基因的表達與ESYT3 呈負相關(guān),提示ESYT3 有可能通過調(diào)控以上基因表達,進而對肺腺癌細胞周期的發(fā)揮調(diào)控作用。
綜上所述,ESYT3基因在肺腺癌組織中低表達,ESYT3 表達水平與患者性別、臨床分期、T 分期、生存期有關(guān)。ESYT3 低表達影響細胞周期等信號通路,并與CCNA2、MAD2L1、PLK1 等基因的表達呈負相關(guān)關(guān)系,ESYT3 有可能通過調(diào)節(jié)CCNA2、MAD2L1和PLK1 等基因的表達來參與肺腺癌細胞周期的調(diào)控,有望成為肺腺癌患者早期診斷和治療的新靶點和生物學標志物。