劉新會 劉斐燁
肝癌是最常見的惡性腫瘤之一,是腫瘤相關死亡的第二大原因[1]。目前,消融、肝切除術和肝移植是治療肝癌的常用方法,盡管近年來手術和系統性治療取得了進展,但肝癌患者的5年生存率仍低于30%[2]。病理分級和BCLC分期是影響肝癌患者預后的重要因素,但現有研究發現即使是相同病理分級和分期的肝癌患者,其復發和死亡風險仍各不相同[3-5]。目前臨床仍無可以精準預測肝癌患者預后的指標。自噬是一種細胞在營養缺乏條件下的分解代謝過程,大量證據表明,自噬在不同類型的癌癥中上調或下調,發揮著阻礙腫瘤啟動或促進腫瘤進展的雙重作用[6-9]。同樣,自噬在肝癌發展和生長過程中發揮著促腫瘤或抗腫瘤的雙重作用[10]。值得注意的是,雖然多種自噬基因在肝癌中的作用已被認識,但自噬基因表達水平能否預測肝癌患者的預后仍不明確,且多數研究都集中在檢測單一自噬基因上,對肝癌中所有自噬基因的表達水平和預后預測價值仍不明確。基于此,本研究分析癌癥基因組圖譜(the cancer genome atlas,TCGA)肝癌數據,明確肝癌組織中所有自噬基因的表達水平及其在預測肝癌預后中的作用,構建自噬基因相關的肝癌預后評估模型,其效果獨立于肝癌患者的臨床特征,能更精準預測肝癌患者的生存時間。
1.1 數據收集和差異表達分析 從TCGA肝癌數據庫(https://www.cancer.gov/about-nci/organization/research/structural-genomics/tcga,tcga-lihc)下載374例肝癌組織和50例癌旁組織的原始RNA測序數據及其臨床特征。采用R語言Limma包分析肝癌組織與癌旁組織間自噬基因的表達差異,顯著差異表達基因(different expression genes,DEGs)定義為:和矯正P<0.05。采用R語言軟件繪制DEGs的火山圖和熱圖。
1.2 DEGs的基因本體論(gene ontology,GO)和京都基因與基因組百科全書(Kyoto encyclopedia of genes and genomes,KEGG)富集分析 為進一步分析DEGs的潛在分子功能、生物學過程和細胞成分的富集情況,采用R語言軟件進行GO富集分析[11],采用clusterProfiler進行KEGG富集分析[12],進一步說明與DEGs相關信號通路的前景。以P<0.05為cut-off值,采用ggplot2和GO-plot R語言軟件作圖。
1.3 自噬基因相關的肝癌預后評估模型建立 通過單因素生存分析,明確與肝癌患者總生存時間(overall survival,OS)顯著相關的自噬基因。隨后,將前15個基因納入多因素Cox回歸分析,發現可獨立指導肝癌預后的自噬基因。選取這些基因的表達值與權重的線性組合,建立肝癌預后評估模型,采用該模型將肝癌患者分為高危和低危亞群。通過Kaplan-Meier生存曲線和log-rank檢驗進一步驗證高危和低危肝癌患者OS的差異。此外,對肝癌患者OS進行多因素Cox回歸分析,包括腫瘤大小分期(T分期)、腫瘤淋巴結狀態(N分期)、腫瘤轉移分期(M分期)、病理分級和臨床分期,同時計算HR和95%CI。所有分析都使用3.0.0版本R軟件進行。
2.1 肝癌組織和癌旁組織之間自噬相關的DEGs 本研究檢測了TCGA肝癌數據庫中203個自噬基因在肝癌組織和癌旁組織之間的表達,見表1。結果發現了60個自噬相關的DEGs,其中4個基因在肝癌組織中表達下調,而56個基因在肝癌組織中表達上調,這60個DEGs的熱點圖見圖1(插頁)。采用KEGG和GO富集分析進一步分析DEGs的生物學功能,見表2~3。KEGG富集的通路包括自噬、HPV感染、細胞凋亡和p53信號通路。GO富集的通路包括自噬、自噬調控和凋亡信號通路。

表1 TCGA肝癌數據庫中60個自噬相關DEGs

表2 DEGs的KEGG富集分析

表3 DEGs的GO富集分析

圖1 TCGA數據庫肝癌組織和癌旁組織中60個自噬相關顯著差異表達基因(DEGs)的火山圖
2.2 自噬基因相關的肝癌預后評估模型 對TCGA肝癌數據庫中的203個自噬基因進行了單因素生存分析。結果發現其中81個基因與肝癌預后顯著相關,進一步選擇前15個基因進行多因素Cox回歸分析,發現4個自噬基因(HDAC1、ATIC、EIF2S1和 RAB7A)與肝癌患者的OS顯著相關,見表4。以多因素Cox回歸系數為權重,基于基因的表達值構建自噬基因相關的肝癌預后評估模型。計算公式具體如下:風險評分=(0.385×HDAC1表達水平)+(0.430×ATIC 表達水平)+(0.596×EIF2S1表達水平)+(0.449×RAB7A表達水平)。按中位風險評分將肝癌患者分為高危組(171例)和低危組(172例)。與低危組相比,高危組患者的OS明顯縮短(P<0.05),見圖2。

圖2 自噬基因相關的肝癌預后評估模型預測高危或低危肝癌患者的生存曲線

表4 肝癌患者自噬基因的多因素Cox回歸分析
2.3 自噬基因相關的肝癌預后評估模型獨立預測肝癌患者預后 采用單因素分析,進一步明確自噬基因相關的肝癌預后評估模型及其他臨床病理因素對肝癌患者預后預測作用,見表5。自噬基因相關的肝癌預后評估模型(P<0.05)與其他臨床病理因素,包括T分期(P<0.05)、M 分期(P<0.05)、腫瘤臨床分期(P<0.05)與肝癌患者OS顯著相關,而N分期和病理分級與肝癌患者OS無關(均P>0.05)。進一步進行多因素Cox回歸分析,以確定自噬基因相關的肝癌預后評估模型對肝癌患者預后的預測價值是否獨立于這些臨床病理因素,見表6。盡管自噬基因相關的肝癌預后評估模型、T分期、M分期、腫瘤臨床分期與肝癌患者OS顯著相關,但只有自噬基因相關的肝癌預后評估模型可獨立指導肝癌患者的預后(HR=1.536,95%CI:1.341~1.760,P<0.05)。

表5 影響肝癌患者預后的單因素分析結果

表6 影響肝癌患者預后的多因素Cox回歸分析結果
目前,病理分級和BCLC分期是評估肝癌預后重要的預測指標。然而,有研究報道,即使是相同病理分級和BCLC分期的肝癌患者的復發和死亡風險也各不相同[5]。因此,需要更多的肝癌預后評估模型來幫助臨床醫生選擇精準化的肝癌預防和治療策略。越來越多的證據證明自噬在發生、發展中發揮著抑癌或促癌的雙重作用[10,13],但自噬基因表達水平能否預測肝癌患者的預后仍不明確。
本研究通過對TCGA肝癌數據庫自噬基因的表達譜分析,確定自噬基因在肝癌中的表達水平及其在預測肝癌預后中的作用。在203個自噬基因中檢測到60個肝癌組織和癌旁組織間的DEGs,其中包括了已經報道的 TP73[14]、CDKN2A[15]、SPHK1[16]、FOS[17]等基因,這和本研究結果一致。但除此之外,本研究還發現一些新的肝癌組織與癌旁組織間DEGs,這些基因目前在肝癌中的作用仍不明確,例如CAPN10、RB1CC1、RPTOR等,這仍需要進一步的研究驗證。
本研究同時分析明確了這些DEGs在自噬、凋亡和p53信號通路中富集,這提示自噬在肝癌發生、發展中可能共同參與了細胞凋亡、p53通路激活等相關信號通路。近年來已有研究表明,肝癌的發生、發展可能與自噬參與的炎癥損傷和氧化應激的積累有關。例如,自噬基因PARP1可以和HBX協同抑制DNA損傷時DNA修復基因的募集,導致損傷進而參與肝癌的發生、發展[18],這和本研究發現自噬基因PARP1在肝癌中顯著高表達一致。
更重要的是,本研究發現81個自噬基因與肝癌患者預后顯著相關。其中包括了既往已經發現的和肝癌預后顯著相關的 TSC1[19]、HDAC1[20]、PEA15[21]、SESN2[22]等基因。但仍有部分基因盡管已有研究發現其參與肝癌的發生、發展,但其能否預測肝癌患者預后仍不明確。例如FOXO1在肝癌中已有研究表明可能發揮抑制肝癌增殖和侵襲的作用[23-24],但是其能否作為肝癌的預后指標仍不明確,本研究不僅發現在肝癌組織中FOXO1顯著低表達,而且其表達較低和肝癌預后較好顯著相關。除此之外,本研究還發現了一些新的和肝癌患者預后顯著相關的自噬基因,如 RAB24、DRAM1、BNIP1、TBK1 等,這些基因仍需要進一步研究明確其在肝癌中的作用及具體機制。
在進一步的多因素Cox回歸分析中,基于4個自噬基因(HDAC1、ATIC、EIF2S1和 RAB7A)成功構建自噬基因相關的肝癌預后評估模型。該模型對肝癌患者的預后評估可獨立于肝癌患者的T分期、M分期、腫瘤臨床分期等其他臨床特征。有研究發現HDAC1可以通過調控細胞有絲分裂參與肝癌的發生、發展,并能預測肝癌患者的死亡率[25-26]。ATIC通過調節AMPK-mTOR-S6 K1信號通路促進肝癌的增殖,并與肝癌預后較差有關[27]。這和本研究結果一致,但RAB7A和EIF2S1在肝癌發生、發展中發揮的作用尚未明確,值得進一步研究。
綜上所述,本研究通過TCGA肝癌數據庫生物信息學分析確定了自噬基因在肝癌的表達水平和對肝癌患者的預后影響,發現了60個在肝癌中顯著表達差異和81個與肝癌預后顯著相關的自噬基因,這些基因在肝癌中的作用及機制仍需要進一步的實驗室研究進行驗證。除此之外,本研究構建了自噬基因相關的肝癌預后評估模型,可獨立預測肝癌患者預后,這值得在臨床肝癌患者中進一步驗證,以用于幫助臨床醫生選擇精準化的肝癌預防和治療策略。