于麗華 王宏 秦麗 王偉娜 崔東燕 趙書平★
中國人群的肺癌發病率以及死亡率也呈逐年升高的趨勢,肺腺癌(Lung adenocarcinoma,LUAD)在我國最為常見[1]。早期LUAD 患者尚有手術機會,而晚期患者,往往只能采用靶向治療、放化療、免疫治療等以延長生存時間[2]。盡管如此,遠處轉移和耐藥問題依舊是患者不良預后的主要原因[3]。所以,進一步尋找可用于預測LUAD 患者的預后和死亡風險的腫瘤標志物,仍然是目前首要任務。磷酸肌醇3-激酶(Phosphoinositide 3-kinase,PI3K)信號下游包含多條信號通路,參與調節各類細胞生理過程。此外,眾多研究發現PI3K 通路在腫瘤的發生發展中也發揮著重要的作用[4]。例如,Heavey 等人發現非小細胞肺癌的侵襲和轉移與PI3K/蛋白激酶B(Protein kinase B,Akt)/哺乳動物雷帕霉素靶蛋白(Mammalian target of rapamycin,mTOR)通路的異常激活與密切相關[5]。雖然PI3K 通路被證明與腫瘤相關,但可否采用PI3K 下游基因構建預后預測模型,用于腫瘤復發預測仍是盲點。本研究通過分析公共數據庫表達譜數據,利用單因素和多因素Cox 回歸分析構建了一項基于PI3K 通路相關基因的預后預測模型。
通過系統檢索PI3K 通路下游基因列表,并從The Cancer Genome Atlas(TCGA)數據庫中提取相應基因的表達譜數據(數據下載于2020年10月1日),及相應患者的臨床信息[主要包括總體生存率(Overall survival,OS)、生存狀態(Survival status)、年齡(Age)、性別(Gender)、腫瘤分期(Tumor stage,T 分期)等,共包括497 例LUAD 病例和54 例對照。
應用R 統計軟件中的“limma”軟件包對數據進行差異分析,與PI3K 通路下游基因列表取交集,以log2FoldChange≥2 或≤-2,校正P-value <0.05 為條件,同時對差異基因進行富集分析。
研究首先采用單因素Cox 回歸分析關聯差異表達的PI3K 通路基因與OS,并提取多因素Cox 回歸分析中各基因的系數用于預后模型的構建,公式=(0.189 042 561×F2RL1 表達值)+(0.159 601 144×TWIST 表達值)-(0.289 521 135×FGR 的表達值)-(0.223 936 656×KLF4 表達值)+(0.250 520 925×CEP55 表達值),基于中位風險值,將患者分為高、低風險兩個亞組。
計數資料以n(%)表示,行χ2檢驗;利用Kaplan-Meier(K-M)和log-rank 分析檢驗模型中高、低危組的生存狀態差異;繪制受試者工作特征(ROC)曲線,計算曲線下面積(AUC),檢驗模型準確性;采用多因素Cox 回歸分析探究該模型預測LUAD 患者預后是否受其他因素影響。以P<0.05為差異有統計學意義。
分析共納入出154 個PI3K 通路相關基因,分析共篩選出34 個差異表達的PI3K 通路基因。對獲取的差異基因進行富集分析,結果顯示這些基因多富集于PI3K 等信號通路。見表1、圖1。

圖1 差異表達基因的富集分析Figure 1 The enrichment analyses of the differentially expressed genes

表1 差異表達PI3K 通路相關基因Table 1 The differentially expressed PI3K pathway-related genes
將有配對臨床資料的LUAD 樣本與差異表達基因相結合,剔除表達量較低或對結果影響較大的樣本,最終納入436 例患者表達譜數據進一步行單因素Cox 回歸分析,結果顯示有11 個基因與OS 相關,差異有統計學意義(P<0.05)。將11 個基因納入多因素Cox 回歸分析,篩選出5 個基因用于建模(F2RL1、TWIST、FGR、KLF4 和CEP55),差異有統計學意義(P<0.05)。其中,KLF4、CEP55、F2RL1和TWIST為高風險基因,FGR為保護性基因。見圖2、表2。

表2 436 例LUAD 患者的臨床病理特征[n(%)]Table 2 The clinicopathological features of the enrolled 436 LUAD cases[n(%)]

圖2 單因素Cox 回歸分析結果Figure 2 The results of univariate Cox regression analysis
患者中位風險評分為0.963 667,以此為依據將患者分為低風險(218 人)和高風險組(218 人)。結果顯示,患者生存時間隨著風險評分升高逐漸縮短(圖3A),且死亡人數(圖3B)則呈上升趨勢;圖3C 可見模型中KLF4、CEP55、F2RL1和TWIST的表達在高危組患者中明顯增高,FGR的表達在低危組患者中明顯增高;K-M 分析結果顯示,風險評分與患者不良預后呈顯著正相關(圖3D);ROC曲線分析結果發現預測模型的預測價值最高(圖3E,AUC=0.735)。見圖3。

圖3 建模基因分布與模型準確性評估Figure 3 Modeling gene distribution and evaluation of model accuracy
單因素Cox 回歸分析表明LUAD 患者的T 分期、N 分期、臨床分期、風險評分與OS 相關(P<0.05);多因素Cox 回歸分析表明預測模型可作為患者OS 評估的獨立預測因子(P<0.05);T 分期、N 分期對患者預后的預測是獨立的(P<0.05)。見表3、表4。

表3 單因素Cox 回歸分析Table 3 Cox regression analyses of univariate

表4 多因素Cox 回歸分析Table 4 Multivariate Cox regression analysis
使用R 軟件的“beeswarm”分析參與模型構建的基因與臨床病理特征之間的關系,結果顯示,CEP55與患者年齡(P=0.006)、生存狀態(P=0.005)、性別(P=0.007)、N 分期(P=4.128e-04)、stage 顯著相關(P=0.003),F2RL1 與患者年齡(P=0.005)、生存狀態(P=0.018)顯著相關,FGR 與患者生存狀態(P=0.006)、T 分期(P=0.021)、stage(P=0.038)顯著相關,見圖4。

圖4 建模基因與臨床參數的關系Figure 4 The correlation between modeling genes and clinicopathological factors
近年來,大量研究證實LUAD 的發生和進展與PI3K 信號通路密切相關,但有關該通路基因是否可作為LUAD 患者預后評估標志物的研究尚處于初步階段。本研究分析了PI3K 通路基因與LUAD 患者預后的關系,篩選出了能夠獨立預測LUAD 患者預后的關鍵基因,并以此為依據構建了預后預測模型,系列分析證實了該預測模型的預測能力。同時,多因素Cox 回歸分析揭示該模型對LUAD 患者的預后評估作用不受其它臨床病理參數的干擾。
當前模型共納入5 個PI3K 通路相關基因。F2RL1基因位于5 號染色體上,其編碼蛋白PAR2是一種G 蛋白偶聯受體,可以啟動多種細胞內信號轉導。在慢性粒細胞白血病中,PAR2 的高表達預示著患者預后不良。研究發現,PAR2 可上調BclL12 表達,而Bcl2L12 可通過抑制Mdm2 與p53蛋白啟動子結合,抑制p53 的轉錄活性,減少肺癌細胞凋亡進程[6]。研究還發現,F2RL1 與吉非替尼耐藥密切相關。抑制PAR2 表達,可以阻斷ERK通路磷酸化及上皮-間質轉化,上調吉非替尼治療敏感性[7]。TWIST 最早在果蠅中被發現調節胚胎中胚層分化和肌細胞形成,現在更多關注的是其在上皮間充質轉化和腫瘤侵襲中的作用。研究發現,Twist 在肺癌組織中較癌旁組織顯著高表達,且Twist 表達與肺腫瘤的分化程度密切有關。肺腺癌細胞系高表達Twist 后,上皮細胞呈梭形、紡錘體改變;此外,高表達該基因的肺腺癌細胞侵襲和遷移能力顯著增強,但增殖能力相對減弱[8]。不僅如此,過表達TWIST 可抑制E-鈣蛋白和β-連環蛋白的表達,同時增強AKT2 蛋白活性,促進腫瘤的侵襲和轉移[9]。KLF4基因含有KLF 超家族的鋅指蛋白結構,參與真核細胞轉錄調控作用。據報道,KLF4基因在乳腺癌中高表達可促進腫瘤增殖[10],但卻在胃癌、前列腺癌等腫瘤中起到抑瘤作用[11]。研究還發現KLF4 在肺癌組織中較癌旁組織表達降低,過表達KLF4 能夠顯著抑制肺癌細胞增殖,引起細胞G1 期阻滯;機制研究發現,KLF4可通過激活p21 和抑制cyclin D1 表達來抑制腫瘤進展,同時其還與Sp1 競爭結合cyclin D1,進而抑制cyclin D1 表達,發揮腫瘤抑制作用[12]。CEP55位于染色體10q23.33 內,是一個55 kDa 的中心體蛋白,在大多數腫瘤中可檢測到CEP55 的異常高表達。Jiang 等人[13]發現CEP55 在非小細胞肺癌腫瘤組織中表達顯著上調,且與患者預后不良顯著相關。Liu 等人[14]也發現,沉默CEP55 表達可顯著抑制肺癌細胞增殖和促進腫瘤細胞凋亡;沉默CEP55 可顯著降低肺癌細胞中CDK4、p21 和Bcl-2表達,上調凋亡前蛋白、Bad、caspase-3 和PARP 的表達,這提示CEP55 可作為肺癌治療的潛在作用靶點。綜上,這些結果更加提示了這些預后相關基因在肺癌發生和進展過程中的關鍵作用。
綜上,本研究通過系統分析構建了一項由5 個PI3K 通路基因組成的LUAD 患者預后預測模型。經過分析與驗證,充分說明該預后模型預測效率以及準確率較高,能夠有效指導患者預后的預測,協助制定更為精準的治療方案。