李占成 石 鐵 周衛忠
膠質瘤是最常見的惡性原發性中樞神經系統腫瘤,預后較差[1],其中膠質母細胞瘤(glioblastoma multiforme,GBM)預后最差,中位總生存期在15~23個月,5年生存率低于6%[2]。
研究表明,細胞自噬在神經退行性疾病、衰老和腫瘤發病過程中具有重要作用[3]。近年來,有學者試圖通過調控細胞自噬尋找膠質瘤新的潛在治療靶點[4]。研究發現,長鏈非編碼RNA(long non-coding RNA,lncRNA)具有廣泛的生物學功能[5],例如調控細胞自噬相關蛋白的表達[6]。本文利用生物信息學方法分析膠質瘤細胞自噬相關lncRNA的表達網絡,為膠質瘤的診治提供參考。
1.1 膠質瘤數據集的獲取 基因組圖譜(CGGA,http://www.cgga.org.cn/)微陣列被用作訓練集,以建立膠質瘤的自噬相關lncRNA 特征,共納入325例膠質瘤病人CGGA mRNA 以及相關的臨床數據。從癌癥基因組圖譜(TCGA,https://cancergenome.nih.gov/)網站下載病人的臨床信息,用于驗證風險評分。TCGA數據集納入160例GBM病人的驗證數據集。
1.2 lncRNA 和自噬基因的篩選 從CGGA mRNAseq數據集獲得lncRNA 和自噬基因的譜。自噬基因列表來自人類自噬數據庫(HADb,http://autophagy.lu/clustering/index.html)。所有mRNA 表達數據通過log2 轉換進行標準化。應用Pearson 相關性計算lncRNA 與自噬相關基因的相關性。相關系數|R2|>0.3的lncRNA被認為是自噬相關lncRNA。
1.3 膠質瘤病人預后影響因素分析 采用單變量和多變量Cox 回歸分析評估自噬相關lncRNA 與膠質瘤病人預后的關系。將單變量分析P<0.01 的lncRNA納入多變量Cox回歸分析,根據結果以確定風險評分=基因1×基因1的表達量+基因2×基因2的表達量+...+基因N×基因N 的表達量。將膠質瘤病人根據中位風險評分分為高風險組和低風險組。
2.1 自噬相關lncRNA 共表達網絡的構建CGGA 數據集共鑒定878 個lncRNA,HADb 數據庫共篩選出215個自噬相關基因。構建一個自噬相關lncRNA共表達網絡,識別自噬相關lncRNA,最后,篩選出402個lncRNA。
2.2 膠質瘤自噬相關lncRNA 的特征 根據自噬相關lncRNA共表達網絡中402個自噬相關lncRNA,利用CGGA 數據集325 例膠質瘤病人,Cox 回歸分析顯示10 個自噬相關lncRNA 是膠質瘤病人預后的獨立影響因素,其中5 個lncRNA 是危險因素(TP53TG1、
ZNF674- AS1、COX10- AS1、DDX11- AS1、SBF2-AS1),5 個是預后保護因素(PCBP1-AS1、DHRS4-AS1、 GABPB1- AS1、 MAPKAPK5- AS1、MIR4453HG)。見表1、2。

表1 膠質瘤自噬相關lncRNA

表2 膠質瘤自噬相關lncRNA 與膠質瘤病人生存預后的多因素Cox回歸分析
2.3 自噬相關lncRNA 與膠質瘤預后的關系 根據中位風險評分將膠質瘤病人分為低風險組和高風險組。多因素Cox 回歸分析顯示,風險評分是膠質瘤預后獨立影響因素(P<0.05,表3)。生存曲線分析顯示低風險組中位生存時間(1 211 d)較高風險組(346 d)明顯延長(P<0.05;圖1)。

圖1 生存曲線分析CGGA數據庫膠質瘤病人生存期與風險評分的關系

表3 膠質瘤病人生存預后影響因素的多因素Cox回歸分析
2.4 TCGA 數據集驗證結果 共納入160 例GBM,根據風險評分中值分為高危組和低危組。多因素Cox回歸分析顯示,風險評分是膠質瘤預后獨立影響因素,生存曲線分析顯示低風險組中位生存時間(468 d)較高風險組(385 d)明顯延長(P<0.05;圖2)。

圖2 生存曲線分析TCGA 數據庫膠質母細胞瘤病人生存期與風險評分的關系
隨著膠質瘤診療技術的進步,很多預后影響因素得到證實,包括腫瘤切除程度、腫瘤分級等。目前,高通量測序技術被廣泛地用于檢測miRNA或基因的改變,可以很好地預測腫瘤復發和腫瘤轉移[7]。lncRNA作為基因或miRNA的補充,為預測膠質瘤復發的風險提供了新的的靶標[18]。目前,自噬在腫瘤治療中的作用知之甚少。最近的研究表明,調節自噬將成為膠質瘤治療的新方法[19,20]。本文利用兩個數據集(CGGA 和TCGA)分析自噬相關lncRNA 與膠質瘤預后的關系,首先篩選出402 個自噬相關lncRNA;然后,Cox 回歸分析顯示10 個自噬相關lncRNA 與膠質瘤病人預后有關;再根據lncRNA 的中位風險評分將膠質瘤病人分為高風險和低風險組,生存曲線分析發現低風險組中位生存時間較高風險組明顯延長。
總之,我們應用生信分析方法篩選出10個與膠質瘤自噬相關的lncRNA,與膠質瘤病人預后密切相關。