張嘉琪 周而樂 王莎莎 許映涵 姜宜鑫 于寧
濱州醫學院附屬醫院病理科,濱州 256603
肺鱗癌是肺癌的主要亞型之一,以40%的比例僅次于肺腺癌,且與肺腺癌相比臨床預后更差[1]。隨著多基因檢測成本的逐漸降低,風險評分預測模型作為一種非侵入性技術逐漸應用于臨床,有助于疾病預后評估[2-3]。肺鱗癌同樣需要有效的預后模型,以評估患者預后。
銅是人體不可缺少的元素,在線粒體呼吸等多種生命過程中發揮著重要作用[4]。銅穩態的失衡影響著腫瘤的生長[5]。有研究發現,在乳腺癌中,靶向內質網的銅(Ⅱ)復合物可促進巨噬細胞吞噬腫瘤細胞[6]。在胰腺癌中,銅攝取的減少可以抑制癌細胞的生長[7]。銅死亡是一種由銅線粒體靶向觸發的細胞死亡方式,且高線粒體依賴性的細胞代謝形式會導致銅死亡敏感性的增加[8]。有研究證實,口服銅螯合劑具有一定的抗腫瘤作用[9]。降低或增加銅的水平可能被作為一種潛在的腫瘤療法[4]。因此,研究銅死亡在癌癥中的作用具有很大臨床應用潛力。
長鏈非編碼RNAs(long non-coding RNAs,lncRNAs)是一類轉錄本長度超過200 nt 的RNA 分子,雖然不編碼蛋白質,但lncRNAs 在調節基因表達的多個環節中發揮著重要作用[10]。研究發現,lncRNAs 在包括膀胱癌、宮頸癌、胰腺癌等多種腫瘤中存在差異性表達[11-13]。在膀胱癌中,lncRNA RMRP 可通過調節miR-206 來促進腫瘤細胞的增殖、遷移和侵襲[11]。在胃癌中,lncRNA CASC11 呈現高表達,敲低CASC11 可抑制癌細胞增殖并促進其凋亡[14]。然而,lncRNAs在肺鱗癌中的作用仍需進一步研究。
目前,腫瘤中銅死亡的機制尚未被充分研究,銅死亡相關lncRNAs 在肺鱗癌中的作用尚無定論。本研究利用生物信息學技術獲取銅死亡相關lncRNAs,并探索它們預測肺鱗癌患者預后的能力及在生物學方面的作用。
從癌癥基因組圖譜(TCGA)數據庫(https://portal.gdc.cancer.gov/)下載肺鱗癌的RNA-Seq 數據和相應的臨床數據,共包含49個正常樣本和502個肺鱗癌樣本。根據TCGA的基因注釋對RNA-Seq 數據進行預處理以區分出其中的lncRNAs。從銅死亡的相關研究中獲得銅死亡相關基因的列表[15-19]。將篩選條件設置為|R|>0.4 和P<0.001,使用R 軟件的limma 包對lncRNAs 和銅死亡相關基因表達譜進行了共表達分析,識別出潛在的銅死亡相關lncRNAs。
將肺鱗癌患者的銅死亡相關lncRNAs 數據以1∶1 隨機分為訓練組和測試組。對訓練組進行單因素Cox 分析,基于1 000 倍交叉驗證對顯著表達的lncRNAs 進行Lasso Cox回歸,最終基于多因素Cox 回歸分析確定影響預后的最佳lncRNAs。使用最佳模型參數構建特征,然后計算風險評分,P<0.05 被認為差異有統計學意義。風險評分公式:Risk score=Exp lncRNA1×β lncRNA1+Exp lncRNA2×β lncRNA2+Exp lncRNA3×β lncRNA3+……+Exp lncRNAn×β lncRNAn。
根據實驗組風險評分的中位數將患者分為高、低風險組,以確定風險特征的預后。本研究使用R 軟件的survival包計算各組肺鱗癌患者的總生存期(overall survival,OS)和無進展生存期(progression free survival,PFS),并進行單因素和多因素Cox 分析,以評估風險預測標志的獨立預后價值。使用pheatmap軟件包繪制患者生存狀態圖和基于風險評分的lncRNAs 表達熱圖。使用timeROC 包計算所有樣本組風險評分的1、3和5年的受試者工作特征曲線(ROC)、曲線下面積(AUC),并與其他臨床數據的AUC進行對比。
使用survival 和rms 包構建了年齡、性別、臨床分期、T分期、N 分期和風險評分的諾莫圖。繪制校準曲線,以顯示諾莫圖預測結果與實際結果間的差異。構建C 指數曲線用于驗證風險特征在預測肺鱗癌患者生存率方面的準確性。
使用clusterProfiler 包對銅死亡相關lncRNAs 進行基因本體論(gene ontology,GO)富集分析,P<0.05 和錯誤發現率(false discovery rate,FDR)<0.05 為差異有統計學意義。同時,以分子簽名數據庫(MSigDB)中的h(h.all.v7.2.symbols.gmt)和c2 (c2.cp.kegg.v7.4.symbols.gmt)作為參考基因集,使用GSEA4.2.3 分析高低風險組樣本間顯著富集的標志基因集、京都基因和基因組百科全書(kyoto encyclopedia of genes and genomes,KEGG)通路,每次分析中基因集排列運算1 000次,P<0.05和FDR<0.25為差異有統計學意義。
采用limma gsva包分析高、低風險組肺鱗癌患者免疫相關功能的差異,P<0.05 為差異有統計學意義。腫瘤免疫功能障礙和排斥(tumor immune dysfunction and rejection,TIDE)是一項使用TIDE評分預測患者接受免疫治療藥物療效的新算法[20]。研究發現,TIDE 評分已被證明代表免疫藥物(抗PD-1、抗CTLA-4)在黑色素瘤患者中的療效,且TIDE 評分越高,治療結果越好[20]。本研究從TIDE 官方網站(http://tide.dfci.harvard.edu/)下載了非小細胞肺癌(non-small cell lung cancer,NSCLC)的TIDE 的數據,對高低風險評分組進行TIDE 評分的計算并分析組間差異,使用CIBERSORT 包對高低風險評分組樣本進行22 種免疫細胞浸潤比例的計算并分析組間差異。
R4.2.1 軟件用于進行所有的統計分析。組間差異采用Student’st檢驗和Wilcoxon 檢驗。AUC>0.6 被認為具有良好的診斷意義。Kaplan-Meier 生存分析以Log-Rank 法檢驗。未進行特殊說明的統計結果判定均以P<0.05為差異有統計學意義。
以|R|>0.4 和P<0.001 為篩選標準,從16 773 個lncRNAs中,篩選出與19 個銅死亡相關基因存在共表達關系的291 個銅死亡相關的lncRNAs。在訓練組中,Lasso Cox 回歸分析及單因素Cox 回歸分析進一步篩選出10 個lncRNAs,并最終通過多因素Cox 分析確定了5 個lncRNAs 作為獨立的預后風險因素。然后,根據5個lncRNAs的表達量計算每個樣本的風險分數(圖1)。風險評分計算公式:Risk score=(0.254 764 388 070 179×AC087521.1)+(-0.110 239 015 304 312×AC253 536.6)+(0.111 591 602 258 198×LINC02 345)+(0.053 832 164 073 007 3×AC019 080.1)+(-0.003 288 819 819 697 88×GAS5)。

圖1 銅死亡相關長鏈非編碼RNAs(lncRNAs)的鑒定。A為Lasso回歸交叉驗證篩選銅死亡相關lncRNAs;B為Lasso回歸動態過程圖;C為森林圖顯示訓練組中影響預后的lncRNAs
為更好地評估風險評分的預后價值,以訓練組風險評分的中位數為截斷值,將患者分為高、低風險組。本研究發現,訓練、測試和所有樣本組中高風險組的OS 和FPS 均明顯短于低風險組(圖2)。風險曲線反映了肺鱗癌患者的風險評分與生存狀態之間的關系,本研究發現高風險患者的病死率高于低風險患者。熱圖顯示了lncRNAs 在高、低風險組中的表達水平,其中LINC02345 和AC087521.1 是高危的lncRNAs,而GAS5、AC019080.1 和AC253536.6 是低危的lncRNAs(圖3)。

圖2 不同分組中高、低風險肺鱗癌患者的Kaplan-Meier生存分析。A:訓練組總生存期,B:測試組總生存期,C:所有樣本組總生存期,D:所有樣本組無進展生存期

圖3 不同分組中肺鱗癌患者風險評分曲線、生存狀態分布及銅死亡相關長鏈非編碼RNAs表達熱圖。A:訓練組;B:試驗組;C:所有樣本組
進行單因素和多因素Cox 回歸分析,以確定風險特征是否有可能成為獨立于其他臨床特征的預后因素。多因素Cox 回歸分析顯示,年齡[風險比(HR)=1.024,1.005~1.044;P<0.05]和風險評分(HR=1.475,1.267~1.717;P<0.05)是影響肺鱗癌患者預后的獨立因素(圖4A、B)。此外,我們使用ROC來評估風險評分的預測準確性。所有樣品組1、3 和5 年OS 的AUC 分別為0.603、0.655 和0.620(圖4C),優于年齡(AUC為0.564)和臨床分期(AUC為0.563)(圖4D)。

圖4 預后模型風險評分的預后價值。A:單因素Cox分析;B:多因素Cox分析;C:所有樣本組風險評分的1、3和5年ROC;D:風險評分和其他臨床特征的ROC
本研究使用年齡、性別、臨床分期、T 分期、N 分期和風險分數等因素構建了諾莫圖(樣本中包含了幾例M 分期未知的樣本,因此將M 分期排除)。結果顯示,諾莫圖可有效預測LUSC 患者1、3 和5 年的OS(圖5A、B)。C 指數曲線顯示,風險評分的C指數值優于其他臨床特征(圖5C)。

圖5 預測肺鱗癌患者預后的諾莫圖、C指數曲線。A:預測肺鱗癌患者總生存期的諾莫圖;B:1年、3年和5年的諾莫圖校準曲線;C:C指數曲線
GO 分析結果顯示,銅死亡相關lncRNAs 主要富集的生物過程包括體液免疫反應、對細菌的防御反應和免疫應答分子介體的產生等過程,主要富集的細胞組分在免疫球蛋白復合體和質膜外側等部位中,主要富集的分子功能包括了抗原結合、受體配體活性和信號受體激活劑活性等功能(圖6A)。此外,GSEA 中標志基因集的富集結果顯示,主要富集的標志基因集包括炎性反應、上皮間充質轉化和補體等(圖6B)。KEGG 分析結果顯示,高風險組樣本主要富集在細胞因子相互作用及補體和凝血級聯等通路(圖6C)。值得注意的是,檸檬酸-三羧酸(TCA)循環是低風險組主要富集的通路(圖6D)。

圖6 功能富集分析。A:銅死亡相關lncRNAs 的GO 富集分析;B:高風險組標志基因集富集分析;C:高風險組KEGG 富集分析;D:低風險組富集于檸檬酸-TCA循環通路
免疫相關功能的分析結果表明,高風險組樣本中Ⅰ型和Ⅱ型干擾素(IFN)反應、MHC-I 類途徑、細胞溶解活性等多種免疫相關功能上調(圖7A)。此外,免疫治療分析顯示,高風險組的TIDE 評分顯著高于低風險組(圖7B)。CIBERSORT 分析顯示,僅漿細胞、CD8+T 細胞和中性粒細胞等6 種免疫細胞的浸潤比例在高、低風險組間存在差異(圖7C)。

圖7 高、低風險組間免疫相關分析。A:高、低風險組間免疫相關功能差異;B:高、低風險組間TIDE 評分差異;C:高、低風險組間免疫細胞浸潤比例差異
肺癌是全球發病率和病死率較高的癌癥之一[21]。目前,隨著低劑量計算機斷層掃描等篩查方式的開展,在一定程度上提高了肺癌的早期檢出率,降低了肺癌病死率,但仍然存在一定的假陽性率。因此,構建可靠的肺鱗癌風險預測模型,對于準確判斷肺鱗癌患者的預后具有重要意義。
LncRNAs 是一類長度>200 個核苷酸的RNA 轉錄物[22]。雖然這類RNAs不參與編碼蛋白質,但他們在基因功能和調控的幾乎每一個層面上都發揮著重要作用[23]。研究發現,lncRNAs 在肺鱗癌中發揮重要的調控作用。例如,lncRNA-ATB 在肺鱗癌中過表達并促進肺鱗癌的進展[24]。還有研究表明,lncRNA STARD13-AS 的過表達通過調節miR-1248/C3A 來限制肺鱗癌細胞的生長和侵襲性[25]。銅死亡是最近發現的一種獨特的細胞死亡形式[15-19]。這種銅依賴的細胞死亡是通過銅與線粒體呼吸中三羧酸循環的酰化脂類成分直接結合而發生的,可以使酰化蛋白發生聚集,隨后鐵硫蛋白減少,導致蛋白毒性并最終導致細胞死亡[26]。線粒體代謝與銅介導的這種細胞死亡方式存在著一定的相關性,因此,針對具有這種代謝特征的腫瘤進行銅離子載體相關治療,給腫瘤治療提供了新思路[15]。伊利司莫是一種有效的銅離子載體,臨床相關研究顯示其在惡性GNAQ/11-突變葡萄膜黑色素瘤的治療中發揮一定價值,但對這類藥物的作用機理仍不甚了解[27]。并且銅死亡及相關lncRNAs在肺鱗癌中的共同調節作用還需要進一步研究。
本研究通過分析銅死亡相關基因和lncRNAs 的共表達關系,獲得并篩選出銅死亡相關的lncRNAs。通過單因素和多因素Cox 回歸分析最終得到包括AC087521.1、AC253536.6、LINC02345、AC019080.1和GAS5在內的5個預后相關lncRNAs 標志物。ROC、生存分析、Cox 分析和C-index 的結果表明,由5 個銅死亡相關lncRNAs 構成的風險預后模型可以準確有效地區分高、低風險患者并預測肺鱗癌患者的預后,這些lncRNAs 是獨立于其他常見臨床特征的預后因素。有研究發現,LINC02345 是透明細胞腎細胞癌的不良預后風險因素,并參與透明細胞腎細胞癌的風險預后模型的構建[28]。這5個lncRNAs中,僅LINC02345與GAS5 在之前的癌癥相關研究中被提及。Filippova 等[29]發現,在乳腺癌中GAS5 可通過細胞死亡受體、線粒體信號通路等多種途徑導致腫瘤細胞發生凋亡。Li 等[30]發現,GAS5通過誘導炎癥小體形成,作為腫瘤抑制因子影響卵巢癌患者的預后。Ni 等[31]發現,GAS5 通過觸發YAP 磷酸化和降解來抑制結直腸癌的進展。還有研究發現,GAS5在非小細胞肺癌中通過影響EMT 過程抑制癌癥的侵襲和遷移[32]。其他3種lncRNAs在癌癥中的作用均為首次被研究。
GO 富集分析顯示,高風險組患者富集的生物過程主要集中在免疫相關過程中,細胞組分與分子功能的富集分析同樣顯示出類似的傾向。GSEA 分析中主要的富集基因集中有炎性反應基因集和補體基因集等,這些同樣與免疫功能相關。此外,KEGG 通路的富集分析結果顯示,銅死亡相關的lncRNAs 可能通過影響多種通路參與肺鱗癌的進展。TCA 循環活躍細胞擁有更高的脂酰化TCA 酶水平,進而增強了細胞對銅離子載體的敏感性[15]。鑒于檸檬酸-TCA 循環通路富集于低風險組,本研究分析銅死亡過程可能在高風險組中被抑制,并進而影響了肺鱗癌患者的預后。
在免疫相關功能分析中,本研究發現高風險組患者存在包括Ⅰ型和Ⅱ型IFN 反應、MHC-I 類途徑、細胞溶解活性在內的多種免疫相關功能的上調。Ⅰ型和Ⅱ型IFN 參與了大量調節癌癥免疫反應的機制,對腫瘤的免疫編輯至關重要[33]。先天免疫細胞在腫瘤免疫治療中起著重要作用,例如NK 細胞可以通過較強的細胞溶解活性控制腫瘤的生長和轉移擴散[34]。MHC-I 類途徑可以將內源性多肽呈遞給T淋巴細胞,進而啟動適應性免疫[35]。多種功能分析顯示,銅死亡相關lncRNAs 的表達可能在一定程度上上調肺鱗癌患者的多種免疫相關功能。不過,免疫系統對腫瘤的進展存在雙重作用[36]。TIDE 評分的結果顯示,高風險組患者可能具有更高的免疫逃逸潛能。較高的免疫逃逸潛能可能是高風險組患者免疫細胞浸潤比例沒有顯著增加并且預后較差的原因之一。同時,較高的TIDE 評分還提示高風險組患者在接受免疫治療時的療效可能更差。在未來,我們將進一步研究銅死亡相關lncRNAs 在腫瘤免疫相關功能及免疫治療等方面的作用。
鑒于本研究結果主要是基于公共數據庫的分析,缺乏臨床指標及實驗信息,因此存在著一定的局限性。未來,我們將持續關注銅死亡相關研究的進展,并爭取改進目前研究的一些限制。
本研究構建了有效的肺鱗癌銅死亡相關lncRNAs 風險預后模型,并且基于風險評分研究了不同肺鱗癌患者群體與免疫相關功能及免疫逃逸潛能的關系。本研究為預測肺鱗癌患者的生存率以及研究銅死亡相關lncRNAs 在肺鱗癌中的作用提供了新的見解。
作者貢獻聲明張嘉琪:醞釀和設計試驗,實施研究,采集數據,分析/解釋數據,起草文章,統計分析;周而樂:實施研究,采集數據;王莎莎、許映涵、姜宜鑫:實施研究;于寧:醞釀和設計試驗,對文章的知識性內容作批評性審閱,獲取研究經費,行政、技術或材料支持,指導