鄭雪瑩,包博文,盧文卿,王一喆,劉云鵬,車曉芳
中國醫科大學附屬第一醫院 遼寧省腫瘤藥物與生物治療重點實驗室 遼寧省惡性腫瘤臨床醫學研究中心,沈陽110001
近年來,隨著腫瘤規范化診療水平的巨大進步,早期胃癌患者的預后已得到顯著改善,但我國晚期胃癌患者5年生存率仍很低,僅約為5%[1]。為準確預測患者預后、制定合理治療方案,迫切需要建立有效的胃癌預后評估模型。然而,傳統基于病理分期、分型等的胃癌預后模型準確性有限。因此,探索有效的分子標志物并構建預后模型具有重要意義。碘甲狀腺素脫碘酶(DIO)家族是一類含硒蛋白酶,由DIO1、DIO2、DIO3構成,主要作用是催化甲狀腺激素(TH)活化(DIO1、DIO2)或失活(DIO3)。眾所周知,TH是關鍵細胞過程的重要調節劑,參與細胞增殖、分化、凋亡和代謝等,TH信號傳導異常與腫瘤形成息息相關,而TH在外周組織中的表達通過DIO的活性來調節。因此,DIO家族在腫瘤發生發展中的作用已逐漸引起關注[2]。現有研究顯示,DIO家族成員在多種腫瘤中高表達,在不同腫瘤中可能發揮著不同的作用[3~10]。最近一項數據分析表明,DIO家族成員是胃癌預后的危險因素[11]。然而,目前尚無利用大樣本在線數據,通過生物信息學分析DIO家族在腫瘤預后中的作用及其可能機制。2019年11月~2020年6月,我們利用基因表達匯編(GEO)數據集,運用Cox回歸分析篩選出DIO家族中影響胃癌患者生存的獨立預后因素,由此計算出風險評分RS1,并利用基因集富集分析(GSEA)探索高RS1可能富集的通路,最終利用RS1和其他獨立預后因素構建預后預測列線圖。現報告如下。
1.1 數據資料收集 在美國國家生物技術信息中心(NCBI)的GEO數據庫(http://www.ncbi.nlm.nih.gov/geo)中下載胃癌樣本數據集GSE62254,選取其中臨床病理學參數及生存資料完整的病例,最終得到283例。
1.2 DIO家族在胃癌預后中的價值評估 利用Cox單因素分析、多因素分析篩選出DIO家族中的胃癌獨立預后因素,計算風險評分(RS)。RS1=β1×exp DIOX1+β2×exp DIOX2+…+βn×exp DIOXn,其中β表示偏回歸系數,exp DIOXn表示DIOn基因表達量,計算每個樣本的RS1。分別以基因表達量/RS1作為自變量、生存狀態作為因變量繪制ROC曲線,計算約登指數及ROC曲線下面積(AUC),選取約登指數最大時的最佳截斷值。根據最佳截斷值將樣本進行二分類,低于該值的樣本為低表達組,高于該值的樣本為高表達組,然后采用Kaplan-Meier法進行生存分析。
1.3 DIO家族RS1在不同胃癌臨床病理學參數患者中的比較 利用χ2檢驗及Fisher確切概率法比較RS1在胃癌患者不同性別、年齡、浸潤深度(T分期)、淋巴結轉移(N分期)、遠端轉移(M分期)及Lauren分型等臨床病理學參數中的差異。
1.4 與高RS1可能相關的信號通路分析 采用GSEA3.0軟件進行基因富集分析。按照上述方法將樣本分為高RS1組和低RS1組,從GSEA網站MsigDB數據庫中獲得c2.cp.kegg.v6.2.symbols.gmt數據集,使用默認加權富集統計的方法進行分析,將隨機組合次數設定為1 000次。
1.5 胃癌獨立預后因素篩選及基于RS1的預后預測列線圖建立 利用Cox單因素及多因素分析篩選出胃癌獨立預后因素,并構建基于RS1的預后預測列線圖,用于預測胃癌患者1年、3年及5年總生存率。通過每一變量分類對應小標尺上的數值得出每項的分值,并將它們相加得到總分值,總分值向下投射則得到該患者的1年、3年及5年生存率。
1.6 統計學方法 采用SPSS16.0軟件進行統計學分析,使用Graphpad Prism 8.0進行生存曲線及ROC曲線繪制。回歸分析采用Cox比例風險回歸法,并對Cox單因素分析中預后影響因素進行多因素分析。生存分析采用Kaplan-Meier及Log-Rank檢驗法,相關性分析運用χ2檢驗和Fisher確切概率法。GSEA所得基因集以P<0.05且錯誤發現率(FDR)<0.25為顯著富集基因集。采用R3.3軟件中的RMS包(http://www.r-project.org/)進行列線圖的構建。
2.1 DIO家族在胃癌患者預后中的意義 單因素分析的結果顯示DIO2和DIO3為影響胃癌患者預后的因素,多因素分析結果提示二者均為獨立預后因素(表1)。按DIO2最佳截斷值7.665(AUC=0.594,95%CI0.518~0.660,約登指數最大值0.164)、DIO3最佳截斷值5.784(AUC=0.556,95%CI0.488~0.623,約登指數最大值0.168)分別將樣本分為高、低表達兩組,結果DIO2和DIO3高表達組患者總生存期(OS)分別為28.25、31.1個月,均短于低表達組的60.2、61.07個月(P均=0.002)。
2.2 DIO家族RS1在胃癌患者預后中的意義 按RS1最佳截斷值4.87(AUC=0.623,95%CI0.558~0.688,約登指數最大值0.2)將樣本分為高RS1組及低RS1組,高RS1組OS(30.95個月)短于低RS1組(77.2個月)患者(P<0.001)。見圖1。

表1 胃癌患者關于DIO家族的單因素和多因素回歸分析結果

注:A為ROC曲線;B為Kaplan-Meier生存曲線。
2.3 不同臨床病理學參數胃癌患者RS1比較 M1期、Lauren分型彌漫型胃癌患者高RS1比例分別高于M0期及腸型、混合型(P均<0.05),而不同性別、年齡、T分期、N分期胃癌患者RS1差異無統計學意義。見表2。

表2 不同臨床病理學參數胃癌患者RS1比較[例(%)]
2.4 RS1的基因富集分析結果 GSEA分析結果顯示,高RS1組富集到黏著斑(P<0.001, FDR=0.038)、鈣信號通路(P<0.001,FDR=0.061)、縫隙連接(P<0.001, FDR=0.043)和細胞外基質(P=0.008,FDR=0.083)等轉移相關通路,提示高RS1與這些通路密切相關。
2.5 胃癌獨立預后因素篩選結果及基于RS1的胃癌預后預測模型 單因素分析顯示,高RS1、浸潤更深(T3~4)、淋巴結轉移(N1)、遠處轉移(M1)及彌漫型是影響胃癌患者預后的危險因素;多因素分析結果顯示,高RS1、浸潤更深(T3~4)、淋巴結轉移(N1)、遠處轉移(M1)是影響胃癌患者預后的獨立危險因素(P均<0.01)。見表3。依據赤池信息量準則,將4個胃癌預后的獨立危險因素納入并構建了預后預測列線圖模型。如圖2所示,C-index=0.717(95%CI0.668~0.752),采用Bootstrap內部檢驗1 000次,預測值與實際值的r2為0.246 1,說明此模型具備良好的擬合度。根據列線圖,高RS1及T分期、N分期、M分期較晚的胃癌患者,其對應評分增加,生存率降低。

表3 胃癌患者基于RS1和臨床病理學特征的單因素和多因素回歸分析結果

圖2 胃癌患者1年、3年及5年總體生存率預測列線圖
在本研究中,我們利用GEO胃癌數據庫中的GSE62254數據集分析了DIO家族在胃癌預后中的作用,發現DIO2、DIO3為影響胃癌預后的獨立因素;計算基于DIO家族的胃癌預后風險評分RS1,并利用GSEA分析高RS1導致預后不良的可能相關信號通路;最后,構建了包含RS1和臨床病理學參數的預后預測列線圖模型。
DIO家族是催化TH活化或失活的一類脫碘酶。TH對于正常的身體發育和細胞分化至關重要,TH信號通過特定的TH受體(TR)和位于質膜的受體介導,TR以配體依賴性方式直接調節靶基因的表達。TR結合的配體是三碘甲腺氨酸(T3),其主要成分通過從四碘甲丙氨酸(T4)中選擇性脫碘而合成,這種脫碘過程則由DIO家族催化。其中,DIO1與DIO2通過T4的5′脫碘催化T3的合成,故為TH活化酶;而DIO3則通過5′脫碘導致T3的失活,因此催化TH的失活。脫碘酶對細胞內TH濃度起主要的代謝控制作用,從而調節組織特異性TH生物利用度[2,12]。近年來,越來越多的證據表明DIO家族在腫瘤中發揮著重要作用。在腎透明細胞癌及肺癌等腫瘤組織中DIO1活性下降,而在乳腺癌組織中DIO1活性增強[3]。因此,DIO1表達在癌組織中的整體作用仍然不夠明確。Kojima等[6]研究發現,在原發性直腸腫瘤組織中DIO2表達較正常組織上調,并能促進腸道腫瘤細胞增殖;最終表明,腫瘤微環境中DIO2通過調節TH信號促進腸道腫瘤發展,揭示了DIO2作為治療靶標的潛在意義。Mariani等[7]通過對卵巢癌原發腫瘤及其腸轉移瘤進行RNA測序發現,DIO2在卵巢癌患者腸轉移中過表達。DIO3在腫瘤中作用研究的最為廣泛,因其在胚胎發育和癌癥中高表達而被定義為“釘螺”蛋白。已有研究發現,DIO3在多種惡性腫瘤組織中高表達,且其表達水平與腫瘤大小、轉移呈正相關[8,9];在良性腺瘤和結腸癌中,DIO3表達高于正常組織,但與病變的組織學分級呈負相關,表明DIO3可能與結腸癌的發生關系密切[10]。但值得注意的是,Mishra等[11]利用“The Kaplan-Meier plotter”在線數據庫進行數據分析的結果提示,DIO1、DIO2、DIO3 mRNA表達增加均與胃癌患者的OS縮短顯著相關。然而,當分別對不同Lauren分型進行生存分析時發現,DIO1為腸型患者的預后危險因素,卻未能對彌漫型患者的預后產生影響;而DIO2僅為彌漫型患者的預后危險因素;DIO3在腸型和彌漫型患者中均顯示出高表達預后差的趨勢。這與我們在利用Cox單因素和多因素分析DIO家族成員對胃癌預后影響的研究結果不完全一致,可能是由于二者數據來源不同及胃癌的高度異質性所致,今后我們還需采用更大的樣本量、采用多種方法進行驗證。
盡管已有研究證實,DIO家族成員可參與多種腫瘤的發展過程,但其具體作用機制尚不十分清楚。我們的結果提示,高RS1與遠處轉移顯著相關,且GSEA富集分析揭示了高RS1可能通過調控黏著斑、鈣信號通路、縫隙連接、細胞外基質等信號通路促進遠處轉移。腫瘤細胞轉移是一個復雜的多步驟、多功能生物學事件,而這些級聯事件中涉及了諸多分子及信號通路[12,13]。既往研究表明,黏著斑通路、鈣信號通路、縫隙連接、細胞外基質通路均與腫瘤細胞的侵襲和轉移密切相關[14]。這與本研究GSEA分析結果相一致,提示DIO家族可能通過影響胃癌細胞生物學行為促進遠處轉移,最終影響患者生存。
目前,在腫瘤的預后預測研究中,基于回歸模型構建列線圖已被廣泛應用。不同于傳統的病理學分期,列線圖所呈現的簡潔直觀的數字界面使預后評估更高效準確,并且對臨床決策的實施具有指導意義,有利于與患者的溝通。在胃癌、肺癌、乳腺癌、結腸癌、食管癌等多種腫瘤中,列線圖均展示了其在預后預測方面的優勢[15~19]。然而,目前列線圖在胃癌中的研究大多數納入的僅僅是臨床病理學參數,或用于術后復發或轉移部位的風險評估[20]。本研究首先利用COX回歸計算出基于DIO家族的風險評分RS1,將包括病理學參數在內的影響胃癌預后的獨立因素納入至列線圖的構建中,建立了基于DIO家族的胃癌預后預測列線圖模型;并且,通過該模型可簡單迅速地得到相應的1年、3年和5年生存率,極大提高了臨床工作中個體化精準治療的效率。
本研究以GEO胃癌數據庫為基礎進行數據分析,樣本量較大且臨床資料客觀完整,并創新性地建立了基于DIO家族在胃癌中的預后預測模型,具有較強的說服力和臨床意義。然而,本研究也存在一定的局限性。首先,GEO數據庫是基于二代測序或高通量芯片的mRNA數據,可能無法完全真實地代表DIO各成員的蛋白表達水平;其次,數據庫中缺乏腫瘤位置、驅動基因狀態等影響胃癌預后的重要因素,并且缺乏內部和外部驗證。因此,在下一步工作中,我們計劃收集大樣本的胃癌患者標本,利用實時熒光定量PCR和免疫組化檢測DIO1、DIO2及DIO3的mRNA和蛋白表達情況,并利用細胞實驗和動物實驗對GSEA富集到的通路加以驗證,深入探討DIO家族在胃癌中的相關機制,同時對預后預測列線圖模型加以補充和完善,以期該模型能夠真正實現胃癌的精準預后預測,有效指導臨床決策。