唐勇 劉海洲陳曦吳健勇劉螢照 楊林凱 王琪
微小 RNA(microRNAs,miRNAs)大約由 20 個內源性非編碼RNA組成,真核生物miRNAs通過與mRNA結合調節基因表達[1]。近年來,研究證實miRNA在腫瘤發生和發展過程中起重要作用,可作為腫瘤診斷標志物及治療的分子靶點[2-3]。其中,miR-200家族被發現可負調控下游E-Cadherin相關轉錄抑制因子ZEB1和ZEB2而調節上皮細胞間質轉換(epithelial-mesenchymal transition,EMT)過程,可能抑制腫瘤轉移[4],因而將其定義為一種潛在的治療藥物[5]。然而,研究者亦發現miR-200家族在不同類型癌癥中顯示出抑制或促進轉移的相互矛盾作用,miR-200家族表達與腫瘤預后的關系也存在截然相反的報道[6]。miR-141、miR-200b和miR-200c被認為是影響原發性腎透明細胞癌(clear cell renal cell carcinoma,ccRCC)的獨立預后標志物[7]。過表達miR-200可抑制肺癌遠處轉移[8],但也可增強乳腺癌模型轉移[9]。另有研究發現,miR-200家族對不同腫瘤的調控機制具有差異性[10]。因此,發現和解釋miR-200家族的驅動生物學差異,將對基于miR-200家族的個體化治療具有重要意義。
miR-200 家 族 共 包 括 miR-429、miR-200a、miR-200b、miR-200c和 miR-141等 5個 miRNAs分子。miR-200a、miR-200b、miR-429 具有相同的核心序列“AAUACU”,而miR-200c、miR-141核心序列為“AACACU”。miR-200家族因具有序列保守性,被認為存在相同的靶基因,并參與相似的生理調控功能,有助于分析其潛在調控機制。本研究利用癌癥基因圖譜(the Cancer GenomeAtlas,TCGA)收錄的PanCanAtlas轉錄組數據,根據miR-200家族表達與患者預后的關系,對21種腫瘤進行分子分型,探討miR-200家族調控腫瘤異質性的機制。
研究對象來自TCGA分析工作組(AWGs)定義的泛癌(Pan-Cancer)樣本,選擇21種不同組織病理學的惡性實體腫瘤類型共7 642例樣本進行分析。從PanCanAtlas項目網站(https://gdc.cancer.gov/aboutdata/publications/pancanatlas)分別下載患者的臨床特征數據 TCGA Clinical Data Resource(TCGA-CDR)Outcome,miRNA轉錄組數據 pancanMiRs_EBadjOn-ProtocolPlatformWithoutRepsWithUnCorr--ectMiRs_08_04_16.csv和RNA-seq數據EBPlusPlusAdjustPANCAN_IlluminaHi-Seq_RNASeqV2.geneExp.tsv。
組織芯片(tissue microarray,TMA)制作選擇廣西醫科大學附屬腫瘤醫院2009年5月至2014年12月的膀胱癌手術組織蠟塊,所有標本均經臨床及病理確診,具有完整的臨床及病理學資料。共納入100例膀胱癌患者,平均年齡(64.13±9.57)歲,pTNM 分期T0期3例,T1~T2期 45例,T3~T4期 52例;肌層浸潤88例。
TCGA臨床終點統計根據PanCanAtlas生存工作組新開發的TCGA泛癌臨床標準化數據集(TCGA Pan-Cancer Clinical Data Resource,TCGA-CDR[11]),以臨床確診至因任何原因引起死亡的時間為總生存期(overall survival,OS),每種腫瘤取 5個 miRNA 表達值。根據miRNA值中位數,將患者劃分為高表達組和低表達組,并比較生存情況。
采用Mirwalk3在線網站(http://mirwalk.umm.uniheidelberg.de/search_mirnas/)對miR-200家族靶標基因進行預測分析,預測miRNA靶向結合3'非翻譯區(untranslated region,UTR)或蛋白質編碼區域(coding sequence,CDS)的 mRNA,以 Targetscan 和 miRDB 數據庫均預測到的基因作為miR-200家族靶標基因合集。
選擇PanCanAtlas項目中膀胱癌、胃腺癌、腎乳頭狀細胞癌、肝細胞癌、胸腺瘤的RNA-seq數據,提取miR-200家族靶標基因集合的表達值。miR-200家族表達值作為輸入表型,運行加權基因共表達網絡分析(weighted correlation network analysis,WGCNA)R 語言包,假定基因網絡服從無尺度分布,不同節點的相異系數大于0.8,找出miR-200關聯性最高和協同表達的基因模塊,模塊內基因與輸入表型相關系數≥0.2或≤-0.2視為顯著互作。采用cystoscape中的cytohubba插件計算該模塊中最核心的5個基因作為單個miRNA調控信號通路。
膀胱癌TMA為本實驗室自制,以辣根過氧化物酶顯色的免疫組織化學法檢測芯片金屬蛋白酶抑制劑 2(TIMP metallopeptidase inhibitor 2,TIMP2)的表達。結果由2位病理醫師采取雙盲法判定,評分不一致的切片取均值。綜合每張切片的染色強度和陽性細胞數量進行判定。根據切片組織中細胞顯色深淺分為5個評分等級:無顯色記為0分,淡黃色記為1分,黃色記為2分,棕色記為3分,棕褐色記為4分。陽性細胞占同類細胞數的百分比評分:無陽性細胞記為0分,≤5%記為1分,6%~25%記為 2分,26%~50%記為3分,51%~75%記為4分,>75%記為5分。以上述2項的乘積為最終總積分。根據TIMP2值中位數,將患者劃分為高表達組和低表達組,并比較生存情況。
選取制作TMA的膀胱癌石蠟標本提取RNA,按照Qiagen公司的miScriptII Reverse Transcription Kit試劑盒說明書進行總miRNA的cDNA合成,熒光定量PCR反應體系的下游引物使用miScript SYBR Green PCR Kit試劑盒中提供的通用引物,上游引物由英濰捷基(廣州)貿易有限公司合成。以人U6 snRNA為內參,采用相對定量法檢測miR-200家族成員在膀胱癌組織的表達,以 ΔCt表示 miRNA表達量,ΔCt=[目的miRNA的Ct值(樣本組)-U6的Ct值(樣本組)]。
采用R Studio(版本號3.6.1)進行統計學處理。采用pearson相關系數分析miR-200家族表達水平與TIMP2蛋白表達的線性關系,生存率計算采用Kaplan-Meier法,Log-rank法比較生存差異,擬合Cox比例風險模型進行生存比較,計算預測因子的風險比率(hazard ratio,HR)及 95%可信區間(confidence interval,CI),HR<1為保護因素,反之為危險因素。以P<0.05為差異有統計學意義。
利用PanCanAtlas數據分析21種實體腫瘤的總生存時間,繪制生存比較森林圖,結果顯示,miR-429、miR-200a、miR-200b、miR-200c和 miR-141等 5個miRNAs分子與不同腫瘤生存時間顯著相關。miR-200家族高表達是膀胱癌(HR=0.55~0.68,P=0.0001~0.0340)和胃腺癌(HR=0.61~0.72,P=0.0055~0.0170)預后的保護因素。但是高表達miR-200家族的肝細胞癌(HR=1.46~1.65,P=0.0061~0.0120)和胸腺瘤(HR=7.44~13.04,P=0.0002~0.0210)患者總生存時間明顯較低表達組短。具有相同核心序列的miR-200家族成員(miR-200a、miR-200b、miR-429)高表達可顯著提高腎乳頭狀細胞癌患者OS(HR=0.23~0.28,P<0.0001),而 miR-141和miR-200c高表達組是患者OS的危險因素(HR=2.53~2.90,P=0.0004~0.0016),圖 1。
Mirwalk3在線網站預測miR-200家族靶向結合的mRNA,Targetscan和miRDB數據庫均預測到的基因共有356個,以此作為miR-200家族靶標基因合集。根據miR-200家族對腫瘤生存的影響,選取其與生存呈正相關的膀胱癌和胃腺癌、與生存呈負相關的肝細胞癌和胸腺瘤以及相關性不同的腎乳頭狀細胞癌進行miRNA靶標基因的腫瘤間異質性分析。WGCNA聚類結果顯示,miR-200家族與5種腫瘤的相關模塊基因均不一致,存在明顯的腫瘤間異質性,其中膀胱癌、腎乳頭狀細胞癌和胸腺瘤可富集到顯著相關模塊,肝細胞癌和胃腺癌無相關性。
膀胱癌中,miR-200家族富集到1個負顯著相關mRNA模塊(圖2A),包括7個靶基因(圖2B),其中TIMP2、SULF1基因與miR-200家族表達顯著相關(圖2C)。利用TCGA的RNA-seq數據分析,結果顯示TIMP2基因高表達是膀胱癌患者總生存時間的危險因素(HR=1.55,95%CI:1.16~2.08,P=0.0031,圖 2D)。
在腎乳頭狀細胞癌中,miR-141和miR-429富集到1個共同的靶基因模塊(圖3A),miR-141對模塊中包括EPHA2在內的8個基因顯示出明顯負相關(r<-0.2)。miR-429負調控靶向基因為VAT1L和ELAVL2(圖3B),且與 EPHA2和 PTPN13基因表達呈正相關(r=0.325,0.282),見圖 3C。胸腺瘤未富集到與 miR-200家族呈負相關的靶基因模塊(圖4A~B),且miR-429表達水平與EPHA2和PTPN13基因一致,PTPN13是影響胸腺瘤生存時間的危險因素(HR=4.65,95%CI:1.08~20.13,P=0.025,圖 4C)。
選取本課題組自制的膀胱癌TMA驗證miR-200家族對TIMP2的調控作用。熒光定量PCR檢測miR-200家族成員表達,免疫組織化學法檢測TIMP2蛋白表達(圖5A),病理評分結果顯示TIMP2蛋白在膀胱癌組織中的表達范圍是0~12,中位值為4.33。miR-200家族成員與TIMP2蛋白表達的pearson相關性分析顯示,miR-429、miR-200a、miR-200b、miR-200c和miR-141等5個miRNAs分子均與TIMP2蛋白表達呈負相關(r<-0.5,P<0.001,圖 5B),且高表達 TIMP2 蛋白的膀胱癌患者總生存時間較低表達患者短(HR=0.68,95%CI:0.41~0.91,P=0.002,圖 5C)。

圖1 miR-200家族成員與21種實體腫瘤總生存期的關系Fig.1 Relationship between miR-200 family members and overall survival of 21 solid tumors

圖2 miR-200家族靶向調控膀胱癌的基因富集分析Fig.2 miR-200 family targeted gene enrichment in bladder cancer

圖3 miR-200家族靶向調控腎乳頭狀細胞癌的基因富集分析Fig.3 miR-200 family targeted gene enrichment in renal papillary cell carcinoma

圖4 miR-200家族靶向調控胸腺瘤的基因富集分析Fig.4 miR-200 family targeted gene enrichment in thymoma

圖5 膀胱癌組織中TIMP2蛋白表達與miR-200家族表達的相關性驗證Fig.5 Correlation between TIMP2 protein expression and miR-200 family expression in bladder cancer
miR-200家族因被發現可抑制ZEB1/ZEB2基因,參與調節腫瘤細胞凋亡[12]及EMT途徑[13],被認為在癌癥預后判斷及治療中具有巨大潛力[14]。然而,利用miR-200家族預測不同腫瘤預后的結果完全相反[15-17]。miR-200對不同腫瘤預后影響的Meta分析亦得出完全相反結論,認為miR-200家族具有較高的預后風險異質性[18]。對于這一異質性結果,研究者最初考慮受種族、測試方法、樣本大小和樣本保存影響。然而,PanCanAtlas項目排除上述因素差異后,發現miR-200家族表達對腫瘤患者OS和PFS的預測仍存在顯著異質性,因此我們推測miR-200家族特異性成員在不同器官或組織中的表達水平不同,以及不同腫瘤組織中miR-200家族靶基因的異質性,導致miR-200家族評估預后的差異。
本研究對排除實驗因素影響的21種實體腫瘤,分析miR-200家族與患者OS的關系,結果顯示miR-200家族高表達是膀胱癌和胃腺癌患者生存時間的保護因素,是肝癌和胸腺瘤患者生存時間的危險因素;miR-200a、miR-200b、miR-429 和 miR-200c、miR-141對腎乳頭狀細胞癌生存的影響則相反,證實miR-200家族核心序列差異對不同腫瘤預后的影響具有異質性。進一步對miR-200家族靶基因進行聚類分析,發現miR-200家族高表達可延長膀胱癌患者總生存時間,且顯著負調控靶標基因TIMP2的表達,提示miR-200家族可能通過下調TIMP2基因表達而抑制腫瘤細胞轉移,是膀胱癌潛在的良好預后判斷指標。本研究同時采用自建的膀胱癌TMA驗證,亦證實miR-200家族與TIMP2蛋白表達呈負相關,且TIMP2蛋白表達升高是膀胱癌的不良預后因素。
研究報道,EPHA2基因與肝癌、乳腺癌、前列腺癌和胰腺癌等增殖和轉移有關,被認為是癌基因及治療靶標[19]。本研究靶基因富集聚類分析顯示miR-141可負調控腎乳頭狀細胞癌EPHA2基因表達,推測miR-141可能通過靶向抑制EPHA2表達,從而延長患者生存時間。而胸腺瘤分析結果顯示miR-429與EPHA2和PTPN13表達均呈正相關,說明miR-429介導EPHA2和PTPN13表達可能導致腎乳頭狀細胞癌和胸腺瘤不良預后。研究發現PTPN13可通過引發src激酶失活而調節乳腺癌細胞侵襲性[20]。有研究認為miRNA通過靶向3'UTR的mRNA抑制轉錄和靶向CDS區抑制蛋白質翻譯[21],但miRNA促基因表達的機制不明,miR-429靶向調控何基因后導致EPHA2和PTPN13升高的具體機制尚不清楚。
本研究表明,miR-200家族對不同腫瘤預后的影響具有異質性,miR-200家族靶標分子眾多,而這些基因在不同組織及腫瘤亞型表達的差異可能導致了miR-200家族生物功能異質性,但具體機制尚不明確,有待未來選擇更多腫瘤樣本進一步研究。