金一 王昕儀 杜潤森 鄭麗華 趙亞恒 楊艷
乳腺癌的預后不盡人意。許多分子已被確定為重要的預后因素。為乳腺癌病人尋找新的生物標志物和治療靶點尤為重要。研究發現,與正常組織相比,腫瘤組織中的 hsa-mir-337顯著下調。 Cox分析表明 hsa-mir-337可以作為乳腺癌預后的獨立生物標志物。
所有數據集均使用 R(版本 3.6.0)中的RTCGA Toolbox包下載,包括乳腺癌病人miRNA測序數據及其對應的臨床病理資料,組織樣本來源于癌癥基因組圖譜(the Cancer Genome Atlas,TCGA)數據庫。
1.基因集富集分析(GSEA):使用Broad研究所的GSEA軟件3.0進行GSEA分析。基因組被認為在NOM p-val<0.25時顯著富集。
2.靶標預測 :通過三種在線分析工具預測miRNA的靶基因,分別是TargetScan(http://wwwtargetscan.org/vert_72/)、miRDB(http://www.mirdb.org/cgi-bin/searc)和miRTarBase。為了進一步提高生物信息學分析的可靠性,我們使用維恩圖將重疊的靶基因和差異表達的miRNA相交,以識別與miRNA共表達的基因。熒光素酶檢測用于靶基因的驗證。Cox檢驗用于鑒定最重要的靶基因。
使用R-studio 3.6.0進行數據分析。Boxplots用于離散變量測量表達差異,χ2檢驗用以檢查hsa-mir-337表達與臨床數據之間的關系。使用Youden指數評估的最佳截止值將病人分為hsa-mir-337高表達組和低表達組。使用Kaplan-Meier進行生存分析,使用Log-rank檢驗比較曲線。單變量Cox分析用于選擇相關變量,輸出風險比(hazard ratio,HR)、P值等。將Cox單因素回歸分析得到的相關變量進一步進行多變量Cox分析,用于確定hsa-mir-337的表達對乳腺癌病人的獨立預后價值。
1.TCGA數據庫資料下載與整理:所有乳腺癌病人數據均從TGGA數據庫下載,病人總數為503例。乳腺癌病人數據特征見表1。

表1 乳腺癌病人數據特征(n=503)
2.hsa-mir-337被認為是乳腺癌的獨立預后因素:如圖1A所示,與正常組織相比,hsa-mir-337在腫瘤組織中顯著下調。Paired-Samples T Test用于驗證hsa-mir-337的差異性表達(圖1B)。Kaplan-Meier 生存分析表明,與高表達組比較,hsa-mir-337低表達組的總生存率更差(圖1C)。單變量Cox分析和多變量Cox 分析表明,hsa-mir-337 可以作為乳腺癌的獨立預后因素。見表2,表3。

A hsa-mir-337在腫瘤組織中的表達顯著降低。B Paired-Samples T Test用于驗證hsa-mir-337的差異表達。C Kaplan-Meier生存分析表明,與高表達組相比,低表達組的總生存期更差。

表2 乳腺癌病人相關因素的單因素分析

表3 乳腺癌病人相關因素的多因素分析
3.GSEA 表示與hsa-mir-337相關的生物學功能和蛋白質:我們進行了GSEA(圖 2A、B)來鑒定乳腺癌中激活的生物學功能 ,發現部分GO通路在hsa-mir-337低表達表型中差異性富集,例如GO_BASEMENT_MEMBRANE,GO_COLLAGEN_CONTAINING_EXTRACELLULAR_MATRIX(表4)。隨著hsa-mir-337表達的降低,ECM PECEPTOR INTERACTION、FOCAL ADHESION等信號通路也出現了差異性富集(表4)。

圖2 通過GSEA進行功能注釋

表4 hsa-mir-337低表達相關GO通路與KEGG通路
4.目標預測:通過靶基因預測,并利用維恩圖將重疊的靶基因和差異表達的miRNA相交,我們確定了53個hsa-mir-337的潛在靶基因。此外,我們發現,隨著hsa-mir-337的上調,C2CD2、CXCR2、FREM1、GAS7、GHR、NKAPL、PCDH18、SYT4的表達水平上調,而ESRP1的表達水平下調。另外,Kaplan-Meier生存分析表明,這些mRNA的差異表達顯示出更差的總生存期。
miRNA是是一類長度約為21~ 25個核苷酸的內源性非編碼小分子單鏈 RNA,它可以通過抑制信使RNA(mRNA)翻譯或誘導mRNA的降解來調節基因表達。它可以參與和調控多種生理和病理過程,包括細胞發育、增殖、分化、遷移、侵襲、自噬和信號轉導。有研究表明,miRNAs在各種惡性腫瘤細胞中差異表達,在腫瘤生物標志物中顯示出巨大的潛力。例如,MiR-126 通過與多種分子相互作用在乳腺癌中發揮重要作用[1]。miR-378的上調通過抑制上皮間質轉化來抑制結腸癌細胞的增殖、遷移和侵襲[2]。這些發現有助于我們實現抑制乳腺癌細胞的轉移。
有研究表明,hsa-mir-337在非小細胞肺癌的癌變過程中起著至關重要的作用,可以作為非小細胞肺癌有前景的生物標志物[3]。miR-337在胃癌的發生過程中也起到了一定作用[4-5]。miR-337通過直接靶向KRAS抑制AKT和ERK通路,在結直腸癌的進展中作為腫瘤抑制因子[6]。此外,miR-337通過靶向STAT3/Wnt/β-catenin軸調節細胞增殖和侵襲,影響胰腺癌的發生[7]。據報道,miR-200家族水平升高與包括乳腺癌在內的種癌癥的不良預后有關[8]。同樣,hsa-miR- 21-5p被認為是主要的致癌miRNA之一,在多種癌癥(例如,乳腺癌、結直腸癌、胃癌[9-11]和非小細胞肺癌)中觀察到其上調。研究表明,miR-4417的低表達與三陰性乳腺癌病人較差的預后顯著相關[12]。
mIR196A的表達也被證明是晚期和絕經后ER+病人的可靠預后因素[13]。有研究進行了整合microRNA和mRNA免疫細胞特征的構建,以預測乳腺癌和卵巢癌病人的生存[14]。
在本次研究中,我們發現乳腺癌組織中hsa-mir-337的表達顯著下調。我們進行了單變量Cox分析和多變量Cox分析,以確定hsa-mir-337表達對病人總生存期的影響,結果表明,hsa-mir-337可以作為乳腺癌的獨立預后因素。為了進一步探索hsa-mir-337的生物學作用,我們進行了GSEA分析,發現GO_BASEMENT_MEMBRANE、GO_CONDENSED_CHROMOSOME等差異表達。隨著hsa-mir-337的減少,各種信號通路也受到影響,如ECM PECEPTOR INTERACTION、FOCAL ADHESION。
此外,我們證實了隨著hsa-mir-337的上調,C2CD2、CXCR2、FREM1、GAS7、GHR、NKAPL、PCDH18、SYT4上調,而ESRP1而下調,可以作為hsa-mir-337的靶基因[15]。然而,hsa-mir-337與這些基因之間相互作用的具體機制尚不清楚。如果進一步闡明它們之間的作用機制,hsa-mir-337的應用將會更廣泛。