陸凌翔, 蔣民軍, 陳建春, 陸季成
(江蘇省蘇州市第九人民醫院, 1.泌尿外科, 2.腫瘤科, 江蘇 蘇州, 215000)
全世界每年有超過40萬人罹患腎細胞癌(RCC), 發病年齡大多為60歲左右,其中2/3患者為男性[1]。RCC包括多種亞型,約70%為腎透明細胞癌(ccRCC)[2]。早期確診并盡早治療可以提高ccRCC的治愈率,但多達1/3的ccRCC患者確診時已出現轉移[3]。轉移性ccRCC惡性程度高,嚴重威脅患者的生命健康[4],因此尋找其診斷和治療靶點尤為重要。微小RNA(miRNA)是一類長度為19~23 nt的內源性小型非編碼類RNA,由DNA轉錄而來[5]。miRNA可通過直接與靶向信使RNA(mRNA)上的堿基進行配對,引導RNA誘導沉默復合體(RISC)間接降解所編碼的蛋白質,或通過直接抑制mRNA蛋白的翻譯而在轉錄后水平或亞轉錄階段終止后水平間接調節靶蛋白質的表達[6]。許多特殊的miRNA在ccRCC組織和正常腎組織中存在差異表達,如微小RNA-206(miR-206)、微小RNA-141-3p(miR-141-3p)、微小RNA-30a(miR-30a)和微小RNA-194-5p(miR-194-5p)[7-10]。研究[11]發現,微小RNA-182-5p(miR-182-5p)通過靶向泛素結合酶E2T mRNA抑制泛素結合酶E2T蛋白表達,進而抑制ccRCC細胞的增殖、遷移和侵襲。另有研究[12]發現,近80%的與ccRCC轉移相關的miRNA與ccRCC患者的復發率和生存率有關。RNA干擾可有效控制基因的表達,在腫瘤治療中起著廣泛作用[13], 而miRNA與ccRCC的發生及發展密切相關,故調控相關miRNA的表達有望成為治療ccRCC的新方法。本研究對數據庫樣本進行挖掘和分析,篩選ccRCC組織的差異表達基因(DEGs), 旨在尋找ccRCC治療的潛在生物學靶點,現報告如下。
從基因表達綜合(GEO)數據庫(https://www.ncbi.nlm.nih.gov/geo/)的數據集中下載ccRCC樣本和正常腎組織樣本的表達譜數據。① GSE116251數據集中,從18名ccRCC患者(9名疾病復發和9名未復發患者)的配對腫瘤組織和鄰近正常組織中分離總RNA,然后進行NanoString miRNA分析。NanoString是一種高通量的RNA表達檢測方法,其優點是適用于嚴重降解的RNA樣本如福爾馬林固定石蠟包埋(FFPE)樣本,且操作簡單、數據準確、重現性好。應用實時定量聚合酶鏈反應(PCR)方法對腫瘤中失調的miRNA 進行進一步驗證。② GSE168845數據集中,分析4個ccRCC組織和配對癌旁組織樣本(作為對照)的基因表達譜。
從GEO數據庫(https://www.ncbi.nlm.nih.gov/geo/)的GSE116251、GSE168845數據集中下載ccRCC樣本和正常腎組織樣本表達譜數據,利用R軟件的Limma包篩選出差異表達的miRNA和基因,設置|log2FC|≥2和錯誤發現率(FDR)<0.05為篩選標準。FunRich(http://www.funrich.org/)是一個主要用于基因和蛋白質的功能富集和相互作用網絡分析的獨立軟件工具,還可用于靶基因預測。本研究利用FunRich網站對差異表達miRNA(DEmiRNAs)進行潛在轉錄因子及靶基因預測,并進行生物學過程(BP)、細胞成分特征(CC)和分子功能(MF)富集分析。利用R軟件的ClusterProfiler包和Cytoscape軟件對靶基因的信號通路進行富集分析。將預測到的靶基因與DEGs取交集,獲得差異表達的靶基因,通過Cytoscape軟件繪制miRNA-mRNA調控網絡。以DEmiRNAs及其靶基因的中位表達值為分界,將患者分為高表達組和低表達組,通過Kaplan-Meier plotter網站(https://kmplot.com)判斷DEmiRNAs及其靶基因的表達水平與患者總生存期的關聯,選擇P值最小的靶基因及其相互作用的miRNA與腫瘤基因組圖譜(TCGA)中616例ccRCC患者的臨床特征(年齡、性別、TNM分期和初始治療結局)進一步分析。通過人類蛋白質圖譜(HPA)數據庫驗證所選基因在ccRCC組織及正常組織中的蛋白表達。
使用Wilcoxon檢驗篩選腫瘤組織與癌旁組織的DEmiRNAs、DEGs, 采用BH法對P值進行矯正,設置|log2FC|>2和FDR<0.05為篩選標準。采用卡方檢驗評估各指標在高表達組、低表達組中的分布差異。采用Kaplan-Meier分析和Log-rank檢驗評估高風險組、低風險組患者的生存差異。應用R軟件(版本4.0.2)對數據進行統計學分析,P<0.05為差異有統計學意義。
應用R軟件篩選GSE116251數據集中的DEmiRNAs和GSE168845數據集中的DEGs,分別篩選出3種DEmiRNAs(miR-142-3p、miR-200c-3p、miR-141-3p)和1 610種DEGs, 見圖1。

A: GSE116251中DEmiRNAs的熱圖; B: GSE116251中DEmiRNAs的火山圖; C: GSE168845中DEGs的熱圖;D: GSE168845中DEGs的火山圖。紅色代表上調,藍色或綠色代表下調。
GO和KEGG富集分析結果顯示, DEmiRNAs在細胞環腺苷酸(cAMP)受體介導的信號傳導、翻譯的調節、發展、溶酶體、高爾基體、細胞表面、受體信號蛋白和絲氨酸酶/蘇氨酸肌激酶活性、磷酸二酯水解酶活性和細胞骨架蛋白等方面具有獨特的功能,見圖2; DEmiRNAs主要富集于6種途徑,即破骨細胞分化、金黃色葡萄球菌感染、細胞黏附分子、補體和凝血級聯、吞噬體和原發性免疫缺陷,見圖3。

A: FunRich軟件識別的DEmiRNAs的潛在轉錄因子; B、C、D: miRNA靶基因表達的前10種生物學過程、細胞成分特征和分子功能富集分析。

Osteoclast differentiation: 破骨細胞分化; Phagosome: 吞噬體;Primary immunodeficiency: 原發性免疫缺陷;Staphylococcus aureus infection: 金黃色葡萄球菌感染;complement and coagulation cascades: 補體和凝血級聯;Cell adhesion molecules(CAMs): 細胞黏附分子。
使用預測軟件對3個DEmiRNAs的靶基因進行預測,共獲得846個靶基因,將其與GSE168845數據集的DEGs取交集,共得到49個交集靶基因,見圖4A。根據相互作用關系,篩選出miRNA-mRNA調控網絡, miRNA包括hsa-miR-142-3p(上調)、hsa-miR-200c-3p(下調)和hsa-miR-141-3p(下調),其關聯的30個靶基因中包括11個下調基因和19個上調基因,見圖4B。

A: 預測的靶基因與GSE168845數據集DEGs交集的韋恩圖; B: miRNA-mRNA調控網絡(綠色表示下調,粉色表示上調)。
通過Kaplan-Meier plotter網站分析ccRCC患者的總生存期,結果顯示, miR-142-3p、miR-200c-3p、miR-141-3p和TNFAIP3、STAT4、P2RY1、CORO1C、MYBL1、CCNE2、BHLHE41、ANLN、BASP1均與ccRCC患者總生存期相關(P<0.05), 見圖5、圖6。各種基因中,ANLN基因的P值最小即差異最顯著,故本研究選擇ANLN基因及其相互作用的miR-200c-3p進行后續研究。

A: hsa-miR-141-3p與總生存期的關系; B: hsa-miR-142-3p與總生存期的關系; C: hsa-miR-200c-3p與總生存期的關系。

圖6 不同基因表達水平與ccRCC患者總生存期的關系
從TCGA數據庫中下載ccRCC患者臨床診斷指標和相關基因片段的克隆表達研究數據(例如患者的年齡、性別、TNM分期和初始治療結局數據),結果顯示,不同TNM分期患者的ANLN、miR-200c-3p表達水平比較,差異有統計學意義(P<0.05), 見表1、表2。進一步分析ccRCC患者臨床特征與預后的關系后發現, TNM分期、初始治療結局均與ccRCC患者預后相關(P<0.05), 見表3、表4。

表1 ANLN表達水平與ccRCC患者臨床特征的關系

表2 miR-200c-3p表達水平與ccRCC患者臨床特征的關系

表3 ccRCC患者臨床特征、ANLN表達與預后關系的單因素分析和多因素分析

表4 ccRCC患者臨床特征、miR-200c-3p與預后關系的單因素分析和多因素分析
基于HPA數據庫,本研究發現,與正常腎臟組織相比, ccRCC組織中的ANLN表達顯著上調,見圖7。

圖7 ANLN蛋白在正常腎臟組織(n=3)和ccRCC組織(n=3)中的表達(HE染色,放大100倍)
本研究從GEO數據庫下載GSE116251、GSE168845數據集進行分析, KEGG分析結果顯示, DEmiRNAs主要富集于破骨細胞分化、金黃色葡萄球菌感染、細胞黏附分子、補體和促凝血因子級聯反應、吞噬體和原發性免疫缺陷這6個途徑中,而這些途徑與癌癥的發生和轉移密切相關[14-16]。已有研究[17]表明,細胞黏附分子配體唾液酸Lewis(a/x)抗原可通過與E-選擇素受體結合而參與內皮細胞壁的黏附,這一生化過程由炎癥細胞和腫瘤細胞共同參與,可以部分解釋炎癥與腫瘤發生之間的關系,進一步闡明抗炎藥在腫瘤治療中的功效。轉錄調節因子是一種能夠以特定序列結合DNA分子并參與調節基因轉錄活動的蛋白質[18]。轉錄抑制因子可通過選擇性識別一些特定類型的DNA序列信息來同時調控染色質形成和轉錄,從而形成一個可調控整個基因組信息表達活動的復雜系統。此外,轉錄因子可以結合特定序列促進或抑制下游基因,對腫瘤發生、遷移和侵襲等生物學過程產生重要影響[19]。
本研究使用Cytoscape軟件進行miRNA-mRNA調控網絡構建,確定了3個miRNA(miR-142-3p、miR-200c-3p和miR-141-3p), 并獲得了846個潛在靶基因,其中僅49個在GSE168845數據集中差異表達,進一步根據相互作用關系篩選miRNA-mRNA調控網絡, 3個miRNA關聯的30個靶基因中包括11個下調基因和19個上調基因。miR-142-3p是雜合性丟失、易位和擴增的首選位點,可參與人體內多種特定生物類型細胞上的某些原發細胞腫瘤分子中過氧化酶的表達,包括原發性肝細胞癌、卵巢癌和胰腺癌等[20-23]。此外, miR-142-3p的過表達可以抑制血清剝奪誘導的細胞凋亡,當miR-142-3p抑制劑降低miR-142-3p表達時,可以逆轉對細胞凋亡的抑制,且miR-142-3p可在G1/S期加速細胞分化并促進細胞增殖[24]。包含miR-200a、miR-200b、miR-200c、miR-141和miR-429的miR-200家族已被證明在上皮間質轉化中發揮作用[25]。另外,越來越多的研究[26-27]表明miR-200家族成員在多種惡性腫瘤組織中下調,包括RCC。因此, miR-200c是一種潛在的生物標志物,或可為RCC替代治療方案的制訂提供參考依據。
ANLN基因編碼蛋白中含有的Anillin蛋白,是體內一種有著高度保守性表達的肌動蛋白結合蛋白,在胞質的分裂及其復制形成過程中發揮著關鍵作用[28]。研究[29-31]發現, ANLN在許多原發腫瘤組織中均有表達,特別是晚期胰腺癌、乳腺癌和中晚期肺癌組織。流行病學研究[32-33]發現,ANLN還具有一系列生物功能,包括參與調節人類腫瘤干細胞的生長、增殖、轉化和腫瘤遷移,影響多種惡性腫瘤組織的發生與發展,因此其通常被認為是對某些腫瘤患者預后具有重要意義的幾個主要特征基因之一。高ANLN表達水平的原發性乳腺癌患者預后可能較差,而ANLN水平敲低可能導致乳腺癌組織衰老的細胞增加、多核形態和G2/M期停滯[34]。另一項人類非小細胞肺癌細胞凋亡實驗[35]發現,敲除ANLN會顯著抑制腫瘤細胞分裂增殖速度和增加多形核細胞凋亡數量。
近年來, miRNA及其靶基因在腫瘤發生發展中的作用已被廣泛研究,基因表達調控可能成為腫瘤治療的新選擇。本研究發現, miR-200c-3p及其靶基因ANLN參與了ccRCC的發展,并可能成為ccRCC的潛在生物標志物。ANLN可能對ccRCC患者的預后判斷具有重要價值,并可為其治療策略提供新的選擇。