謝天琪,裴麗霞,宋亞芳,孫夢珠,趙婷婷,易 越,孫建華
(南京中醫藥大學附屬醫院 南京 210029)
腎細胞癌(Renal cell carcinoma,RCC)是臨床高發的腎皮質腫瘤,據全球癌癥觀測站數據顯示,僅2018年新發病例達40 萬例[1],其中,惡性RCC 中腎透明細胞 癌(clear cell Renal Cell Carcinoma,ccRCC)約 占70%-85%[2]。臨床多采用手術切除、消融等治療手段,由于1/3 的患者存在術后復發或轉移等,同時放化療的臨床療效不顯著,致其死亡率高,預后不佳[3]。研究發現,基因組序列中不到2%為編碼基因,而非編碼基因則被轉錄并形成競爭性內源RNA 網絡(ceRNA)調節靶標mRNA 的表達[4,5]。研究顯示,長非編碼RNA(lncRNA)與miRNA 等相互作用,調控肝癌、乳腺癌等細胞增殖、凋亡、遷移、衰老[6-8]。研究發現,URRCC 作為ccRCC 促瘤lncRNA 調控組蛋白H3 乙酰化進而增加EGFL7 的表達[9],而SNHG14 等lncRNA 也會影響ccRCC 的發生與發展,其主要機制是特異海綿化miR-203 和 釋 放N-WASP 蛋 白[10],MRCCAT1 等lncRNA 則通過p38-MAPK 信號傳導通路影響ccRCC 轉移[11]。盡管已有部分研究,但其確切機制仍未明確。
中醫藥防治腫瘤有獨特優勢,但由于中藥成分復雜,作用靶點較多,目前機制尚不明確,故而通過網絡藥理學進一步完善理論體系成為研究熱點。盡管已有部分研究對中藥及其活性成分干預ccRCC 進行了挖掘[12],但機制仍未得到完全的闡發,且缺乏與ceRNA網絡結合。傳統中藥虎杖性微寒,味苦,因其長于清熱解毒、散瘀止痛,被廣泛應用于臨床[13],其藥理機制與分子化合物的研究逐年增多。自虎杖提取出的多酚類化合物白藜蘆醇在抗炎、抗氧化、抗腫瘤細胞生長等方面效果顯著[14-18],網絡藥理學結合ceRNA 網絡的系統分析將完善中藥治療ccRCC的理論體系。
本研究通過篩選差異表達基因(difference expressed genes,DEGs)與差異lncRNA(DELs),預測上游miRNA,構建ceRNA 網絡,并探討白藜蘆醇干預ccRCC 的有效機制。通過對GEO 基因表達綜合數據庫(Gene Expression Omnibus)與TCGA 癌癥基因組圖譜數據庫(The Cancer Genome Atlas)的原始數據集的篩選和分析,利用與預后相關的DEGs 預測miRNA 與lncRNA,隨后進行加權基因共表達網絡分析(WGCNA)提高研究可靠性,構建ceRNA 網絡,通過網絡藥理學分析探討白藜蘆醇的作用靶點。研究探討了ccRCC 的生物學機制,并進一步挖掘了白藜蘆醇抑制ccRCC 的潛在機制,為ccRCC 的診斷及治療帶來新思路。
在GEO 數據庫(www.ncbi.nlm.nih.gov/geo)中下載原 始 基 因 數 據 集 GSE40435、GSE53757 及GSE66271(表1)。
其中,GSE40435 包含腫瘤組織與癌旁組織各101例,GSE53757 中各72 例,納入GSE66271 各12 例。通過GDC 在 線 工 具(https://portal.gdc.cancer.gov/)從TCGA 數據庫(https://portal.gdc.cancer.gov/)中下載基因及lncRNA 數據,包括538 個腫瘤樣本、72 個癌旁樣本 及530 例 臨 床 樣 本,通 過R 軟 件limma 包,按P <0.05,|log2 (FC)| >2 篩選DEGs 與DELs。韋恩圖重疊得到可信度較高的DEGs,熱圖由TBtools軟件創建。
基因本論(GO)及《京都基因與基因組百科全書》(KEGG)通路富集分析使用DAVID Bioinformatics Resources 6.8(https://david.ncifcrf.gov/)聯合KOBAS 3.0(http://kobas.cbi.pku.edu.cn/)進行功能注釋,以P <0.05 為 截 止 標 準,通 過EasyChart(http://www.ehbio.com)將分子功能(Molecular Function MF)、細胞成分(cellular component CC)、生 物 學 過 程(biological process BP)及通路信息等特征可視化。
通過STRING(https://string-db.org/cgi/input.pl)構建蛋白質相互作用信息(protein-protein interaction,PPI)網絡,相關參數按默認標準設置。使用Cytoscape_v3.7.1(http://apps.cytoscape.org/apps/)可 視化,CentiScape 2.2 插件(http://apps.cytoscape.org/apps/)進行拓撲分析,挑選出節點度算法閾值2倍的DEGs作為關鍵基因。
將關鍵基因導入PrognoScan 預后數據庫(http://dna00.bio.kyutech.ac.jp/PrognoScan/),以COX-p value值小于0.05為標準,篩選對預后影響較大的基因。
利用TargetScanHuman 7.2(www.targetscan.org/)、miRDB(www.mirdb.org/mirdb/)及miRTarBase(http://mirtarbase.mbc.nctu.edu.tw/)[19-21]進行綜合分析,韋恩圖重疊得到上游miRNA,導入starBase 在線數據庫(http://starbase.sysu.edu.cn/)預測并篩選共同作用的lncRNA。
加權基因共表達網絡分析(Weighted Gene Correlation Network Analysis WGCNA)在本研究中用以鑒定與臨床特征相關的高度協同變化[22]的lncRNA 模塊。采用R 軟件WGCNA 包[23],進行質量評估后,根據皮爾森相關系數并選擇最佳軟閾值(β 值)以接近無尺度網絡分布,使用biockwiseModules 函數構建加權共表達網絡;拓撲重疊TOM 矩陣由鄰接矩陣轉換,進行層次聚類,以plotDendroAndColors 函數可視化。分析DELs 與530 例臨床信息的關聯性,在挑選出的模塊中驗證lncRNA的臨床相關性。
StarBase 數據庫(http://starbase.sysu.edu.cn/)用以確定預后相關的DEGs、靶miRNA 及lncRNA,并構建相互作用的ceRNA網絡,使用Cytoscape軟件可視化。
TCMSP 數據庫(http://tcmspw.com/tcmsp.php)中包括499 種傳統中草藥及其化合物的藥代動力學信息[24]。通過TCMSP 檢索中藥“虎杖”,篩選口服生物利用度(OB)≥30%,類藥性(DL)≥0.18的具有生物活性的分子;RCSB PDB 數據庫(http://www.rcsb.org/pdb)檢索關鍵靶點蛋白,使用SYBYL-X 2.0 軟件對蛋白晶體結構進行結構轉換與白藜蘆醇的分子對接。

圖1 包含GSE40435,GSE53757,GSE66271及TCGA(KIRC)篩選的DEGs的Venn圖

圖2 ccRCC差異表達基因熱圖
對TCGA 中ccRCC 數據以及GEO 的數據篩選后,得到109 個上調的DEGs 與60 個下調的DEGs,共計169 個DEGs(圖1),層次聚類熱圖體現表達量(圖2)。lncRNA 數據按照相同的截止標準篩選得到1076 個DELs,其中,上調的DELs 483個,下調的DELs 593個。

表2 PPI網絡中關鍵基因節點
使用DAVID 聯合KOBAS 3.0 進行GO 和KEGG 富集分析,隨后將MF、CC、BP 及通路信息可視化(圖3)。可視化前10位的生物學過程及信號通路(P <0.05)。
GO 富集分析中,DEGs 主要參與了“血管增生”、“藥物反應”、“低氧反應”、“分泌”、“凝血”、“細胞外基質組織”、“血小板脫粒”、“受體內移”、“鈉離子穩態”及“細胞底物粘附的負調節”等;并在“基底外側質膜”、“血微粒”、“細胞外泌體”、“膠原三聚體”、“血小板α顆粒內腔”、“質膜”、“胞外間隙”、“胞外區”、“質膜組成部分”與“頂質膜”等CC 上富集;MF 主要包含“肝素結合”、“細胞外基質結構成分”、“ATP 酶結合”、“不依賴鈉的有機陰離子跨膜轉運蛋白活動”、“磷酸吡哆醛結合”、“相同蛋白結合”、“受體結合”、“蛋白質同二聚活性”、“轉氨酶活性”、“無機陰離子交換活性”等。
KEGG 富集分析顯示,DEGs 與“抗生素的生物合成”、“碳代謝”、“粘著斑”、“補體和凝血級聯”、“AMPK信號通路”等通路顯著相關,在“乙醛酸和二羧酸酯代謝”、“醛固酮調節鈉的重吸收”、“金黃色葡萄球菌感染”、“糖酵解/糖異生”、“果糖和甘露糖代謝”等途徑富集。
將169 個DEGs 導入STRING,形成包含141 個節點與459 條邊的PPI 網絡(圖4)。利用CentiScape 插件,按截斷標準大于13挑選得21個關鍵基因(表2)。

圖3 ccRCC差異表達基因GO及KEGG富集分析

圖4 ccRCC差異表達基因PPI網絡圖(藍色:DEGs;黃色:關鍵基因)
PrognoScan 預后數據庫進一步篩選(表3)得5 個表達水平與預后呈負相關的基因,即ALB、CAV1、COL1A2、HRG和IGFBP3。
通過TargetScan、miRDB 及miRTarBase 數據庫中檢索確定hsa-miR-25-3p 與hsa-miR-23a-3p 兩個上游miRNA 與COL1A2、HRG 兩個DEGs。StarBase 數據庫預測到的11 個lncRNA 與DELs 交集得到SNHG17與AL136040.1。

表3 與ccRCC預后相關的關鍵基因

圖5 ccRCC差異lncRNA加權基因共表達網絡分析
對1076 個DELs 質量評估后進行WGCNA 分析。利用picksoftThreshold 函數選擇9 作為權重參數,動態混合剪切得到3 個模塊(圖5),兩個lncRNA(SNHG17與AL136040.1)均存在于yellow 模塊,且此模塊的ME較高,證明兩個lncRNA與ccRCC發生發展相關。
利用分析得到的lncRNA(SNHG17、AL136040.1),2 個miRNA(hsa-miR-25-3p 與hsa-miR-23a-3p)以及2 個DELs(COL1A2、HRG)構 建ceRNA 網 絡,使 用Cytoscape 軟件可視化(圖6),其中HRG 過表達,COL1A2低表達。

圖6 ccRCC差異表達基因-miRNA-lnRNA的ceRNA網絡

圖7 白藜蘆醇與HRG及COL1A2分子對接
根據OB 及DL 篩選確定白藜蘆醇為化合物分子,PDB 數據庫中檢索靶點蛋白COL1A2 及HRG,分別得到5CTD、5CTI、5CVA 及6HG7、5VLK、5VBL、5IJR、2VDN、1UJV 化合物分子。SYBYL-X 2.0 軟件分別對5CV 及1UJVA 處理并進行分子結構對接,5CVA 與白藜蘆醇通過三個位點對接,1UJV則存在兩個對接位點(圖7),白藜蘆醇與5CVA 及1UJV 對接打分均良好(3.57,2.75)。
由于腎透明細胞癌(ccRCC)對放化療不敏感與易復發性,致該病預后較差,且相關研究較少,目前中醫藥治療ccRCC 的潛在機制尚不明確。本研究構建了ccRCC 預后相關的ceRNA 網絡,并探討了虎杖提取物白藜蘆醇干預ccRCC 的有效機制。通過對比腫瘤組織與癌旁組織篩選169 個DEGs 及1076 個DELs,利用TargetScan、miRDB、miRTarBase 和starBase 三個數據庫確定兩個mRNA 及其上游miRNA 與lncRNA,WGCNA 分析使最終建立的ceRNA 網絡更可靠,并通過網絡藥理學分析進行更深一步的探討。
在ccRCC 的發生,發展與遷移中,上皮細胞粘附分子、PPAR 等起到的作用已被證實[25,26]。在169 個DEGs 的GO 分析中,血管增生、藥物反應、基底外側質膜等顯著富集。多種信號通路如絲裂原激活的蛋白激酶、過氧化物酶體增殖激活受體等被激活[27-29];抗生素的生物合成、碳代謝、粘著斑、AMPK 信號通路等亦與侵襲及遷移密切相關。
長鏈非編碼RNA(long non-coding RNA,lncRNA)是一組長度超過200nt 的非編碼序列,曾被認為不具生物功能[6],近年來逐漸發現與腫瘤密切相關[30]。ccRCC 細胞增殖、分級與轉移,與lnc-DILC 表達缺失顯著相關,并導致預后較差[6];而高表達的SNHG3亦提示較差預后[31]。本研究通過多個數據庫確定兩個上游miRNA: hsa-miR-25-3p 與hsa-miR-23a-3p,starBase與GELs篩選出2個lncRNA(SNHG17與AL136040.1),結合性別、年齡、放療、化療、分期以及生存時間等臨床數據進行WGCNA 分析,最終構建的ceRNA 網絡則探討了內在機制。
隨著ccRCC 的發病率逐年上升,耐藥性強、術后復發率高、五年生存率低[32]等困擾仍未解決,而傳統中醫藥逐漸成為治療ccRCC又一選擇[33]。中藥通過多靶點,多途徑協同影響腫瘤細胞的侵襲、發展、轉移等,但由于中藥成分復雜,作用機制尚不明確。隨著網絡藥理學與計算機技術的興起,闡明中藥作用機制將成為可能。虎杖是治療濕熱黃疸、淋癥等疾病的傳統中藥,始見于《雷公炮炙論》,具有清熱解毒,散瘀止痛等功效[34]。研究表明,從虎杖中提取出的白藜蘆醇具抗炎、抑制粥樣硬化、抗氧化等作用[35],并可抑制胃癌、乳腺癌、腎癌等進展[36,37]。研究顯示,白藜蘆醇通過多個通路與靶點抑制腎細胞癌細胞,如:白黎蘆醇抑制MMP-2 和MMP-9 表達來影響腎癌786-O 細胞[38];減少腎癌組織新生血管并抑制皮下組織生長[39],可能是其藥理作用機制之一。本研究利用生物信息學及網絡藥理學分析發現,白藜蘆醇通過作用于HRG 及COL1A2 調控上游miRNA 與lncRNA,影響ccRCC 預后。此外,富集分析發現血管生成等生物過程與ccRCC發展與轉移密切相關。
綜上所述,在此ceRNA 網絡中上游lncRNA 與miRNA 通過HRG 上調及COL1A2 下調,影響ccRCC 預后,同時,白藜蘆醇作用于兩個mRNA靶點干預ccRCC進展。本研究探索了新的ccRCC 腫瘤標志物與白藜蘆醇干預ccRCC 的有效機制,為臨床診斷與治療提供新思路。