姚 慧,孫 濤,徐君南
1遼寧中醫藥大學研究生院,沈陽 116620;2遼寧省腫瘤醫院,沈陽 110042
據統計,2020年,女性乳腺癌首次超過肺癌,成為全球最常見的癌癥,約占新發癌癥病例的11.7%[1]。我國乳腺癌的發病率也呈逐年上升且年輕化態勢。目前乳腺癌主要治療手段有手術、化療、放療、靶向治療等,均會產生不同程度的副反應,影響患者預后。而中醫治療以其不良反應小、有效改善患者生存質量、延長患者生存時間的優勢,在乳腺癌治療中起著舉足輕重的作用。
乳香(frankincense)為橄欖科植物乳香樹BoswelliacarteriiBirdw.及同屬植物BoswelliabhaurdajianaBirdw.樹皮滲出的樹脂,性辛、溫,味苦,歸心、肝、脾經,具有活血止痛、消腫生肌之效。沒藥(myrrh)是橄欖科(Burseraceae)沒藥屬CommiphoraEngl.植物地丁樹CommiphoramyrrhEngl.或哈地丁樹CommiphoramolmolEngl.的干燥樹脂[2],性平,味辛、苦,歸心、肝、脾經,散瘀止痛、消腫生肌之效佳。乳香、沒藥配伍應用最早出現在《證治準繩》中的“乳香止痛散”中,臨床上二者常以藥對形式出現,相須為用,協同增效,為活血化瘀類常用中藥。
目前有乳香、沒藥針對關節炎、乳腺增生、癌性疼痛的網絡藥理學研究,這些研究只是直觀反映了化合物的靶點及通路之間的生物過程,尚沒有深層次的對乳香、沒藥治療乳腺癌進行網絡藥理學及相關驗證研究。本文通過查閱《腫瘤方劑大辭典》等中醫書籍,收集乳腺癌相關臨床診療數據,挖掘藥物配伍規律、核心藥物等關聯規則,得出中醫治療乳腺癌所使用藥物中置信度最高的為“乳香-沒藥”藥對。進而對乳香-沒藥藥對展開網絡藥理學及分子對接研究,進一步明確乳香、沒藥活性成分及作用靶點,并分析其治療乳腺癌的分子機制。
查閱《中華人民共和國藥典臨床用藥須知·中藥成方制劑卷》(中國醫藥科技出版社)、《腫瘤方劑大辭典》(中醫古籍出版社)、《腫瘤良方大全》(安徽科學技術出版社)、《腫瘤良方大全》(山西科學技術出版社)、《腫瘤治療名方驗方》(人民衛生出版社),篩選出主治乳腺癌的臨床醫案,檢出乳腺癌內服方共351首。
納入標準:所選方劑均為中醫藥治療乳巖(即乳腺癌)的臨床藥方,符合《中醫內科學》[3]乳巖診斷;治療處方為中藥內服制劑且有明確的藥物組成、劑量;文獻中認定此方劑內服之療效確切;治療方法以中藥為主。排除標準:中醫臨床診斷非乳巖的醫案;臨床癥狀及方藥記錄不全者;以針灸、貼敷等其他治法治療者。
運用Apriori關聯規則算法挖掘藥對所有數據采用雙人原則錄入WPS Excel表格,并進行篩選、規范化命名、核查等,例如將忍冬花、二花、雙花統一為金銀花,元胡、元胡索、延胡統一為延胡索,粉甘草、粉草統一為甘草等,建立目標數據庫。運用SPSS Modeler軟件處理目標數據庫內的中藥,運用Apriori關聯規則算法建立數據挖掘模型,得出置信度最高的藥對。
決策樹算法是一種離散函數的逼近方法,通過歸類來解決數據特征。經數據預讀,選擇乳香作為因變量,其余頻次≥12的84個中藥作為自變量進入決策樹模型的篩選過程,運用SPSS Statistics 22.0軟件中的CHAID、CRT、QUEST決策樹方法進行決策樹模型分析。
通過檢索中藥系統藥理學分析平臺(traditional Chinese medicine systems pharmacology database and analysis platform,TCMSP)(http://lsp.nwsuaf.edu.cn/tcmsp.php)檢索乳香、沒藥的化學成分,結合口服生物利用度(oral bioavailability,OB)≥30%和藥物相似性(drug likeness,DL)≥0.18作為篩選條件,時間截止至2021年5月10日,篩選出活性成分較高的化合物并收集靶蛋白,并查閱相關文獻作為補充。將上面收集到的靶蛋白在數據庫UniProt(https://www.uniprot.org/)中進行校正,選擇物種為人,用靶蛋白的簡寫表示,建立藥物的靶點蛋白數據庫。
在人類基因數據庫Genecards(https://www.genecards.org/)中以“breast cancer”為關鍵詞,檢索出乳腺癌的相關靶基因,并與藥對中活性成分靶基因進行映射對比篩選出共同靶點,則為藥對活性成分治療乳腺癌的靶點。
運用Cytoscape 3.7.1軟件構建乳香-沒藥“化合物-靶點”網絡并進行可視化分析。網絡中各節點(node)分別代表活性成分和關鍵靶點基因;網絡中邊(edge)用來連接活性成分與關鍵靶點基因;連接到網絡的節點以度值(degree)為單位進行表示。某節點與其他節點連接的邊數越多,則說明該節點在網絡中扮演的角色越重要,度值也越大。
利用Cytoscape 3.7.1軟件中Bisogenet插件分別對乳香-沒藥與乳腺癌關鍵靶點進行蛋白網絡互做分析(protein-protein interaction,PPI),通過Merge功能取二者交集,再用CytoNCA插件對網絡中所有點的拓撲參數度值(degree)、接近中心性(closeness centrality,CC)和介度中心性(betweenness centrality,BC)進行分析,借助網絡拓撲理念篩選網絡中的關鍵節點,篩選標準為degree大于所有節點的2倍degree中位數,CC、BC大于所有節點對應值的中位數。
將關鍵靶點上傳至David 6.8(database for annotation,visualization and integrated discovery)數據庫(https://david.ncifcrf.gov/,Version 6.8),以人類為研究對象,進行GO(gene ontology)分析以了解靶點主要的作用過程,主要包括生物過程(biological process,BP),細胞組成(cellular component,CC),分子功能(molecular function,MF)三方面,并且對關鍵靶點進行KEGG(kyoto encyclopedia of genes and genomes,https://www.kegg.jp/)富集分析,并使用微生信在線繪制柱狀圖和氣泡圖。
定義CytoNCA篩選后乳香-沒藥藥對和乳腺癌相關疾病的核心交集靶點為受體,篩選整理后的乳香-沒藥重要活性成分為配體。檢索RSCB PDB數據庫(http://www.rcsb.org/pdb/home/home.do)并下載核心靶點的3D結構,檢索并下載TCMSP數據庫中乳香-沒藥活性成分的2D結構,利用PyMOL 2.4.0軟件對乳腺癌靶蛋白進行去水、加氫等預處理。應用AutoDock Vina軟件進行分子對接,最后運用PyMOL、LigPlot+軟件對對接結果進行三維可視化分析。
351首處方涉及中藥358味,用藥總頻次達4 298次,頻率越高藥物種類越少,以6∶3∶1分成高頻藥(頻率>40%)、中頻藥(頻率10%~40%)、低頻藥(頻率<10%),得出高頻藥1種,中頻藥29種,低頻藥328種,高、中頻藥詳見表1。

表1 治療乳腺癌高、中頻藥物頻次分布
取358味中藥里頻數大于平均數12的84味中藥,運用SPSS Modeler中的Apriori進行建模,選取支持度>0.05,置信度>0.85,前項>18,進行二項關聯分析(見圖1、表2)。其中,置信度最高的且關聯性強的藥對是乳香-沒藥,在文獻中有64個實例,置信度為96.364%,支持度為15.670%。在此次分析規則中,置信度較高的藥對,可作為臨床上治療乳腺癌的常用藥對。

圖1 關聯關系可視圖Fig.1 Visual graph of association relationship

表2 治療乳腺癌處方中藥物的關聯規則
經數據預讀,選擇乳香作為因變量,其余頻次≥12的84個中藥作為自變量進入決策樹模型的篩選過程。采用SPSS Statistics 22.0軟件中的CHAID、CRT、QUEST決策樹方法進行識別規律的挖掘,使用10倍交叉驗證方法進行模式驗證,統一將父節點數設定為100,子節點為50。三種決策樹模型的最佳識別中藥均為沒藥,摘要見表3。

表3 CHAID、CRT、QUEST決策樹模型摘要
在TCMSP中檢索乳香-沒藥所有成分數據,設置口服生物利用度OB≥30%,藥物相似性DL≥0.18,同時篩去無對應靶點的成分,最終篩選出乳香8個主要活性成分,沒藥45個主要活性成分,見表4。

表4 乳香-沒藥的有效活性成分

續表4(Continued Tab.4)
在TCMSP中以OB≥30%和DL≥0.18作為篩選條件,收集到乳香有效成分8個,沒藥有效成分45個,刪除重復并去除假陽性,利用UniProt(http://www.uniprot.org)將蛋白質名稱轉換成Gene symbol,通過Cytoscape 3.7.1軟件構建乳香-沒藥“化合物-靶點”的可視化網絡圖(見圖2)。

圖2 乳香-沒藥“化合物-靶點”的可視化網絡圖Fig.2 Visualization network diagram of “compound-target” of frankincense-myrrh 注:淺綠色為乳香;墨綠色為沒藥;粉色為基因靶點。Note:Light green is frankincense;Dark green is myrrh;Pink is the gene target.
利用GeneCards(http://www.genecards.org)收集乳腺癌靶點,通過多次截取參數Relevance score中位數法最終選取1 123個乳腺癌靶點。利用Cytoscape 3.7.1軟件中Bisogenet插件分別構建藥物和疾病靶基因PPI網絡,并取交集進行蛋白網絡互做分析,得到由5 633個節點和141 839個邊組成的網絡(見圖3),再用CytoNCA插件對網絡進行拓撲分析,選取degree大于所有節點的2倍degree中位數,CC、BC大于所有節點對應值的中位數,提取Hithubs網絡,得到1 459個節點和63 918個邊組成的網絡(見圖3),再次使用截取中位數法篩選,最終構建了1個具有81個節點和1 524條邊的靶點網絡(見圖3)。這81個核心基因為藥物與疾病中共同基因的核心部分,其中degree值評分較高的有酪氨酸3-單加氧酶/色氨酸5-單加氧酶活化蛋白(YWHAE)、cAMP反應元件結合蛋白(CREBBP)、生長因子受體結合蛋白2(GRB2)、酪氨酸3-單氧合酶/色氨酸5-單氧合酶激活蛋白γ肽(YWHAG)、核內不均一性核糖核蛋白K(HNRNPK)等,為后續進行GO功能富集、KEGG通路分析以及分子對接奠定基礎。

圖3 蛋白網絡互作構建及拓撲分析Fig.3 Protein network interaction construction and topology analysis注:A有5 633個節點、141 839條邊;B有1 459個節點、63 918條邊;C有81個節點,1 524條邊。Note:A contains 5 633 nodes and 141 839 edges;B contains 1 459 nodes and 63 918 edges;C contains 81 nodes and 1 524 edges.
將“2.6”中81個核心基因利用DAVID平臺進行GO功能富集分析,包括3個分支:BP、CC和MF。設定閾值P<0.05(見圖4)。BP分析可以看出這些靶點主要涉及positive regulation of transcription from RNA Pol-II、negative regulation of transcription from RNA Pol-II、transcription/DNA-template等248條生物過程。CC分析可以看出靶點主要涉及nucleus、nucleoplasm、cytoplasm等60條細胞組分。MF分析中可以看出,靶點主要涉及protein binding、poly(A) RNA binding、enzyme binding等94條分子功能。

圖4 乳香-沒藥活性成分治療乳腺癌靶點的GO富集分析Fig.4 GO enrichment analysis of frankincense-myrrh active ingredients for breast cancer target
利用DAVID平臺進對81個核心基因進行KEGG通路分析,設定閾值為P<0.05,得到39條KEGG通路富集,并繪制氣泡圖,結合表5和圖5,可知基因主要集中在病毒致癌作用(viral carcinogenesis)、癌癥的途徑(pathways in cancer)、PI3K-Akt信號通路(PI3K-Akt signaling pathway)、癌癥中的微小核糖核酸(microRNAs in cancer)等通路上。

圖5 KEGG通路富集分析氣泡圖Fig.5 Bubble diagram of KEGG pathway enrichment analysis

表5 KEGG通路富集分析(前20條)
在Cytoscape中使用cytoNCA插件對乳香、沒藥的有效成分進行分析,根據degree結果得出評分較高的活性成分有沒藥中的3-甲氧基呋喃酮-9-烯-8酮、槲皮素和乳香中的乳香酸等。運用PyMOL、AutoDock Vina等軟件對關鍵成分及主要靶點進行分子對接(見圖6),同時對主要有效成分作用于CREBBP、GRB2、HNRNPK、YWHAE、YWHAG的結合能進行了測定,一般認為配體與受體結合的構象穩定時能量越低,發生的作用可能性越大。本研究中與GRB2結合能最低的化合物為Boswellic acid(結合能為-9.1 kcal/mol),由此可見乳香-沒藥中的核心化學成分乳香酸與受體蛋白GRB2形成構象能量低,結構穩定,結合活性較高。

圖6 乳香-沒藥活性成分與靶蛋白對接三維圖(結合能 ≥ -9.1 kcal/mol)Fig.6 Three dimensional docking diagram of the active component of frankincense-myrrh and target protein (binding energy ≥ -9.1 kcal/mol)注:A~F分別為GRB2與乳香酸、HNRNPK與乳香酸、YWHAE與乳香酸、YWHAE與槲皮素、YWHAG與乳香酸、YWHAG與槲皮素的分子對接圖。Note:A-F are the molecular docking diagrams of GRB2 and boswellic acid,HNRNPK and boswellic acid,YWHAE and boswellic acid,YWHAE and quercetin,YWHAG and boswellic acid,and YWHAG and quercetin,respectively.

表6 乳香-沒藥活性成分與靶點的結合能
通過Apriori關聯規則分析目標數據庫里的用藥規律,得到乳香與沒藥同時配伍治療乳腺癌置信度最高,置信度越高,沒藥與乳香配伍出現的可能性就越大。CHAID、CRT、QUEST是三種常用決策樹預測方法。CHAID默認情況下使用多路拆分,使節點中的樣本大小變薄,從而導致樹的深度減少。CRT會執行二進制拆分(每個節點都拆分為兩個子節點)。CHAID旨在與分類/離散的目標一起使用,CRT可以進行回歸和分類。與CART相比,CHAID中的拆分變量和拆分點選擇的混淆程度較小。QUEST節點可提供用于構建決策樹的二元分類法,此方法的設計目的是減少大型CRT決策樹分析所需的處理時間,同時減小分類樹方法中常見的偏向類別較多預測變量的趨勢。運算過程比CRT更簡單有效,三種方法優勢互補。決策樹算法以乳香為因變量,CHAID、CRT、QUEST三種決策樹算法均篩選出沒藥與乳香的配伍可能性更大,表明乳香、沒藥這一活血化瘀藥對參與樹模型構建組方意義較大。乳香最早記載于《明醫別錄》,性溫味淡,氣香而走竄,善理氣活血。沒藥最早記載于宋代的《開寶本草》,性平,氣薄味苦,重在化瘀理血[4],二者常相須為用,協同增效。
通過Cytoscape中的插件cytoNCA進一步挖掘乳香與沒藥中53個活性成分,根據參數degree排名,結合臨床研究文獻,發現3-甲氧基呋喃酮-9-烯-8-酮、乳香酸、槲皮素等成分發揮著重要的作用。現代研究表明,乳香中最具特征性、研究最為深入的成分為乳香酸類(例如乳香酸)成分,屬于五環三萜類化合物,對腫瘤細胞有抗增殖、分化誘導和細胞凋亡等作用,特別是其中的乙酰乳香酸毒性低,是一個有前景的抗腫瘤藥物和腫瘤轉移抑制劑[5]。呋喃酮類也能在一定程度上能增強腫瘤細胞增殖抑制活性[6]。槲皮素是存在于多種水果與植物中的多酚類物質,具有抗氧化、抗炎、促凋亡等作用[7]。研究發現,槲皮素通過抑制TLR-4/NF-κB信號通路,間接抑制炎性因子白介素-1β(IL-1β)和腫瘤壞死因子(TNF-α)的表達[8]。
對關鍵靶點進行GO功能和KEGG通路富集分析,進一步探究乳香-沒藥治療乳腺癌的作用機制,GO包含了基因參與的生物過程、所具有的細胞組分、發揮的分子功能三方面功能信息,結果發現,乳香-沒藥可能通過參與RNA聚合酶Ⅱ啟動子轉錄的正/負調控、轉錄/DNA模板等248條生物過程,細胞核、核質、細胞質等60條細胞組分,蛋白質結合、聚(A)RNA結合、酶結合等94條分子反應,進而調控PI3K-Akt信號通路、Estrogen信號通路、MicroRNAs in cancer、MAPK信號通路、P53信號通路等發揮抗腫瘤作用。關鍵基因在乳香-沒藥治療乳腺癌中具有重要意義,利用Cytoscape中的cytoHubba插件篩選出degree值排名前十的核心基因,根據參考相關文獻和KEGG富集分析中的關鍵通路,篩選出2條有效作用通路MicroRNAs in cancer和MAPK信號通路,核心基因富集于這兩條通路的有CREBBP、GRB2、HNRNPK、YWHAE、YWHAG。MicroRNAs in cancer通路中MicroRNAs的異常表達與乳腺癌血管形成、腫瘤細胞的轉移、侵襲及腫瘤耐藥性等過程有密切的關系[9],miRNAs可以用于乳腺癌的早期診斷指標[10],也有希望成為用于乳腺癌的有效治療藥物。研究證明,沒藥中的沒藥甾酮也可能通過調節miRNAs的表達進而影響某些關鍵靶蛋白的活性從而起到抗瘤作用[11]。MAPK是細胞內廣泛存在的絲/蘇氨酸蛋白激酶,MAPK signaling pathway(絲裂原活化蛋白激酶信號轉導通路)參與細胞增殖、凋亡、自噬過程及調控耐藥相關基因和蛋白的表達[12],干預MAPK信號通路,可以提高腫瘤對化療藥物的敏感性,從而逆轉耐藥[13],有研究表明,沒藥中的β-欖香烯也具有很好的抗腫瘤療效,其對膠質母細胞瘤的抗增殖作用是通過激活MAPK信號通路實現[14]。YWHAE與腫瘤的發生、發展密切相關,主要在腫瘤細胞周期、生長凋亡、擴散遷移及信號轉導等途徑發揮作用[15]。CREBBP作為轉錄輔激活因子可參與多種細胞功能,同時有抑制腫瘤的作用,其突變能夠導致卵巢癌、濾泡性淋巴癌及乳腺癌的發病率增加[16]。GRB2是一種在細胞中廣泛表達的銜接蛋白,其異常表達或活化與腫瘤的發生息息相關,研究表明,它可以作為抗腫瘤治療的分子靶點[17],因此GRB2抑制劑也就成了抗腫瘤藥物的研發熱點。YWHAG為酪氨酸3-單氧合酶/色氨酸5-單氧合酶激活蛋白γ肽(14-3-3γ),參與蛋白定位及運輸、細胞內信號傳導、細胞周期調控和細胞凋亡[18]。HNRNPK基因在細胞內可分布于細胞質和(或)細胞核,能與不同亞細胞結構中的多種蛋白相互作用[19],在腫瘤中參與調控多種癌基因及抑癌基因的表達。
為了進一步驗證網絡藥理學結果的可靠性,利用分子對接技術將核心成分和關鍵靶點分別進行分子對接,結果發現,核心成分3-甲氧基呋喃鳥苷-9-烯-8-酮、乳香酸、槲皮素與靶點CREBBP、GRB2、HNRNPK、YWHAE、YWHAG的結合能均小于-5.0 kcal/mol,表明它們有較好的結合活性。其中乳香酸與GRB2的結合能為-9.1 kcal/mol,表明它們具有強烈的結合活性,提示GRB2是乳香-沒藥可能發揮治療乳腺癌作用的重要靶點。
綜上,本文采用網絡藥理學的方法構建“化合物-靶點-疾病”相關網絡,從整體上分析乳香-沒藥成分、靶點、信號通路之間的相互作用關系,采用分子對接技術驗證了乳香、沒藥抗乳腺癌作用機制,推測了乳香、沒藥可能通過3-甲氧基呋喃鳥苷-9-烯-8-酮、乳香酸、槲皮素等成分協同作用于CREBBP、GRB2、HNRNPK、YWHAE、YWHAG等靶點,通過MicroRNAs in cancer通路、MAPK信號通路參與細胞增殖、凋亡、自噬過程及調控耐藥相關基因等,側面展示了乳香、沒藥通過多成分、多靶點、多通路發揮抗癌作用的機制,后續可對乳香-沒藥藥對進行實驗研究,對本文分子靶向對接虛擬篩選研究的結果進行驗證,深入探討關鍵作用機制,為治療乳腺癌藥物的研發提供新的方向及依據。