劉志強, 王博龍
(宜春學院化學與生物工程學院, 江西 宜春336000)
中藥是指在傳統中醫藥理論、 辨證施治指導下, 用于預防和治療疾病的一類藥物[1-2]。 中醫藥在醫藥產業、 替代醫學等眾多領域發揮著不可替代的作用, 但因其化學成分復雜、 藥理作用機制不甚明確, 又受中藥材品種、 產地和制劑加工技術等因素的影響, 使得其在藥理研究、 質控監管以及現代化、 國際化發展中面臨巨大阻礙[3-4]。 傳統的藥理實驗為證明藥物對某個疾病的線性因果關系, 通常是設置對照試驗、 施加單一藥物因素, 研究其對某個靶蛋白的高親和力、 高特異性相互作用, 以揭示藥物對疾病的作用機制[5]。 但這與中醫藥辨證論治、 整體觀、 系統觀的醫療理念, 以及中藥“多組分、 多靶點、 多通路” 系統作用機制的研究理念是相悖的。 而且, 現代醫學研究表明腫瘤、心血管系統疾病、 神經精神系統等諸多疾病是由多種遺傳、非遺傳因素, 多個靶點、 通路引起的復雜性疾病, 傳統的“一個靶點, 一種疾病, 一個藥物” 的研究模式, 已很難系統、 整體地闡明中藥藥效物質基礎及其對復雜疾病的藥理作用機制[6-7]。
2007 年, Hopkins[8]首次提出了網絡藥理學的概念,2011 年, 李梢[9]又提出了網絡靶標等概念。 網絡藥理學等新理念相繼提出, 為中藥研究帶來了新的技術與方法, 其系統性、 整體性的研究理念與中藥復方多組分、 多功效、協同作用等特點是不謀而合的。 目前, 網絡藥理學在中藥藥理機制研究、 新藥發現、 藥物重新定位、 老藥新用以及不良反應、 毒副作用研究等方面取得了良好成效[10-11]。 張尊建等[12]運用代謝組學技術在疾病診斷、 網絡靶標發現方面取得顯著成效; 程肖蕊等[13]發現網絡藥理學實驗技術具有高通量、 可定量、 快速、 靈敏、 準確等特點, 除基因組、蛋白質、 代謝組等組學外, 高通量/高內涵技術、 雙高通量技術基因表達測序技術和分子相互作用技術在網絡藥理學研究中也有較好的應用前景。 中藥成分挖掘及靶標預測是網絡藥理學研究的基礎工作, 運用公共的中藥化學數據庫、 靶標數據庫、 基因組數據庫、 知識發現工具, 化合物-蛋白互作網絡及一站式中藥網絡藥理學分析平臺, 挖掘中藥藥效成分、 預測其潛在功能靶標, 構建“藥物-靶點-疾病” 網絡,闡明其“多組分、 多靶點、 多途徑” 的藥理機制, 已成為中藥網絡藥理學研究中必不可少的內容。 鑒于中藥成分挖掘與靶標預測技術在網絡藥理學領域的重要性, 現就其常用的技術方法原理及在中藥研究中的應用情況進行總結。
中藥藥效物質基礎是其所含有的有效化學成分, 但其所含成分十分復雜, 有效成分與非有效成分難以區分。 因此, 研究中藥有效成分的提取分離方法、 構建中藥化學成分數據庫, 對中藥網絡藥理學研究有重要意義[14]。 近年來, 國內外許多科研院所、 課題組已成功建設了一批數據多元化、 涉及內容廣的中藥、 天然藥物化學成分數據庫,并廣泛應用于中藥、 中藥及方劑的網絡藥理學研究。 目前常用的中藥、 天然化學成分數據庫, 見表1, 包括TCMSP[15]、 TCMID[16]、 TCMD[17]、 TCM@ TAIWAN[18]、 Herb-BioMap[19]、 HIT[20]、 TCMGeneDIT、 CHCD、 BPCD 等[18,21]。
TCMSP、 TCMID 是應用較多的2 個中藥化學數據庫與網絡藥理學分析平臺。 TCMSP 是由西北農林科技大王永華團隊研發的一款系統藥理學分析服務器, 其通過文獻挖掘和數據庫整合, 得到500 味常用中藥、 30 069 個中藥化合物的藥物代謝動力學、 藥物化學和藥物-靶標蛋白網絡-疾病網絡的基本信息[15]。 TCMSP 構建的中藥化學分子庫較為全面, 在納入皂苷類中藥化合物時, 還特意區分加入了皂苷去糖形式的化合物, 編號M11043 的人參皂苷Rh2與編號為MM11044 的人參皂苷Rh2-qt 就因一個糖基的差別(圖1、 表2), 而造成化學參數的巨大差別。 TCMSP 特別將兩者區分, 分別納入, 使其中藥化學庫更加準確全面。

表1 中藥化學成分數據庫

圖1 人參皂苷化合物結構

表2 TCMSP 與TCMID 數據庫對比
TCMID 數據庫通過整合HIT、 TCM@ TAIWAN 等數據庫及文本挖掘等方法收集中藥化合物信息, 并利用STITCH、 HIT 數據庫、 文本檢索等方式預測化合物靶標,利用HPRD 構建蛋白互作網絡, 構建的一款中藥綜合數據庫[16]。 以中藥成分阿魏酸為例比較TCMSP、 TCMID 提供的信息功能, 見表3。 TCMSP 數據庫提供了包括中藥分子氫受體、 供體、 血腦屏障通透性等藥化、 藥動學參數, 及其對應的潛在靶點、 疾病和中藥來源, 還包含一個mol2 格式三維結構文件, 就單一中藥化學成分信息而言, 比TCMID 數據庫內容更加全面。 但TCMSP 數據庫總體上收錄的中藥品種不多, 浮小麥、 血竭、 五靈脂等常用藥均未收錄, 也不包含中藥方劑的信息, 因此實際運用中應綜合考慮TCMSP、 TCMID 數據庫。
TCMD 是由創騰科技公司和中科院過程工程研究所分子設計課題組聯合開發的綜合性中藥化學數據庫, 包含6 735種植物、 23 033 個中藥化合物, 每個中藥化合物含有CAS 號、 分子式、 來源、 藥理活性、 物理化學性質等11 項數據[17]; TCM@TAIWAN 是由臺灣中國醫科大學研發的一款中藥篩選平臺, 收錄有352 味中藥的37 170 個化合物[18]。 2018 年, 霍曉乾等[22]在研究大黃利膽片網絡藥理機制時, 利用TCMD、 TCM@ TAIWAN 兩個數據庫收集到大黃利膽片中229 種大黃成分、 254 種余甘子成分以及21種手掌參成分, 并運用靶標預測技術、 蛋白互作網絡、 聚類分析技術, 闡釋了大黃利膽片在對免疫系統的綜合調節和對機體的營養代謝調節等方面發揮協同作用的配伍機制。
HerbBioMap 是一套集成數據庫, 搜錄整合了包括中藥信息數據、 中藥成分數據、 中藥藥對信息、 方劑信息數據、證候等多種信息數據, 包含636 種常用中藥及10 838 種中藥成分等的基本信息[19]。 李梢團隊曾利用該數據庫, 成功揭示了葛根芩連方治療2 型糖尿病的網絡藥理機制[23]。HIT 則是收集Pubmed 數據庫中藥成分及其靶點信息, 并與TTD 靶點庫、 DrugBank 藥物數據庫、 UniProt 等數據庫整合連接組建的中藥成分靶標數據庫, 但該數據庫存在化學成分數據量 少、 信息不 足 等 缺點。 同 樣, TCMGeneDIT、CHCD、 BPCD 3 個數據庫也因其收錄的信息少、 相關報道不多, 在網絡藥理學研究中應用較少。
高效、 準確地預測中藥及其藥效成分潛在靶標是中藥網絡藥理學研究中的一個關鍵問題, 隨著藥物-靶標預測技術的發展, 許多舊的靶標服務器、 靶標預測工具已經停止運行, 但越來越多的新的靶標預測工具已開始用于中藥網絡藥理學研究[24]。 靶標預測方法主要包括數據挖掘、 知識發現工具應用、 化合物-蛋白質相互作用網絡構建、 藥效團模型匹配、 正反分子對接技術、 藥物-靶標相似性算法等,幾種方法各有利弊, 具體還要結合實際情況綜合分析利用[25]。 2016 年, 霍夢琪等[26]在研究川芎嗪治療冠心病的網絡機制時, 綜合運用疾病化學生物數據庫Chemprot、 化合物-蛋白相互作用分析平臺STITCH 4.0、 藥效團虛擬篩選等三種靶標預測方法, 發現川芎嗪能作用于白細胞介素8、過氧化物酶體增殖物激活受體γ、 血紅素加氧酶1 等10 種潛在靶標, 通過調節免疫、 炎癥反應、 細胞凋亡信號通路調控及血液循環等7 種途徑發揮治療冠心病的效果。 目前常用的靶標預測工具見表3, 包括網絡藥理學分析數據庫(TCMSP、 TCMID 等數據庫的檢索挖掘)、 Arrowsmith 知識發現工具[27]、 STITCH[28]、 ChEMBL[29]等化合物靶標分析平 臺; PharmMapper[30]、 DRAR-CPI[31]、 idTarget[32]、 HTDocking[33]等反向分子對接服務器; AutoDock Vina[34]、 Discovery studio[35]等 分 子 對 接 軟 件; drugCIPHER[36]、BATMAN-TCM[37]、 TargetHunter[38]等靶標預測工具。

表3 靶標預測工具
2.1 靶標數據挖掘 TCMSP、 TCMID 等數據庫在提供中藥成分信息時也提供了部分其潛在靶點信息, 但這些數據庫仍存在對應靶標不全等情況, 人參皂苷Rh2、 天麻素等重要活性成分的靶點信息, TCMSP 數據庫就未能提供。 因此在研究化合靶標信息時, 還需要綜合考慮多種數據庫和挖掘工具來收集其潛在靶點。 Arrowsmith 芝加是哥大學Swanson 教授[27]研制的基于非相關文獻的知識發現工具,為研究中藥靶標及其藥理毒副機制提供了新思路。 2017年, 王仁杰等[39]通過構建龍血竭A 集合和缺血性腦卒中C集合, 運用Arrowsmith 工具發現兩者密切關聯的B 集合中含有環氧合酶-2、 一氧化氮合酶、 電壓門控性鉀通道等5個靶標, 推測以上靶點可能是龍血竭治療缺血性腦卒中關鍵因素。 STITCH、 ChEMBL 化合物靶標作用平臺是用于預測已知的化合物和蛋白質相互作用關系的平臺, STITCH 服務器能通過置信度打分精確化合物與蛋白質相互作用的關系強度, 以川芎嗪為例, 設置相互作用蛋白為“Homo sapiens” (智人), score 為“medium confidence 0.400”, 發現川芎嗪能對應CFTR、 TNF、 IL8、 HIF1A 四個潛在靶標(圖2)。 2014 年, 任真真等[54]以三七皂苷為研究對象, 利用STITCH、 ChEMBL 平臺和藥效團模型匹配方法, 并通過蛋白互作、 MCODE 聚類分析發現三七皂苷有189 個潛在靶點, 藥效作用與環磷酸腺苷代謝、 血管伸縮、 血液凝固等生物過程密切相關。 此外一些化學、 藥物數據庫, 如Pub-Chem[55]、 DrugBank[56]等也可以挖掘一些天然化學成分的藥物及其靶標信息。

圖2 STITCH 平臺的川芎嗪潛在靶標
2.2 反向分子對接與藥效團匹配 正反分子對接技術、 藥效團模型匹配是中藥化合物靶標預測中不可或缺的重要工具。 早期的反分子對接軟件, 如新加坡國立大學的INVDOCK[57]、 蔣華良團隊的Tarfis Dock[58]等, 在藥物靶標預測研究中均獲得了良好的應用效果[59-60]。 在此基礎上,蔣華良等推出了新一款藥效團匹配反向找靶工具Pharm-Mapper, 該服務器整合了Target Bank、 Drug Bank、 Binding DB 和PDTD 四大數據庫, 能快速獲得藥物的潛在靶點信息。 2018 年, 李靜等[61]運用PharmMapper 成功預測款冬花止咳化痰主要活性成分的作用靶點, 并探討了其多成分-多靶點-多通路的作用機制。 DRAR-CPI 是上海交通大學Bio-X研究所楊輪等采用DOCK 中的算法, 通過重疊球體定義受體分子潛在結合位點, 將藥物分子與多個蛋白結合位點進行反向對接的服務器, 主要用于藥物-靶蛋白相互作用的模擬研究, 該服務器規定Z′-score<-0.5 時化合物與靶點有潛在結合的可能性, 以川芎嗪為例, Z′-score<-0.5 的潛在靶標(同一靶標、 不同結合方式的, 仍按一個靶標計算,1T40_ 2 與1T40_ 1 為一個靶標) 共計101 個, 排名第二的靶標為與凝血密切相關的凝血因子X (PDB ID: 1FOR),其Z′-score =-2.31562, 見 圖3。 國 立 臺 灣 大 學 研 發 的idTarget 服務器是一款含7 864 個靶點的預測服務器, 也常用于中藥化合物靶標預測, 但其運算速度較慢且2017 年12月維護后一直未能恢復運行, 與以上服務器相比不具優勢。HTDocking 是一款基于二維結構和靶蛋白特征的反向對接服務器, 白雨等[51]用HTDocking 和PharmMapper 預測羅格列酮復方的靶標, 發現基于三維結構的PharmMapper 可能比二維結構式HTDocking 預測結果更有效。 對比以上幾款反向分子對接、 藥效團匹配服務器, PharmMapper 和DRAR-CPI 的綜合性能可能更佳。

圖3 川芎嗪與凝血因子X 反向分子對接
2.3 分子對接技術 除了現有的反向分子對接技術服務器、 分析平臺外, 還可以在靶標數據庫、 疾病基因組數據庫挖掘與某個疾病相關的靶標、 基因, 構建疾病對應的靶標庫, 利用分子對接軟件進行靶標預測。 AutoDock vina 是Molecular Graphics 實驗室開發的一款免費軟件, 與該實驗室早期產品AutoDock 相比, Vina 摒棄了拉馬克遺傳算法,回歸了梯度優化尋找最小點, 精度更高、 運算速度也更快;Discovery studio (DS) 是Accelrys 的一款藥物輔助設計軟件, 其對接程序采用特征性算法, 在運輸速度、 精度上優于Vina 軟件, 但由于Vina 屬于開發型軟件, DS 為收費軟件, 兩者在推廣使用上互有利弊。 史海龍等[62]在PDTD 藥物靶標數據庫收集了36 個抗腫瘤靶標, 利用AutoDock vina軟件將土貝母皂苷甲與抗腫瘤靶標分子對接, 發現土貝母皂苷甲可能通過抑制酪蛋白激酶Ⅱ、 金屬基質蛋白酶-8、胸苷酸合成酶以及微管蛋白等的活性, 發揮抗腫瘤作用。除AutoDock vina、 DS 軟件外, Surflex、 DOCK、 iGemdock等軟件也常用于靶標預測工作, 實際運用中也各有利弊。分子對接軟件在研究化合物與潛在靶點相互作用時, 比反向分子對接服務器更為細致, 例如用AutoDock vina 探索川芎嗪與凝血因子X (PDB ID: 1FOR) 的相互作用情況, 見圖4, 發現兩者相互作用的親和力為-5.3 kcal/mol, 能與結合的GLU-97、 THR-98、 TYR-99 等17 個0.4 nm 以內氨基酸殘基相互作用, 但分子對接軟件通過自建靶點庫預測靶標的方法, 與反向分子對接服務器相比, 存在靶標少等缺點, 實際運用中應綜合權衡考慮。

圖4 川芎嗪與凝血因子X 分子對接
2.4 相似性靶標預測 利用藥物-靶標相似性算法尋找中藥化合物潛在靶標, 也是常用的靶標預測方法之一。 李梢等[36]構建的drugCIPHER 是一款利用相似性線性回歸模型,并結合藥理空間和基因組空間關聯算法的靶標預測工具,在預測葛根芩連方治療2 型糖尿病的網絡藥理機制時, 表現了良好的預測性能[23]。 BATMAN-TCM 服務器是由劉中揚等組建開發的一款一站式網絡藥理學平臺, 其靶標尋找方式是基于Perlman 等[25]的SITAR 概念, 利用藥物之間的結構、 副作用、 ACT 分類系統、 藥物誘導基因表達、 化合物相互作用分數的相似性。 以及靶點之間氨基酸序列、 蛋白互作網絡接近中心性、 GO 功能富集的相似性, 利用邏輯回歸、 “棄一法交叉驗證” 構建的一種靶點預測工具, 曾預測了芪參顆粒治療冠心病的多靶點藥理機制, 并在實驗驗證中得到了很好的證實[63]。 TargetHunter 是一款能根據化合物2D 結構相似性, 整合ChEMBL、 文獻、 PubMed 信息, 反向挖掘化合物靶標的服務器。
2.5 藥物靶標數據庫 生物信息學、 分子生物學的發展,促生了許多藥物、 蛋白質、 基因組數據庫的產生, 正是在這些數據庫的基礎上, 新一代靶標預測工具才能層出不窮,日漸應用于網絡藥理學的研究。 同時, 各種組學技術、 網絡藥理學、 系統藥理學的發展, 也對藥物、 蛋白質、 基因組數據庫提出了更高的要求, 進一步推進了數據庫的構建與發展。 信息比較全面的藥物靶點、 基因組數據庫包括TTD[64]、 GeneCards[65]、 CTD[66]、 DrugBank[56]、 OMIM[67]、PDB[68]、 Uniprot[69]、 Binding DB[70]等, 見表4。

表4 藥物靶點、 基因組數據庫
網絡藥理學分析平臺、 中藥數據庫、 靶標預測技術的構建發展, 為研究中藥藥效物質基礎及作用機制, 闡明其療效好、 安全性高、 多組分、 多靶點的作用特點帶來了新的思路和策略, 也為中藥現代化與國際化現代化發展指明了新的方向[71-72]。 傳統的研究方法主要依靠藥化、 藥理實驗, 存在通量低、 精度不高、 周期長、 費用大等問題, 利用生物信息學、 計算機技術與實驗相結合的方法研究中藥的藥效成分、 潛在作用靶點, 突破了傳統研究的不足, 更加快速靈活, 準確率更高, 目前已廣泛應用于中藥網絡藥理學研究。
但現存的一些中藥網絡藥理學分析平臺、 中藥成分數據庫、 靶標預測技術仍有一定不足, 有待發展。 中藥成分數據庫提供的化學成分信息, 多為體外分離提取的成分,未涉及體內藥代動力學、 血清藥化學領域內容, 但中藥真正發揮藥效作用物質是其血中移行成分[73]。 秦建平[74]利用UPLC-Q-TOF-MS 技術, 推斷出天舒膠囊中24 種血中移行成分, 其中13 種為原型成分, 11 種為非原型成分。 若僅以中藥體外分離成分為研究對象, 進行靶標分析、 網絡藥理學研究, 難免會與藥物實際效果產生一定偏差。 李圣耀等[75]通過挖掘清心解瘀方中入血成分, 利用BATMANTCM 平臺進行網絡藥理研究, 發現清心解瘀方能治療多種心血管疾病, 并對慢性阻塞性肺病、 抑郁也有一定藥理作用, 與其實際適應癥基本相符。
藥物-靶點預測技術是網絡藥理學研究的核心內容之一, 但不論是數據挖掘、 藥靶相似性算法, 還是正反向分子對接技術, 都存在諸多問題, 如數據挖掘時藥物命名復雜, 數據源信息假陽性誤差; 相似性算法精度不高, 藥物與靶點關聯性差; 反向找靶標預測工具所依賴的靶標數據庫信息不全或假陽性, 靶蛋白三維結晶精度不高, 模擬分析與體內實際情況差距大[76-77]。 因此, 開發新一代高標準、 高精度、 高智能化的中藥化學數據庫、 靶標預測工具,綜合使用多種成分、 靶標挖掘技術, 并結合相關實驗驗證,是今后中藥網絡藥理學研究的主要發展方向之一。