孟棵,楊秋蕊,姜迪,王彩君,閆海峰,陳瑞,張淑潁,肖娟蘭,王怡
(天津中醫藥大學,天津 301617)
心肌缺血(myocardial ischemia)是常見的病理狀態,是指心臟的血液灌注減少,導致心臟的供氧減少,心肌能量代謝不正常,不能支持心臟正常工作的一種病理狀態。缺血性心臟病嚴重危害著人們的身體健康,僅在2010年缺血性心臟病造成700萬的病死率,較1990年上升了35%[1]。研究表明,截止到2017年,缺血性心臟病在中國仍是威脅生命的5個主要因素之一,該病每10萬人中的平均致殘年齡標準較1990年下降了4.6%[2]。
中醫在治療心肌缺血方面也有突出貢獻,同時在治療過程中具有風險小,副作用低,患者經濟壓力小等優勢。網絡藥理學具有多靶點多成分多靶點多途徑的特點,對于研究中醫藥療效具有獨特的優勢。因此本研究采用數據挖掘與網絡藥理學此案結合的方法探討中醫藥治療心肌缺血的用藥規律以及對其分子機制的預測。
1.1 方劑來源 登錄國家專利網(http://epub.sipo.gov.cn),按照國家專利網格式輸入“中藥心肌缺血”所得方劑。
1.2 納排標準
1.2.1 納入標準 將所有主要治療心肌缺血的方劑納入。
1.2.2 排除標準 1)不以心肌缺血為主要治療方向的方劑;2)重復方劑;3)大量包含不常見中藥或非中藥類方劑;4)以食療為主的食療食譜。
1.3 中藥名稱規范 按照《中華人民共和國藥典》上的中藥名稱將所有錄入中藥進行規范,將“仙靈脾”統一為“淫羊藿”,“土元”統一成“土鱉蟲”,“全蟲”統一為“全蝎”,“杞果”統一為“枸杞子”等。
1.4 用藥規律分析
1.4.1 藥頻及性味歸經分析 將篩選所得的149首方劑中的所有中藥輸入Microsoft Excel 2016中進行藥頻統計。
1.4.2 主成分分析 采用R語言版本3.6.0,通過對高維度數據(中藥組成)進行正交變換,不斷尋找方差最大化的線性組合,最終取方差最大的前幾個線性組合作為描述整個數據的關鍵點。
1.4.3 聚類分析 采用R語言版本3.6.0,通過Kmeans聚類法和分層聚類法對原數據在高維空間中的歐式距離來判斷不同觀測間的相似度,將相似度接近的觀測分為同一類,最終將數據投影至二維空間,以此判斷對原數據貢獻度大的類別。
1.4.4 關聯規則 采用R語言版本3.6.0,通過Apriori算法分析數據變量間的頻數發生規律,設置最低支持度為0.05,最小置信度為0.8,分別從三個角度(支持度、置信度、提升度)尋找出變量間關聯或相關的關系,并且基于置信度和提升度給出具體規則的可視化圖。
1.5 靶點獲取與數據集的建立 取藥頻大于50的4味藥物進行網絡藥理學分析。通過中藥系統生物學分析數據庫 TCMSP(http://lsp.nwu.edu.cn/tcmsp.php),以口服生物利用度(OB),血腦屏障(BBB),類藥性(DL)作為藥物成分ADME的重要參數,獲取上述四味藥的化學成分以及作用靶點的信息(OB≥15;BBB≥-0.3;DL≥0.1)。使用 Cytoscape3.7 構建“藥物-成分-靶點”的可視化網絡圖。同時采用DisGeNET 網站(http://www.disgenet.org/)通過搜索疾病關鍵詞“myocardialischemia”,獲取治療心肌缺血的所作用的藥物靶點。將藥物靶點和疾病靶點取交集獲得共有基因。
1.6 PPI關系分析 采用STRING數據庫(https://string-db.org/cgi/network.pl)進行蛋PPI網絡可視化分析,將藥物和疾病的共同基因輸入STRING數據庫,將物種設置為“人類”進行分析,將結果輸入Cytoscape3.71進行可視化網絡分析。
1.7 Kegg通路和Go功能的富集分析 將共同基因集輸入 Enrichr數據庫(http://amp.pharm.mssm.edu/Enrichr/),獲取藥物靶點與疾病靶點的重合基因進行GO功能富集分析和KEGG通路富集分析,其中GO富集分析選擇生物過程(biological proces)。富集分析結果選擇按校正后的P值從小到大排列。
2.1 藥頻分析 通過納排標準篩選得出149首方劑,并對藥頻進行統計,發現丹參、黃芪,川芎,三七用藥頻次大于50,其中丹參最多為82次。
2.2 主成分分析 在主成分分析中,按照貢獻度選取最高的兩個維度進行分析,如圖1所示。在第一維度中,貢獻度前20的藥物多是補氣養血,收斂安神之藥。而在第二維度中,貢獻度前20的藥多為滋陰活血、理氣走竄之藥。同時可以在主成分向量圖中可以觀察到,在第一維度中,黨參的作用效果最強,山楂則在第二維度中作用最明顯,黃芪在一、二維度中,均有較強的作用。

圖1 主成分分析圖
2.3 聚類分析 通過聚類分析可以看出,如圖2所示,采用不同算法進行聚類分析,其中左圖按貢獻度將藥物分為4類,其中綠色區域,在可見的2個維度中集中于0點附近,多為加減用藥,紫色和藍色區域則明顯有較強重要性,其中紫色區域多是活血化瘀、行氣走竄之藥;而藍色區域則多為補氣養血、斂陰助陽的藥物組成。右圖采用層次聚類法同樣將所有藥物分為4類,其中綠色仍以加減藥物為主,紫色以補氣活血藥居多,紅色區域以行氣通絡藥為主,而藍色區域則以養血安神藥為主。

圖2 聚類分析圖
2.4 關聯規則分析 在關聯規則分析中,如圖3所示,左圖表明丹參和酸棗仁等藥在用于治療心肌缺血時經常與其他藥聯用,而石斛和遠志的高置信度則顯示了其作為后項經常被關聯使用的事實。我們將置信度前30的藥對進行觀察,如右圖所示,研究發現丹參、紅花、黃芪、川芎、黨參、桃仁這幾位藥與其他藥關聯度和提升度最高。

圖3 關聯規則分析圖
2.5 靶點的獲取及數據庫的建立 采用在藥頻分析中用藥頻率≥50的四味中藥“丹參”“黃芪”“川芎”“三七”構建“藥物-成分-靶點”的可視化網絡分析圖,如圖4。將在DisGeNET網站搜索的疾病靶點和藥物靶點相交獲得共有基因。其中四味藥物對應靶點共有240個,疾病靶點共有447個,其中共有基因64個。表1見開放科學(資源服務)標識碼。

圖4 “藥物-成分-靶點”可視化網絡圖
2.6 PPI分析 通過STRING數據庫與Cytoscape3.7進行可視化分析的PPI網絡,如圖5所示,節點顏色越鮮亮說明節點的關聯度越高。其中關聯度最高的前3位蛋白是白細胞介素-6(IL-6)、血管內皮生長因子 A(VEGFA)、基質金屬蛋白酶 9(MMP9)。

圖5 PPI可視化分析網絡圖
2.7 KEGG通路富集分析和GO富集分析 通過Enrichr數據庫過共有基因進行富集分析,根據校正后P值升序取前十條通路進行分析,其中排名第1的是糖尿病并發癥中的AGE-RAGE信號通路,其余通路還包括動脈粥樣硬化流體剪切力信號通路、癌癥信號通路、TNF信號通路等如圖6。在GO功能分析中,根據校正后P值從小到大排列,取前十功能進行分析,其中大多為炎癥因子、細胞因子和趨化因子或是血管生成或發育功能,包括細胞對細胞因子刺激的回應、細胞因子介導的信號通路、血管生成的積極調節,炎癥反應等,如圖6。

圖6 富集分析
本研究發現,中醫理論治療心肌缺血多采用“補氣養血,行氣活血”的藥物治療,或以“行氣活血”之藥加以輔助。同時本研究基于網絡藥理學方法,發現其中互作水平最高的兩個基因為IL-6與VEGFA;在KEGG富集分析中排名前2的通路是糖尿病并發癥中的AGE-RAGE信號通路和脈粥樣硬化流體剪切力信號通路;GO功能富集分析中大部分功能以炎癥、細胞因子和血管功能為主。
IL-6在缺血性心臟疾病的診斷和治療中有著重大的意義。IL-6在再灌注損傷中表達上升,其表達在溶栓后12~24 h含量可達到峰值[3]。而VEGFA與心血管疾病息息相關,其可以有效提高心臟中血漿酶原活化因子的活性,進而加速細胞外蛋白水解,最終形成新生的毛細血管的作用[4]。VEGFA在動物實驗中還被證明可以作為致死性心律失常的診斷標準之一[5]。AGE-RAGE通路的表達與心肌纖維化密切相關,研究表明Ⅱ型糖尿病大鼠的AGERAGE的上調與Ⅱ型糖尿病大鼠的心肌纖維化程度程顯著正相關[6-8]。此外剪切應力的不良變化不僅可以加快心血管中斑塊的形成,而且還可以通過炎癥通路來影響基質金屬蛋白酶和細胞外基質從而導致心肌和血管的重塑[9]。同時,眾多炎癥因子的表達也是心肌缺血的重要機制[10],有研究表明重組人白細胞介素-1β(IL-1β)受體拮抗劑,可以抑制實驗性急性心肌梗死細胞凋亡[11]。
在中醫角度講,心肌缺血的辨證基本可分為痰瘀痹阻,寒凝心脈,氣陰兩虛,心陽不振4個證型。其中虛癥多為氣陰兩虛、心陽不振為主[11]。而實證多為氣痰瘀痹阻,寒凝心脈為主。筆者從納入的方劑中分析所得的用藥規律可以了解到,中藥治療心肌缺血,對于虛癥而言,多以補氣養血的藥物來滋補心腎,心主血脈,腎納精氣,心腎雙補,氣血同養;而針對實證來說,多采用活血化瘀,行氣通絡的藥物作為主要治療手段;從性味歸經上來看,多以甘溫藥物用以滋補,佐以苦寒藥物以防滋補太過,體現了中醫的平衡理論。
本研究從數據挖掘和網絡藥理學角度探討了中藥方劑治療心肌缺血的用藥規律與分子機制,其結果具有可靠性,但仍需要臨床試驗和基礎研究對其用藥規律和分子機制進行更加科學系統的驗證和闡釋。